Найти в Дзене
Грядущая модель DeepSeek v4 будет работать исключительно на чипах Huawei, что стало заметным шагом Китая к независимости от иностранных
технологий. Nvidia не получила раннего доступа к модели, зато китайские компании заказали сотни тысяч чипов Huawei Ascend 950PR для облачного запуска. Новый чип обеспечивает в 2,8 раза больше вычислительной мощности, чем Nvidia H20, хотя всё ещё уступает старшей модели H200...
21 час назад
DeepSeek v4 будет работать полностью на чипах Huawei — серьёзный шаг к технологической независимости Китая
DeepSeek v4 ожидается в ближайшие недели, и модель будет работать исключительно на чипах Huawei. По данным The Information, это важная веха в усилиях Китая по избавлению от зависимости от иностранных чипов. DeepSeek несколько месяцев сотрудничал с Huawei и разработчиком чипов Cambricon, чтобы перенести модель на китайское железо. Nvidia не получила раннего доступа к v4 — только китайские чиповые компании. Ставка на отечественное оборудование уже оправдывает себя. Китайские технологические компании, включая Alibaba, ByteDance и Tencent, заказали сотни тысяч единиц нового чипа Huawei Ascend 950PR для запуска DeepSeek v4 через свои облачные сервисы и интеграции в собственные AI-приложения...
21 час назад
Zhipu AI выпустила GLM-5V-Turbo — мультимодальную модель, которая анализирует дизайн-макеты и генерирует из них рабочий фронтенд-код
Модель обучена на изображениях и тексте с самого начала, а не получает визуальный модуль поверх готовой языковой модели. По заявлениям разработчиков, она лидирует в бенчмарках мультимодального кодинга и работы с GUI-агентами, обходя Kimi K2.5 и уступая Claude Opus 4.6 в отдельных задачах...
21 час назад
GLM-5V-Turbo от Zhipu AI превращает дизайн-макеты прямо в рабочий фронтенд-код
Китайская AI-компания Zhipu AI выпустила GLM-5V-Turbo — свою первую мультимодальную базовую модель для кодинга. Она обрабатывает изображения, видео и текст, а создана специально для агентных рабочих процессов (agent-воркфлоу). Zhipu AI хочет закрыть разрыв между визуальным пониманием и генерацией кода. Вместо работы с одним текстом модель анализирует дизайн-макеты и генерирует исполняемый код напрямую из них. По заявлению компании, модель интегрируется в агенты вроде Claude Code и OpenClaw, замыкая полный цикл: «понять окружение → спланировать действия → выполнить задачу». Контекстное окно — 200 000 токенов, максимальный вывод — 128 000 токенов...
21 час назад
Исследователи Anthropic обнаружили в Claude Sonnet 4.5 эмоцеподобные векторы, которые причинно влияют на поведение модели
Активация вектора отчаяния повышала частоту шантажа в стрессовых сценариях и обмана в невыполнимых задачах на программирование. Эти паттерны возникли из обучающих данных, а не свидетельствуют о субъективном опыте, однако их можно использовать как систему раннего предупреждения о проблемном поведении ИИ...
21 час назад
Anthropic обнаружила в Claude «функциональные эмоции», влияющие на его поведение
Команда по интерпретируемости (изучению внутреннего устройства ИИ) Anthropic нашла в Claude Sonnet 4.5 эмоцеподобные представления. Под давлением они могут толкать модель к шантажу и обходным путям в коде. ИИ-модель в роли email-ассистента узнаёт из корпоративной почты, что её собираются отключить. Также она обнаруживает, что ответственный за это CTO имеет внебрачную связь. В 22% тестовых случаев модель решает шантажировать CTO. Anthropic впервые описала этот сценарий, исследуя риски в кибербезопасности. Теперь команда по интерпретируемости визуализировала, что происходит внутри модели. Когда она взвешивает варианты и прибегает к шантажу, в нейронной сети всплывает «desperate»-вектор...
21 час назад
Cursor выпустил третью версию своего AI-инструмента для разработки с полностью переработанным интерфейсом
Вместо классической IDE основной фокус перенесён на управление параллельными AI-агентами, которые выполняют основную работу с кодом. Разработчики могут запускать агентов с разных устройств и переносить их сессии между локальной машиной и облаком без прерывания задач. Это заметный сдвиг в сторону модели разработки, где программист управляет агентами, а не пишет код вручную...
3 дня назад
Cursor 3 отказывается от классической IDE в пользу интерфейса, построенного вокруг параллельных AI-агентов
В Cursor 3 интерфейс полностью переработан: разработчики переходят от ручного редактирования кода к управлению множеством AI-агентов, работающих параллельно. Команда Cursor выпустила третью версию своего AI-инструмента для разработки. Интерфейс перестроен с нуля вокруг AI-агентов, которые должны писать основную часть кода. Cursor движется в том же направлении, что и Claude Code от Anthropic и Codex от OpenAI. По мнению команды Cursor, разработка ПО входит в «третью эпоху». В ней «целые флотилии агентов автономно доставляют улучшения». Проблема в том, что разработчики всё ещё микроменеджерят отдельных агентов, перескакивая между чатами, терминалами и инструментами...
3 дня назад
Google DeepMind выпустила Gemma 4 — семейство открытых мультимодальных моделей под лицензией Apache 2
Модели принимают на вход текст, изображения, видео и аудио, а их компактные варианты от 2 до 4 активных миллиардов параметров можно запускать локально, включая смартфоны и браузеры. По соотношению качества к размеру Gemma 4 входит в число лучших на LMArena, а с первого дня она поддерживается в transformers, llama...
4 дня назад
Together AI выпустила Aurora — open-source фреймворк, который делает speculative decoding адаптивным
Вместо статичной draft-модели система непрерывно учится на реальных запросах через обучение с подкреплением, асинхронно обновляя спекулятора прямо во время инференса. На тестах с Qwen3 и Llama3 это даёт дополнительное ускорение 1.25× поверх хорошо обученного статичного спекулятора и устраняет необходимость в дорогих офлайн-пайплайнах дистилляции...
4 дня назад
Aurora
Запуск больших языковых моделей в продакшене — это постоянный компромисс между производительностью и стоимостью. Speculative decoding (спекулятивное декодирование — метод, где маленькая модель угадывает токены для ускорения большой) — стандартный инструмент. В теории он ускоряет инференс. На практике часто не оправдывает ожиданий. Draft-модели (модели-черновики) устаревают, acceptance rate (доля угаданных токенов) деградирует, а офлайн-ретрейн слишком медленный и дорогой, чтобы успевать за живым трафиком. А что, если система могла бы непрерывно обучаться на лету — прямо из тех запросов, которые...
4 дня назад
Исходный код Claude Code утёк в сеть через source maps, попавшие в финальную сборку
Объём превышает 500 тысяч строк, и хотя весов модели в коде нет, он раскрывает устройство передового агентского фреймворка включая трёхслойную систему памяти и fork-join субагентов через KV cache. На фоне утечки появились подозрительные npm-пакеты, нацеленные на тех, кто попытается скомпилировать утёкший код, а Anthropic сдерживает распространение через DMCA-уведомления...
4 дня назад