Добавить в корзинуПозвонить
Найти в Дзене
SEOLIME

DeepSeek V4 наконец-то вышла: 1,6 трлн параметров, 1 млн токенов и открытые веса 🐳

Китайская лаборатория DeepSeek наконец-то представила свой первый крупный релиз с начала 2025 года. DeepSeek V4 — это не просто обновление, а две флагманские LLM с открытым исходным кодом и открытыми весами, которые компания называет «почти на передовой, но за небольшую долю цены». Модели уже доступны в веб-версии и по API, а их вес можно скачать на Hugging Face. 🔹 DeepSeek-V4-Pro — флагманский вариант с 1,6 трлн параметров (49 млрд активных на токен). Он превосходит все текущие открытые модели в математике, STEM и кодинге, а по мировым знаниям уступает только Gemini-3.1-Pro. Его производительность в решении кодовых задач на Codeforces достигает рейтинга 3206, что значительно выше среднего показателя в 1500 у человека. «Производительность V4-Pro сопоставима с лучшими в мире закрытыми моделями», — отмечают в компании. 🔹 DeepSeek-V4-Flash — компактная версия с 284 млрд параметров (13 млрд активных). Она сохраняет возможности рассуждения почти на уровне Pro-версии, но отличается меньшим
Оглавление

Китайская лаборатория DeepSeek наконец-то представила свой первый крупный релиз с начала 2025 года. DeepSeek V4 — это не просто обновление, а две флагманские LLM с открытым исходным кодом и открытыми весами, которые компания называет «почти на передовой, но за небольшую долю цены». Модели уже доступны в веб-версии и по API, а их вес можно скачать на Hugging Face.

айти журнал.

🤖 Две модели: Pro и Flash

-2

Новая серия включает две модели архитектуры MoE (Mixture-of-Experts):

🔹 DeepSeek-V4-Pro — флагманский вариант с 1,6 трлн параметров (49 млрд активных на токен). Он превосходит все текущие открытые модели в математике, STEM и кодинге, а по мировым знаниям уступает только Gemini-3.1-Pro. Его производительность в решении кодовых задач на Codeforces достигает рейтинга 3206, что значительно выше среднего показателя в 1500 у человека.

«Производительность V4-Pro сопоставима с лучшими в мире закрытыми моделями», — отмечают в компании.

🔹 DeepSeek-V4-Flash — компактная версия с 284 млрд параметров (13 млрд активных). Она сохраняет возможности рассуждения почти на уровне Pro-версии, но отличается меньшим размером, более высокой скоростью отклика и гораздо более выгодной ценой API.

Обе модели поддерживают контекст в 1 млн токенов — этого достаточно, чтобы единовременно обрабатывать романы вроде «Войны и мира».

⚡ Эффективность и интеграции

DeepSeek V4 может похвастаться выдающейся эффективностью. При работе с контекстом в 1 млн токенов V4-Pro требует всего 27% вычислительных ресурсов (FLOPs) и 10% объёма KV-кэша по сравнению с V3.2.

V4-Flash доводит эти показатели до 10% и 7% соответственно. Достичь такой эффективности удалось благодаря внедрению архитектуры DSA (DeepSeek Sparse Attention) и механизмам сжатия по измерению токенов.

Особое внимание разработчики уделили агентным возможностям. V4 легко интегрируется в Claude Code, OpenClaw и OpenCode, что делает её мощным инструментом для автоматизации кодинга и других задач.

-3

💰 Цены API и доступность

Попробовать новые модели можно в веб-версии и приложении DeepSeek (режим Expert — V4-Pro, Instant — V4-Flash), а также через DeepSeek API.

> «Интеграция проста и прозрачна. Достаточно изменить model_name на deepseek-v4-pro или deepseek-v4-flash, чтобы начать использовать новый мощный движок в ваших проектах», — поясняют разработчики.

Стоимость API:

🔸 V4-Pro — от 1,74 до 3,48 доллара за 1 млн токенов.

🔸 V4-Flash — всего от 0,14 до 0,28 доллара за 1 млн токенов.

Инженеры уже обеспечили поддержку адаптации на китайских чипах. По сообщениям, новинка уже полностью подготовлена к запуску на чипах Huawei Ascend 910C, а компания Cambricon официально объявила об успешной Day 0-адаптации V4 на своём оборудовании.

💎 Вердикт

DeepSeek совершила очередной прорыв, выпустив открытую модель, которая по многим параметрам не уступает лучшим закрытым аналогам. Сочетание гигантского контекста, впечатляющей эффективности и крайне низкой цены делает V4 серьёзным вызовом для OpenAI, Anthropic и Google. Особенно интересно, что DeepSeek уже готовится к запуску на китайских чипах, что в будущем может гарантировать стабильную работу сервиса даже в условиях санкций.

Как вы считаете, сможет ли DeepSeek V4 составить реальную конкуренцию лидерам рынка и изменить расстановку сил в мире ИИ? Делитесь мнением в комментариях 👇

❤️ Спасибо, что читаете нас! Если вам нравятся наши разборы важных новостей и вы хотите быть в курсе главных событий из мира технологий — поддержите нас. Подпишитесь на наш канал в Max по ссылке ниже. Это поможет нам развиваться и радовать вас новыми статьями. Оставайтесь с нами! 👇

🔗 https://max.ru/id532116117290_biz