5085 подписчиков

DeepSeek представила бесплатные ИИ-модели V4-Pro и V4-Flash, сопоставимые с Claude Opus 4.6

ВчераВчера

1 мин

DeepSeek выпустила две новые модели: DeepSeek-V4-Pro и DeepSeek-V4-Flash – они получили улучшенные возможности рассуждения и производительности. Версии различаются размером и профилем производительности. Обе модели поддерживают контекстное окно до одного миллиона токенов и построены на архитектуре «смесь экспертов». Они работают как в стандартном режиме, так и в режиме мышления, где интенсивность можно регулировать с помощью параметра reasoning_effort. По заявлениям разработчиков, DeepSeek-V4-Pro превосходит все доступные модели с открытым исходным кодом в математике, науке и программировании. В задачах общего знания она немного уступает Gemini-Pro-3.1, но опережает другие открытые модели. Также отмечаются улучшенные агентные возможности. Внутренние тесты показали, что пользовательский опыт превосходит Claude Sonnet 4.5, а качество ответов сопоставимо с Opus 4.6 в стандартном режиме. Уже сейчас V4-Pro используется как основная модель для задач программирования. Технически DeepSeek-V4 и

Оглавление

Особенности
Результаты тестов
Цены

DeepSeek выпустила две новые модели: DeepSeek-V4-Pro и DeepSeek-V4-Flash – они получили улучшенные возможности рассуждения и производительности.

Особенности

Версии различаются размером и профилем производительности. Обе модели поддерживают контекстное окно до одного миллиона токенов и построены на архитектуре «смесь экспертов». Они работают как в стандартном режиме, так и в режиме мышления, где интенсивность можно регулировать с помощью параметра reasoning_effort.

DeepSeek-V4-Pro содержит в общей сложности 1,6 триллиона параметров, из которых 49 миллиардов активны. По данным DeepSeek, модель демонстрирует производительность, сопоставимую с ведущими закрытыми решениями, особенно в задачах математики, STEM-дисциплин и программирования.
DeepSeek-V4-Flash включает 284 миллиарда параметров, из которых 13 миллиардов активны. Она быстрее и экономичнее, показывая схожие результаты с версией Pro в простых задачах, но уступает ей в более сложных.

Результаты тестов

По заявлениям разработчиков, DeepSeek-V4-Pro превосходит все доступные модели с открытым исходным кодом в математике, науке и программировании. В задачах общего знания она немного уступает Gemini-Pro-3.1, но опережает другие открытые модели. Также отмечаются улучшенные агентные возможности.

Внутренние тесты показали, что пользовательский опыт превосходит Claude Sonnet 4.5, а качество ответов сопоставимо с Opus 4.6 в стандартном режиме. Уже сейчас V4-Pro используется как основная модель для задач программирования.

Технически DeepSeek-V4 использует новый механизм внимания, сжимающий токены, в сочетании с технологией DeepSeek Sparse Attention. Это позволяет поддерживать длинный контекст при заметно меньших вычислительных затратах и требованиях к памяти по сравнению с классическими подходами.

Цены

Ключевой особенностью DeepSeek V4 стала агрессивная ценовая политика. Обе модели заметно дешевле прямых конкурентов. DeepSeek-V4-Flash – одна из самых доступных моделей в своем классе и даже дешевле OpenAI GPT-5.4 Nano. Стоимость составляет $0,14 за миллион входных токенов и $0,28 за миллион выходных.

DeepSeek-V4-Pro, в свою очередь, остается одной из самых доступных высокопроизводительных моделей и стоит значительно меньше, чем Claude Sonnet 4.6 или GPT-5.4. Цена составляет $1,74 за миллион входных токенов и $3,48 за миллион выходных.

Как и раньше, модели можно использовать прямо на сайте полностью бесплатно.

Электроника

81,9 тыс интересуются