359 подписчиков

DeepSeek-V4: архитектура на 1,6 трлн параметров и контекст 1 млн токенов

25 апреля25 апр

2 мин

Компания DeepSeek выпустила четвертую версию своих нейросетей. Обновление направлено на работу с огромными массивами данных и сложные агентские задачи.

Две новые модели: Pro и Flash

Разработчики разделили линейку на два основных направления, чтобы закрыть разные потребности пользователей:

DeepSeek-V4-Pro. Флагманское решение с архитектурой Mixture-of-Experts. Общее количество параметров

Две новые модели: Pro и Flash

DeepSeek-V4-Pro. Флагманское решение с архитектурой Mixture-of-Experts. Общее количество параметров

Две новые модели: Pro и Flash

DeepSeek-V4-Pro. Флагманское решение с архитектурой Mixture-of-Experts. Общее количество параметров составляет 1,6 трлн, из которых 49 млрд активны. Модель оптимизирована для глубокой логики, программирования и сложных аналитических цепочек. Это инструмент для тех, кому важна максимальная точность и проработка деталей.

DeepSeek-V4-Flash. Более экономичная версия, в которой 284 млрд параметров (13 млрд активных). Она нацелена на высокую скорость работы при сохранении высокого качества рассуждений, сопоставимого с версией Pro. Это решение для повседневных задач, где критически важна скорость ответа.

Технические изменения

Контекстное окно 1 миллион токенов. Это основное новшество. Модель способна обрабатывать до миллиона токенов за один запрос. На практике это значит, что в чат можно загружать длинные технические документы, целые репозитории кода или многочасовые записи разговоров целиком. Нейросеть удерживает весь этот объем в памяти и опирается на него при составлении ответа.

Режимы работы: Think и Non-think. Пользователь теперь сам выбирает способ генерации ответа:

Think. Модель выстраивает внутреннюю логическую цепочку, пишет черновик размышлений перед тем, как выдать финальный результат. Это полезно для математических вычислений, написания сложного программного кода или планирования архитектурных задач, где важно не допустить ошибки в последовательности действий.

Non-think. Прямая генерация ответа без лишних раздумий. Оптимальный вариант для общения, перевода текстов или получения кратких выжимок из статей.

Эффективность работы. Благодаря архитектурным инновациям, модели стали значительно экономнее расходовать ресурсы при работе с длинным контекстом. По сравнению с предыдущими итерациями, потребление памяти сократилось, что позволяет модели работать стабильнее при выполнении объемных задач.

Где попробовать

Доступ к новым моделям уже открыт через следующие площадки:

Официальный сайт: deepseek.com — основной интерфейс для прямого общения с чат-ботом. Рекомендуется использовать этот вариант для тестирования функций работы с файлами.

Мобильное приложение: Доступно в официальных магазинах приложений для iOS и Android. Удобно для мобильной работы, если требуется быстрый доступ к нейросети на ходу.

API: Для тех, кто интегрирует нейросети в свои сервисы, телеграм-боты или системы автоматизации, работа возможна через адрес api.deepseek.com. Модели Pro и Flash уже доступны в списке методов. Важный момент для разработчиков: старые идентификаторы запросов будут поддерживаться до 24 июля 2026 года, после чего потребуется переход на новые наименования моделей (deepseek-v4-pro и deepseek-v4-flash).

Open Source: Веса моделей опубликованы на платформе Hugging Face. Это позволяет запускать нейросеть на собственных мощностях, если у вас есть соответствующее оборудование.

Новая версия DeepSeek — это закономерный шаг в сторону увеличения контекста и улучшения логических способностей нейросетей. Инструменты стали гибче: можно выбирать между мощью Pro-версии и скоростью Flash-версии, а также настраивать модель на режим рассуждений в зависимости от сложности задачи. Это делает систему пригодной для решения задач профессионального уровня, от анализа документации до написания функционального кода.