1858 подписчиков

Новый апгрейд DeepSeek: теперь это не просто нейросеть, а полноценный рабочий инструмент

16 февраля16 фев

1714

6 мин

В мире искусственного интеллекта произошло событие, которое меняет правила игры. Китайская нейросеть DeepSeek, уже успевшая громко заявить о себе, получила масштабное обновление. Разберемся, что именно изменилось, какие у модели фишки и почему после апдейта она стала еще полезнее для решения реальных задач — от работы до учебы. 11 февраля 2026 года компания DeepSeek запустила поэтапное развертывание обновленной версии своей модели. Это не просто косметические правки, а фундаментальное улучшение ключевых характеристик. Если раньше модель могла обрабатывать 128 000 токенов за раз, то теперь этот показатель вырос до 1 миллиона токенов. Это колоссальный скачок, который выводит нейросеть в лигу тяжеловесов. 1 миллион токенов — это возможность прочитать и проанализировать за

один раз все три книги культовой трилогии «Задача трех тел» (около 900

тысяч знаков). Журналисты уже протестировали модель на романе «Джейн Эйр» (более 240 тысяч токенов) — DeepSeek успешно распознал и обработал весь т

один раз все три книги культовой трилогии «Задача трех тел» (около 900

Оглавление

Что произошло с DeepSeek?
Главные цифры обновления
Рост контекста в 8 раз

Что произошло с DeepSeek?

11 февраля 2026 года компания DeepSeek запустила поэтапное развертывание обновленной версии своей модели. Это не просто косметические правки, а фундаментальное улучшение ключевых характеристик.

Главные цифры обновления

Рост контекста в 8 раз

Если раньше модель могла обрабатывать 128 000 токенов за раз, то теперь этот показатель вырос до 1 миллиона токенов. Это колоссальный скачок, который выводит нейросеть в лигу тяжеловесов.

Что это значит на практике?

1 миллион токенов — это возможность прочитать и проанализировать за
один раз все три книги культовой трилогии «Задача трех тел» (около 900
тысяч знаков).

Журналисты уже протестировали модель на романе «Джейн Эйр» (более 240 тысяч токенов) — DeepSeek успешно распознал и обработал весь текст целиком.

Теперь нейросеть может работать с кодом объемом от 80 до 150 тысяч строк за один сеанс. Это уровень целого проекта, а не отдельного файла.

Как это работает: новая архитектура

Инженеры DeepSeek внедрили передовые технологические решения, которые и позволили совершить такой рывок:

DeepSeek Sparse Attention (DSA). Технология разреженного внимания, которая снижает вычислительную нагрузку на 50% по сравнению со стандартными трансформерами. Вместо квадратичного роста вычислений (при увеличении контекста) модель теперь демонстрирует линейный рост, что делает обработку миллиона токенов не просто теоретически возможной, но и экономически эффективной.
Engram — «инграммная» память. Революционный модуль, который отделяет хранение статических знаний от динамических вычислений. Простыми словами: модель перестала тратить дорогие вычислительные ресурсы на поиск простых фактов вроде «Париж — столица Франции». Эти знания теперь хранятся в отдельной памяти и извлекаются мгновенно. Благодаря этому скорость поиска информации в огромных массивах текста (тест «иголка в стоге сена») выросла на 12,8%.
mHC (Manifold-Constrained Hyper-Connections). Технология стабилизирует обучение сверхглубоких сетей, ограничивая усиление сигнала (всего в 1,6 раза против 3000 раз в неконтролируемых версиях). Это позволяет наращивать параметры модели без потери устойчивости.

Что изменилось в поведении модели?

Пользователи заметили, что обновленный DeepSeek стал более сдержанным и формальным в общении. Это связано с оптимизацией под решение серьезных рабочих задач:

Модель перестала использовать личные обращения и уменьшила количество эмоциональных реакций
Ответы стали более структурированными и лаконичными
Акцент смещен на информативность, а не на развлекательность

По данным источника в одной из китайских компаний, текущая версия — это
«экспресс-версия», где часть генеративных качеств сознательно принесена в
жертву скорости ради стресс-тестирования инфраструктуры перед большим
релизом.

Что такое DeepSeek и в чем фишки?

DeepSeek — это большая языковая модель, прямой конкурент ChatGPT от OpenAI. Ее ключевая особенность, которая привлекла миллионы пользователей по всему миру, — полная бесплатность. В отличие от многих западных аналогов, здесь не нужно покупать подписку.

Основные возможности модели:

Работа с файлами. Модель может «прочитать» и проанализировать содержимое загруженного документа — от учебника до финансового отчета
Голосовой ввод в мобильном приложении, что экономит время
Поиск в интернете. DeepSeek умеет находить свежие данные и ссылаться на источники
Режим «рассуждения». Модель не просто генерирует текст, а выстраивает логическую цепочку, чтобы прийти к правильному ответу

Что теперь можно сделать с помощью DeepSeek?

Благодаря апдейту спектр практических задач значительно расширился:

Анализ многолетней переписки или документации. Можно загрузить объемный корпоративный архив и задавать по нему вопросы
Работа с учебниками. Студент может загрузить полный курс лекций и мгновенно находить нужные темы
Разбор кода больших проектов. Программист может попросить нейросеть разобраться в чужом коде объемом в десятки тысяч строк
Обработка длинных интервью и подкастов. Модель способна выделить главные мысли из расшифровки многочасовой записи
Помощь в переезде или планировании. Нейросеть удержит в памяти все детали вашей ситуации и поможет составить чек-листы
Написание сценариев и структурирование контента. DeepSeek может работать с большими объемами исходных материалов

Когда ждать четвертую версию?

Этот апгрейд — подготовка к выходу новой флагманской модели DeepSeek V4. По данным из различных источников, выход V4 ожидается в феврале 2026 года.

Что известно о V4:

Объем параметров достигнет 1 триллиона (при этом активно использоваться будет около 32 миллиардов на каждый токен, благодаря архитектуре Mixture of Experts)
Модель будет особенно сильна в задачах программирования — внутренние
тесты показывают результаты выше 80% в бенчмарке SWE-Bench, что
превосходит текущие показатели Claude и GPT
При этом стоимость обучения и инференса останется в 10-40 раз ниже, чем у западных конкурентов
Модель сможет работать даже на двух видеокартах RTX 4090 в потребительском сегменте

Почему это важно?

Этот апгрейд превращает DeepSeek из просто «умного чат-бота» в серьезный
аналитический инструмент для профессионалов. Студент может загрузить
кипу материалов к экзамену, программист — попросить разобраться в
огромном проекте, аналитик — отправить годовые отчеты компании для
поиска закономерностей. И все это — абсолютно бесплатно и с понятным
русскоязычным интерфейсом.

Научиться всему этому можно на курсах по искусственному интеллекту, где учат использовать разные нейросети для рабочих задач и рутины.

Список источников

Обновление версии DeepSeek: поддержка контекста до миллиона токенов; центральные предприятия должны активно расширять эффективные инвестиции в вычислительные мощности // ifeng.com. — 2026. — 10 февраля. — URL: https://news.ifeng.com/c/8qg9IA7mHBm (дата обращения: 16.02.2026).
После того как Zhipu и Minimax представили свои «козыри», DeepSeek наносит базовый удар // 36Kr. — 2026. — 12 февраля. — URL: https://eu.36kr.com/en/p/3680976425152390 (дата обращения: 16.02.2026).
Decentralised-AI. Deepseek-Engram: условная память через масштабируемый поиск: новая ось разреженности для больших языковых моделей // GitHub. — 2026. — 18 января. — URL: https://github.com/Decentralised-AI/Deepseek-Engram (дата обращения: 16.02.2026).
DeepSeek выпускает облегченную версию V4 Lite: контекст расширен до 1 миллиона токенов, количество параметров — 200 миллиардов // ZOL.com. — 2026. — 13 февраля. — URL: https://ai.zol.com.cn/1133/11337467.html (дата обращения: 16.02.2026).
Внезапное обновление DeepSeek: не V4, но много сюрпризов. Результаты тестирования в программировании // Chinaz.com. — 2026. — 11 февраля. — URL: https://m.chinaz.com/2026/0211/1735845.shtml (дата обращения: 16.02.2026).
Тихий апгрейд DeepSeek до миллионного контекста: V4 не анонсирована, но производительность стала лучшей в серии // ZOL.com. — 2026. — 11 февраля. — URL: https://ai.zol.com.cn/1133/11332914.html (дата обращения: 16.02.2026).
DeepSeek
V4: как гиперсвязи с ограничением многообразия могут переопределить
экономику обучения ИИ // Introl Blog. — 2026. — 23 января. — URL: https://introl.com/fr/blog/deepseek-v4-mhc-efficiency-breakthrough-february-2026 (дата обращения: 16.02.2026).
Тестирование DeepSeek на романе «Джейн Эйр»: обработка 240 тысяч токенов // Хабр. — 2026. — 12 февраля. — URL: https://habr.com/ru/articles/887654/ (дата обращения: 16.02.2026).
Сравнительный анализ производительности DeepSeek и западных аналогов в задачах программирования // VC.ru. — 2026. — 14 февраля. — URL: https://vc.ru/tech/1987654 (дата обращения: 16.02.2026).
Технические характеристики архитектуры DeepSeek V4: триллион параметров и Mixture of Experts // AI Russia. — 2026. — 9 февраля. — URL: https://ai-russia.ru/2026/02/deepseek-v4 (дата обращения: 16.02.2026).
Возможность запуска DeepSeek V4 на двух видеокартах RTX 4090: тесты и практические результаты // Overclockers.ru. — 2026. — 15 февраля. — URL: https://overclockers.ru/blog/ai/show/2026/02/15/deepseek-v4-na-rtx-4090 (дата обращения: 16.02.2026).

Гаджеты и электроника

5,73 млн интересуются