Найти в Дзене
avencores.

DeepSeek V3.1 — крупное обновление LLM: что добавили?

Компания DeepSeek выпустила обновление своей большой языковой модели до версии V3.1. Обновлённая модель остаётся доступной бесплатно, при этом по ряду показателей демонстрирует уровень, сопоставимый с именитыми платными конкурентами. DeepSeek V3.1 — это Mixture-of-Experts модель с сотнями миллиардов параметров. Всего заявлено около 685 млрд параметров, из которых активно используется примерно 37 млрд на каждый токен. Новая версия получила поддержку увеличенного контекстного окна до 128 000 токенов, что сопоставимо с объёмом большой книги в 400 страниц. Это даёт возможность обрабатывать очень длинные тексты и вести продолжительные диалоги без потери контекста. * Увеличенное окно контекста — до 128 000 токенов, что значительно расширяет возможности анализа больших массивов данных. * Улучшенное «мышление» (reasoning) — обновлённая архитектура с доработанными токенами обеспечивает более точные логические выводы и структурированные ответы. * Интеграция с веб-ресурсами — модель способна испо
Оглавление

Компания DeepSeek выпустила обновление своей большой языковой модели до версии V3.1. Обновлённая модель остаётся доступной бесплатно, при этом по ряду показателей демонстрирует уровень, сопоставимый с именитыми платными конкурентами.

Основное о релизе

DeepSeek V3.1 — это Mixture-of-Experts модель с сотнями миллиардов параметров. Всего заявлено около 685 млрд параметров, из которых активно используется примерно 37 млрд на каждый токен. Новая версия получила поддержку увеличенного контекстного окна до 128 000 токенов, что сопоставимо с объёмом большой книги в 400 страниц. Это даёт возможность обрабатывать очень длинные тексты и вести продолжительные диалоги без потери контекста.

Основные возможности

* Увеличенное окно контекста — до 128 000 токенов, что значительно расширяет возможности анализа больших массивов данных.

* Улучшенное «мышление» (reasoning) — обновлённая архитектура с доработанными токенами обеспечивает более точные логические выводы и структурированные ответы.

* Интеграция с веб-ресурсами — модель способна использовать данные в реальном времени, что повышает актуальность и точность ответов.

* Доступность — бесплатный доступ к демо и возможность использования API делают модель удобной как для разработчиков, так и для обычных пользователей.

Замеченные результаты и тесты

По неофициальным данным, в бенчмарках по программированию DeepSeek V3.1 показала результат 71,4% точности генерации кода, что даже выше, чем у некоторых конкурентов премиум-класса.

Изменения в интерфейсе

Пользователи заметили, что на сайте DeepSeek исчезла кнопка активации режима R1 (DeepThink-R1). Это может означать, что новая модель теперь включена по умолчанию, предлагая пользователю сразу унифицированный режим работы с расширенным контекстом и улучшенными возможностями reasoning.

Преимущества

* Работа с очень длинными текстами без потери связности.

* Более последовательные и логически выверенные ответы.

* Бесплатный доступ, что делает модель доступной широкому кругу пользователей.

* Совместимость с современными сценариями использования: анализ документов, программирование, исследования.

Перейти на сайт

⬇️Поддержать автора⬇️

✅SBER: 2202 2050 7215 4401