Китайская компания DeepSeek выпустила новую языковую модель DeepSeek V3.1, которая сразу вызвала ажиотаж в ИИ-сообществе. Без всяких анонсов и презентаций она появилась на платформе Hugging Face — и моментально стала поводом для сравнения с передовыми ИИ от OpenAI и Anthropic. По производительности DeepSeek V3.1 сопоставима с GPT-5 и Claude 4, но стоит почти в 100 раз дешевле. Модель получила гибридную архитектуру, объединяющую логическое мышление, чат и программирование в одной системе. Она работает с контекстом до 128 тысяч токенов, что примерно соответствует 400-страничной книге. При этом отвечает быстрее, чем модели, рассчитанные только на анализ текста. Разработчики могут выбирать режим точности, чтобы настроить модель под своё оборудование — это делает систему гибкой и универсальной. Внутри обнаружены специальные токены, позволяющие DeepSeek в реальном времени выполнять поиск в интернете и моделировать «мышление». Это выводит модель на новый уровень — раньше подобные попытки (нап
DeepSeek V3.1 — китайский аналог GPT-5, но почти бесплатно
20 августа 202520 авг 2025
14
1 мин