Китайский стартап DeepSeek выпустил новую версию своей популярной языковой модели — DeepSeek-V3-0324. Обновлённая модель вызвала серьезный ажиотаж, став прямым конкурентом знаменитому ChatGPT от OpenAI. Что нового: • Повышенная скорость обработки: DeepSeek-V3 генерирует текст со скоростью до 60 токенов в секунду, что в три раза быстрее предыдущей версии. • Совершенная архитектура модели: модель основана на технологии Mixture-of-Experts (MoE) с рекордными 671 миллиардом параметров, что значительно увеличивает её эффективность. • Расширенный объем обучения: обучена на 14,8 триллиона токенов, что позволяет ей генерировать максимально естественный и человекоподобный текст. • Улучшенные навыки рассуждения и программирования: модель показала впечатляющие результаты в решении сложных задач и программировании. • Расширенное окно контекста: модель поддерживает обработку последовательностей до 128 тысяч токенов, упрощая работу с длинными текстами и сложными задачами. • Доступность в открытом д