25 подписчиков

DeepSeek-V3: новая китайская модель бросает вызов OpenAI

26 марта 202526 мар 2025

1 мин

Китайский стартап DeepSeek выпустил новую версию своей популярной языковой модели — DeepSeek-V3-0324. Обновлённая модель вызвала серьезный ажиотаж, став прямым конкурентом знаменитому ChatGPT от OpenAI. Что нового: • Повышенная скорость обработки: DeepSeek-V3 генерирует текст со скоростью до 60 токенов в секунду, что в три раза быстрее предыдущей версии. • Совершенная архитектура модели: модель основана на технологии Mixture-of-Experts (MoE) с рекордными 671 миллиардом параметров, что значительно увеличивает её эффективность. • Расширенный объем обучения: обучена на 14,8 триллиона токенов, что позволяет ей генерировать максимально естественный и человекоподобный текст. • Улучшенные навыки рассуждения и программирования: модель показала впечатляющие результаты в решении сложных задач и программировании. • Расширенное окно контекста: модель поддерживает обработку последовательностей до 128 тысяч токенов, упрощая работу с длинными текстами и сложными задачами. • Доступность в открытом д

Что нового:

• Повышенная скорость обработки: DeepSeek-V3 генерирует текст со скоростью до 60 токенов в секунду, что в три раза быстрее предыдущей версии.

• Совершенная архитектура модели: модель основана на технологии Mixture-of-Experts (MoE) с рекордными 671 миллиардом параметров, что значительно увеличивает её эффективность.

• Расширенный объем обучения: обучена на 14,8 триллиона токенов, что позволяет ей генерировать максимально естественный и человекоподобный текст.

• Улучшенные навыки рассуждения и программирования: модель показала впечатляющие результаты в решении сложных задач и программировании.

• Расширенное окно контекста: модель поддерживает обработку последовательностей до 128 тысяч токенов, упрощая работу с длинными текстами и сложными задачами.

• Доступность в открытом доступе: DeepSeek-V3 доступна на популярной платформе Hugging Face, что способствует активному развитию сообщества.

Однако успех DeepSeek привёл и к конфликтам. OpenAI уже заявила о возможном нарушении интеллектуальной собственности, так как результаты моделей оказались очень близкими на тестах GPQA и MATH-500.

Развитие DeepSeek сильно повлияло на индустрию, вызвав глобальные изменения в сфере искусственного интеллекта. Более дешёвые и эффективные модели могут ускорить появление новых технологий и повысить доступность ИИ-решений, но одновременно с этим поднимаются вопросы безопасности и этичности.

Что думаете о таких моделях вы — готовы перейти на новый уровень или останетесь верны проверенному ChatGPT?