Согласно данным из китайских отраслевых источников и технических публикаций, активно обсуждается возможный выход DeepSeek R2. Система может предложить существенно более низкую стоимость работы по сравнению с западными аналогами. Инсайдеры утверждают, что DeepSeek R2 построена на гибридной архитектуре MoE (Mixture of Experts) с 1,2 триллиона параметров — вдвое больше, чем у предыдущей версии R1. Если верить утечкам, стоимость обработки токенов у новой модели окажется на 97,4% ниже, чем у GPT-4. Для бизнесов, активно использующих ИИ, это может означать существенную экономию. Особый интерес вызывает аппаратная часть проекта. Модель полностью обучали на китайских чипах Huawei Ascend 910B, достигнув 82% загрузки кластера. Это демонстрирует растущую независимость китайского ИИ-сектора от западных технологий. Вычислительная мощность системы во время обучения составила 512 PFLOPS при точности FP16. Первая версия DeepSeek R1 уже показала, что китайские разработчики могут создавать конкурентоспо
В китайских отраслевых источниках начинают циркулировать слухи о выходе DeepSeek R2
27 апреля 202527 апр 2025
229
1 мин