Найти в Дзене
ProAi

DeepSeek торопится выпустить новую модель R2

Китайская компания DeepSeek стремительно продвигается к запуску своей новой модели искусственного интеллекта R2, которая станет преемницей январской версии R1, как сообщает Reuters. Модель R1 произвела настоящий фурор, превзойдя многие западные аналоги, несмотря на использование более слабых чипов Nvidia, что не только снизило ее стоимость, но и сделало её конкурентоспособной. Первоначально планировалось, что выход R2 состоится в начале мая 2025 года, однако теперь стартап ставит перед собой задачу как можно скорее вывести ее на рынок для укрепления своих позиций. Модель R2, по обещаниям разработчиков, станет ещё более мощной и функциональной по сравнению с R1. Ожидается, что она будет способна не только генерировать высококачественный программный код, но и эффективно рассуждать на множестве языков, выходя за рамки единственного английского языка. Это станет значительным шагом в развитии технологической области и может представлять собой поворотный момент в эволюции ИИ, как считает опе
Оглавление
   DeepSeek торопится выпустить новую модель R2
DeepSeek торопится выпустить новую модель R2

Китайский стартап DeepSeek ускоряет разработку новой модели ИИ R2

Китайская компания DeepSeek стремительно продвигается к запуску своей новой модели искусственного интеллекта R2, которая станет преемницей январской версии R1, как сообщает Reuters.

Модель R1 произвела настоящий фурор, превзойдя многие западные аналоги, несмотря на использование более слабых чипов Nvidia, что не только снизило ее стоимость, но и сделало её конкурентоспособной. Первоначально планировалось, что выход R2 состоится в начале мая 2025 года, однако теперь стартап ставит перед собой задачу как можно скорее вывести ее на рынок для укрепления своих позиций.

Обещания новой модели

Модель R2, по обещаниям разработчиков, станет ещё более мощной и функциональной по сравнению с R1. Ожидается, что она будет способна не только генерировать высококачественный программный код, но и эффективно рассуждать на множестве языков, выходя за рамки единственного английского языка. Это станет значительным шагом в развитии технологической области и может представлять собой поворотный момент в эволюции ИИ, как считает операционный директор индийского поставщика технологических услуг Zensar Виджаясимха Алилугхатта.

Влияние DeepSeek на рынок

Успех DeepSeek уже привёл к интеграции её моделей многими китайскими компаниями и государственными учреждениями. По меньшей мере 13 городских правительств и 10 государственных энергетических компаний Китая заявили о внедрении технологий DeepSeek. Такие технологические гиганты, как Lenovo, Baidu и Tencent, также делают ставку на модели этого стартапа.

Выход R2, вероятно, вызовет обеспокоенность в правительстве США, которое расценивает лидерство в области ИИ как национальный приоритет. Успешные разработки DeepSeek, включая модели R1 и V3, уже подстегнули некоторых западных технологических игроков изменить свои стратегии. Например, OpenAI снизила стоимость своих услуг, а Google с моделью Gemini ввел дисконтированные уровни доступа после успешного запуска R1.

Ответные меры со стороны конкурентов

В этом месяце OpenAI представила модель O3-Mini, оптимизированную под меньшие вычислительные мощности, что является прямым ответом на вызовы, брошенные DeepSeek. Кроме того, Microsoft и OpenAI начали расследование в отношении возможного несанкционированного использования своих технологий китайским стартапом.

Несмотря на отсутствие официальных комментариев со стороны DeepSeek, эксперты предполагают, что выход R2 может ещё больше ослабить позиции доминирующих игроков в сфере ИИ-разработок и стимулировать активизацию интеграции технологий DeepSeek со стороны китайских государственных структур и бизнеса.

Стратегические инициативы DeepSeek

Компания также предпринимает шаги для открытия доступа к двум ключевым технологиям: DeepEP и FlashMLA. DeepEP представляет собой первую библиотеку с открытым исходным кодом, предназначенную для оптимизации процессов коммуникации в моделях с архитектурой Mix-of-Experts (MoE), которая сыграла важную роль в разработке модели R1. FlashMLA — это высокопроизводительный декодирующий модуль для графической архитектуры NVIDIA Hopper, который демонстрирует значительные показатели производительности.

🔔 Подписывайтесь на мой канал Telegram!

В канале я буду публиковать свой опыт освоения автоматизации и взаимодействия с нейросетями, новости в мире ИИ, полезные гайды и много полезной информации!