Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

Инсайдеры: новая версия DeepSeek R2 станет конкурентом GPT-4

К выпуску готовится новая версия ИИ-модели DeepSeek, и в сети появляется всё больше подробностей о разработке китайской компании. Недавно инсайдеры сообщили, что премьера нейросети сдвинется с августа на более поздний срок — зато к моменту релиза ощутимо «прокачается» для конкуренции с ChatGPT. По данным The Information со ссылкой на источник, близкий к компании, релиз DeepSeek R2 задерживается из-за ограниченного доступа к вычислительным ресурсам. Сейчас NVIDIA не может свободно экспортировать графические ускорители в Китай, поэтому разработчики перешли на модель HUAWEI Ascend 910B, которая в масштабе кластера обеспечивает около 91% эффективности NVIDIA A100. Кроме того, по словам инсайдеров, генеральный директор DeepSeek Лян Вэньфэн по-прежнему недоволен производительностью модели на текущем этапе её развития. Ожидается, что ситуация вскоре может улучшиться в свете нового торгового соглашения NVIDIA и AMD с правительством США: компании смогут экспортировать чипы при условии 15-процен
   Инсайдеры: новая версия DeepSeek R2 станет конкурентом GPT-4
Инсайдеры: новая версия DeepSeek R2 станет конкурентом GPT-4

К выпуску готовится новая версия ИИ-модели DeepSeek, и в сети появляется всё больше подробностей о разработке китайской компании. Недавно инсайдеры сообщили, что премьера нейросети сдвинется с августа на более поздний срок — зато к моменту релиза ощутимо «прокачается» для конкуренции с ChatGPT.

-2

По данным The Information со ссылкой на источник, близкий к компании, релиз DeepSeek R2 задерживается из-за ограниченного доступа к вычислительным ресурсам. Сейчас NVIDIA не может свободно экспортировать графические ускорители в Китай, поэтому разработчики перешли на модель HUAWEI Ascend 910B, которая в масштабе кластера обеспечивает около 91% эффективности NVIDIA A100.

Кроме того, по словам инсайдеров, генеральный директор DeepSeek Лян Вэньфэн по-прежнему недоволен производительностью модели на текущем этапе её развития. Ожидается, что ситуация вскоре может улучшиться в свете нового торгового соглашения NVIDIA и AMD с правительством США: компании смогут экспортировать чипы при условии 15-процентных отчислений от выручки.

По неофициальным сведениям, DeepSeek R2 с 1,2 трлн параметров будет позиционироваться как конкурент GPT-4 (около 1,76 трлн). По слухам, обучение нейросети стоило на 97% дешевле, чем потратила на указанную модель OpenAI: это позволит DeepSeek предложить клиентам более низкую цену доступа по API.

Точная дата релиза DeepSeek R2 пока не объявлена.