Найти в Дзене
4pda.to

Китай победил в ИИ-гонке? О чём говорит успех DeepSeek

Последнюю неделю ИИ-индустрия гудит: китайский стартап DeepSeek выпустил модели искусственного интеллекта V3 и R1, которые почти не уступают продуктам OpenAI, но намного дешевле в обслуживании. В понедельник акции NVIDIA упали на 17%. Компания под руководством Дженсена Хуанга считается главным выгодоприобретателем от ИИ-лихорадки, поскольку изготавливает передовые чипы для обучения нейросетевых моделей. Шок задел котировки других игроков рынка, в том числе Google, Microsoft, Amazon и TSMC. Дело в том, что DeepSeek при скромных ресурсах удалось добиться результатов, сопоставимых с топовыми LLM от OpenAI. Для обучения модели V3 инженеры потратили 2,8 млн часов работы GPU NVIDIA H800. С учётом того, что аренда мощностей такого GPU составляет 2 доллара за час, общие затраты на обучение превысили 5,6 млн долларов. Для сравнения, на тренинг GPT-4 компания Сэма Альтмана потратила свыше $100 млн. Всё становится ещё интереснее, если вспомнить, что США запретили экспорт передовых чипов для обуче
Оглавление
   Китай победил в ИИ-гонке? О чём говорит успех DeepSeek
Китай победил в ИИ-гонке? О чём говорит успех DeepSeek

Последнюю неделю ИИ-индустрия гудит: китайский стартап DeepSeek выпустил модели искусственного интеллекта V3 и R1, которые почти не уступают продуктам OpenAI, но намного дешевле в обслуживании.

-2

NVIDIA не в восторге

В понедельник акции NVIDIA упали на 17%. Компания под руководством Дженсена Хуанга считается главным выгодоприобретателем от ИИ-лихорадки, поскольку изготавливает передовые чипы для обучения нейросетевых моделей. Шок задел котировки других игроков рынка, в том числе Google, Microsoft, Amazon и TSMC.

Дело в том, что DeepSeek при скромных ресурсах удалось добиться результатов, сопоставимых с топовыми LLM от OpenAI. Для обучения модели V3 инженеры потратили 2,8 млн часов работы GPU NVIDIA H800. С учётом того, что аренда мощностей такого GPU составляет 2 доллара за час, общие затраты на обучение превысили 5,6 млн долларов. Для сравнения, на тренинг GPT-4 компания Сэма Альтмана потратила свыше $100 млн.

-3

Всё становится ещё интереснее, если вспомнить, что США запретили экспорт передовых чипов для обучения искусственного интеллекта в Китай (а ещё в Россию, Беларусь, Иран и ряд других стран). Ускорители H800 не подпадают под ограничения, но если бы DeepSeek имела в распоряжении топовый H100, затраты на создание модели оказались бы ещё ниже.

Другое важное отличие китайских моделей — публикация параметров в открытый доступ. Любой желающий может доработать модель под себя. Или запустить технологию на собственном оборудовании.

Обычных потребителей привлекает доступность. Воспользоваться «рассуждающей» моделью DeepSeek-R1 можно бесплатно, тогда как аналог от OpenAI доступен лишь в платной подписке. Поэтому неудивительно, что приложение DeepSeek взлетело на первую строчку американского App Store.

Не DeepSeek единым

До недавнего времени о DeepSeek слышали немногие. На китайском рынке блистали корпорации с бездонными бюджетами — Alibaba и Tencent. Например, Alibaba Cloud выпустила свыше 100 моделей с открытым исходным кодом, в том числе Qwen2.5-1M и Qwen2.5-Instruct-1M с контекстным окном в миллион токенов.

-4

Но на фоне успеха DeepSeek всё чаще слышно о других стартапах из Поднебесной. Так, свежая модель MiniMax-01 отличается рекордным размером контекста — 4 млн токенов. А компания 01.AI предложила высокоэффективную LLM под названием Yi-Large.

Что в итоге

Любопытно, что почти одновременно с бумом DeepSeek администрация Трампа совместно с OpenAI, SoftBank и Oracle анонсировала проект Stargate: в течение четырёх лет на создание инфраструктуры для разработки искусственного интеллекта будут инвестированы ошеломительные 500 млрд долларов.

Тем временем стартап DeepSeek наглядно доказал, что для создания передовых моделей ИИ не обязательно тратить огромные деньги. Это отметил даже новоизбранный президент США.

-5

Есть ещё один вывод из этой истории: разрушен нарратив о том, что Китай значительно отстаёт от лидеров ИИ-индустрии. Многие эксперты предполагали, что Штаты опережают азиатских разработчиков по крайней мере на несколько лет.

Но в целом достижения азиатских программистов, конечно, пойдут индустрии на пользу. Глава Microsoft Сатья Наделла напомнил про парадокс Джевонса: когда находится способ более эффективного применения ресурса, спрос на него не падает, а растёт. Стартапы получат наглядный пример того, что добиться впечатляющих результатов можно и без миллиардных бюджетов. А это, в свою очередь, запустит новую волну заказов топовых чипов от NVIDIA и других производителей.

Deep Seek
20,9 тыс интересуются