«Больше инвестиций не обязательно приводит к большему количеству инноваций. В противном случае крупные компании захватили бы все инновации», — сказал Лян Вэньфэн, основатель DeepSeek.
Новостные ленты всколыхнулись от новости о том, что компания из Китая – DeepSeek, по сути стартап со штатом 200 человек, совершила просто рывок в области искусственного интеллекта, создав нейросеть, которая не только не уступает известному ChatGPT, но и превосходит его. При этом объем инвестиций в китайский проект в тысячи раз меньше, чем понадобился для создания ChatGPT. Китайцы, в условия блокады поставок чипов той же Nevida, на которые полагались американцы при разработке ChatGPT, пошли своим путем – они применили глубокий семантический анализ, полностью изменив процесс обучения нейросети, таким образом, добившись колоссального успеха.
Что такое DeepSeek?
Компания основана в 2023 году Лян Вэньфэном, руководителем хедж-фонда High-Flyer, специализирующегося на инвестициях в ИИ. DeepSeek создает модели с открытым кодом. Что это значит? А это значит, что другие разработчики могут проверять и улучшать ПО модели. Компания предоставила лицензию частным лицам, заинтересованным в разработке чат-ботов с применением технологии, использованной в R1. После выхода приложения, менее чем за месяц R1 возглавил список загрузок в США и не только. Презентация приложения состоялась в ноябре 2024 и с того момента к компании были прикованы взгляды специалистов.
На волне этой информации, инвесторы логично рассудили, что прорыв китайского стартапа может серьезно подорвать лидерство американских компаний, акции которых в результате рухнули, и это все на фоне растущей конкуренции между двумя мировыми центрами. Ведь все помнят недавнее заявление Трампа о желании инвестировать 500 млрд долларов в создание Stargate.
Вообще, складывается ощущение, что эта гонка напоминает историю создания ядерной бомбы – кто первый встал, того и тапки и когда, казалось, что лидерство США в этом процессе непоколебимо… выстрелил DeepSeek. Похоже на эффект, когда СССР смог разработать и получить собственное ядерное оружие в противовес, имеющемуся у американцев.
Исследование DeepSeek ставит под сомнение необходимость миллиардных инвестиций, компания наглядно продемонстрировала, что для достижения такого результата объем денежных вливаний не всегда имеет решающее значение.
Так что же такое этот DeepSeek и почему его прорыв сравнивают с прорывом в освоении космоса СССР?
Стартапу DeepSeek чуть больше года, команде удалось создать модель рассуждающего ИИ и конкурентов в США повергла в шок сама возможность появления чего-то более технологичного, чем есть у них и это при объеме инвестиции со стороны Китая в объеме 6 (в некоторых источниках 12) миллионов долларов, что никак не сопоставимо с средствами, вкладываемыми американскими компаниями Open AI, Meta и другими. Для работы созданной модели необходимо 2000 ускорителей, при этом для работы того же Open AI это цифра составляет 100 000.
Что такое ускорители?
Нейронный процессор (англ. Neural Processing Unit, NPU или ИИ-ускоритель англ. AI accelerator) — это специализированный класс микропроцессоров и сопроцессоров (часто являющихся специализированной интегральной схемой), используемый для аппаратного ускорения работы алгоритмов искусственных нейронных сетей, компьютерного зрения, распознавания по голосу, машинного обучения и других методов искусственного интеллекта (Википедия).
Продукт DeepSeek отличается от ChatGPT своей способностью формулировать рассуждению перед тем, как дать ответ на вопрос, при этом, производительность R1 на уровне с полной платной версией ChatGPT.
После взлета приложение DeepSeek к 25 января его скачали 1,6 пользователей, видимо, не предполагая такого эффекта, создатели сообщили о временном прекращении регистрации новых пользователей.
Что потеряли американские компании?
На сегодняшний день потери составили более 1,2 трлн долларов. Но кроме этого – удар нанесен по технологическому доминированию США в гонке нейросетей и плюс - это вызов новоизбранному президенту, за спиной которого как раз и стоят основные бенефициары гонки за ИИ. И кроме этого, анонсированный Трампом проект Stargate теперь под вопросом – а стоит ли выделять 500 млрд, если можно как китайцы и с тем же результатом? Ведь китайская R1 доказала, что мнение о том, что для развития ИИ в будущем потребуется все больше энергии и затрат – ошибочно.
Но и это еще не все. Фондовый рынок само собой, кстати, только Nvida потеряла 600 млрд капитализации, но теперь встал вопрос – что делать с чипами Nvida, ведь китайцы показали, что для достижения цели они не нужны в таких количествах и не переоценены ли изделия американской компании?
А санкции? Так ли они эффективны? Если китайские инженеры смогли, не смотря на них, создать продукт такого уровня? Вопрос. Введенные ограничения на поставки полупроводников для графических процессоров должны были сделать невозможным прорыв Китая в этой сфере, а получилось наоборот. Барьеры вынудили ученых пойти другим путем, который оказался успешным и теперь китайские компании создают собственную экосистему, схожую с системой, построенной в США вокруг Nvida.
Интересна реакция руководства США и компаний, стоящих за разработкой технологий ИИ – что дальше? Давить Китай санкциями? Но очевидно, что они не сработали… а как остановить переток клиентов и падение на фондовом рынке?
Теперь гонка вооружений само собой, только к ней добавляется гонка технологий искусственного интеллекта.