Найти в Дзене
SpaceForYou

Китай выпустил искусственный интеллект DeepSeek и обрушил американский рынок на $1 трлн

Итак, американский рынок акций высокотехнологичных компаний рухнул на $1 трлн. Акции крупнейшей компании-производителя чипов Nvidia опустились в цене на $600 млрд, что больше совокупного бюджета РФ в год ($432 млрд).

Виной переполоху стал выпуск новой ИИ-модели DeepSeek, которая буквально перевернула подходы человечества к созданию генеративных моделей искусственного интеллекта. И сейчас вы поймёте, почему.

На 2024 год лидер отрасли — OpenAI — тратит 7 миллиардов долларов в год на обучение языковых моделей, а также 1,5 миллиарда долларов на персонал. И затраты на обучение моделей с целью создания сильного искусственного интеллекта в США планировали довести до $500 млрд.

В Китае рассудили иначе и обучили модель всего за $6 млн — что примерно соответствует годовой зарплате IT-инженера из Кремниевой долины и примерно в 1000 раз меньше того, что OpenAI тратит в год.

История DeepSeek началась с того, что в 2021 году китайский предприниматель Лян Вэньфэн закупил 10 000 GPU до введения американских санкций — "на всякий случай". Чувствуете разницу? Если в РФ патриоты-миллиардеры "на всякий случай" закупают новую яхту в США, то китайцы инвестируют деньги во благо нации.

Долгое время эти видеокарты использовались для анализа рынка, но по большей части простаивали. В 2023-м фонд High-Flyer выделил ИИ-направление в DeepSeek, а для обучения ИИ были использованы те самые карты и фантастическая команда спецов, которые натурально ночевали в офисе, работая по 18 часов в сутки 7 дней в неделю.

Таким образом, High-Flyer использовал далеко не самое впечатляющее "железо", но именно это помогло внедрить воистину революционные механизмы обработки данных в ходе обучения модели. Собственно, чему здесь удивляться? Если вы видели победителей мировой олимпиады по математике, то из года в год они выглядят так.

Как итог, DeepSeek базируется на принципе Multi-head Latent Attention (MLA) — сократившем стоимость обучения моделей на 90% за счёт игнорирования 95% данных.

Что характерно, в DeepSeek всего 671 миллиард параметров (у GPT-4 около 1 триллиона), но для решения задач ИИ использует только 37 миллиардов. Это позволяет серьёзно улучшить быстродействие. Работает это примерно так: когда пользователь обращается к какой-то конкретной отрасли, каждый раз для ответа используется AI-юрист, AI-менеджер или другой "хранитель знаний". Модель несколько похожа на человека, который страдает синдромом множественной личности. Получается быстро и дёшево.

ИИ-юрист, который решает проблемы.

Показывая аналогичную результативность с GPT-4, DeepSeek обеспечивает в десятки раз меньшую стоимость генерации ответа и сопоставимую скорость. И здесь важно повториться, что этот ИИ работает на устаревшем по меркам 2025 года "железе".

-3

Получается довольно забавная ситуация. Вся та "железная революция", о которой нам весь прошлый год вещала Nvidia, сделавшая компанию самой дорогой в мире, оказалась, в общем-то, и не нужна. Модели, которые умеют рассуждать, можно обучать и запускать на "устаревшем" железе. Именно эта новость и обрушила акции Nvidia на $600 млрд.

В то же время не стоит думать, что США валяются в нокдауне и навсегда вытеснены из гонки ИИ Китаем. Скорее, всё наоборот: верхи США получили вполне вменяемый сигнал к тому, что предсказываемая ранее гонка ИИ действительно началась и США находятся в роли отстающих. В прошлый раз такое происходило, когда СССР совершенно внезапно осуществил запуск первого спутника Земли.

Безусловно, стоит понимать, что искусственный интеллект Китая или искусственный интеллект США для России особой погоды не делает. Здесь важно учитывать, что страна, чей материальный и интеллектуальный потенциал вывезен за рубеж, едва ли может претендовать даже на место аутсайдера в главной гонке XXI века.

-4

В то же время, если OpenAI вводит запрет на использование своего сервиса на территории РФ, то DeepSeek доступен для россиян и отлично понимает русский язык, что в целом ведёт нас к этой модели при построении бизнеса.

Наступает новая эра, где искусственный интеллект будет определять благополучие целых стран. Уже в этом десятилетии сильные модели возьмут на себя управление целыми отраслями экономики, и именно сейчас мы как никогда близки к самым кардинальным изменениям с момента возникновения нашего социума.