23 января 2024 года в мире искусственного интеллекта произошло тихое землетрясение. Китайская компания DeepSeek выпустила свою флагманскую модель — DeepSeek-V2. Эта модель не просто конкурировала с GPT-4 Turbo от OpenAI по многим тестам, таким как рассуждение, математика и программирование, но и превосходила его. Однако настоящей сенсацией стала не архитектура модели, а ее цена: модель была доступна полностью бесплатно через веб-интерфейс, а также через API по цене в 128 раз ниже, чем у ее конкурентов. Эта новость вызвала шок у западных аналитиков, которые испытали когнитивный диссонанс. Bloomberg писал о “невозможной эффективности", MIT Technology Review говорил о “нарушении законов масштабирования", а VentureBeat задавался вопросом: “Что они знают такого, чего не знаем мы?"
Когда Илон Маск был втянут в спор с OpenAI из-за того, что они отклонились от своей первоначальной цели, Google представила Gemini, который, по мнению многих, был выпущен раньше срока. Тем временем американские стартапы получили огромные инвестиции для участия в гонке по накоплению параметров. Тем не менее, команда из Пекина, состоящая всего из двухсот человек и имеющая бюджет, который был лишь малой частью того, что имели в распоряжении OpenAI, добилась того, чего не смогли достичь тысячи лучших американских инженеров, несмотря на их практически неограниченные финансовые ресурсы.
Секретный ингредиент DeepSeek не был в самих чипах, не в собранных данных и не в больших деньгах. Все оказалось намного проще. Он был спрятан в уникальном подходе, который сочетал западные нейронные сети с восточной философией, которая стремится к минимализму.
Финансовый водопад
Западный мир разработки искусственного интеллекта стал больше похож на соревнование по размеру кошелька. Компания OpenAI получила огромную инвестицию в размере 13 миллиардов долларов от Microsoft. Компания Anthropic получила 7 миллиардов долларов от Amazon и Google. И что действительно удивительно, так это то, что всего за один год, 2023, американские стартапы, работающие с искусственным интеллектом, получили более 50 миллиардов долларов инвестиций. Это привело к возникновению очень конкретной экономической среды:
Стоимость аренды чипов Nvidia H100 увеличилась до такой степени, что теперь она превышает стоимость аренды офисов в Манхэттене. Это значительный скачок, учитывая, что Манхэттен является одним из самых дорогих районов для коммерческой недвижимости в мире. Стоимость этих чипов стала настолько высокой, что арендовать их теперь дороже, чем снять офисное помещение в этом престижном районе.
— Зарплаты топ-инженеров достигли $2-3 миллионов в год
— Энергопотребление одного дата-центра сравнялось с потреблением города в 100 000 человек
— Инсайты от TechCrunch: "Архитектурный минимализм"
Технический директор одного из FAANG, пожелавший остаться анонимным, рассказал TechCrunch:
Мы внимательно изучили работу DeepSeek. Одним из их главных достижений стала технология Dynamic Sparse Training, или DST. Обычно при тренировке нейронных сетей мы учитываем все нейроны. Однако DeepSeek с самого начала определяет, какие связи являются наиболее важными, и сосредотачивается на них. Это примерно как проектирование здания, когда вы заранее знаете, какие элементы конструкции будут испытывать наибольшие нагрузки.
Главный результат их работы заключается в том, что DeepSeek удалось добиться производительности, составляющей 95% от показателей GPT-4, при этом используя в 12 раз меньше вычислительных операций, известных как FLOPs. Это значительное достижение, которое может открыть новые возможности для более эффективного использования вычислительных ресурсов в области искусственного интеллекта.
DeepSeek достигла большего, когда как чем больше вкладывает Америка, тем дороже становится следующий шаг, тем уже круг компаний, которые могут участвовать в гонке, и тем сильнее давление на монетизацию.
Экономика «народного ИИ»
Бесплатность DeepSeek — не благотворительность, а стратегическое оружие нового типа:
• Захват рынка развивающихся стран:
Цена на GPT-4 составляет 20 долларов в месяц. Для Индии это довольно много, примерно 10 процентов средней зарплаты. С другой стороны, DeepSeek бесплатен.
За первые 3 месяца 87% пользователей пришли из стран Азии, Африки и Латинской Америки
• Создание экосистемной зависимости:
Разработчики из 153 стран начали строить приложения на API DeepSeek.
По данным Financial Times: "Двойная стратегия Китая":
"Пока DeepSeek завоевывает развивающиеся страны бесплатными сервисами, Alibaba и Tenzen играют в другую игру. Их облачные подразделения предлагают 'DeepSeek-as-a-Service' для корпораций США и Европы — по ценам на 60% ниже AWS и Google Cloud."
37% американских стартапов уже используют китайские ИИ-сервисы через посредников в Сингапуре и ОАЭ.
Спускает ли Китай рынок Америки? Нет, он его трансформирует
Вот пять способов, которыми китайский прорыв в ИИ может повлиять на лидерство США в технологической области:
1. Ценовое давление: демократизация как оружие конкурентной борьбы
Когда DeepSeek выпустила свою флагманскую модель бесплатно, это оказало большое влияние на рынок коммерческих ИИ-сервисов. В результате Google снизила цены на Gemini API на тридцать пять процентов, что было неожиданным шагом для компании, известной своей стабильной ценовой политикой. Это заставило Microsoft пересмотреть свою стратегию монетизации Copilot, рассматривая возможность либо снижения цены, либо перехода на модель, которая включает бесплатный доступ, но с определенными ограничениями.
Компании, которые только начинали работать и полагались на дорогой API OpenAI, оказались в особенно трудном положении. Они рассчитывали, что цены будут постепенно снижаться в течение следующих нескольких лет, но вдруг всё изменилось. Многие из этих компаний получили большое количество денег от инвесторов, но теперь они столкнулись с большой проблемой: как конкурировать с бесплатным продуктом, который столь же хорош? Инвесторы хотят знать, что эти компании будут делать, чтобы решить эту проблему, и некоторые уже находятся на грани закрытия, едва пережив первые несколько месяцев 2024 года.
2. Смена фокуса инвестиций: от "больше" к "умнее"
Венчурная экосистема Кремниевой долины переживает значительные изменения. Ранее основным фактором для инвестиций был масштаб. Это означало, что инвесторы интересовались тем, сколько мощных компьютеров, таких как GPU, стартап мог арендовать, или какой объем данных он собрал. Однако сейчас всё изменилось. Теперь инвесторы больше заботятся об эффективности. Они ищут стартапы, которые могут добиться отличных результатов, используя ограниченные ресурсы. Эти компании называются “эффективными ИИ-стартапами".
Последние тенденции говорят о том, что происходит заметный сдвиг в направлении инвестиций. Например, по данным PitchBook, уже в этом году около 2 миллиардов долларов были перенаправлены из крупных проектов в алгоритмические разработки. Фонд Y Combinator, известный своей поддержкой стартапов, также изменил свои рекомендации. Теперь они советуют не акцентировать внимание на затратах, связанных с инфраструктурой, а рассказывать о прорывах, достигнутых в области алгоритмов. Другой пример - Sequoia Capital, которая провела внутренний семинар под названием “Уроки DeepSeek: как строить компании, основанные на искусственном интеллекте, в эпоху эффективности".
3. Кризис легитимности санкций: когда ограничения теряют смысл
Соединенные Штаты ввели санкции, ограничивающие поставки высокопроизводительных чипов в Китай, исходя из идеи, что без этих чипов Китай не сможет развивать современный искусственный интеллект. Такой подход повлиял на политические и экспортно-контрольные решения Вашингтона. Однако компания DeepSeekmanaged добилась прорыва, который в Пентагоне называют “технологическим контрсценарием". DeepSeek создала модель мирового класса, используя менее совершенные китайские чипы Ascend 910B.
Это достижение имеет большое значение. Оно показывает, что санкции могут не быть таким эффективным инструментом, как мы думали. Если Китай может создавать передовые технологии, используя свои собственные или доступные компоненты, то ограничения не работают так, как планировалось. Это также значит, что другие страны, такие как Россия, Иран и страны БРИКС, могут последовать примеру Китая и найти способы обойти санкции. Кроме того, возникает вопрос, не делают ли санкции противоположное тому, чего мы хотим - вместо того, чтобы сдерживать инновации, они могут их ускорять.
4. Геополитический перекос: когда доступность становится мягкой силой
Страны развивающегося мира, такие как Индия, Бразилия, Нигерия и Индонезия, теперь имеют доступ к передовым технологиям искусственного интеллекта без каких-либо затрат. Это не только помогает их экономикам, что действительно является значительной выгодой, поскольку экономия для этих стран составляет миллиарды долларов. Это также играет большую роль в формировании их культурного влияния.
Соединенные Штаты Америки могут потерять то, что долгие годы было их конкурентным преимуществом: влияние на культуру с помощью новых технологий. Когда студент в Кении, врач в Перу или предприниматель во Вьетнаме используют DeepSeek для обучения, диагностики или ведения бизнеса, они не просто используют инструмент — они видят определенный образ технологий. Китай предлагает идею, что передовые технологии должны быть доступны всем, а не только богатым. Напротив, Соединенные Штаты Америки сейчас представляют передовые технологии как премиум-продукт, доступный только тем, кто может заплатить за него.
Перекос уже заметен в образовании. Университеты в Азии, Африке и Латинской Америке начинают менять курсы по искусственному интеллекту. Они делают это, чтобы использовать доступные инструменты, которые в основном приходят из Китая.
5. Открытость против закрытости: битва за умы следующего поколения
DeepSeek делится своей архитектурой и некоторыми данными о модели, потому что считает, что это помогает построить доверие и стимулирует новые идеи. Напротив, компании вроде OpenAI, Google и Anthropic работают по другому принципу - их модели полностью принадлежат им, и то, как они принимают решения, не очень понятно. Кроме того, не так легко узнать, как устроены их модели изнутри.
Университеты и научные институты со всего мира начинают переходить на открытые платформы, потому что существует большой контраст. Этот контраст создаёт значительную разницу во мнениях внутри академического и исследовательского сообщества.
Чтобы провести исследования, нам необходимо понять, как работает модель. Это означает, что нам нужно иметь чёткое представление о том, как она функционирует и какие принципы лежат в её основе. Таким образом, мы сможем правильно интерпретировать результаты и сделать обоснованные выводы. Понимание модели имеет решающее значение для проведения качественных исследований и получения достоверных результатов.
Образовательный процесс невозможен на "магическом ящике"
Научная репутация строится на воспроизводимости результатов
Массачусетский технологический институт уже сделал шаг и создал лабораторию, которая будет заниматься исследованиями открытых ИИ-моделей. Стэнфорд также принял меры и запустил курс под названием “Архитектура современных языковых моделей", который основан на документации DeepSeek. Кроме того, Европейский союз изучает возможность предоставления регуляторных преференций для открытых моделей в рамках своего ИИ-акта.
Война, в которой все выиграли, кроме старой системы. Это звучит как довольно необычная война, поскольку в большинстве войн есть победители и проигравшие. Но в данном случае, кажется, что каждый, кто участвовал, получил что-то хорошее, кроме старого способа делать вещи. Это как будто война была способом сбросить старую систему и начать всё заново. Я задаюсь вопросом, что это была за война и как она привела к такому результату. Была ли это революция или что-то подобное? И что это означает для людей, участвовавших в ней?
DeepSeek выиграла не потому, что была умнее в абсолютном смысле. Она выиграла, потому что переопределила понятие "умный".
Секретный ингредиент оказался не техническим, а философским: эффективность важнее мощи, доступность важнее прибыли, открытость важнее контроля.
Wall Street Journal может говорить о “технологической войне", но обычные люди, такие как студент в Найроби или врач в Джакарте, делают свой выбор. Они используют то, что работает для них. Результаты говорят сами за себя - за первый квартал 2024 года было 8,7 миллиардов бесплатных запросов к DeepSeek по сравнению с 2,1 миллиардом платных запросов к GPT-4.
Эта война закончится не подписанием договора, а обычным утром, когда разработчик в Сан-Франциско откроет китайскую документацию, чтобы решить задачу, которая не поддаётся решению с помощью американских инструментов. В этот момент он поймёт, что будущее уже наступило — оно просто развивается по другому сценарию, чем он ожидал.
Как сказал один из создателей DeepSeek в интервью Caixin: "Мы не воюем с Америкой. Мы просто показали, что путь может быть другим. Если это война, то война идей. А в такой войне побеждает не тот, у кого больше пушек, а тот, чьи идеи оказываются полезнее для большего числа людей."
В этом, возможно, и заключается самый секретный ингредиент: понимание, что в XXI веке настоящая сила измеряется не в гигафлопсах, а в количестве жизней, которые технология делает лучше. И по этому показателю счет пока не в пользу Запада.