Взрывной рост цен на память, дефицит видеокарт, остановка поставок комплектующих — 2025 год запомнился беспрецедентным сжатием полупроводниковой цепочки поставок. Эксперты индустрии объясняют механику текущего кризиса и перспективы его разрешения.
Два сценария: распродажа или затяжной голод
Существует две диаметрально противоположные точки зрения на развитие ситуации. Первая предполагает, что через пару лет крупные дата-центры начнут массово сбрасывать устаревшие AI-ускорители на вторичный рынок, по аналогии с тем, как майнеры после крипто-краха заполонили площадки подержанными видеокартами. Дешёвые бывшие в употреблении профессиональные ускорители внезапно станут доступны широкому кругу покупателей.
Логика простая: оборудование дата-центров имеет конечный жизненный цикл, графики амортизации и обновления выталкивают старое железо в утиль через несколько лет.
Однако вторая группа экспертов утверждает: AI-вычисления не ведут себя как потребительский рынок видеокарт, а предположение о трёхлетнем сроке годности ускорителей — полная чушь. Стейси Расгон, управляющий директор и старший аналитик инвестиционной компании Bernstein, заявил:
«Идея, что они разваливаются через три года и становятся непригодными — это бред».
«Гигацикл» вместо обычного бума
Бен Баджарин, аналитик исследовательской компании Creative Strategies, описывает текущий момент как «гигацикл», а не просто очередной чиповый бум. Согласно его расчётам, глобальная выручка полупроводниковой индустрии вырастет примерно с $650 млрд в 2024 году до более чем $1 трлн к концу десятилетия.
Ключевой парадокс:
- Производители остаются крайне осторожными в наращивании мощностей;
- Все боятся застрять с избыточными фабриками через 7-8 лет, когда спрос может упасть.
«Необходимо некоторое наверстывание объёмов, но полупроводниковая индустрия остаётся крайне консервативной, потому что обычно она циклична», — объяснил Баджарин. — «Все озабочены риском перепроизводства».
Этот консерватизм критически важен, поскольку производственные мощности требуют времени, усилий и колоссальных денег для запуска. Именно поэтому рынок останется напряжённым ещё долго: спрос взлетает, но компании не спешат наращивать предложение без абсолютных гарантий возврата инвестиций.
Цифры не врут: 0,2% пластин дают 20% выручки
Согласно анализу Баджарина, AI-чипы в 2024 году занимали менее 0,2% всех производственных пластин, однако генерировали примерно 20% выручки от полупроводников — колоссальная концентрация прибыли на одном узком сегменте. Это объясняет, почему текущий дефицит ощущается совсем иначе, чем нехватка видеокарт во времена пандемии и криптобума.
В 2020-2021 годах потребительский спрос взлетел, цепочки поставок рухнули, но базовые продукты всё ещё оставались массовыми в производственном смысле. Сегодняшние AI-ускорители требуют самых передовых технологических норм, экзотических стеков памяти и сложнейшей упаковки.
Произвести их больше технически возможно, но не быстро и не без побочных эффектов.
«Если посмотреть на прогнозы по мощностям производства пластин или подложек, никто не наращивает масштабы», — предупреждает Баджарин.
Память: узкое горлышко индустрии
Расгон отмечает: хотя не всё находится в дефиците, самые «напряжённые» сегменты сконцентрированы в памяти. Он указывает на Micron, одного из трёх глобальных гигантов производства DRAM, который заявил, что напряжённость с памятью может сохраниться и после 2026 года, во многом из-за AI-спроса и высокопропускной памяти HBM.
Показательно, что Micron недавно закрыл потребительское подразделение Crucial, чтобы сосредоточиться на более прибыльных продуктах для дата-центров.
HBM представляет собой совершенно иной производственный вызов, способный поглощать огромные мощности. Производство HBM потребляет гораздо больше ресурсов пластин, чем стандартная оперативная память, по словам Расгона — настолько, что создание гигабайта HBM может требовать «в три или четыре раза больше пластин», чем производство гигабайта DDR5.
Это означает простую математику: перенаправление мощностей в HBM напрямую сокращает общее количество обычной памяти DRAM, которое индустрия может поставлять на рынок.
Приоритизация производителями памяти HBM для ускорителей искусственного интеллекта затрагивает не только крупные корпорации. Она имеет каскадный эффект на компьютеры, серверы и другие устройства — стандартная оперативная память становится дефицитнее и дороже. Именно поэтому производители в последние месяцы массово поднимали цены на компьютерное оборудование.
Крупные дата-центры могут проглотить рост затрат на компоненты, поскольку монетизируют вычисления напрямую. Все остальные (производители компьютеров, сборщики систем и конечные покупатели) ощущают давление максимально остро.
Баджарин считает, что HBM станет одним из главных ограничителей до конца десятилетия, прогнозируя четырёхкратный рост рынка до более чем $100 млрд к 2030 году. При этом HBM3E может требовать примерно втрое больше производственных мощностей на гигабайт по сравнению с обычной DDR5.
Micron даже признался в неспособности удовлетворить весь спрос ключевых клиентов, заявив о возможности поставки только половины или двух третей от запрошенных объёмов, даже при увеличении капитальных вложений и запуске новых проектов.
Узкое место: передовая упаковка чипов
Существует множество причин текущей напряжённости, но даже при бесконечном количестве кремниевых пластин и памяти рынок всё равно упирается в бутылочное горлышко: технологию передовой упаковки чипов.
Индустрия агрессивно наращивала мощности CoWoS (chip-on-wafer-on-substrate — чип-на-пластине-на-подложке), но производители необычайно откровенно признают, насколько сложно опережать спрос. В начале 2025 года глава Nvidia Дженсен Хуанг заявил, что общие мощности передовой упаковки выросли вчетверо менее чем за два года, но всё ещё остаются узким местом для компании.
Это касается не только Nvidia. Аналитическая компания TrendForce спрогнозировала рост мощностей CoWoS у тайваньского гиганта TSMC примерно до 75 000 пластин в месяц в 2025 году с достижением 120 000-130 000 пластин к концу 2026-го. Такой рост впечатляет, но он вряд ли ослабит текущие ограничения.
Баджарин выделил главную причину: капитальные затраты четырёх крупнейших облачных провайдеров — Amazon, Google, Microsoft и Meta — удвоились до примерно $600 млрд ежегодно всего за два года. Деньги текут рекой, но физически построить инфраструктуру быстрее просто невозможно.
Прогнозирование невозможно
Хотя кажется очевидным, что спрос продолжит расти из-за безумных инвестиций технологических гигантов, точно спрогнозировать будущий спрос крайне сложно из-за особенностей работы чипового рынка.
Расгон объясняет: полупроводниковые компании находятся «в конце цепочки поставок», что ограничивает их способность ясно видеть реальный спрос конечных потребителей. Это порочный круг, который усугубляется при дефиците: клиенты начинают накапливать чипы и делать двойные заказы, пытаясь застраховаться от нехватки.
В результате спрос выглядит искусственно завышенным, пока ситуация не нормализуется и не начнутся массовые отмены заказов. Поставщики хотят избежать ловушки, когда они построят фабрики под спрос, который внезапно испарится.
«Прогнозирование в полупроводниках — нерешённая проблема», — констатирует Расгон. — «Моё убеждение: фактическая видимость реального спроса у руководства полупроводниковых компаний равна точно нулю».
Баджарин добавляет, что индустрия работает «очень осторожно», потому что помнит болезненные циклы бум-спад, особенно на рынке памяти. «Нам придётся жить с постоянной напряжённостью предложения из-за этой динамики, которая исторически характерна для полупроводниковой индустрии», — резюмирует он.
Старые чипы никуда не денутся
Ещё один потенциальный источник облегчения дефицита — вторичный рынок профессиональных ускорителей предыдущих поколений. Логика простая: крупные компании постоянно обновляют парк оборудования, старые чипы должны куда-то деваться.
Уже сейчас можно найти небольшие объёмы профессиональных GPU на площадках через реселлеров и брокеров. Но отдельные чипы — это не массовая распродажа, которой многие ожидают по аналогии с крипто-крахом.
Ключевое отличие: AI-компании не спешат избавляться от старого оборудования. Профессиональный ускоритель — это не игровая видеокарта, которая морально устаревает через пару лет. Это капитальное оборудование, которое может работать и приносить прибыль годами.
Финансовый директор OpenAI Сара Фриар призналась в ноябре: для обработки запросов пользователей в ChatGPT компания всё ещё использует чипы архитектуры Ampere от Nvidia, выпущенные в 2020 году. Обучение моделей требует новейших чипов, но обслуживание пользователей прекрасно работает на старых поколениях.
«Старые чипы не только используются — они используются очень прибыльно», — подчёркивает Расгон.
Когда закончится кризис?
Предсказать момент нормализации рынка невозможно — как и подобает индустрии, которая не умеет прогнозировать собственный спрос.
«До тех пор, пока мы строим фундаментально новую инфраструктуру вокруг искусственного интеллекта, дефицит сохранится в обозримом будущем — просто из-за уроков предыдущих циклов бум-спад», — объясняет Баджарин.
Но даже при наличии достаточного количества чипов остаётся проблема инфраструктуры. Дата-центры требуют времени на строительство, гигаватты электроэнергии и мощнейшие системы охлаждения.
«Даже если мы произведём все необходимые чипы, мы не сможем их разместить из-за нехватки электромощностей», — констатирует Баджарин.
Впрочем, с планированием малых модульных реакторов и расширением электросетей есть надежда на постепенное решение энергетической проблемы.
Главный вывод: текущая напряжённость связана не только с производством чипов. Вопрос в том, успеет ли индустрия построить всю необходимую инфраструктуру (здания, охлаждение, электросети и т.п.) достаточно быстро, чтобы соответствовать взрывному росту спроса.
«Дефицит сохранится до тех пор, пока мы либо полностью построим всю инфраструктуру и получим достаточно вычислительных мощностей», — заключает Баджарин, — «либо это окажется пузырём, и он лопнет».