Добавить в корзинуПозвонить
Найти в Дзене
ELEKTRA

Реальная экономика AI-вычислений: почему “бесплатные токены” упираются в счёт за электричество, пластины и мегаватты дата-центров

Громкие рассказы про “модели на триллион параметров” создают ощущение бесконечного масштаба, хотя под каждым ответом нейросети лежит очень материальная экономика: стоимость графических процессоров, дефицит пластин на передовых техпроцессах, тарифы на электричество, вода для охлаждения и кредиты под строительство дата-центров. Yole Group в свежем белом отчёте по ИИ прямо говорит о “иллюзии бесконечного масштаба” и предлагает смотреть на ИИ как на машину, где решают не только алгоритмы, но и физика железа. Контекст на цифрах простой. По оценке Yole Group, выручка рынка графических процессоров для дата-центров вырастет примерно с ста миллиардов долларов в две тысячи двадцать четвёртом году до около двухсот пятнадцати миллиардов к две тысячи тридцатому году, а блок питания для таких центров вытянет ещё примерно четырнадцать миллиардов выручки к той же дате. Это не “хайп вокруг стартапов”, это стабильный инфраструктурный бизнес, который тянет за собой память, силовую электронику и сети.

Громкие рассказы про “модели на триллион параметров” создают ощущение бесконечного масштаба, хотя под каждым ответом нейросети лежит очень материальная экономика: стоимость графических процессоров, дефицит пластин на передовых техпроцессах, тарифы на электричество, вода для охлаждения и кредиты под строительство дата-центров. Yole Group в свежем белом отчёте по ИИ прямо говорит о “иллюзии бесконечного масштаба” и предлагает смотреть на ИИ как на машину, где решают не только алгоритмы, но и физика железа.

Контекст на цифрах простой. По оценке Yole Group, выручка рынка графических процессоров для дата-центров вырастет примерно с ста миллиардов долларов в две тысячи двадцать четвёртом году до около двухсот пятнадцати миллиардов к две тысячи тридцатому году, а блок питания для таких центров вытянет ещё примерно четырнадцать миллиардов выручки к той же дате. Это не “хайп вокруг стартапов”, это стабильный инфраструктурный бизнес, который тянет за собой память, силовую электронику и сети.

Если разобрать стоимость одного AI-кластера, картина складывается из нескольких слоёв. Первый слой это ускорители и серверы с графическими процессорами. Второй слой сеть и системы хранения. Третий слой электрическая инфраструктура и охлаждение, включая резервные источники питания и системы распределения нагрузки. Четвёртый слой земля, здания, подключение к энергосистеме и операционные расходы на команду, мониторинг, лицензии и поддержку. Только часть этих затрат видна в прайсах на “GPU в облаке”, остальное прячется в строке “инфраструктура”.

Железо остаётся крупнейшей единовременной статьёй. На уровне чипов Nvidia даёт понять, что поколение Blackwell будет стоить дорого, по оценкам рынка листовая цена одной платы в составе систем может находиться в диапазоне тридцати–сорока тысяч долларов, при этом компания в состоянии произвести сотни тысяч таких GPU в квартал и конвертировать их в миллиарды долларов выручки. Фактически одна стойка с восемью топовыми ускорителями для ИИ уже сопоставима по цене с хорошей квартирой в крупном городе.

Над чипами стоит более крупная проблема пластин. Продвинутые графические процессоры производят на передовых техпроцессах по пять или три нанометра, а мощностей фабрик ограниченное число. Yole Group подчёркивает, что “реальная экономика AI compute” упирается в конкуренцию за одни и те же пластины между центрами обработки данных, смартфонами, автомобилями и сетевым оборудованием. Любой всплеск спроса на ИИ означает, что эти пластины не достанутся кому-то ещё, поэтому рост не может быть бесконечным только за счёт “добавим ещё серверы”.

Дальше идёт электричество. Международное энергетическое агентство прогнозирует, что потребление электроэнергии дата-центрами в мире примерно удвоится к две тысячи тридцатому году и достигнет около девятисот сорока пяти тераватт-часов в год, то есть близко к текущему потреблению всей Японии, при этом центры, оптимизированные под ИИ, по их оценке, увеличат свой спрос более чем в четыре раза. Если взять условный кластер на двадцать мегаватт, работающий без остановки, то при тарифе десять центов за киловатт-час годовой счёт за электричество выйдет больше семнадцати миллионов долларов и это без учёта сетевых и налоговых надбавок.

Охлаждение превращается из инженерной детали в отдельную статью экономики. Процессорные сокеты тянут уже не двести, а триста–пятьсот ватт, графические процессоры в ИИ-серверах выходят на восемьсот–тысячу двести ватт на модуль, а суммарная тепловая мощность стойки легко перелезает за тридцать киловатт. Это делает традиционное воздушное охлаждение малоэффективным, поэтому в дата-центрах растёт доля жидкостных решений и блоков питания мощностью выше трёх киловатт, рынок которых, по оценкам, растёт быстрее пятнадцати процентов в год и тянет за собой поставщиков шлангов, помп, теплообменников.

География перестаёт быть нейтральным фоном. Крупные AI-кластеры тянутся туда, где на стыке дешёвой энергии, прохладного климата и стабильной политики можно получить сотни мегаватт мощности. Одни игроки строят залы рядом с гидроэлектростанциями и ветропарками в северных регионах, другие договариваются о поставках из будущих малых модульных реакторов. Там, где сеть слабая или дорогая, планы по ИИ легко упираются не в модели, а в невозможность получить дополнительную линию на двадцать–тридцать мегаватт в разумные сроки.

Основатели и игроки инфраструктуры задают ритм этой экономики. Характерный пример CoreWeave, американской компании облачной инфраструктуры для ИИ, основанной в две тысячи семнадцатом году в Нью-Джерси Майклом Интратором, Брайаном Вентуро, Браннином Макби и Петером Саланки. Стартовав как проект вокруг высокопроизводительных вычислений и криптомайнинга, команда сместила фокус на аренду графических процессоров для ИИ, построила сеть собственных дата-центров в США и Европе и вышла на биржу, превратившись в одного из ключевых партнёров Nvidia и крупных облаков.

Модель роста таких инфраструктурных игроков показывает, как складывается “цена токена” в облаке. CoreWeave в две тысячи двадцать третьем году привлекает один из крупнейших частных кредитов в истории США под залог будущей загрузки GPU, затем фиксирует многолетние контракты с гиперскейлерами и в две тысячи двадцать пятом выходит на публичное размещение, где часть инвесторов тревожит уровень долга и концентрация выручки на нескольких клиентах. По сути компания берёт на себя капекс по закупке железа и строительству залов, а разработчики оплачивают это в виде поминутных тарифов на обучение и инференс.

Для продуктовых команд реальная экономика AI compute начинается не с лирики о “помощи пользователю”, а с таблицы, где в строках тренировки и инференс, а в столбцах количество параметров модели, размер контекста, длительность сессии и цена часа GPU. В крупных проектах обучение может стоить десятки миллионов долларов, но затем распределяться на годы работы, тогда как ежедневный счёт за инференс в продакшене становится постоянной операционной статьёй. На практике это означает выбор архитектуры, квантования, кэширования и микробатчинга не “по красоте”, а по цене миллиона токенов ответа и задержке, которую пользователь готов терпеть.

Реальные риски тоже не про “абстрактные опасности ИИ”, а про вполне измеримые величины. Зависимость от одного поставщика ускорителей делает компанию уязвимой к перебоям поставок или изменению цен, привязка к конкретному региону с дешёвой энергией создаёт геополитический риск, а жёстко заданные требования по логированию и аудитам в законах об ИИ добавляют накладные расходы на хранение, которые в больших масштабах легко вырастают в отдельные миллионы долларов в год. Экономика ИИ здесь работает как любая другая инфраструктура, только с более плотной упаковкой ваттов в стойки.

Если смотреть на горизонт шесть–двадцать четыре месяца, тренды достаточно чёткие. По оценкам Yole Group, выручка от дата-центровых графических процессоров продолжит быстрый рост, рынок блоков питания войдёт в зону активного обновления под мощности выше трёх киловатт, а Международное энергетическое агентство ожидает, что доля дата-центров в мировом потреблении электроэнергии приблизится к трём процентам, при этом сами ИИ-центры станут главным источником роста. Параллельно крупные игроки договариваются о долгосрочных контрактах на возобновляемую и ядерную генерацию, чтобы стабилизировать себестоимость.

Для разработчика или предпринимателя “экономика запроса” сводится к нескольким практичным решениям. Выбирая модель и архитектуру сервиса, важно считать не только точность, но и стоимость токена плюс задержку при ожидаемом количестве пользователей и сценариев. Там, где это возможно, логично сочетать более тяжёлые модели для сложных задач с облегчёнными для типовых запросов, использовать кэширование и пайплайны, выносить часть вычислений на устройство пользователя и закладывать в бизнес-план не только расходы на запуск, но и график удешевления мощности в перспективе нескольких лет.

Реальная экономика AI-вычислений и дата-центров давно перестала быть “где-то за кулисами” и напрямую определяет, какие продукты вы увидите, сколько они будут стоить и насколько устойчивым окажется бизнес, который на них опирается. Если интересно следить не только за новыми моделями, но и за тем, как меняются энергетика, железо и финансовые конструкции вокруг ИИ, имеет смысл сохранить этот разбор, обсудить его с командой и подписаться на ELEKTRA в Дзене и ВК, что-бы не пропустить следующие развороты этой инфраструктурной истории.