31 подписчик

Энергетический кризис ЦОДов: почему через 5 лет нам не хватит розеток для ИИ

24 марта24 мар

3 мин

Каждый раз, когда вы просите нейросеть сгенерировать картинку или написать код, где-то в мире чуть сильнее нагревается атмосфера. Мы привыкли считать интернет чем-то эфемерным, «облачным», но за легкостью цифровых сервисов стоит тяжелая, горячая и невероятно энергоемкая инфраструктура. Дата-центры (ЦОДы) уже потребляют около 9% всей мировой электроэнергии, и с бумом генеративного ИИ эта цифра грозит удвоиться в годы. Инженеры бьют тревогу: если не изменить подход к строительству вычислительных мощностей, мы столкнемся с физическим дефицитом электричества. Разбираемся, как индустрия планирует спасать ИИ от энергетического голода. Чтобы понять масштаб проблемы, достаточно сравнить классический поиск и запрос к нейросети. Обычный запрос в Google тратит около 0,3 Вт·ч энергии. Диалог с ChatGPT съедает почти в 10 раз больше — около 2,9 Вт·ч. Проблема делится на два этапа: По закону Мура мощность чипов растет, но вместе с ней растет и их «аппетит». Современная серверная стойка с ИИ-ускорител

Оглавление

Скрытая цена «умного» ответа
Почему старые методы больше не работают?
Жидкий холод: когда серверы учатся плавать

Дата-центры (ЦОДы) уже потребляют около 9% всей мировой электроэнергии, и с бумом генеративного ИИ эта цифра грозит удвоиться в годы. Инженеры бьют тревогу: если не изменить подход к строительству вычислительных мощностей, мы столкнемся с физическим дефицитом электричества. Разбираемся, как индустрия планирует спасать ИИ от энергетического голода.

Скрытая цена «умного» ответа

Чтобы понять масштаб проблемы, достаточно сравнить классический поиск и запрос к нейросети. Обычный запрос в Google тратит около 0,3 Вт·ч энергии. Диалог с ChatGPT съедает почти в 10 раз больше — около 2,9 Вт·ч.

Проблема делится на два этапа:

Обучение: чтобы «натренировать» модель вроде GPT-4, требуются месяцы работы десятков тысяч видеокарт (GPU). Это гигаватты энергии, сопоставимые с потреблением небольшого города.
Инференс (использование): это ежедневная работа модели, когда миллионы пользователей задают ей вопросы. Именно здесь кроется основная угроза для электросетей в будущем.

По закону Мура мощность чипов растет, но вместе с ней растет и их «аппетит». Современная серверная стойка с ИИ-ускорителями потребляет столько же энергии, сколько 50–100 обычных стоек десять лет назад.

Почему старые методы больше не работают?

Главный враг электроники — тепло. Чем мощнее чип, тем сильнее он греется. Традиционные ЦОДы охлаждаются воздухом: огромные кондиционеры гоняют ледяной ветер через ряды серверов.

Но плотность вычислений стала такой высокой, что воздух перестал справляться.

Низкая теплоемкость: воздух плохо забирает тепло. Чтобы остудить топовый чип NVIDIA H100, нужен ураганный поток, который создает шум и вибрации.
Энергозатраты: в старых ЦОДах до 40% электричества тратится не на вычисления, а на то, чтобы просто охладить оборудование. Это тупиковый путь.

Жидкий холод: когда серверы учатся плавать

Инженеры нашли выход, который еще недавно казался экзотикой — жидкостное охлаждение. Вода (или специальная жидкость) проводит тепло в 3000 раз эффективнее воздуха.

Сейчас внедряются две основные технологии:

Direct-to-Chip: к самым горячим компонентам (процессору и памяти) подводятся трубки с хладагентом, как в игровых ПК, только в промышленном масштабе.
Иммерсионное охлаждение: серверы целиком погружают в ванны с диэлектрической жидкостью. Она не проводит ток, но отлично забирает тепло.

Карманные АЭС: атомный ренессанс для IT

Даже если мы идеально охладим серверы, им все равно нужно электричество. Солнечные и ветряные станции нестабильны: ИИ не может «спать», когда нет ветра. Ему требуется бесперебойное питание 24/7.

Техногиганты (Microsoft, Google, Amazon) увидели решение в ядерной энергетике.

Восстановление АЭС: Microsoft уже договорилась о перезапуске реактора на АЭС Три-Майл-Айленд специально для питания своих дата-центров.
Малые модульные реакторы: это будущее отрасли. Вместо гигантских станций строятся компактные реакторы, которые можно безопасно разместить в непосредственной близости от ЦОДа. Они собираются на заводе как конструктор и доставляются на место уже в готовом виде.

Идея в том, чтобы сделать дата-центры автономными от общих городских сетей, которые просто не выдержат такой нагрузки.

Битва за эффективность: новые чипы и фотоника

Последний рубеж обороны — изменение самой архитектуры вычислений. Универсальные видеокарты (GPU) хороши, но избыточны.

На смену им приходят нейропроцессоры — чипы, созданные исключительно для задач ИИ. Они не умеют запускать игры или Windows, но перемножают матрицы для нейросетей с эффективностью, недостижимой для обычного железа.

А на горизонте маячит кремниевая фотоника. В таких чипах информация передается не электронами по медным дорожкам, а фотонами (светом). Это обещает снизить энергопотребление в десятки раз и увеличить скорость передачи данных практически до скорости света.

Вывод прост: через 5 лет ИИ действительно может столкнуться с дефицитом «розеток», если мы продолжим строить инфраструктуру по-старому. Но кризис — двигатель прогресса. Сплав ядерной физики, гидродинамики и фотоники трансформирует серые коробки дата-центров в высокотехнологичные, автономные экосистемы.

Бизнес и финансы

1,13 млн интересуются