К концу десятилетия глобальные инвестиции в дата-центры достигнут 6,7 трлн долларов, и 5,2 трлн из этой суммы пойдут на обслуживание ИИ-нагрузок. Для пользователей это означает быстрее работающие сервисы и повсеместные ИИ‑ассистенты. Для рынка — резкий рост капитальных затрат и борьбу за эффективность вычислений 💷. Инференс как главная статья расходов По оценкам McKinsey, до 90% всех вычислительных ресурсов за жизненный цикл модели приходится на инференс — генерацию ответов в реальном времени. Обучение модели дорого, но краткосрочно. Инференс — это постоянная нагрузка: каждый запрос пользователя запускает цепочку вычислений. Экономика здесь строится вокруг трех показателей: стоимость одного запроса, загрузка серверов и энергопотребление. При аудитории в сотни миллионов пользователей даже доли цента на запрос формируют миллиарды долларов годовых расходов ⚙️. Почему гиперскейлеры сохраняют маржинальность Крупные платформы, которые одновременно разрабатывают модели и владеют инфраст
Как инференс съедает $5 трлн: новая экономика дата-центров к 2030 году
СегодняСегодня
2 мин