1846 подписчиков

Неужели безудержные траты на ИИ не остановить?

4 марта4 мар

6 мин

Судя по последним финансовым результатам Nvidia, к 2030 году расходы на вычисления вырастут в десять раз. Дженсен Хуанг прогнозирует рост CapEx на дата-центры до $3-4 трлн. — computerweekly.com Ожидается, что расходы на центры обработки данных вырастут в десять раз. Такое заявление прозвучало от генерального директора Nvidia Дженсена Хуанга во время последнего квартального отчета компании. Он спрогнозировал, что капитальные затраты (CapEx) на дата-центры вырастут с нынешних 300–400 млрд долларов до 3–4 трлн долларов к 2030 году. Замечания Хуанга, сделанные в конце февраля, последовали через несколько дней после мероприятия Microsoft’s AI Tour London, когда генеральный директор Сатья Наделла по сути призвал разработчиков корпоративного программного обеспечения использовать возможности, встроенные в Microsoft 365, для создания агентских ИИ-рабочих процессов, оптимизирующих бизнес-процессы. Наделла обсудил необходимость наличия эффективной «фабрики токенов», где фразы или токены могут пер

Ожидается, что расходы на центры обработки данных вырастут в десять раз. Такое заявление прозвучало от генерального директора Nvidia Дженсена Хуанга во время последнего квартального отчета компании. Он спрогнозировал, что капитальные затраты (CapEx) на дата-центры вырастут с нынешних 300–400 млрд долларов до 3–4 трлн долларов к 2030 году. Замечания Хуанга, сделанные в конце февраля, последовали через несколько дней после мероприятия Microsoft’s AI Tour London, когда генеральный директор Сатья Наделла по сути призвал разработчиков корпоративного программного обеспечения использовать возможности, встроенные в Microsoft 365, для создания агентских ИИ-рабочих процессов, оптимизирующих бизнес-процессы. Наделла обсудил необходимость наличия эффективной «фабрики токенов», где фразы или токены могут передаваться в ИИ-движки, которые интерпретируют естественный язык для запросов к большим языковым моделям (LLM). Видение корпоративного ИИ от Microsoft основано на фундаменте M365, который служит хранилищем знаний, на котором может быть построен новый класс программного обеспечения, основанного на знаниях. Во время своей основной презентации Наделла говорил об интеллекте, существующем в различных ИТ-системах, используемых в бизнесе. Он заявил, что предприятия должны иметь возможность задействовать интеллект, который уже существует в масштабах всего предприятия, начиная с того, что он назвал «данными, лежащими в основе Microsoft 365», которые, по словам Наделлы, представляют собой людей в бизнесе, их взаимоотношения с коллегами и рабочие артефакты, такие как проекты, календари и коммуникационные данные. «Это огромный объем информации», — сказал он, который можно использовать для быстрого запуска агентских ИИ-проектов. «Наша цель — сделать все инновации и системы доступными на фабрике токенов», — сказал Наделла. «Таким образом, вы сможете создавать программное обеспечение, способное использовать все [предоставляемые нами] возможности для обучения моделей и предоставления моделей для инференса». По сути, он видит, как экосистема программного обеспечения Windows эволюционирует до нынешнего состояния экосистемы Microsoft 365, где корпоративные данные хранятся в офисных продуктивных инструментах с поддержкой ИИ, таких как Word, Excel, PowerPoint, Teams и Outlook, и они могут использоваться в качестве основы для нового поколения приложений, которые могут использовать эти источники знаний ИИ. Именно об этой идее, что все программное обеспечение должно быть осведомлено о знаниях, Хуанг говорил во время отчета о доходах компании. «Генерация токенов находится в центре почти всего, что в будущем будет связано с программным обеспечением и вычислениями», — сказал он. «Если посмотреть на то, как мы использовали вычисления в прошлом, то объем вычислительных потребностей для программного обеспечения в прошлом составляет крошечную долю от того, что потребуется в будущем». По словам Хуанга, объем вычислений, необходимых для работы ИИ, в 1000 раз превышает вычислительную мощность, необходимую для запуска не-ИИ программного обеспечения. «Потребность в вычислениях просто намного выше», — сказал он. «И поэтому, если мы продолжим верить в его ценность, мир будет инвестировать в производство этих токенов». Когда его спросили, уверена ли Nvidia в том, что ее клиенты сохранят возможность тратить больше на ИИ-инфраструктуру, что может повлиять на способность Nvidia расти, Хуанг говорил о возможностях предприятий использовать агентский ИИ и его широкую полезность в организациях. «Мы увидели переломный момент в агентском ИИ и полезность агентов по всему миру и на всех предприятиях», — сказал он. «Из-за этого вы наблюдаете невероятный спрос на вычисления. В этом новом мире ИИ вычисления — это доходы. Без вычислений нет способа генерировать токены. Без токенов нет способа увеличить доходы». По крайней мере, именно так он представил ИИ аналитикам инвестиционных банков на отчетной конференции. Компания сообщила о выручке за четвертый квартал в размере 68 млрд долларов, что на 73% больше по сравнению с аналогичным периодом прошлого года. Выручка от дата-центров выросла на 75% до 62 млрд долларов, что, по данным Nvidia, обусловлено спросом на ее архитектуру Blackwell и развертыванием ИИ-инференса. Компания также сообщила о сетевой выручке в размере 1 млрд долларов, что в 3,5 раза больше по сравнению с аналогичным периодом прошлого года, чему способствовало внедрение NVLink, Spectrum X и других технологий Ethernet от Nvidia. В прошлом году во время своей основной презентации на конференции GTC в США Хуанг утверждал, что самая низкая стоимость токена достигается при использовании самого дорогого GPU — на тот момент это был Grace Blackwell NVLink 72. Nvidia описывает GB200 Grace Blackwell как «суперчип», который соединяет два высокопроизводительных графических процессора Nvidia Blackwell Tensor Core и центральный процессор Nvidia Grace с интерфейсом NVLink-Chip-to-Chip (C2C), способным обеспечивать двунаправленную пропускную способность 900 ГБ/с. Важно отметить, что архитектура позволяет приложениям иметь согласованный доступ к единому пространству памяти. По данным Nvidia, это упрощает программирование и поддерживает большие потребности в памяти LLM с триллионом параметров, трансформерных моделей для мультимодальных задач, моделей для крупномасштабного моделирования и генеративных моделей для 3D-данных.

«Закон Хуанга»

Некоторые отраслевые наблюдатели ввели термин «Закон Хуанга» для описания его точки зрения на то, как каждое новое поколение GPU обеспечивает 10-кратное увеличение производительности, по сравнению с законом Мура, удваивающим производительность каждые 18 месяцев. Наделла и Хуанг оба говорили о том, что новое оборудование более энергоэффективно при выполнении рабочих нагрузок ИИ. Во время тура Microsoft AI Наделла отметил, что сегодняшняя система поддерживает совершенно иную иерархию памяти, что, по его словам, означает, что «теперь нет задержек при ИИ-инференсе». Посыл от руководителей Microsoft и Nvidia заключается в том, что наилучшая эффективность достигается за счет использования возможностей, доступных в этих новых системах. «С этими системами и рабочими нагрузками, будь то рабочие нагрузки обучения или инференса, происходит невероятный ренессанс, не похожий ни на что, что мы видели в прошлом», — сказал Наделла. Технологический сектор твердо намерен добиться того, чтобы предприятия все больше внедряли ИИ. Он встраивается в корпоративное программное обеспечение, осведомленное о знаниях, которое, вероятно, будет использовать возможности, доступные в новейшем поколении оборудования для ускорения ИИ. Очевидно, что бизнес-модели Microsoft и Nvidia связаны с ростом спроса на ИИ. Но также очевидно, что развертывание передовых систем ИИ не станет дешевле. Скорее всего, капитальные затраты на центры обработки данных продолжат расти феноменальными темпами, подпитываемые спросом на эти новые системы ИИ и необходимое им оборудование для ускорения ИИ.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Cliff Saran

Оригинал статьи