Для соответствия требованиям искусственного интеллекта центры обработки данных должны повышать энергоэффективность и улучшать систему охлаждения, уделяя особое внимание концепции социальной и экологической ответственности и передовым наукам о материалах.
Современные центры обработки данных быстро развиваются, особенно в связи с растущими требованиями к рабочим нагрузкам, связанным с искусственным интеллектом (ИИ). Поскольку требования к питанию чипов растут, центры обработки данных должны адаптировать свою архитектуру для удовлетворения растущих потребностей в энергии и охлаждении. Виктор К. Ли, старший вице-президент подразделения стратегической бизнес-платформы для центров обработки данных Delta Electronics, рассказал о значении эффективности центров обработки данных и предложенных решениях (рис. 1) для удовлетворения этого спроса.
На глобальном саммите OCP Global Summit были представлены новые мощные системы питания ORV3 с КПД до 97,5% (рис. 2), литий-ионные конденсаторы с длительным временем ожидания до 15 секунд при нагрузке 20 кВт, система жидкостного охлаждения с мощностью до 1,5 МВт, а также первый в мире преобразователь постоянного тока мощностью 4000 Вт для серверов на базе наземных источников питания в центрах обработки данных с ИИ.
Рис. 1 Компания Delta Electronics Americas продемонстрировала свои энергосберегающие системы питания и жидкостного охлаждения на саммите OCP Global Summit 2024.
Распределение и преобразование электроэнергии
Поскольку требования к питанию чипов возрастают, часто достигая или превышая 800 Вт, системы распределения электроэнергии в центрах обработки данных должны претерпевать существенные изменения.
«Традиционные системы напряжением 12 В все чаще не справляются с более высокими требованиями к току, что приводит к переходу на более высокие уровни напряжения, такие как 48, 50 и даже 400 В. Будущие чипы, например, разработанные для поддержки алгоритмов искусственного интеллекта, могут даже обеспечивать потребляемую мощность более 2000 Вт, что в некоторых архитектурах может достигать 800 В», - сказал Ли.
Рабочие нагрузки ИИ требуют иного подхода к резервированию в архитектуре электропитания. Для некритичных приложений, таких как большие языковые модели, избыточность не так важна, и питание можно сохранить и возобновить позже.
«Это отличается от критически важных центров обработки данных, таких как банковские или медицинские учреждения, где необходимо бесперебойное питание, обычно обеспечиваемое резервными батареями и генераторами. Эти особые требования подчеркивают необходимость создания специализированных систем распределения и преобразования электроэнергии, обеспечивающих баланс между эффективностью и надежностью», - добавил Ли.
Рис. 2 Энергосистема ORV3 мощностью 18 кВт
Стратегии охлаждения центров обработки данных
С ростом требований к энергопотреблению в современных центрах обработки данных растут и требования к охлаждению. Традиционно эти центры использовали воздушное охлаждение, однако, поскольку мощность чипов достигает нескольких сотен Ватт, этого подхода уже недостаточно. Для обеспечения таких высоких уровней мощности были разработаны новые методы охлаждения, например, охлаждение жидкость-воздух, охлаждение жидкость-жидкость и иммерсионное охлаждение.
«Эти передовые технологии охлаждения направлены на повышение общей эффективности и снижение энергопотребления. Хотя погружное охлаждение, например, обеспечивает эффективное рассеивание тепла, оно может оказаться недоступным для коммерческого использования из-за стоимости и сложности. Баланс между отводом тепла и затратами на охлаждение имеет решающее значение, поскольку эффективность центров обработки данных все больше зависит от оптимизации как преобразования энергии, так и охлаждения», - отметил Ли.
Проблемы, связанные с управлением питанием микросхем и температурой
«Современные мощные микросхемы, работающие при низком напряжении, но требующие большой силы тока, создают сложные проблемы как в распределении мощности, так и в отводе тепла. Например, чип, потребляющий 4000 Ватт при напряжении 0,8 вольта, может потреблять почти 5000 ампер, что создает значительные проблемы с управлением температурой и электричеством», - заявил Ли.
Основными проблемами являются потери электрической мощности, которые относятся к тепловым потерям в электрических цепях, и управление высокими значениями скорости изменения тока, которые вызывают скачки напряжения. Для минимизации потерь и эффективного управления тепловыделением источники питания часто размещают близко к чипу, либо горизонтально на материнской плате, либо вертикально. Разработчики должны учитывать теплопроводные материалы, профили охлаждения и геометрию платы, чтобы максимально эффективно отводить тепло.
Еще одной важной проблемой является надежность центров обработки данных, где типичный ожидаемый срок службы оборудования составляет от 5 до 10 лет. «Учитывая, что для мощных чипов требуется больше вентиляторов и компонентов охлаждения, разработка долговечных компонентов, способных прослужить столь длительный срок, представляет собой сложную задачу. Инженеры работают над тем, чтобы компоненты охлаждения, такие как вентиляторы, соответствовали требованиям к долговечности, но по мере роста требований к охлаждению достичь этих показателей надежности становится все труднее», - сказал Ли.
Традиционные охлаждающие материалы заменяются высокопроизводительными альтернативами, такими как алмаз и золото, для улучшения теплопроводности в полупроводниковых приборах. Такие материалы, как медь, золото и алмаз, могут эффективно отводить тепло, но при этом остается проблема масштабируемости и экономичности для более крупных применений. Кроме того, увеличение площади поверхности для отвода тепла и оптимизация геометрии необходимы для управления выделением тепла в мощных чипах.
Потребление энергии и проектирование будущих центров обработки данных
Как заявил Ли, «Энергопотребление центров обработки данных в настоящее время составляет примерно 3% от общемирового потребления энергии, и этот показатель, по прогнозам, удвоится с развитием искусственного интеллекта. Учитывая ограничения существующей сетевой инфраструктуры, имеются серьезные опасения по поводу удовлетворения будущих потребностей в энергии».
Одним из способов решения этих проблем является строительство центров обработки данных в сельской местности, что снизит нагрузку на городские электросети. Кроме того, изучаются альтернативные источники энергии, хотя сами по себе они могут не удовлетворить растущий спрос. Предпринимаются меры по интеграции различных источников энергии, например, природного газа и ядерной энергии, хотя это требует экологических компромиссов. Поиск устойчивого и надежного решения для энергоснабжения станет ключевой задачей, поскольку центры обработки данных с использованием искусственного интеллекта продолжают расширяться.
Ввиду того, что требования к энергопотреблению растут, центры обработки данных должны уделять приоритетное внимание экологичности. Эффективность энергопотребления должна быть сведена к максимуму, а такие компоненты, как аккумуляторные батареи, каркасы и упаковочные материалы, должны быть спроектированы таким образом, чтобы их можно было перерабатывать. Например, технология производства аккумуляторов требует дальнейших исследований в области экологически чистых материалов, а системы должны учитывать эффективность жизненного цикла для удовлетворения экологических требований. Достижения в области материаловедения имеют решающее значение для достижения эффективности и экологичности в крупномасштабных центрах обработки данных.
Использование технологий охлаждения из других отраслей промышленности
ЦОД могут извлечь выгоду из достижений в области систем охлаждения электромобилей. Например, технологии жидкостного охлаждения, обычно используемые в электромобилях, в настоящее время адаптируются для центров обработки данных, особенно в связи с увеличением плотности энергопотребления последних. Сотрудничество между различными отраслями позволяет проектировщикам центров обработки данных внедрять проверенные стратегии охлаждения, повышая эффективность и экономичность с точки зрения затрат.
Для оптимизации производительности центров обработки данных необходимы три области: (1) разработка общей архитектуры с акцентом на централизованные и распределенные системы и конфигурации переменного и постоянного тока; (2) оптимизация каждого сегмента, особенно в области преобразования энергии и охлаждения; и (3) развитие материаловедения для улучшения теплопроводности и масштабируемости.
Центры обработки данных будут продолжать развиваться в соответствии с потребностями высокопроизводительных применений, искусственного интеллекта и устойчивости развития в условиях рационального природопользования. Благодаря усовершенствованию систем электропитания и охлаждения, повышению эффективности использования материалов и внедрению межотраслевых технологий следующее поколение центров обработки данных сможет удовлетворить как технологические, так и экологические требования будущего.