Найти тему
XX2 ВЕК

Учёные-компьютерщики показывают путь: модели ИИ не должны быть ТАКИМИ энергоёмкими

Негативное влияние развития ИИ на изменение климата остаётся недооценённым. Учёные-компьютерщики из Копенгагенского университета (University of Copenhagen) создали «книгу рецептов» для разработки моделей ИИ, потребляющих минимум энергии без ущерба для производительности. По мнению этих учёных, в процесс разработки и обучения ИИ необходимо ввести как фиксированный критерий энергопотребление и углеродный след.

Photo: Getty Images
Photo: Getty Images

Тот факт, что любое использование ИИ — например, поиски в «Google» и общение с Siri или ChatGPT — требует колоссального количества энергии, постепенно стал общеизвестным. По оценкам одного исследования, к 2027 году серверы ИИ будут потреблять столько же энергии, сколько Аргентина или Швеция. И это неудивительно, так как, по подсчётам специалистов, всего одно обращение за помощью к ChatGPT потребляет в среднем столько же энергии, сколько зарядка сорока мобильных телефонов. Но, отмечают учёные-компьютерщики из Копенгагенского университета, сообщество исследователей ИИ и соответствующая индустрия ещё не сделали поворот в сторону создания энергоэффективных и, следовательно, более безопасных для климата моделей ИИ.

«Сегодня разработчики сосредоточены на создании моделей ИИ, эффективных с точки зрения точности результатов. Это всё равно, что оценивать эффективность автомобиля по одной лишь скорости движения, без учёта потребления топлива. В результате, с точки зрения энергопотребления, модели ИИ нередко неэффективны», — говорит доцент Рагхавендра Селван (Raghavendra Selvan) с факультета компьютерных наук, изучающий возможности сокращения углеродного следа ИИ.

Однако Селван и студент-компьютерщик Педрам Бахтиарифард (Pedram Bakhtiarifard) провели исследование, которое показало, что ограничить выбросы CO₂, не ставя под угрозу точность ИИ, совсем не трудно. Для этого необходимо лишь, проектируя и обучая модели ИИ, учитывать влияние на климат.

«Если вы с самого начала разрабатываете энергоэффективную модель, то на каждом этапе её «жизненного цикла» вы сведёте выбросы углекислого газа к минимуму. Это относится и к обучению модели, которое особенно энергоёмко, ибо нередко требует недель и даже месяцев, и к её применению», — говорит Селван.

«Книга рецептов» для индустрии ИИ

В своём исследовании учёные подсчитали, сколько энергии требуется для обучения более 400 000 моделей ИИ типа свёрточных нейронных сетей — причём подсчитали без фактического обучения всех этих моделей. Помимо прочего, свёрточные нейронные сети используются для анализа изображений в сфере здравоохранения, для перевода текстов, а также для распознавания объектов и лиц (у вас на смартфоне, возможно, есть соответствующее приложение для камеры).

-2
Каждая точка на этом рисунке представляет собой модель свёрточной нейронной сети. Горизонтальная ось — потребление энергии, вертикальная — производительность. Обычно выбор модели осуществляется только на основе производительности, без учёта энергопотребления, в результате чего выигрывают модели из зоны красного эллипса. Данное исследование нацеливает практиков на выбор моделей из зоны зелёного эллипса, которые обеспечивают отличный компромисс между производительностью и энергоэффективностью.
Каждая точка на этом рисунке представляет собой модель свёрточной нейронной сети. Горизонтальная ось — потребление энергии, вертикальная — производительность. Обычно выбор модели осуществляется только на основе производительности, без учёта энергопотребления, в результате чего выигрывают модели из зоны красного эллипса. Данное исследование нацеливает практиков на выбор моделей из зоны зелёного эллипса, которые обеспечивают отличный компромисс между производительностью и энергоэффективностью.

На основе расчётов исследователи создали коллекцию образцов ИИ, которые, не теряя или почти не теряя производительности, решают задачи, используя сравнительно мало энергии. Исследование показало, что на этапе обучения и развёртывания можно достичь экономии энергии в размере 70 — 80 % при снижении производительности всего на 1 % или меньше за счёт коррекции моделей или выбора других их типов. И эта оценка, утверждают исследователи, консервативная.

«Считайте наши результаты книгой рецептов для профессионалов в области разработки ИИ. В этих рецептах дана не только производительность различных алгоритмов, но и их энергоэффективность. А ещё показано, что, заменяя при разработке модели один ингредиент другим, нередко можно получать один и тот же результат. Так что теперь специалисты могут выбирать желательную для них модель на основе и производительности, и энергопотребления. При этом нет необходимости в предварительном обучении каждой модели», — говорит Педрам Бахтиарифард.

«Нередко, прежде чем найти ту модель, которая, возможно, окажется наиболее подходящей для решения данной конкретной задачи, приходится обучать множество разных моделей, — продолжает он. — Это делает разработку ИИ чрезвычайно энергозатратной. Поэтому более экологично — с самого начала выбрать правильную модель, а не искать на этапе обучения ту, которая не требует слишком много энергии».

Исследователи подчёркивают, что в определённых сферах деятельности, таких как производство беспилотных автомобилей или некоторые области медицины, точность моделей должна быть максимальной, ибо от неё зависит безопасность. Здесь компромиссная производительность неприемлема. Однако это не означает, что в других сферах деятельности тоже можно пренебрегать высокой энергоэффективностью.

«ИИ обладает потрясающим потенциалом. Но, если мы хотим обеспечить устойчивое и ответственное развитие ИИ, нам нужен более комплексный подход, учитывающий не только производительность модели, но и её влияние на климат. В своём исследовании мы показали, что можно найти отличный компромисс. При разработке ИИ для решения тех или иных задач следует сделать фиксированным критерием энергоэффективность — так же, как во многих других отраслях», — заключает Рагхавендра Селван.

«Книга рецептов», которую создали Селван и Бахтиарифард, доступна в виде набора данных с открытым исходным кодом, чтобы другие исследователи имели возможность экспериментировать с этими данными. Информация обо всех этих 423 000 вариантах архитектуры размещена на сервисе «Github», и специалисты по ИИ могут получить доступ к ней с помощью простых скриптов «Python».

Перевод — Александр Горлов, «XX2 ВЕК». Источники.

Вам также может быть интересно: