1332 подписчика

«Горячая» математика: матричный термопроцессор.

31 января31 янв

7 мин

Как физика теплопроводности заменила транзисторы, а тепло стало носителем информации. Квантовые компьютеры уже набили оскомину своей хоть и выдающейся, но в каком-то смысле всё ещё гипотетической производительностью. Растущие тем временем рабочие нагрузки не способствуют снижению потребностей в разработке всё более и более энергоэффективных вычислительных подходов и архитектур. Одними из основных направлений новых парадигм современности выступают нейроморфные и аналоговые вычисления. Фундаментальной операцией в подобных системах является матрично-векторное умножение (МВУ). Суть его, в общем-то, проста, но на пальцах особо не объяснишь, поэтому приведём очень упрощённый пример. Представьте, что вы выбираете сок —допустим, «яблоко-виноград» — и вам важны ингредиенты. Так вот из множества упаковок разных производителей вам нужно выбрать тот вариант, который содержит долю N винограда, S — яблок и L — сахару (куда ж без него). Таким образом мы определили важность соответствующего элемента

Как физика теплопроводности

заменила транзисторы,

а тепло стало

носителем информации.

Квантовые компьютеры уже набили оскомину своей хоть и выдающейся, но в каком-то смысле всё ещё гипотетической производительностью. Растущие тем временем рабочие нагрузки не способствуют снижению потребностей в разработке всё более и более энергоэффективных вычислительных подходов и архитектур. Одними из основных направлений новых парадигм современности выступают нейроморфные и аналоговые вычисления.

Фундаментальной операцией в подобных системах является матрично-векторное умножение (МВУ). Суть его, в общем-то, проста, но на пальцах особо не объяснишь, поэтому приведём очень упрощённый пример. Представьте, что вы выбираете сок —допустим, «яблоко-виноград» — и вам важны ингредиенты. Так вот из множества упаковок разных производителей вам нужно выбрать тот вариант, который содержит долю N винограда, S — яблок и L — сахару (куда ж без него). Таким образом мы определили важность соответствующего элемента сока. И вот МВУ позволяет этой важностью (то есть N, S и L) оперировать как множителями: применяя их к составу конкретного продукта в виде N*[доля винограда] + S*[доля яблок] + L*[доля сахара], вы получите результирующее число по каждому претенденту и выведите собственный качественный рейтинг соков. Этот математический метод используется практически во всех случаях обработки данных и разного вида сигналов. Все наши чаты GPT и прочие LLM-ки без него также не могут обойтись, включая не только работу, но и сами процессы машинного обучения.

Вездесущность этих операций отнимает много ресурсов — как вычислительных, так и энергетических, — но что, если ваш смартфон или ноутбук смогли бы экономить энергию своих батарей на этих расчётах, используя тепло процессоров? Учёные из Массачусетского технологического института (MIT) создали крошечные кремниевые структуры, которые делают именно это: они превращают избыточное тепло в полезные вычисления.

Обычно для работы электроники тепло предстаёт довольно нежелательным побочным продуктом. Даже при незначительно избыточном нагревании чипы начинают работать хуже, а единожды пережившие сильный перегрев вскоре и вовсе выходят из строя. Этим обусловлена необходимость постоянного совершенствования систем охлаждения вслед за ростом производительности новых моделей компьютеров. Но теперь кое-что может измениться: избытки тепла не только сэкономят энергоресурсы, но также и разгрузят системы охлаждения.

Идея заключается в том, что входные данные (числа для расчётов) можно кодировать в виде разных температур: горячие зоны для "1", холодные — для "0". Авторы работы направили поток тепла через специальную кремниевую "сетку" (как воду по лабиринту труб) и на выходе собрали мощность в виде тепла, получив на другом конце своего рода термостат с фиксированной температурой. Получаемый таким образом тепловой коэффициент становится результатом теплового преобразования.

Иными словами, получилось аналоговое вычисление: результирующие коэффициенты стали не дискретными битами (0 или 1), а выстроились в плавные непрерывные сигналы. Подобно тому, как звуковая волна вашей речи может передать намного больше информации, чем азбука Морзе, которой не подвластны ни интонации, ни темп, подобные аналоговые вычисления имеют свои преимущества. Воплотить их в технологиях — задача будущего, а пока результатом данной работы стала точность свыше 99% для базовых операций вроде вышеописанного матричного умножения. Учитывая, что вычисления выполнены в электронном устройстве, работающем за счёт избыточного тепла вместо электричества, это именно то, что так нужно современным носимым ИИ-решениям.

Ключом к успеху стало так называемое обратное проектирование: вместо того чтобы действовать методом проб и ошибок, учёные снабдили программную систему — свою более раннюю разработку — необходимыми целевыми параметрами, и она рассчитала геометрию будущего термовычислительного элемента так, чтобы он был способен проводить тепло определённым образом. Получилась сетка из прямоугольников с микропорами в кремнии. Во время производства расчётов каждый "пиксель" корректируется тысячи раз, пока тепло не потечёт ровно так, как нужно. Таким образом геометрия полученного лабиринта сама кодирует поток.

На этом месте возникла проблема, связанная с тем, что тепло всегда течёт в сторону холода, и никогда — обратно. Это означает, что учёные научились кодировать лишь положительные коэффициенты. Поэтому, чтобы иметь возможность обрабатывать также и отрицательные значения, целевая матрица была разделена на противоположно оптимизированные сегменты. Разница между ними и стала данными «со знаком минус».

Кайо Силва, студент физфака MIT и ведущий автор статьи в Physical Review Applied о новой вычислительной парадигме, вместе со своим научным руководителем Джузеппе Романо, сотрудником Института военных нанотехнологий, провели тесты разработки на моделях простых матриц (2–3 столбца). Да, для «первого блина» проекта точность довольно высока, но для больших ИИ — далеко не идеальна. Всё потому, что машинному интеллекту понадобятся миллионы таких структур, а значит накопительные потери точности, которые обязательно проявятся на расстоянии, вкупе с низкими скоростями пока что оставляют задачу в состоянии научного вызова, а никак не решённой проблемы.

Тем не менее, вызов принят, и в будущем учёные хотят выстроить из своих структур цепочки, в которых тепловые данные на выходе из одной структуры становятся входящими для другой. Это, за исключением тепла, и происходит в послойной математике нейросетей. Сделать это не просто, поскольку при каждом шаге тепло будет частично рассеиваться, смазывая результаты. Однако на начальном этапе можно будет продумывать геометрию структур и расстояния так, чтобы сигнал не потерялся и не стал слишком медленным.

Помимо этого, авторам предстоит замахнуться на программируемые версии своего подхода, чтобы иметь возможность изменять расчёты без физической перестройки элементов вычислительного процессора. Сейчас под конкретную матрицу заново оптимизируется геометрия кремниевого сеточного термопроцессора. Как уже говорилось, это зашито в самом алгоритме обратного проектирования: он подбирает форму пор в кремнии так, чтобы она реализовывала нужные коэффициенты. По сути – это калькулятор, который умеет делать ровно одну операцию.

Честно говоря, трудно даже представить, как в таких условиях можно добиться программируемости. Тем не менее, учёные усматривают некоторые возможности. Они хотят создать базовую структуру, чьи тепловые свойства можно будет изменять манипуляциями с толщиной слоёв, фазовыми переключателями, микромеханическими элементами, материалами с управляемой теплопроводностью и прочими всевозможными переменными. Если это получится, то одну и ту же "тепловую матрицу" можно будет перенастраивать под разные задачи вместо того, чтобы травить новый кусок кремния под каждый набор коэффициентов.

Пока это направление работ будущего, которое именно так и формируется: от статической маски — к настраиваемому тепловому оператору. Значит ли это, что описанная работа является подготовительной и на сегодня её важность преувеличена?

Отнюдь: для микроэлектроники её результаты полезны уже как есть. Новым структурам не нужно ни электричества, ни лишних чипов чтобы замечать перегрев. Эти тепловые датчики поневоле сами учуют горячее задолго до того, как «запахнет жареным», предотвращая поломки от теплового расширения. И это, конечно, значительный прорыв в разработке "тепловых компьютеров", где отходы становятся топливом для вычислений.

Обычно для тепломониторинга на кристалле ставят сеть датчиков температуры с АЦП, кодирующим тепло в нули и единицы, с логикой и линиями связи, а здесь та же кремниевая структура одновременно "собирает" тепловое поле, выполняет вычисление и выдаёт уже обработанный сигнал, сообщая, например, о горячей точке такой‑то силы. Это потенциально сокращает число отдельных датчиков и цифровой обвязки, освобождая площадь на чипе. Энергия сэкономлена, чипы проще, и даже экология в плюсе.

С другой стороны, представьте сколько энергии в виде тепла просто выбрасывается дата-центрами. Так что у сегодняшней работы огромный потенциал. Компании вроде thermalAI уже пробуют использовать отходящее тепло для так называемых резервуарных вычислений — аналоговых ИИ‑систем, в которых сложная физика среды сама реализует вычислительный резервуар. Данная работа логично ложится в то же направление инженерной мысли, только на уровне аккуратно спроектированных кремниевых метаструктур.

АРМК, по материалам MIT.

Гаджеты и электроника

5,73 млн интересуются