Мы беседуем с Робом Акерсом, директором программ по вычислениям в Институте атомной энергетики Великобритании, о его новом суперкомпьютере на базе искусственного интеллекта. — computerweekly.com
Правительство Великобритании недавно представило свою Стратегию по термоядерному синтезу Великобритании до 2026 года, которая включает выделение 125 миллионов фунтов стерлингов на развитие зоны роста искусственного интеллекта (ИИ) в Калхэме, Оксфордшир. Это включает инвестиции в размере 45 миллионов фунтов стерлингов в «Санрайз» — новый суперкомпьютер, предназначенный для моделирования термоядерного синтеза. Одной из областей применения «Санрайза» станет ускорение моделирования, создание суррогатов и проектирования, где ИИ сможет упрощать симуляции или изучать поведение сложных систем, таких как плазма, для ускорения расчетов, которые ранее занимали недели или месяцы. Он также будет использоваться для управления данными, обеспечивая согласованность, доступность и электронную читаемость экспериментальных данных и исследований в области термоядерного синтеза Управления по атомной энергетике Великобритании (UKAEA). Кроме того, «Санрайз» предоставит UKAEA — исполнительному неведомственному органу государственного управления, курируемому Департаментом по энергетической безопасности и чистой энергии (DESNZ) — возможность улучшать экспериментальные операции и управление с помощью диагностики в реальном времени, где ИИ может быть обучен выявлять аномалии и сигнализировать о проблемах. Роль оборудования для ускорения ИИ на базе высокопроизводительных вычислений (HPC) в государственной стратегии по ядерному синтезу заключается в подготовке данных для приложений ИИ, чтобы исследователи из малых и средних предприятий (МСП) и академических учреждений могли получать доступ к данным, что будет способствовать более тесному сотрудничеству и взаимодействию с отраслевыми партнерами. В создании суперкомпьютера «Санрайз» с производительностью 6,76 экзафлопс для ИИ участвуют AMD, DESNZ, Департамент науки, инноваций и технологий (DSIT), Dell Technologies, Intel, UKAEA, Кембриджский университет и Weka, поставщик платформы данных. Анализируя его основные показатели производительности, Роб Акерс, директор программ по вычислениям в UKAEA, говорит: «Очень сложно определить, насколько мощным является такое оборудование, как «Санрайз», потому что это зависит от вашей метрики успеха». «Санрайз» предлагает полный спектр точности с плавающей запятой, от 8-битной до 64-битной точности, но, как отмечает Акерс, каждая из них нацелена на разную часть задачи. «Для нас важно, что мы не можем отказаться от 64-битной точности, поскольку именно она будет питать алгоритмы искусственного интеллекта, которые мы будем применять при использовании «Санрайза» в качестве инженерного инструмента», — говорит он. «Санрайз» — это не просто очень мощный ноутбук, это очень сложная машина, которую мы будем использовать для решения очень большого набора сложных задач»Роб Акерс, UKAEA ИИ позволяет сворачивать высокоточные модели, требующие очень высокой битовой точности, в так называемые «суррогатные» модели, по словам Акерса, который добавляет, что эти суррогаты могут работать на рабочей станции или ноутбуке за ничтожную долю времени, которое потребовалось бы большим решателям на крупных суперкомпьютерах. «Это почти как инструмент для открытий», — добавляет он. ««Санрайз» не похож на ноутбук. Это не просто очень мощный ноутбук — это очень сложная машина, которую мы будем использовать для решения очень большого набора сложных задач». Одна из интересных цифр, которая всплывает в спецификации «Санрайза», — это показатель 8-битной точности, особенно учитывая, что 8-битные вычисления отсылают нас к эпохе домашних компьютеров примерно 50 лет назад. «Интересно то, что 8-битная точность стала невероятно мощной частью вычислительного ландшафта благодаря большим языковым моделям [LLM]», — говорит Акерс. Планы UKAEA включают запуск LLM. «Мы собираемся работать в этой области, создавая очень специализированные модели, которые будут обрабатывать архив текстовых документов, собранных за многие-многие десятилетия, и превращать их в полезную информацию и знания», — говорит он.
Цифровые двойники
Акерс говорит, что эта информация будет сопоставлена с данными экспериментов MAST (Mega Amp Spherical Tokamak), проводимых в Калхэме. «Понимание того, как этого достичь, требует всего спектра точности», — отмечает он. Хотя 8-битная точность является областью LLM, которым необходимо обрабатывать токены как можно быстрее для понимания больших объемов текстовой информации, Акерс утверждает, что 64-битная точность — это сфера высокоточного моделирования, требующая высокой степени аккуратности. «Из-за того, как мы запускаем модели вперед во времени, мы не можем допустить их дрейфа. Они должны сохранять определенные физические величины, чтобы симуляции оставались осмысленными», — говорит он. Таким образом, хотя точность с плавающей запятой рассматривается как метрика для сравнения с другими машинами ИИ, для Акерса это не обязательно лучшая метрика для оценки абсолютной производительности научной машины ИИ. По его словам, необходима «способность моделировать очень точные, сильно связанные модели». Это связано с огромной сложностью машины, которая призвана имитировать способ выработки энергии солнцем. «На атомной электростанции, работающей на термоядерном синтезе, существует множество различных физических механизмов, которые связывают установку воедино — от структурных сил из-за гравитации до электромагнетизма. Затем есть тепловой поток и поток излучения по всей системе. Все связано друг с другом», — говорит Акерс. Исторически UKAEA не имела возможности моделировать эту среду в масштабе. «Нас беспокоят «черные лебеди» или эмерджентное поведение, являющееся результатом этой связи», — добавляет он. Акерс говорит, что цифровые двойники, работающие на «Санрайзе», смогут моделировать эти очень сложные системы, результаты которых затем можно будет сравнить с результатами экспериментов. «Мы сможем настроить нашу способность продвигаться вперед во времени или выходить за пределы того, что мы видели ранее, или даже создавать новые установки, которых мы никогда раньше не видели, и совершить гигантский скачок, имея уверенность в том, что мы зафиксировали известные неизвестные в симуляциях», — говорит он. «Проектирование на основе тестов — это дорого и медленно», — добавляет Акерс. Цель состоит в том, чтобы использовать «Санрайз» для сокращения объема проектирования на основе тестов, которое должно выполнять UKAEA. «Это позволит нам браться за задачи, подобные «лунной гонке», гораздо более рентабельно, снижая риски и ускоряя сроки коммерциализации термоядерного синтеза».
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Cliff Saran