Как известно, лидер всемирного рейтинга суперкомпьютеров, японский кластер Fugaku, имеет гомогенную архитектуру и полностью построен на процессорах Fujitsu A64FX, сочетающих архитектуру ARM v8 и фирменные векторные 512-битные расширения.
Такие системы проще в программировании, но это не значит, что процессоры Fujitsu не способны работать в комплексе с сопроцессорами иных архитектур и разработчиков. И новый японский суперкомпьютер Wisteria/BDEC-01 будет гетерогенным по своей природе.
Проект Wisteria — детище Токийского университета, создаваемое с целью поддержки проекта «Society 5.0 ». Не секрет, что Япония испытывает немало проблем, как экономических, так и социальных: старение общества, снижение численности трудоспособного населения, устаревшая инфраструктура и множество других, включая экологию. Для поиска решений и был создан вышеназванный проект, но лишь сейчас он получит серьёзную вычислительную поддержку.
Новый суперкомпьютер будет состоять из двух основных частей: симуляционной под названием Odyssey и кластера анализа данных, названного Aquarius. Эти названия были даны в честь командного и посадочного модулей лунного проекта «Аполлон 13». Пиковая производительность должна находиться в районе 33,1 Пфлопс на вычислениях двойной точности, при этом кластер Odyssey станет второй по производительности HPC-системой на базе ARM, уступая только Fugaku.
Кластер Odyssey будет состоять из 20 стоек Fujitsu PRIMEHPC FX1000, включающих в себя 7680 узлов на базе 48-ядерного процессора A64FX, дополненного 32 Гбайт памяти HBM2 (240 Тбайт совокупно). Для соединения узлов, как и в Fugaku, задействуется фирменная шина Tofu-D с пропускной способностью 13 Тбайт/с.
А вот кластер Aquarius имеет совсем другую архитектуру. Он получит 45 узлов на базе серверов Fujitsu PRIMERGY GX2570. Каждый узел располагает двумя процессорами Intel Xeon Ice Lake и восемью ускорителями NVIDIA A100; общий объём оперативной памяти составляет 36,5 Тбайт. Для соединения здесь используется сеть InfiniBand HDR 200 Гбит/с, а с кластером Odyssey связь будет осуществляться посредством InfiniBand EDR (100 Гбит/с).
С внешним миром Wisteria будет связана интерфейсами 25GbE с совокупной пропускной способностью 800 Гбит/с. Новый суперкомпьютер получит две подсистемы хранения данных на базе Fujitsu Exabyte File System (в основе файловая система Lustre). Быстрая NVMe-часть объёмом 1 Пбайт обеспечит скорость 1 Тбайт/с, а более медленная ограничится скоростью 500 Гбайт/с, зато её объём составит 25,8 Пбайт.
С точки зрения программной поддержки всё выглядит довольно обычно: говорится о поддержке стандартных HPC-решений и компиляторов, включая Fortran, C/C++ и Python, а также библиотек MPI. Однако архитектурно Wisteria уникальна, она включает в себя, как минимум, три архитектуры — ARM, x86-64 и NVIDIA Ampere, и ряд вопросов, касающихся программирования столь необычной системы, пока остаётся открытым.
Для новой системы разрабатывается специальная программная платформа h3-Open-BDEC (Hierarchical, Hybrid, Heterogeneous; Big Data and Extreme Computing), которая должна интегрировать задачи симуляции, анализа данных и машинного обучения в единое целое. На развитие этой платформы уже выделен правительственный грант в объёме 157 млн японских йен ($1,48 млн), рассчитанный на пять лет.
Первые пробные запуски Wisteria/BDEC-01 намечены на 14 мая 2021 года, а начало полномасштабной эксплуатации нового суперкомпьютера запланировано на октябрь. Это первый случай, когда для поиска решений социально-экономических и общественных проблем будет задействованы столь серьёзные вычислительные ресурсы.