Найти в Дзене
DanFlops

Гонка к ExaFLOPS

На трассе сейчас четыре основных лидера - США, Китай, Япония и Евросоюз вместе взятый.

Все участники тратят миллиарды долларов на то, чтобы к 2021-2024 году (это уж как пойдёт) - построить огромный суперкомпьютер. Который будет выполнять 1 ExaFLOPS, или 1 000 000 000 000 000 000 (здесь восемнадцать нулей!) операций с плавающей точкой в секунду.

Есть такая организация, Hyperion, которая любит собирать всякие слухи и статистику по суперкомпьютерам.

Они предсказывают, что первыми будут китайцы, которые уже в 2020-м году построят огромную машину и теоретически она будет экзафлопсом. В 2021-м году свой экзафлопс представит США.

Европа отстаёт, потому что они очень сильно вложились в разработку собственного процессора, базирующегося на ARM и/или RISC V. Рискованное, в общем, мероприятие.

Правда, японцы тоже свой процессор делают на базе ARM, но у них уже дела ближе к завершению. Короче, одна табличка вместо квадриллиона слов:

Hyperion Research ExaScale Update
Hyperion Research ExaScale Update

В табличке есть два интересных параметра: Sustained ES и Peak ES.

Peak ES - это значит, что все железки собрали в кучу, объединили интерконнектом и софтом худо-бедно и воткнули в розетку. Можно начинать мериться Линпаками.

А вот Sustained ES - это гораздо интереснее. Sustained - значит, что на всей груде железа запустили реальное 64-битное приложение, и оно выдало производительность 1 экзафлопс. Для этого пикового (теоретически возможного на данном железе) экзафлопса ни разу не достаточно.

Но это единственный по-настоящему важный параметр. Потому что планируемый суперкомпьютерный монстр стоит целое состояние и однозначно будет сжирать энергетический бюджет небольшого городка (изначально целились в 20 MW, но сейчас уже про 30-40 MW говорят).
И чтобы он себя окупил, он должен решать реальные задачи.

Задачи тоже уже готовятся - это и климатические модели, и сейсмические, и термоядерная энергия, и персонализированная медицина (включая поиск лекарств от рака, старости и всех болезней).

А это значит, что в гонке победит не тот, кто придёт к финишу первым. А тот, кто построит реальную машину, на которой можно будет считать много разных жизненно-важных задач. То есть с нормальным, зрелым программным стеком - чтобы не приходилось годами делать архитектурно-зависимые оптимизации для прикладных задач и чтобы отказоустойчивость была приемлемая.