LineShine возглавил Top500: 2,198 Эфлопс только на CPU

2 дня назад2 дня назад

3 мин

Суперкомпьютер LineShine из Шэньчжэня занял первое место в рейтинге Top500 и обошёл американский El Capitan. В Linpack он выдал 2,198 Эфлопс FP64, причём без GPU-ускорителей — только на процессорах. Это редкий случай, когда новость из мира суперкомпьютеров читается почти как анонс железа для энтузиастов. Только масштабы другие: не 16 ядер в домашнем Ryzen, а 13,79 млн ядер в одной системе. LineShine стал первой машиной в Top500, которая удержала больше 2 Эфлопс двойной точности FP64 на одних CPU. Для научных расчётов это ключевой показатель: FP64 нужен в моделировании, физике, инженерных задачах и других сценариях, где ошибка округления быстро превращается в мусорный результат. ❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО Систему разместили в National Supercomputing Centre in Shenzhen. Результаты в Top500 подал NSCS, а построил машину Shenzhen Cloud Computing Center. В основе LineShine стоят полузаказные процессоры LX2. Каждый чип получил 304 ядра Armv9 и работа

Оглавление

2,198 Эфлопс FP64 без GPU-ускорителей
LX2: 304 ядра Armv9, HBM и DDR5 в одном CPU
Энергоэффективность лучше Fugaku, но ниже El Capitan

Суперкомпьютер LineShine из Шэньчжэня занял первое место в рейтинге Top500 и обошёл американский El Capitan. В Linpack он выдал 2,198 Эфлопс FP64, причём без GPU-ускорителей — только на процессорах.

Это редкий случай, когда новость из мира суперкомпьютеров читается почти как анонс железа для энтузиастов. Только масштабы другие: не 16 ядер в домашнем Ryzen, а 13,79 млн ядер в одной системе.

2,198 Эфлопс FP64 без GPU-ускорителей

LineShine стал первой машиной в Top500, которая удержала больше 2 Эфлопс двойной точности FP64 на одних CPU. Для научных расчётов это ключевой показатель: FP64 нужен в моделировании, физике, инженерных задачах и других сценариях, где ошибка округления быстро превращается в мусорный результат.

❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО

Систему разместили в National Supercomputing Centre in Shenzhen. Результаты в Top500 подал NSCS, а построил машину Shenzhen Cloud Computing Center.

В основе LineShine стоят полузаказные процессоры LX2. Каждый чип получил 304 ядра Armv9 и работает на частоте 1,55 ГГц. Всего система насчитывает 13,79 млн ядер и использует фирменную сеть LingQi для связи между узлами.

Потребление тоже соответствующее — 42,2 МВт. Для масштаба: это не стойка в серверной, а полноценный энергетический объект. Такой компьютер уже планируют рядом с доступной мощностью, охлаждением и инфраструктурой.

LX2: 304 ядра Armv9, HBM и DDR5 в одном CPU

Процессор LX2 выглядит необычно даже по меркам серверного железа: два вычислительных чиплета, восемь кластеров и 38 ядер в каждом кластере. Китайские инженеры сделали ставку на плотность CPU-ядер, векторные блоки и широкую память, а не на дискретные ускорители.

Архитектура: Armv9
Ядер на процессор: 304
Кластеры: 8 блоков по 38 ядер
Частота: 1,55 ГГц
Память на корпусе: 32 ГБ HBM
Пропускная способность HBM: до 4 ТБ/с
Внешняя память: до 256 ГБ DDR5

Каждое ядро поддерживает Arm SVE и SME. Эти блоки ускоряют векторные и матричные операции, которые встречаются в научных расчётах и задачах ИИ. Поддерживаются форматы FP64, FP32, BF16, FP16 и INT8.

Связка HBM и DDR5 здесь логична. HBM даёт огромную пропускную способность рядом с процессором. DDR5 добавляет объём, без которого большие модели и научные наборы данных быстро упираются в потолок.

Но в смешанной точности LineShine не выглядит так же уверенно. В HPL-MxP система набрала 7,92 EFLOPS и уступила El Capitan, Frontier и Aurora. Для задач обучения и инференса ИИ это ограничение, особенно на фоне систем с AMD Instinct MI300A или Intel Ponte Vecchio.

Переход от FP64 к смешанной точности дал LX2 прирост только в 3,6 раза. Для CPU с SVE и SME это неплохо, но ускорители низкой точности обычно масштабируются сильнее. Упираются не только вычислительные блоки, но и софт, память, сеть между узлами.

❗️ ПОДПИСЫВАЙСЯ НА НАШ КАНАЛ В ДЗЕНЕ И ЧИТАЙ КРУТЫЕ СТАТЬИ БЕСПЛАТНО

Энергоэффективность лучше Fugaku, но ниже El Capitan

По производительности на ватт LineShine не обошёл El Capitan, хотя и стал быстрее в общем рейтинге Linpack. Зато на фоне Fugaku, прежнего CPU-only лидера, скачок огромный: разница в эффективности достигает более чем трёх раз по верхней оценке Fugaku.

Система Ключевой показатель Энергоэффективность LineShine 2,198 Эфлопс FP64 в Linpack 52,07 GFLOPS/W El Capitan Предыдущий лидер Top500 60,94 GFLOPS/W Fugaku CPU-only лидер прошлых лет 14,78-16,84 GFLOPS/W

LineShine также поднялся на первое место в рейтинге HPCG с результатом 22,00 HPCG-PFLOPS. Этот тест ближе к реальным инженерным нагрузкам, чем чистый Linpack. Он сильнее давит на память и межсоединения, поэтому хороший результат там ценят отдельно.

Для Китая эта публикация в Top500 важна ещё и технически. NSCS не стал держать машину в тени и отправил результаты в официальный рейтинг. Значит, разработчики готовы публично показывать платформу, процессоры LX2 и сеть LingQi.

В карточке Top500 для LineShine указаны 13 790 000 ядер, 42,2 МВт потребления и результат 2,198 Эфлопс в Linpack.

Подписывайтесь на наши каналы в Telegram и Дзен, чтобы узнавать больше. И делитесь своим мнением и опытом в нашем чате.

LineShine возглавил Top500: 2,198 Эфлопс только на CPU ⚡️