Ресурс InsideHPC сообщил о проблемах, которые наблюдаются у экзафлопсного суперкомпьютера Frontier Окриджской национальной лаборатории (ORNL) на этапе тестирования в ходе подготовки к запуску «полноценных пользовательских операций», намеченному на январь следующего года. Frontier официально является самым быстрым суперкомпьютером в мире, хотя в Китае уже используют ряд экзафлопсных систем, которые не вошли в список TOP500. Практически ежедневно у Frontier фиксируются аппаратные сбои. Как утверждает InsideHPC, это объясняется отсутствием стабильности в работе Frontier при выполнении ресурсоёмких рабочих нагрузок. Некоторые из проблем связаны с ускорителями AMD Instinct MI250X, которые несут большую часть вычислительной нагрузки. Ресурс ранее сообщал о проблемах с интерконнектом HPE Cray Slingshot 11, наблюдавшихся с конца прошлого до весны этого года, которые специалисты пытались решить до запуска бенчмарка HPL в мае, когда система преодолела отметку в 1 Эфлопс в FP64-вычислениях. Впроч
Frontier, самый мощный суперкомпьютер США, всё ещё страдает от ежедневных аппаратных сбоев
11 октября 202211 окт 2022
9
3 мин