В преддверии выхода нового графического ускорителя Instinct MI325X, компания AMD представила подробности архитектуры своей серии MI300X. Листинг раскрыл множество ключевых характеристик, включая количество вычислительных блоков, объем и тип видеопамяти, а также глубокие архитектурные особенности чипов.
Ускорители MI300X и MI325X используют чиплетные дизайны, которые изготавливаются по передовым 5-нм и 6-нм техпроцессами и содержат 153 миллиарда транзисторов.
Графический процессор в MI300X разделен на восемь плиток XCD, каждая из которых содержит четыре шейдерных движка с десятью вычислительными блоками. Это теоретически дает 320 вычислительных блоков на чип, однако в каждом XCD отключены по два CU, что в итоге приводит к общему количеству 304 активных вычислительных блоков. Кроме того, на чипах располагаются 1216 матричных ядер и 19 456 графических ядер. Каждый XCD также получил 4 МБ L2-кэша и 32 МБ Infinity Cache.
Сами чиплеты соединены между собой при помощи двух шин Infinity Fabric, при этом пропускная способность продольной линии составляет 6 ТБ/c, а поперечной — 4,8 ТБ/c. Пропускная способность интерфейса межсоединения XCD/IOD достигает 2,1 ТБ/c.
На общей подложке MI300X располагаются восемь чипов памяти HBM3 с суммарным объемом в 192 ГБ, что соответствует 24 ГБ на каждый чип. Пропускная способность памяти достигает 5,2 ТБ/c. В свою очередь, MI325X будет оснащен более современными чипами памяти HBM3e общей емкостью 288 ГБ с пропускной способностью в 6 ТБ/c. Для объединения нескольких ускорителей в стек AMD применяет шину Infinity Fabric четвертого поколения с пропускной способностью в 896 ГБ/c. Для связи с процессором предусмотрена шина PCIe 5.0 с пропускной способностью 128 ГБ/c.
AMD также предлагает MI300X Platform как индустриальный стандарт — это кластер из восьми MI300X с общей памятью HBM3 в 1,5 ТБ. Компания продемонстрировала несколько примеров стандартных серверов на базе этой платформы.
По производительности в тренировке нейросетей платформа MI300X сопоставима с кластером NVIDIA H100 HGX, а ожидаемая платформа MI325X должна превзойти ее по скорости.