Компания Intel официально представила сегодня свой ускоритель Gaudi 3 для рабочих нагрузок ИИ. Новые процессоры медленнее популярных графических процессоров H100 и H200 от Nvidia, поэтому Intel делает ставку на успех Gaudi 3 за счет его более низкой цены и более низкой совокупной стоимости владения (TCO).
Процессор Gaudi 3 от Intel использует два чиплета, которые содержат 64 тензорных ядра процессора (TPC, структура MAC 256x256 с накопителями FP32), восемь процессоров умножения матриц (MME, 256-битный векторный процессор) и 96 МБ кэша SRAM на кристалле с пропускной способностью 19,2 ТБ/с. Кроме того, Gaudi 3 включает 24 сетевых интерфейса 200 GbE и 14 медиа-процессоров, способных работать с кодеками H.265, H.264, JPEG и VP9 для поддержки обработки изображений. Процессор комплектуется 128 ГБ памяти HBM2E в восьми стеках, предлагая огромную пропускную способность в 3,67 ТБ/с.
Gaudi 3 от Intel представляет собой значительное улучшение по сравнению с Gaudi 2, который имеет 24 TPC, два MME и несет 96 ГБ памяти HBM2E. Однако похоже, что Intel упростила как TPC, так и MME, поскольку процессор Gaudi 3 поддерживает только матричные операции FP8, а также матричные и векторные операции BFloat16, т. е. больше никаких FP32, TF32 и FP16.
Что касается производительности, то Intel заявляет, что Gaudi 3 может предложить до 1856 TFLOPS в BF16/FP8, а также до 28,7 BF16 векторных TFLOPS при TDP около 600 Вт. По сравнению с Nvidia H100, по крайней мере на бумаге, Gaudi 3 предлагает немного более низкую производительность BF16, в два раза более низкую производительность FP8 и значительно более низкую векторную производительность BF16 (28,7 против 1979 TFLOPS).
Более важным, чем чистые спецификации, будет фактическая производительность Gaudi 3 в реальных приложениях. Процессору нужно конкурировать с серией AMD Instinct MI300, а также с процессорами Nvidia H100 и B100/B200. Следует иметь в виду, что многое зависит от программного обеспечения и других факторов. На данный момент Intel показала несколько слайдов, утверждающих, что Gaudi 3 может предложить значительное преимущество в цене и производительности по сравнению с Nvidia H100.
Ранее в этом году Intel указала, что комплект ускорителя на основе восьми процессоров Gaudi 3 на базовой плате будет стоить 125000 долларов, это означает, что каждый из них будет стоить около 15625 долларов. Для сравнения, карта Nvidia H100 в настоящее время доступна за 30678 долларов, поэтому Intel действительно планирует применить стратегию более низкой цены перед своим конкурентом. Тем не менее, с потенциально огромными преимуществами в производительности, предлагаемыми графическими процессорами B100/B200 на базе Blackwell, еще предстоит увидеть, сможет ли Intel сохранить свое преимущество над конкурентом.
«Спрос на ИИ ведет к масштабной трансформации в центрах обработки данных, и отрасль требует выбора в области оборудования, программного обеспечения и инструментов для разработчиков. С запуском Xeon 6 с P-ядрами и ИИ-ускорителями Gaudi 3 компания Intel обеспечивает открытую экосистему, которая позволяет нашим клиентам реализовывать все свои рабочие нагрузки с большей производительностью, эффективностью и безопасностью», — сказал Джастин Хотард, исполнительный вице-президент Intel и генеральный менеджер группы центров обработки данных и искусственного интеллекта.
Ускорители искусственного интеллекта Gaudi 3 от Intel будут доступны в IBM Cloud и Intel Tiber Developer Cloud. Кроме того, системы на базе Intel Xeon 6 и Gaudi 3 будут доступны в системах Dell, HPE и Supermicro в четвертом квартале, при этом поставки систем от Dell и Supermicro начнутся в октябре, а поставки от Supermicro — в декабре.