Ускоритель искусственного интеллекта Gaudi 3 является преемником искусственного интеллекта Gaudi 2, и Intel заявляет, что предстоящий 5-нм ускоритель обеспечит удвоенную производительность FP8, четырехкратную производительность BF16, удвоит пропускную способность сети и увеличит пропускную способность памяти на 50% по сравнению с Gaudi 2.
С точки зрения общих характеристик, эта деталь оптимизирована как для работы с очень большими моделями, так и для возможности масштабирования до огромных размеров. Его архитектурные особенности и большая кэш-память SRAM объемом 96 МБ дают ему преимущество при работе с очень большими моделями искусственного интеллекта.
Intel сравнивает Gaudi 3 непосредственно с графическим процессором Intel Hopper H100, обучающим различные модели. Во всех примерах Gaudi 3 демонстрирует значительное преимущество в производительности.
Gaudi 3 демонстрирует конкурентоспособную и впечатляющую производительность. Это действительно большая модель Falcon-180B, в которой новая деталь Intel показывает четырехкратное улучшение производительности - хотя мы должны подчеркнуть, что все эти цифры являются прогнозами.
Важным аргументом в пользу проекта Gaudi 3, который Intel подчеркивала прессе, является его относительная эффективность. Несмотря на то, что Gaudi 3 построен по 5-нм техпроцессу по сравнению с H100 от Nvidia (который изготовлен на базе 4N от TSMC), Intel утверждает, что Gaudi 3 может обеспечить до 2,3-кратного повышения энергоэффективности по сравнению с предыдущими компонентами NVIDIA.
Intel утверждает, что разработчики смогут перенести свои модели для работы на Gaudi всего за три строки кода. Stability AI утверждает, что переход на оборудование Intel занял "менее суток".