Добавить в корзинуПозвонить
Найти в Дзене
OVERCLOCKERS.RU

Intel анонсировала ускоритель ИИ Gaudi3

На выставке Vision 2024 компания Intel приоткрыла завесу тайны над Gaudi3, своим ускорителем нового поколения, сочетающим в себе два 5-нм кристалла производства TSMC. Чип может похвастаться впечатляющими характеристиками: 64 тензорных ядра 5-го поколения, 128 ГБ памяти HBM2w и мощность в 900 Вт. Gaudi3 пришел на смену Gaudi2, разработанному Habana Labs, которую Intel приобрела пять лет назад. Количество тензорных ядер увеличилось с 24 на Gaudi2 до объединения двух 32-ядерных чипов в Gaudi3. Каждый чип имеет 48 МБ SRAM-памяти, всего 96 МБ на весь пакет. Сама память SRAM имеет пропускную способность 12,8 ТБ/с и поддерживается памятью HBM2e, но с более высокой общей пропускной способностью 3,7 ТБ/с по сравнению с 2,45 ТБ/с у Gaudi2. Кроме того, полная емкость, как сказано выше, увеличилась с 96 ГБ до 128 ГБ. Для варианта форм-фактора PCIe (HL388) Gaudi3 также использует интерфейс PCI Express 5.0 на всех 16 линиях. Согласно имеющейся информации эта версия имеет TDP 600 Вт, что редко встреч

На выставке Vision 2024 компания Intel приоткрыла завесу тайны над Gaudi3, своим ускорителем нового поколения, сочетающим в себе два 5-нм кристалла производства TSMC. Чип может похвастаться впечатляющими характеристиками: 64 тензорных ядра 5-го поколения, 128 ГБ памяти HBM2w и мощность в 900 Вт. Gaudi3 пришел на смену Gaudi2, разработанному Habana Labs, которую Intel приобрела пять лет назад. Количество тензорных ядер увеличилось с 24 на Gaudi2 до объединения двух 32-ядерных чипов в Gaudi3. Каждый чип имеет 48 МБ SRAM-памяти, всего 96 МБ на весь пакет. Сама память SRAM имеет пропускную способность 12,8 ТБ/с и поддерживается памятью HBM2e, но с более высокой общей пропускной способностью 3,7 ТБ/с по сравнению с 2,45 ТБ/с у Gaudi2. Кроме того, полная емкость, как сказано выше, увеличилась с 96 ГБ до 128 ГБ.

Для варианта форм-фактора PCIe (HL388) Gaudi3 также использует интерфейс PCI Express 5.0 на всех 16 линиях. Согласно имеющейся информации эта версия имеет TDP 600 Вт, что редко встречается для этого форм-фактора. Однако существует и версия ОАМ (HLB-32B), имеющая номинальный TDP 900 Вт при воздушном охлаждении сервера, а при водяном охлаждении этот показатель может быть еще выше.

-2

Intel привела несколько сравнений с нынешним лидером отрасли NVIDIA, имеющей в своем ассортименте чипы H100 и H200 на базе архитектуры Hopper и уже анонсировала преемника на архитектуре Blackwell, выпуск которого, однако, не стоит ожидать в ближайшее время. Текущие прогнозы показывают, что обучение Gaudi3 будет в 1,7 раза быстрее по сравнению с H100 (в 1,4–1,7 раза быстрее в зависимости от используемой модели большого языка). Однако если говорить о скорости вывода, то фактическая производительность будет варьироваться, иногда от проигрыша до 10%, а иногда и выигрыша до 70%. С точки зрения энергоэффективности Gaudi3 в 1,2–2,3 раза более эффективен.

Intel явно стремится догнать и по возможности превзойти NVIDIA, но никаких конкретных цифр по конкуренции с AMD Instinct, не приводит.

-3

Первые образцы Gaudi3 будут предоставлены партнерам в первой половине 2024 года. Однако больших объемов ожидать не стоит раньше второй половины текущего года. В настоящее время независимых тестов нет, поэтому пока приходится полагаться на данные самой Intel.