2164 подписчика

FuriosaAI отказывается от GPU: новый 2-нм чип для инференса от Broadcom с памятью HBM4/E превосходит по пропускной способности топовые GPU

27 мая27 мая

3 мин

FuriosaAI и Broadcom сотрудничают для создания высокопроизводительного ускорителя ИИ с памятью HBM4/E. Ускоритель FuriosaAI нового поколения использует чиплетную архитектуру 2 нм и поддержку HBM4/E для массивных кластеров ИИ. Анонсировано третье поколение ускорителя, основанное на платформе RNGD 2-го поколения. — wccftech.com FuriosaAI и Broadcom объединили усилия для создания высокопроизводительного чипа-ускорителя искусственного интеллекта с использованием памяти HBM4/E нового поколения. FuriosaAI анонсировала ускоритель ИИ третьего поколения, который базируется на платформе RNGD второго поколения, находящейся в серийном производстве по техпроцессу 5 нм от TSMC. Платформа ИИ RNGD второго поколения представляет собой решение на базе PCIe мощностью 180 Вт, ориентированное на рабочие нагрузки LLM и агентного ИИ. Решение нового поколения полностью сосредоточится на сегменте инференса ИИ, поскольку спрос на агентный ИИ продолжает расти. Основные особенности ускорителя ИИ третьего поколени

FuriosaAI и Broadcom объединили усилия для создания высокопроизводительного чипа-ускорителя искусственного интеллекта с использованием памяти HBM4/E нового поколения.

Ускоритель ИИ нового поколения от FuriosaAI: чиплетная архитектура 2 нм, поддержка памяти HBM4/E для массивных вычислительных кластеров ИИ

FuriosaAI анонсировала ускоритель ИИ третьего поколения, который базируется на платформе RNGD второго поколения, находящейся в серийном производстве по техпроцессу 5 нм от TSMC. Платформа ИИ RNGD второго поколения представляет собой решение на базе PCIe мощностью 180 Вт, ориентированное на рабочие нагрузки LLM и агентного ИИ. Решение нового поколения полностью сосредоточится на сегменте инференса ИИ, поскольку спрос на агентный ИИ продолжает расти.

Основные особенности ускорителя ИИ третьего поколения от FuriosaAI:

Платформа сочетает технологию вычислений 2 нм с памятью HBM4/4E, предназначенную для обеспечения высокоскоростного сетевого взаимодействия на уровне стоек в массивных вычислительных кластерах ИИ.
Архитектура оптимизирована для требовательных рабочих нагрузок инференса с акцентом на высокоскоростное перемещение данных, что обеспечивает более высокую производительность на ватт и большую плотность токенов по сравнению даже с самыми эффективными GPU.
Решение основано на чипе RNGD текущего поколения от Furiosa, который уже запущен в серийное производство. Среди клиентов — Samsung SDS и LG AI Research.

Согласно деталям, предоставленным FuriosaAI, платформа чипа будет использовать передовой вычислительный кристалл 2 нм и стандарт памяти HBM4/E. Компания сотрудничает с Broadcom для использования передовых возможностей упаковки (advanced packaging), что позволит интегрировать несколько кремниевых кристаллов в единый высокопроизводительный чип ИИ (систему на кристалле).

На тизерном изображении компания демонстрирует чип ИИ 3-го поколения с 12 разъемами памяти HBM4/E, двумя массивными вычислительными чиплетами (2 нм) и двумя контроллерами ввода-вывода. Это составит 432 ГБ, если Furiosa использует модули памяти 12-Hi по 36 ГБ на стек.

Помимо вычислительной архитектуры, FuriosaAI также задействует IP-блоки Ethernet и PCIe от Broadcom, что обеспечит более высокую пропускную способность и сетевое взаимодействие на уровне стоек в массивных кластерах ИИ. Чип ИИ оптимизирован для требовательных реальных рабочих нагрузок ИИ, таких как постобучающая выборка, и высокая пропускная способность является ключевым моментом, поэтому компания выбирает новейшие стандарты HBM4/E.

Компания утверждает, что ее ориентация на пропускную способность, а не на управление потоками (требуемое GPU), поможет ей обеспечить более высокую эффективность и большую пропускную способность токенов по сравнению с современными конструкциями GPU. Кроме того, компания заявляет, что ее программный стек позволяет разработчикам быстро развертывать новые модели ИИ, одновременно удовлетворяя требованиям к пропускной способности и задержке.

SDK Furiosa использует универсальный компилятор, который автоматически преобразует код PyTorch высокого уровня в кремний. Для разработчиков, которым требуется более детальный контроль, виртуальная ISA Furiosa предлагает декларативную модель программирования, обеспечивающую аппаратный контроль без недетерминированной сложности традиционного программирования GPU.

«Объединение инфраструктурных возможностей Broadcom и архитектуры Tensor Contraction Processor от Furiosa, а также ее эталонного программного стека, позволяет нам выйти за рамки уровня чипа и предложить комплексное решение для эпохи «фабрик токенов»», — заявил соучредитель и генеральный директор Furiosa Джун Пак.

Что касается доступности, ожидается, что образцы ускорителя FuriosaAI 3-го поколения появятся в первой половине 2028 года, и он будет готов удовлетворить вычислительные потребности центров обработки данных ИИ нового поколения.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Hassan Mujtaba

Оригинал статьи

Гаджеты и электроника

5,73 млн интересуются