Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Microsoft анонсирует Maia 200 — ИИ-ускоритель второго поколения для экономичного выполнения вычислений.

Microsoft представила Maia 200 — собственный ИИ-ускоритель второго поколения на 3-нм техпроцессе, оптимизированный для инференса. Чип демонстрирует значительное превосходство в производительности FP8 над аналогами от Amazon и Google, а также повышенную энергоэффективность. Ещё в 2023 году Microsoft впервые анонсировала разработку собственного ускорителя для ИИ под кодовым названием Maia. Позже, на конференции Build 2024, компания представила более подробную информацию о Maia 100 — своем первом фирменном ИИ-ускорителе. На мероприятии Hot Chips 2024 Microsoft опубликовала спецификации Maia 100 и раскрыла дополнительные детали, включая требования к энергопотреблению. Сегодня Microsoft представила Maia 200 — ускоритель искусственного интеллекта второго поколения, ориентированный на рабочие нагрузки инференса (вывода). В то время как Maia 100 был создан на техпроцессе TSMC 5 нм, Maia 200 базируется на 3-нм техпроцессе TSMC и включает нативные тензорные ядра FP8/FP4. Он поддерживает 216 ГБ п

Microsoft представила Maia 200 — собственный ИИ-ускоритель второго поколения на 3-нм техпроцессе, оптимизированный для инференса. Чип демонстрирует значительное превосходство в производительности FP8 над аналогами от Amazon и Google, а также повышенную энергоэффективность.

Ещё в 2023 году Microsoft впервые анонсировала разработку собственного ускорителя для ИИ под кодовым названием Maia. Позже, на конференции Build 2024, компания представила более подробную информацию о Maia 100 — своем первом фирменном ИИ-ускорителе. На мероприятии Hot Chips 2024 Microsoft опубликовала спецификации Maia 100 и раскрыла дополнительные детали, включая требования к энергопотреблению.

Сегодня Microsoft представила Maia 200 — ускоритель искусственного интеллекта второго поколения, ориентированный на рабочие нагрузки инференса (вывода). В то время как Maia 100 был создан на техпроцессе TSMC 5 нм, Maia 200 базируется на 3-нм техпроцессе TSMC и включает нативные тензорные ядра FP8/FP4. Он поддерживает 216 ГБ памяти HBM3e с пропускной способностью 7 ТБ/с, а также 272 МБ кэш-памяти SRAM на кристалле.

В официальном блоге, анонсирующем Maia 200, Microsoft утверждает, что это самый производительный собственный чип среди всех гиперскейлеров, включая Amazon и Google. В качестве неожиданного шага Microsoft также опубликовала сравнительную таблицу, демонстрирующую преимущества Maia 200 над аналогичными чипами от Google и Amazon. Согласно таблице, Maia 200 обеспечивает почти вдвое большую производительность FP8 по сравнению с Trainium третьего поколения от Amazon и примерно на 10% более высокую производительность FP8, чем TPU седьмого поколения от Google.

-2

Microsoft также подчеркнула энергоэффективность Maia 200, заявив о 30%-ном улучшении производительности на доллар по сравнению с новейшим оборудованием, развернутым в Azure. Maia 200 также спроектирован для крупномасштабных развертываний и оснащен интегрированным сетевым интерфейсом (NIC) на кристалле с двунаправленной пропускной способностью 2,8 ТБ/с для связи в кластере из 6144 ускорителей.

Maia 200 способен обслуживать широкий спектр моделей ИИ, включая GPT-5.2 от OpenAI, что позволит компании внедрять функции ИИ в Microsoft 365 и другие сервисы. Команда Superintelligence от Microsoft также будет использовать Maia 200 для генерации синтетических данных и обучения с подкреплением при разработке будущих внутренних моделей.

В отличие от Maia 100, о котором было объявлено задолго до развертывания, Maia 200 уже используется в центрах обработки данных Microsoft в регионе US Central (недалеко от Де-Мойна, Айова) и в регионе US West 3 (недалеко от Финикса, Аризона).

Чтобы помочь разработчикам и стартапам оптимизировать свои инструменты и модели для Maia 200, Microsoft выпускает предварительную версию SDK для Maia. Этот комплект включает интеграцию с PyTorch, компилятор Triton, оптимизированные библиотеки ядер и доступ к низкоуровневому языку программирования Maia.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Pradeep Viswanathan

Оригинал статьи

Microsoft
32,8 тыс интересуются