Добавить в корзинуПозвонить
Найти в Дзене
DigiNews

Microsoft представила новейший ИИ-чип собственной разработки

Microsoft представила ускоритель ИИ Azure Maia 200 на 3-нм техпроцессе, который на 30% превосходит предшественника по показателю цена/производительность и опережает решения Amazon и Google. Чип сфокусирован на эффективности и инференсе FP4/FP8. Microsoft представила свой новейший ускоритель искусственного интеллекта — Microsoft Azure Maia 200. Этот новый чип для центров обработки данных, разработанный силами самой Microsoft, является следующим поколением линейки графических процессоров Maia. Он предназначен для инференса моделей ИИ с ошеломляющей скоростью, превосходя кастомные решения конкурентов-гиперскейлеров Amazon и Google. Maia 200 позиционируется как «самая эффективная система для инференса» от Microsoft, при этом все пресс-релизы компании уделяют равное внимание как впечатляющим показателям производительности, так и заявленной приверженности экологичности. Microsoft утверждает, что Maia 200 обеспечивает на 30% больше производительности на доллар по сравнению с Maia 100 первого

Microsoft представила ускоритель ИИ Azure Maia 200 на 3-нм техпроцессе, который на 30% превосходит предшественника по показателю цена/производительность и опережает решения Amazon и Google. Чип сфокусирован на эффективности и инференсе FP4/FP8.

Microsoft представила свой новейший ускоритель искусственного интеллекта — Microsoft Azure Maia 200. Этот новый чип для центров обработки данных, разработанный силами самой Microsoft, является следующим поколением линейки графических процессоров Maia. Он предназначен для инференса моделей ИИ с ошеломляющей скоростью, превосходя кастомные решения конкурентов-гиперскейлеров Amazon и Google.

Maia 200 позиционируется как «самая эффективная система для инференса» от Microsoft, при этом все пресс-релизы компании уделяют равное внимание как впечатляющим показателям производительности, так и заявленной приверженности экологичности. Microsoft утверждает, что Maia 200 обеспечивает на 30% больше производительности на доллар по сравнению с Maia 100 первого поколения, что является впечатляющим достижением, учитывая, что новый чип технически заявляет на 50% более высокий показатель TDP, чем его предшественник.

Maia 200 построен на 3-нм техпроцессе TSMC и содержит 140 миллиардов транзисторов. Заявленная пиковая производительность чипа в вычислениях FP4 достигает 10 петафлопс, что в три раза превышает показатели конкурента от Amazon — Trainium3. Maia 200 также оснащен 216 ГБ памяти HBM3e на борту с пропускной способностью 7 ТБ/с, дополненной 272 МБ SRAM на кристалле.

Как видно выше, Maia 200 демонстрирует явное преимущество в чистой вычислительной мощности по сравнению с внутренними разработками Amazon и поднимает интересный вопрос в сравнении с флагманскими GPU от Nvidia. Очевидно, что сравнивать их как прямых конкурентов — занятие неблагодарное: Maia 200 недоступен для прямых продаж внешним заказчикам, Blackwell B300 Ultra оптимизирован для гораздо более ресурсоемких сценариев использования, чем чип Microsoft, а программный стек Nvidia выводит его на недосягаемую для большинства современников высоту.

Тем не менее, Maia 200 превосходит B300 по энергоэффективности, что является большим плюсом в эпоху растущего общественного беспокойства по поводу воздействия ИИ на окружающую среду. Maia 200 работает почти вдвое ниже TDP B300 (750 Вт против 1400 Вт), и, если он ведет себя так же, как Maia 100, то будет работать ниже своего теоретического максимального TDP; Maia 100 был спроектирован как 700-ваттный чип, но Microsoft заявляет, что в эксплуатации он ограничивался 500 Вт.

Maia 200 оптимизирован для производительности в форматах FP4 и FP8, ориентируясь на клиентов, выполняющих инференс моделей ИИ, требующих высокой производительности FP4, а не более сложных операций. Значительная часть бюджета Microsoft на НИОКР для этого чипа, по-видимому, была направлена на иерархию памяти, реализованную в 272 МБ банка высокоэффективной SRAM, которая разделена на «многоуровневую SRAM кластерного уровня (CSRAM) и SRAM плиточного уровня (TSRAM)», что обеспечивает повышенную операционную эффективность и философию интеллектуального и равномерного распределения рабочих нагрузок по всем кристаллам HBM и SRAM.

Сложно оценить улучшения Maia 200 по сравнению с предшественником Maia 100, поскольку официальные технические спецификации Microsoft для обоих чипов практически не имеют пересечений или общих метрик. На данном этапе можно лишь констатировать, что Maia 200 будет работать горячее, чем Maia 100, и, по заверениям, на 30% лучше по показателю «производительность на доллар».

Maia 200 уже развернут в дата-центре Microsoft Azure US Central, а будущие развертывания анонсированы для US West 3 в Финиксе, штат Аризона, и последующие по мере поступления новых чипов. Чип станет частью гетерогенного развертывания Microsoft, работая в тандеме с другими различными ускорителями ИИ.

Maia 200, изначально носивший кодовое имя Braga, наделал шума из-за сильной задержки в разработке и выпуске. Выпуск и развертывание чипа планировались на 2025 год, возможно, даже раньше B300, но этому не суждено было сбыться. Следующий аппаратный релиз Microsoft не определен, но, по сообщениям октября, он, вероятно, будет изготовлен на процессе 18A от Intel Foundry.

Сообщение Microsoft о приоритете эффективности в контексте Maia 200 соответствует недавним тенденциям корпорации подчеркивать свою заявленную заботу о сообществах, прилегающих к ее ЦОДам, прилагая большие усилия, чтобы заглушить критику бума ИИ. Генеральный директор Microsoft Сатья Наделла недавно выступил на Всемирном экономическом форуме, заявив, что если компании не смогут помочь общественности увидеть предполагаемые преимущества развития ИИ и строительства ЦОДов, они рискуют потерять «социальное разрешение» и спровоцировать нежелательный пузырь ИИ.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Sunny Grimm

Оригинал статьи

Microsoft
32,8 тыс интересуются