2111 подписчиков

Alibaba бросает вызов NVIDIA Hopper: чип Zhenwu M890 обещает трехкратный прирост производительности H20, 144 ГБ HBM3 и план развития до 2028 года

21 мая21 мая

173

3 мин

Alibaba представила ИИ-чип «Чжэньу M890» и LLM «Qwen3.7-Max» для Агентного ИИ. Чип M890 на архитектуре PPU предлагает 0,6 PFLOPs FP16, сопоставимо с A100 NVIDIA, и втрое быстрее Hopper H20. Модель Qwen3.7-Max ориентирована на кодирование и долгосрочные задачи. — wccftech.com Компания Alibaba представила свой новейший ИИ-чип «Чжэньу M890» и большую языковую модель (LLM) «Qwen3.7-Max», разработанные для рабочих нагрузок Агентного ИИ. Alibaba Zhenwu M890 основан на собственной архитектуре PPU (Parallel Processing Unit — блок параллельной обработки) компании и оснащен движком на базе архитектуры Transformer. Чип разработан для рабочих нагрузок Агентного ИИ с акцентом на инференс (вывод) ИИ, предлагая производительность 0,6 PFLOPs в формате FP16 (половинной точности), что сопоставимо с A100 от NVIDIA и в три раза быстрее решения Hopper H20. Компания также заявляет, что ИИ-чип M890 обеспечивает в 3 раза большую вычислительную производительность по сравнению с предложениями предыдущего поколе

Компания Alibaba представила свой новейший ИИ-чип «Чжэньу M890» и большую языковую модель (LLM) «Qwen3.7-Max», разработанные для рабочих нагрузок Агентного ИИ.

На фоне бума Агентного ИИ Alibaba выпускает собственный ИИ-чип и LLM: встречайте GPU Zhenwu M890 и модель Qwen3.7-Max

Alibaba Zhenwu M890 основан на собственной архитектуре PPU (Parallel Processing Unit — блок параллельной обработки) компании и оснащен движком на базе архитектуры Transformer.

Чип разработан для рабочих нагрузок Агентного ИИ с акцентом на инференс (вывод) ИИ, предлагая производительность 0,6 PFLOPs в формате FP16 (половинной точности), что сопоставимо с A100 от NVIDIA и в три раза быстрее решения Hopper H20. Компания также заявляет, что ИИ-чип M890 обеспечивает в 3 раза большую вычислительную производительность по сравнению с предложениями предыдущего поколения.

Что касается спецификаций, Zhenwu M890 оснащен памятью HBM3 объемом 144 ГБ, что на 50% больше, чем у Zhenwu 810E, который имел 96 ГБ памяти. Пропускная способность межсоединений также увеличена до 800 ГБ/с, что на 100 ГБ/с больше, чем у чипа 810E. Кроме того, новый чип поддерживает форматы FP32, FP16, FP8 и FP4 для рабочих нагрузок ИИ. Это ставит чип в один ряд с возможностями серий Rubin от NVIDIA и Ascent 950 от Huawei.

Компания предлагает полную экосистему с внедрением нового чипа межсоединений под названием ICN Switch 1.0. Этот чип обеспечивает скорость межсоединений 25,6 Тбит/с при задержке P2P менее 150 нс. Более высокая пропускная способность позволяет поддерживать массовую конкурентность агентов. Также имеются хост-процессор Yitian на базе Arm и сетевые карты серии Panmai, которые будут объединены в сервере Panjiu AL128 Supernode от Alibaba Cloud.

Этот новый сервер будет тесно интегрировать 128 ИИ-ускорителей в одном корпусе, обеспечивая пропускную способность в масштабе петабайт в секунду (PB/s). T-Head сообщает, что на сегодняшний день отгружено около 560 000 ИИ-чипов Zhenwu, обслуживающих более 400 внешних клиентов из 20 отраслей.

Заглядывая в будущее, Alibaba Cloud работает над серией чипов Zhenwu, следующих за M890.

В третьем квартале следующего года компания планирует представить V900 с обновленной архитектурой, обеспечивающей 3-кратный прирост производительности, 216 ГБ памяти и пропускную способность 1200 ГБ/с, а его преемник, Zhenwu J900, появится в третьем квартале 2028 года с еще большими архитектурными улучшениями и приростом производительности.

Модель демонстрирует исключительные агентные возможности в различных доменах. В качестве передового помощника по кодированию она поддерживает задачи от быстрого прототипирования фронтенда до сложной разработки программного обеспечения с множеством файлов. Для повышения производительности офисной работы она надежно управляет рабочими процессами с несколькими агентами для выполнения сложных операций. Примечательно, что Qwen 3.7-Max может автономно выполнять долгосрочные агентные задачи — поддерживая непрерывную работу до 35 часов и управляя более чем 1000 вызовами инструментов без снижения производительности.Глубоко оптимизированная для ведущих агентных фреймворков, включая OpenClaw, Hermes Agent, Claude Code, Qwen Paw и Qoder, она служит надежной основой для различных агентных систем. Модель достигает лучших результатов в основных бенчмарках по кодированию, универсальным агентам, общим возможностям и многоязычию, что делает ее конкурентоспособной с ведущими передовыми моделями. Вскоре она станет доступна глобальным разработчикам через сервисную платформу моделей Alibaba Model Studio.Alibaba Cloud

Помимо чипов, Alibaba Cloud также запускает свою новейшую LLM Qwen3.7-Max. Эта модель ориентирована на продвинутое агентное кодирование, сложное рассуждение и выполнение долгосрочных задач. Новая модель скоро будет доступна разработчикам и предприятиям.

Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.

Автор – Hassan Mujtaba

Оригинал статьи

Гаджеты и электроника

5,73 млн интересуются