20 марта 2026 года на China Partner Conference в Шэньчжэне Huawei выкатила Atlas 350 — ускорительную карту на новом процессоре Ascend 950PR. Вице-президент Ма Хайсюй и глава направления Ascend Чжан Дисюань заявили: в формате FP4 карта выдаёт 1,56 петафлопс. Это в 2,8 раза больше, чем у адаптированной для Китая Nvidia H20. Почему FP4 так важен? Традиционные форматы (FP16, FP32) точны, но медленны и энергозатратны. FP4 — это всего 4 бита на число. Меньше точности — зато в разы выше пропускная способность памяти и скорость вычислений. Для инференса (а не тренировки) это золотая середина: качество почти не падает, а стоимость и энергопотребление падают драматично. Рекомендательные системы, мультимодальные модели, голосовые ассистенты, генеративный поиск — всё это теперь можно запускать на куда больших масштабах. Запуск не случайный. Семь крупных китайских производителей серверов одновременно анонсировали решения на Atlas 350. Это значит: экосистема готова, чипы уже идут в коммерческие да
Huawei Atlas 350: чип, который в 2,8 раза быстрее Nvidia H20 в эпоху инференса
21 марта21 мар
2
2 мин