2187 подписчиков

Пока весь мир стоит в очереди за памятью HBM, Huawei сделала свою и встроила ее в ускоритель, который быстрее Nvidia

29 марта29 мар

5 мин

Санкционная война США против китайской полупроводниковой отрасли должна была замедлить Пекин на годы. Вместо этого она, похоже, ускорила появление технологий, которых без давления извне могло не быть ещё долго. Huawei представила ускоритель Ascend 950PR и плату Atlas 350 на его основе — устройство, которое по ключевому для ИИ-инференса показателю почти втрое превосходит Nvidia H20, специально урезанный чип, разрешённый Вашингтоном к поставкам в Китай. Но главная сенсация не в цифрах производительности, а в том, что стоит под крышкой: память HBM собственной разработки Huawei, произведённая на территории КНР. Чжан Дисюань, руководитель направления Ascend в Huawei, заявил о пиковой производительности нового процессора на уровне 1,56 петафлопса в формате FP4 — четырёхбитных вычислений с плавающей запятой. Для сравнения: Nvidia H20 в том же режиме выдаёт примерно 0,56 Пфлопс. Разница — 2,8 раза в пользу китайского чипа. Ключевые характеристики платы Atlas 350 на базе Ascend 950PR: Впрочем,

Оглавление

Что показывают цифры
Зачем нужен FP4 и почему это не уловка
Дорожная карта: что дальше

Что показывают цифры

Чжан Дисюань, руководитель направления Ascend в Huawei, заявил о пиковой производительности нового процессора на уровне 1,56 петафлопса в формате FP4 — четырёхбитных вычислений с плавающей запятой. Для сравнения: Nvidia H20 в том же режиме выдаёт примерно 0,56 Пфлопс. Разница — 2,8 раза в пользу китайского чипа.

Ключевые характеристики платы Atlas 350 на базе Ascend 950PR:

объём памяти HBM — до 112 ГБ (у Nvidia H20 — 96 ГБ, разница около 17%);
пропускная способность памяти — 1,4 ТБ/с;
энергопотребление — около 600 Вт;
прирост скорости мультимодального инференса — до 60% относительно H20, по заявлению разработчика.

Впрочем, сравнение требует контекста. H20 располагает пропускной способностью памяти 4 ТБ/с — почти втрое больше, чем у Atlas 350. Энергопотребление китайского решения на 50% выше. Кроме того, как отмечает Tom's Hardware, ускорители Nvidia на архитектуре Hopper (к которой относится H20) не поддерживают FP4 нативно — этот формат реализован только в новейшей линейке Blackwell. Фактически Huawei сравнивает свой чип с конкурентом в режиме, который тому недоступен. Независимые бенчмарки на момент анонса отсутствуют — все цифры исходят исключительно от самой Huawei.

Зачем нужен FP4 и почему это не уловка

Четырёхбитные вычисления — не маркетинговый трюк, а осознанный инженерный компромисс, набирающий популярность в индустрии ИИ. Суть проста: при инференсе, то есть при использовании уже обученной модели для обработки запросов, сверхвысокая точность вычислений зачастую избыточна. Нейросеть, отвечающая на вопрос пользователя или распознающая объект на изображении, вполне справляется с четырёхбитной арифметикой.

Выигрыш от перехода на FP4 — колоссальный. Модель с 70 миллиардами параметров в режимах более высокой точности может потребовать до 140 ГБ видеопамяти. В формате FP4 тот же самый набор весов укладывается в 35 ГБ — вчетверо меньше. Это означает, что на одном ускорителе можно запустить либо значительно более крупную модель, либо обслуживать кратно больше параллельных запросов. Для дата-центров, где каждый слот в стойке — это деньги, разница принципиальна.

Собственная HBM: главный козырь Huawei

Производительность и архитектурные решения — важны, но настоящий стратегический прорыв кроется в другом. Ascend 950PR оснащён памятью HiBL 1.0 — высокоскоростной памятью с широкой шиной, разработанной и изготовленной самой Huawei. Это первый случай, когда крупный производитель ИИ-ускорителей располагает собственной технологией HBM, не зависящей от внешних поставщиков.

Для понимания значимости этого шага: Nvidia и AMD — две крупнейшие компании, проектирующие ИИ-ускорители, — не производят память самостоятельно. Обе закупают HBM у тройки корейско-американских поставщиков: SK Hynix, Samsung и Micron. В условиях дефицита, вызванного взрывным ростом спроса со стороны ИИ-индустрии, очередь на получение чипов HBM растягивается на кварталы, а цены растут двузначными темпами.

Huawei, создав собственный аналог, вырвалась из этой зависимости. Как отмечает TrendForce, наличие внутреннего производства HBM даёт китайской компании преимущество, которого нет ни у одного другого разработчика ускорителей в мире, включая саму Nvidia.

Внедрение HiBL 1.0 позволило увеличить пропускную способность внутренних соединений в 2,5 раза по сравнению с ускорителями Huawei предыдущего поколения. Пока характеристики HiBL уступают лучшим образцам HBM3e от SK Hynix по абсолютной скорости (1,4 ТБ/с против 4,8 ТБ/с), но сам факт существования работающей альтернативы меняет расстановку сил.

Дорожная карта: что дальше

Ascend 950PR — не разовый продукт, а часть долгосрочного плана, представленного Huawei в сентябре 2025 года. Расписание до 2028 года выглядит следующим образом:

Ascend 950PR — поставки стартуют в первом квартале 2026 года (уже идут). Специализация — инференс;
Ascend 950DT — ожидается в четвёртом квартале 2026-го. Предназначен для обучения ИИ-моделей — задачи, требующей значительно большей вычислительной мощности;
Ascend 960 — четвёртый квартал 2027 года;
Ascend 970 — четвёртый квартал 2028 года

Если Huawei выдержит этот график, к концу десятилетия Китай будет располагать полностью автономной линейкой ИИ-ускорителей с собственной памятью, собственной архитектурой и собственной программной экосистемой — параллельной вселенной, не зависящей ни от Nvidia, ни от американских санкций.

Контекст: что произошло с Nvidia H20

Для полноты картины стоит напомнить, чем является Nvidia H20 — тот самый чип, с которым сравнивается Ascend 950PR. Это специально ослабленный ускоритель, спроектированный Nvidia для соответствия американским экспортным ограничениям. По производительности он существенно уступает флагманским H100 и H200, но формально разрешён к поставкам в Китай.

В июле 2025 года администрация Трампа ослабила ограничения, позволив Nvidia и AMD возобновить поставки H20 и аналогичных устройств в КНР без индивидуальных экспортных лицензий. Это открыло для Nvidia обратный путь на крупнейший рынок ИИ-ускорителей, но одновременно и подстегнуло Huawei к демонстрации того, что Китай уже способен обходиться без американских чипов.

Важность для российского рынка

Для России развитие линейки Ascend имеет практическое значение. В условиях санкционных ограничений доступ к ускорителям Nvidia сужается.

Китайские ускорители Huawei — потенциальная альтернатива для российских дата-центров и разработчиков ИИ, не подпадающая под западные экспортные ограничения. Если Ascend 950PR подтвердит заявленные характеристики в реальной эксплуатации, а программная экосистема (CANN и MindSpore) дозреет до уровня, сопоставимого с CUDA от Nvidia, российский рынок может получить легально доступный инструмент для построения ИИ-инфраструктуры — без посредников, серых схем и миллионных наценок.