Vishal Bansal, Unsplash
Вскоре после введения новых экспортных ограничений США в отношении поставок ускорителей вычислений в ряд стран, включая Китай, стало известно о планах компании NVIDIA выпустить новые ускорители, которые бы отвечали ограничениям и могли хотя-бы частично заместить решения, поставка которых стала невозможна. В игровом сегменте вместо GeForce RTX 4090 в Китае представили урезанный вариант RTX 4090 D, а для серверного сегмента сообщалось о подготовке трёх ускорителей, самым производительным из которых был H20 в форм-факторе SXM и поддержкой NVLink.
Источник: ITHome / NVIDIA
NVIDIA планирует начать массовое производство ускорителя H20 во втором квартале 2024 года, сообщает Wccftech со ссылкой на MyDrivers. Решение предложит 96 ГБ HBM3 памяти с общей пропускной способностью 4 ТБ/с и это даже больше, чем у флагманской H100, но что касается вычислительной производительности, если судить по сухим цифрам, разрыв между H20 и H100 огромен. Например, для H20 на операциях INT8 заявлена производительность 296 TFLOPS, в то время как для H100 в этом же формате вычислений — 3958 TFLOPS. Это цифры с учётом разреженных вычислений.
В Wccftech отмечают, что H20 вместе с двумя другими ускорителями должны были выпустить под конец 2023 года, однако их перенесли на 2024 год, чтобы уладить все нюансы в связи с новыми санкциями. В MyDrivers пишут, что производством ускорителей займётся Wistron, партнёр NVIDIA и, в частности, поставщик подложек для чипов компании.