Недавно представленный графический процессор Nvidia Blackwell B200 по своей архитектуре отличается от предыдущей Hopper, при этом энергопотребления выросло вдвое. Во время анонса на мероприятии GTC 2024 о технической стороне говорилось мало. В следующие дни представители компании рассказали больше подробностей.
Blackwell является серьёзным обновлением по сравнению с архитектурой Hopper. Здесь есть второе поколение технологии Transformer Engine, что приносит форматы вычислений FP4 и FP6. Вместе с оптимизацией программного обеспечения это делает чип самым быстрым при обработке ИИ. Однако это негативным образом сказалось на вычислениях FP64, которые стали быстрее всего на 32%.
Чиплеты (MCM) используются здесь для повышения общей производительности, а не процента выпуска годных процессоров. В результате два графических процессора работают в одной упаковке. CUDA отлично справляется с этим и с разными архитектурами, не требуя от программистов серьёзных изменений.
Blackwell нельзя назвать лишь графическим процессором. Это настоящая платформа, на основе которой создаётся ряд продуктов с использованием графических процессоров. Пока было анонсировано три вида этих продуктов.
Среди них ведущую роль занимает флагманский полноценный B200 для платформы GB200 Superchip. Здесь предлагаются максимальные вычислительные возможности и TDP составляет 1200 Вт, что на 500 Вт превосходит Hopper. Применяются два GPU B200 и CPU Grace с общей мощностью 2700 Вт.
Далее располагается Blackwell B200 на платформах DGX и HGX. У них потребление составляет около 1000 Вт, а уровень производительности до 90% от полноценного варианта. На третьем месте находится Blackwell B100 с TDP 700 Вт. Здесь даётся 80% или 70% максимальной производительности.
Возможно, в будущем появится однокристальный Blackwell, в первую очередь для платформ на основе PCIe. Архитектура Blackwell уже применяется в потребительских продуктах RTX и ИИ. Заказчики начнут получать Blackwell GB200 в конце года.