На конференции Nvidia GTC 2024 в понедельник была представлена платформа Blackwell GPU, разработанная компанией для генеративной обработки данных искусственного интеллекта. Новая линейка графических процессоров следующего поколения включает в себя GPU B200 и "суперчип" GB200 Grace, которые обеспечивают все необходимые функции для выполнения задач LLN-инференса, при этом значительно снижая энергопотребление.
Графический процессор B200 содержит в себе 208 миллиардов транзисторов и достигает производительности FP4 до 20 петафлопс. Он также оснащен улучшенным двигателем трансформации второго поколения с точностью FP8. Суперчип GB200 Grace объединяет два чипа B200 с процессором Nvidia Grace и соединяет их через интерфейс NVLink C2C, обеспечивая двунаправленную пропускную способность в 900 Гбит/с. Компания заявляет, что новые ускорители помогут достичь прорывов в области обработки данных, инженерного моделирования, электронного дизайна, автоматизации, автоматизированного проектирования лекарств и квантовых вычислений.
По данным Nvidia, всего 2000 графических процессоров Blackwell способны обрабатывать 1,8 миллиарда параметров LLN при энергопотреблении всего 4 мегаватта, в то время как для выполнения той же задачи ранее требовалось 8000 графических процессоров с энергопотреблением 15 мегаватт. Кроме того, компания утверждает, что в тесте GPT-3 LLN с 175 миллиардами параметров GB200 обеспечивает в 7 раз более высокую производительность по сравнению с H100 и в 4 раза более высокую производительность при обучении. Также отмечается, что новые чипы снижают эксплуатационные расходы и энергопотребление до 25 раз.
Кроме отдельных чипов, Nvidia также представила многоузловую систему NVL72 Blackwell с жидкостным охлаждением для интенсивных вычислительных нагрузок. Она объединяет 36 суперчипов Grace Blackwell, включающих 72 графических процессора Blackwell и 36 процессоров Grace, соединенных между собой через NVLink пятого поколения. Система оборудована 30 ТБ оперативной памяти и обеспечивает производительность искусственного интеллекта в 1,4 эксафлопса для последнего DGX SuperPod. Nvidia заявляет, что эта система обеспечивает производительность в 30 раз выше, чем системы H100, в ресурсоемких приложениях, таких как GPT-MoE с 1,8 трлн параметров.
Ожидается, что множество организаций и предприятий перейдут на использование Blackwell, среди которых крупнейшие технологические компании США, такие как Amazon Web Services (AWS), Dell, Google, Meta, Microsoft, OpenAI, Oracle, Tesla и XAI, а также другие. К сожалению для геймеров, генеральный директор Nvidia Дженсен Хуанг не представил игровые графические процессоры Blackwell, которые ожидается будут выпущены позже в этом году или в начале 2025 года. По предварительным данным, линейку возглавит RTX 5090 с графическим процессором GB202, в то время как RTX 5080 будет дополнен GB203.