На конференции GTC 2024 в понедельник компания Nvidia представила свою платформу графических процессоров Blackwell, которая, по ее словам, предназначена для генеративной обработки ИИ. В линейку следующего поколения входят графический процессор B200 и суперчип GB200 Grace, которые обеспечивают все возможности, необходимые для рабочих нагрузок LLM, при этом существенно снижая энергопотребление.
Новый графический процессор Nvidia B200 содержит 208 миллиардов транзисторов и обеспечивает производительность FP4 до 20 петафлопс. Он также включает в себя быстрый трансформатор второго поколения с точностью FP8. GB200 Grace включает в себя два чипа B200 с процессором Nvidia Grace и соединяет их через интерфейс NVLink (C2C), который обеспечивает двунаправленную полосу пропускания со скоростью 900 ГБ/с.
Компания утверждает, что новые ускорители будут способствовать прорывам в области обработки данных, инженерного моделирования, проектирования электроники, автоматизации, компьютерного дизайна лекарств и квантовых вычислений.
По данным Nvidia, 2000 графических процессоров Blackwell могут обучить LLM с 1,8 триллионами параметров, потребляя при этом всего четыре мегаватта энергии, тогда как раньше для выполнения той же задачи требовалось 8000 графических процессоров Hopper и 15 мегаватт.
Компания также утверждает, что в тесте LLM GPT-3 со 175 миллиардами параметров GB200 обеспечивает 7-кратное повышение производительности по сравнению с процессором H100, предлагая при этом в 4 раза более высокую производительность при обучении. Новые чипы потенциально могут снизить эксплуатационные расходы и энергопотребление до 25 раз.
Помимо отдельных чипов, Nvidia также представила многоузловую стоечную систему с жидкостным охлаждением под названием GB200 NVL72 для рабочих нагрузок с интенсивными вычислениями. Она объединяет 72 графических процессора Blackwell и 36 процессоров Grace, соединенных между собой посредством NVLink пятого поколения.
Система оснащена 30 ТБ быстрой памяти и обеспечивает производительность искусственного интеллекта 1,4 эксафлопс для DGX SuperPOD. Nvidia утверждает, что она обеспечивает в 30 раз большую производительность, чем системы с H100 в ресурсоемких приложениях, таких как 1,8T GPT-MoE.
Ожидается, что многие организации и предприятия будут использовать чипы Blackwell. В число крупнейших технологических компаний, планирующих закупить для своих нужд новые графические процессоры, входят Amazon Web Services (AWS), Dell, Google, Meta, Microsoft, OpenAI, Oracle, Tesla и xAI и многие другие.
Конечно многие ожидали или хотели увидеть какие-либо намеки от главы Nvidia об игровых графических процессорах на архитектуре Blackwell, которые, как ожидается, будут выпущены в конце текущего или начале следующего года.
На данный момент предполагается, что флагманом игровой серии станет модель GeForce RTX 5090 на базе графического процессора GB202, а субфлагманом будет RTX 5080 на основе GPU GB203.