Добавить в корзинуПозвонить
Найти в Дзене
OVERCLOCKERS.RU

Ускоритель Blackwell Ultra GB300 получил 20480 ядер CUDA, 288 ГБ памяти HB3E и PCIe Gen6

NVIDIA представила подробную информацию об ускорителе Blackwell Ultra GB300. Чип отличается увеличенным числом ядер, объёмом памяти, поддержкой хостов I/O и запасом мощности по сравнению с GB200. Новый GB300 использует два кристалла на базе техпроцесса TSMC 4NP, которые работают как один графический процессор. Кристаллы соединены с помощью шины NV-HBI со скоростью 10 ТБ/с и содержат в общей сложности около 208 миллиардов транзисторов. Графический процессор содержит 160 потоковых мультипроцессоров. Каждый содержит 128 ядер CUDA (всего 20480 ядер) и тензорные ядра 5-го поколения с форматами FP8, FP6 и новым NVFP4. Каждый мультипроцессор также имеет 256 КБ тензорной памяти (TMEM), что составляет 40 МБ на графический процессор, а также дополнительные блоки специальных функций для ядра математических вычислений. Память включает восемь 12-Hi стеков HBM3E с общим объемом 288 ГБ. Пропускная способность составляет 8 ТБ/с благодаря топологии контроллера 16x512 бит (8192-битный интерфейс). Мощнос

NVIDIA представила подробную информацию об ускорителе Blackwell Ultra GB300. Чип отличается увеличенным числом ядер, объёмом памяти, поддержкой хостов I/O и запасом мощности по сравнению с GB200. Новый GB300 использует два кристалла на базе техпроцесса TSMC 4NP, которые работают как один графический процессор. Кристаллы соединены с помощью шины NV-HBI со скоростью 10 ТБ/с и содержат в общей сложности около 208 миллиардов транзисторов.

Графический процессор содержит 160 потоковых мультипроцессоров. Каждый содержит 128 ядер CUDA (всего 20480 ядер) и тензорные ядра 5-го поколения с форматами FP8, FP6 и новым NVFP4. Каждый мультипроцессор также имеет 256 КБ тензорной памяти (TMEM), что составляет 40 МБ на графический процессор, а также дополнительные блоки специальных функций для ядра математических вычислений.

Память включает восемь 12-Hi стеков HBM3E с общим объемом 288 ГБ. Пропускная способность составляет 8 ТБ/с благодаря топологии контроллера 16x512 бит (8192-битный интерфейс). Мощность ускорителя увеличилась до 1400 Вт.

-2

Подключение между графическими процессорами по-прежнему осуществляется по NVLink 5 со скоростью 1,8 ТБ/с в обоих направлениях на каждый графический процессор. Соединения Grace-GPU продолжают использовать NVLink-C2C со скоростью 900 ГБ/с с когерентностью. Подключение к хосту осуществляется по интерфейсу PCIe 6.0 x16 с пропускной способностью 256 ГБ/с в обоих направлениях, что делает GB300 первым продуктом NVIDIA с таким интерфейсом. Варианты платформы включают стойки GB300 NVL72, объединяющие 72 графических процессора, до 20,7 ТБ памяти HBM3E и общую пропускную способность 576 ТБ/с. Grace Superchip по-прежнему использует процессор с 72 ядрами Arm и 480 ГБ памяти LPDDR5X со скоростью 512 ГБ/с.

-3

NVFP4 является новым форматом данных с низкой точностью, реализованный в тензорных ядрах. Он сочетает масштабирование микроблоков FP8 (E4M3) на блоках по 16 значений с масштабированием на уровне FP32. Формат обеспечивает точность, близкую к FP8, при одновременном сокращении объёма памяти примерно в 1,8 раза по сравнению с FP8 и до 3,5 раза по сравнению с FP16.

NVIDIA заявляет, что GB300 уже находится в массовом производстве и отгружается первым заказчикам. Интересно, что разработка архитектуры Rubin, следующей за ней, также завершена.

📃 Читайте далее на сайте