Компания NVIDIA представила новую архитектуру Blackwell и первый суперчип B200, который способен решать задачи с тремя раза большим количеством параметров, чем его предшественник H100. Благодаря этому, система может обрабатывать языковые модели GPT-3 размером более 175 миллиардов параметров. Также была представлена модель сервера DGX Superpod, состоящая из восьми стоек NVL72, каждая из которых имеет 288 CPU, 576 GPU и 240 TB высокоскоростной памяти HBM3E. Эта модель позволяет объединять десятки тысяч устройств B200 с использованием новейших 800-гигабитных коммутаторов Quantum-X800 InfiniBand и Spectrum-X800 Ethernet. Компания сообщила, что крупные облачные гиганты, такие как Amazon, Google, Microsoft и Oracle, будут предоставлять свои клиентам возможность использовать эту мощную систему. ]]>
NVIDIA выпускает революционный ИИ-суперчип для моделей машинного обучения с триллионами параметров
20 марта 202420 мар 2024
34
~1 мин