Найти в Дзене

Новый DGX SuperPOD от Nvidia может работать с моделями искусственного интеллекта с триллионами параметров

Nvidia запускает свои самые мощные системы с новым DGX SuperPod в рамках широкого развертывания аппаратного и программного обеспечения на конференции Nvidia GTC. В последние годы DGX стал одной из основных серверных и облачных систем Nvidia. Новая система DGX SuperPod работает на базе графических процессоров Nvidia следующего поколения для ускорения искусственного интеллекта, известного как Blackwell, который был анонсирован на GTC в качестве преемника графического процессора Hopper. Blackwell позиционируется Nvidia для поддержки и включения моделей искусственного интеллекта с триллионом параметров. DGX SuperPOD интегрирует версию суперчипа GB200 Blackwell, которая включает в себя ресурсы как CPU, так и GPU. Предыдущее поколение суперчипов Nvidia Grace Hopper лежит в основе предыдущего поколения систем DGX. Существующие системы DGX от Nvidia уже широко используются в различных сферах применения, включая разработку лекарств, здравоохранение, обнаружение мошенничества, финансовые услуги,
Оглавление

Nvidia запускает свои самые мощные системы с новым DGX SuperPod в рамках широкого развертывания аппаратного и программного обеспечения на конференции Nvidia GTC.

В последние годы DGX стал одной из основных серверных и облачных систем Nvidia. Новая система DGX SuperPod работает на базе графических процессоров Nvidia следующего поколения для ускорения искусственного интеллекта, известного как Blackwell, который был анонсирован на GTC в качестве преемника графического процессора Hopper. Blackwell позиционируется Nvidia для поддержки и включения моделей искусственного интеллекта с триллионом параметров.

DGX SuperPOD интегрирует версию суперчипа GB200 Blackwell, которая включает в себя ресурсы как CPU, так и GPU. Предыдущее поколение суперчипов Nvidia Grace Hopper лежит в основе предыдущего поколения систем DGX. Существующие системы DGX от Nvidia уже широко используются в различных сферах применения, включая разработку лекарств, здравоохранение, обнаружение мошенничества, финансовые услуги, рекомендательные системы и потребительский Интернет.

«Это суперкомпьютерная платформа мирового класса, и она поставляется «под ключ», — сказал Ян Бак, вице-президент по гипермасштабированию и высокопроизводительным вычислениям в Nvidia во время брифинга для прессы. «Он поддерживает полный программный стек Nvidia для искусственного интеллекта, обеспечивая непревзойденную надежность и масштабируемость».

Что внутри DGX SuperPOD?

В то время как термин SuperPOD может показаться просто маркетинговой превосходной степенью, фактическое оборудование, которое Nvidia упаковывает в свою новую систему DGX, впечатляет.

DGX SuperPOD — это не просто стоечный сервер, это комбинация нескольких систем DGX GB200. Каждая система DGX GB200 оснащена 36 суперчипами Nvidia GB200, которые включают в себя 36 процессоров Nvidia Grace и 72 графических процессора Nvidia Blackwell, подключенных как единый суперкомпьютер через Nvidia NVLink пятого поколения.

Что делает SuperPOD превосходным, так это то, что DGX SuperPOD может быть сконфигурирован с восемью или более системами DGX GB200 и может масштабироваться до десятков тысяч суперчипов GB200, подключенных через Nvidia Quantum InfiniBand.

Система может предоставить 240 терабайт памяти, что критически важно для обучения больших языковых моделей (LLM) и генеративного вывода ИИ в больших масштабах. Еще одна впечатляющая цифра, заявленная Nvidia, заключается в том, что DGX SuperPOD имеет 11,5 экзафлопс супервычислительной мощности искусственного интеллекта.

Усовершенствованные сетевые устройства и блоки обработки данных обеспечивают коммутационную сеть с искусственным интеллектом и интеллектом

Ключевым элементом того, что делает DGX SuperPOD превосходным, является тот факт, что многие системы GB200 могут быть соединены вместе с помощью унифицированной вычислительной матрицы.

Поддержка этой матрицы с помощью недавно анонсированной сетевой технологии Nvidia Quantum-X800 InfiniBand. Эта архитектура обеспечивает пропускную способность до 1 800 гигабайт в секунду для каждого графического процессора на платформе.

DGX также интегрирует DPU (блок обработки данных) Nvidia BlueField-3 и пятое поколение межсоединений Nvidia NVLink пятого поколения.

Кроме того, новый SuperPOD включает в себя технологию Nvidia Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) четвертого поколения. По данным Nvidia, новая версия SHARP обеспечивает 14,4 терафлопс внутрисетевых вычислений, что представляет собой 4-кратное увеличение архитектуры DGX SuperPOD следующего поколения по сравнению с предыдущим поколением.

Blackwell выходит в Nvidia DGX Cloud

Новые системы DGX на базе GB200 также появятся в облачном сервисе Nvidia DGX. Возможности GB200 будут доступны в первую очередь в Amazon Web Services (AWS), Google Cloud и Oracle Cloud.

«DGX Cloud — это наше облако, с которым мы тесно сотрудничаем и совместно с нашими облачными партнерами, чтобы предоставить лучшие технологии Nvidia для собственного использования Nvidia для наших собственных исследований и разработок в области искусственного интеллекта в наших продуктах, а также для того, чтобы сделать его доступным для наших клиентов», — сказал Бак.

Новый GB200 также поможет продвинуть суперкомпьютер Project Ceiba, который Nvidia разрабатывает совместно с AWS, и который был впервые анонсирован в ноябре 2023 года. Project Ceiba — это попытка использовать DGX Cloud для создания крупнейшей в мире общедоступной облачной суперкомпьютерной платформы.

«Я рад сообщить, что Project Ceiba перескочил вперед, теперь мы обновили его, чтобы Grace Blackwell поддерживал 20 000 графических процессоров», — сказал Бак. «Теперь он будет поставлять более 400 экзафлопс ИИ».