Найти в Дзене

Четыре GPU NVIDIA A100 в SuperWorkstation

Не так давно мы собирали бюджетный вариант сервера с двумя GPU на базе Supermicro. Использовали сервер Supermicro GPU SuperWorkstation 7049GP-TRT. В сервер можно установить до 4 больших GPU 10.5' двойной ширины. Для GPU с пассивным охлаждением может понадобиться комплект вентиляторов MCP-320-74702-0N-KIT, мне не понадобился. Особенности: Для начала мы устанавливали две карты A100, соответственно, понадобился только один процессор. Теперь пришла пора добавить еще две карты A100, нам также понадобится второй процессор и память. Расположение разъёма питания: Берём с собой память, столько же, сколько сейчас установлено на одном процессоре. Второй процессор. И сами видеокарты. Не забываем комплект вентилятора с радиатором охлаждения от шасси сервера. Сервер нужно обесточить и извлечь из стойки. Работать следует вдвоём. Снимаем крышку, проводим осмотр. В сервере, как и ожидалось, установлен один процессор и пара GPU. Готовимся к работе. Снимаем мешающие фиксирующие скобы. На втором сокете ус
Оглавление

Не так давно мы собирали бюджетный вариант сервера с двумя GPU на базе Supermicro.

Использовали сервер Supermicro GPU SuperWorkstation 7049GP-TRT. В сервер можно установить до 4 больших GPU 10.5' двойной ширины. Для GPU с пассивным охлаждением может понадобиться комплект вентиляторов MCP-320-74702-0N-KIT, мне не понадобился. Особенности:

  • Два процессора (LGA 3647), поддержка процессоров 2nd Gen Intel Xeon Scalable (Cascade Lake/Skylake)
  • 16 DIMMs; до 4TB 3DS ECC DDR4-2933MHz RDIMM/LRDIMM, поддержка Intel Optane DCPMM
  • PCIe
    4 PCI-E 3.0 x16 (double-width) slots
    2 PCI-E 3.0 x16 (single-width) slots\
    1 PCI-E 3.0 x4 (in x8) slot
  • 8 Hot-swap 3.5" drive bays
  • 2x 10GBase-T LAN ports
  • 1 VGA, 2 COM, 5 USB 3.0
  • Охлаждение
    4 внутренних вентилятора
    2 радиатора на процессоры с управляемыми вентиляторами
    2 вытяжных вентилятора
    2 опциональных вентилятора для пассивных GPU

Для начала мы устанавливали две карты A100, соответственно, понадобился только один процессор. Теперь пришла пора добавить еще две карты A100, нам также понадобится второй процессор и память.

Краткая спецификация NVIDIA A100 80GB PCIe

  • Product SKU
    P1001 SKU 230
    NVPN: 699-21001-0230-xxx
  • Total board power
    300 W default
    300 W maximum
    150 W minimum
  • Thermal solution: Passive
  • Mechanical Form Factor: Full-height, full-length (FHFL) 10.5”, dual-slot
  • GPU SKU: GA100-893FF, GA100-893FFF, GA100-893HH, GA100-893HHH
  • PCI Express interface: PCI Express 4.0 ×16
  • Power connectors and headers: One CPU 8-pin auxiliary power connector

Питание GPU

Расположение разъёма питания:

-2

Апгрейдим сервер

Берём с собой память, столько же, сколько сейчас установлено на одном процессоре.

-3

Второй процессор.

-4

И сами видеокарты.

-5

Не забываем комплект вентилятора с радиатором охлаждения от шасси сервера.

-6

Сервер нужно обесточить и извлечь из стойки. Работать следует вдвоём.

-7

Снимаем крышку, проводим осмотр. В сервере, как и ожидалось, установлен один процессор и пара GPU.

-8

Готовимся к работе.

-9

Снимаем мешающие фиксирующие скобы.

-10

На втором сокете установлена заглушка. Не снимайте её, если не планируете ставить процессор.

-11

Снимаем заглушку.

-12

Перед установкой процессора чищу его спиртом.

-13

Устанавливаем процессор в сокет. По инструкции положено устанавливать процессор в пластиковую скобу и пристёгивать к радиатору, но в данной модели сервера радиатор можно установить двумя способами: правильным и неправильный. Поэтому я предпочитаю устанавливать радиатор на процессор, он прилипнет, а потом уже пристёгивать и закреплять скобу.

-14

Устанавливаем память, потом будет сложно подлезть.

-15

Достаём вентилятор.

-16

Теперь подключим вентилятор к материнской плате. Да, по инструкции это нужно делать потом, но... не подлезешь.

-17

Питание вентилятора подключено.

-18

Сам вентилятор пока пусть повисит в сторонке.

-19

Устанавливаем пластиковую скобу на процессор. Тоже можно было бы заранее сделать, но без разницы, мне так удобнее.

-20

Готовим радиатор. Заводская термопаста уже нанесена.

-21

И внимательно устанавливаем радиатор, точно так же, как установлен первый.

-22

Ниже на фото показано как можно ошибиться, не делайте так. При такой установке вентиляторы начинают дуть друг на друга.

-23

Поэтому разворачиваем как нужно и приклеиваем к процессору. Если забыли поставить память, то радиатор можно извлечь вместе с процессором и плотно подогнать пластикувую направляющую, заодно память поставить.

-24

Устанавливаем радиатор правильной стороной.

-25

Затягиваем винты в порядке, указанном на радиаторе.

-26

Понадобится длинный шестигранник.

-27

Заранее подберите его перед поездкой.

-28

На радиатор устанавливаем вентилятор и закрепляем винтом.

-29

Подготавливаем пространство для GPU, снимаем заглушки.

-30

Снимаем с видеокарт защитные плёнки.

-31

Устанавливаем видеокарты и подключаем питание. Переходники не понадобятся.

-32

Заранее распределите кабели питания, они разной длины.

-33

Укладываем кабели питания, при необходимости фиксируем стяжками.

-34

Закрепляем GPU винтами и защёлками.

-35

Красота.

-36

Устанавливаем обратно фиксирующую планку и закрепляем GPU.

-37

Фиксаторы туго удерживают карты резиновыми наконечниками.- Особенно полезно при вертикальной установке корпуса.

-38

Всё собрано.

-39

Закрываем крышку.

Готовим рельсы, убираем мешающие кабели.

-40

Устанавливаем сервер в стойку.

-41

И радуемся хорошо выполненной работе. Не забываем включить сервер и проверить работоспособность системы.

Ссылки

Четыре GPU на SuperWorkstation, йо-хо-хо, и два NV-Link!

Источник:

Четыре GPU NVIDIA A100 в SuperWorkstation | internet-lab.ru

💰 Поддержать проект

Если вам понравилась статья, то ставьте 👍🏻 каналу.
Пишите комментарии, задавайте вопросы, подписывайтесь.