Найти в Дзене
ProITWorld

Обзор сервера Lenovo ThinkSystem SR680a V4, предназначенного для GPU оптимизированных вычислений

Приветствую всех на моем канале. Сегодняшний обзор будет посвящен самой мощной платформе для систем искусственного интеллекта на момент его написания. Создана она исключительно под акселераторы NVIDIA SXM B300 - наиболее производительные и современные (на момент написания обзора опять же). Первый важный фактор - это Lenovo ThinkSystem SR680a V4. Второй важный фактор - использование воздушного охлаждения в сервере, сильно упрощающего организацию пространства для размещения. Далее обо всех нюансах по порядку. Аппаратная платформа Большому кораблю - большое плавание, а мощному серверу - солидное шасси. Высоту оно имеет 8U и монтируется в стандартные 19-ти дюймовые стойки. Процессоров имеет два семейства Intel Xeon 6700P (Granite Rapids), которые предоставляют производительные P-core ядра в количестве до 86-ти на CPU с TDP до 350W. Каждый процессор имеет 8 каналов памяти, количество DIMM на канал — 2. Таким образом получается 16-ть модулей на CPU, 32 - на систему. Тип памяти - TruDDR5 RDI
Сервер Lenovo ThinkSystem SR680a V4
Сервер Lenovo ThinkSystem SR680a V4

Приветствую всех на моем канале.

Сегодняшний обзор будет посвящен самой мощной платформе для систем искусственного интеллекта на момент его написания. Создана она исключительно под акселераторы NVIDIA SXM B300 - наиболее производительные и современные (на момент написания обзора опять же).

Первый важный фактор - это Lenovo ThinkSystem SR680a V4.

Второй важный фактор - использование воздушного охлаждения в сервере, сильно упрощающего организацию пространства для размещения.

Далее обо всех нюансах по порядку.

Аппаратная платформа

Большому кораблю - большое плавание, а мощному серверу - солидное шасси. Высоту оно имеет 8U и монтируется в стандартные 19-ти дюймовые стойки.

Процессоров имеет два семейства Intel Xeon 6700P (Granite Rapids), которые предоставляют производительные P-core ядра в количестве до 86-ти на CPU с TDP до 350W.

Каждый процессор имеет 8 каналов памяти, количество DIMM на канал — 2. Таким образом получается 16-ть модулей на CPU, 32 - на систему.

Тип памяти - TruDDR5 RDIMM 6400MHz. Скорость работы - до 6400 MHz при одной планке на канал и до 5200 MHz при 2-х.

Набор портов спереди следующий:

  • 3 x USB 3 (5 Gb/s);
  • 1 x USB 3 (XCC local management);
  • 1 x VGA;
  • 1 x RJ-45 1GbE (systems management).

Внутренних нет. Сзади также (в смысле портов не имеется) - только блоки электропитания и вентиляторы.

Сервер Lenovo ThinkSystem SR680a V4 вид сзади
Сервер Lenovo ThinkSystem SR680a V4 вид сзади

Слоты расширения PCIe 5.0 x16 FHHL в количестве 4-х штук располагаются спереди. Там же размещен один OCP PCIe 5.0 x16. Все они работают через процессорный интерконнект.

Для GPU Direct соединения спереди находятся 8-мь интерфейсов OSFP 800 Gb/s, подключаемых к внутренним ConnectX-8 коммутаторам.

Сервер Lenovo ThinkSystem SR680a V4 схема
Сервер Lenovo ThinkSystem SR680a V4 схема

Акселераторов NVIDIA B300 SXM 270 GB HBM3e устанавливается 8-мь штук.

Для загрузки операционной системы предлагается два M.2 2280 NVMe носителя с поддержкой RAID.

Фронтальная корзина вмещает 8-мь дисков NVMe PCIe 5.0 x4 формата SFF горячей замены, которые подключаются напрямую к процессорам. Опция VROC для них не поддерживается.

Сервер Lenovo ThinkSystem SR680a V4 вид спереди
Сервер Lenovo ThinkSystem SR680a V4 вид спереди

Блоков электропитания устанавливается 8-мь штук Titanium мощностью 3200W переменного тока. Уровень резервирования - N+1.

Управление и мониторинг

Для удобства работы с серверами имеется большое количество различных опций диагностики и управления. Перечислим самые важные:

  • Lenovo XClarity Provisioning Manager (запускается по нажатию F1 во время загрузки);
Lenovo XClarity Provisioning Manager загрузка
Lenovo XClarity Provisioning Manager загрузка
Lenovo XClarity Provisioning Manager
Lenovo XClarity Provisioning Manager
  • XClarity Controller 3 (XCC) - обеспечивает расширенные функции управления, мониторинга и оповещения, основанных на технологиях OpenBMC; создан на базе baseboard management controller (BMC) AST2600 с использованием двухъядерного 32-разрядного RISC-сервисного процессора ARM Cortex A7, работающего на частоте 1,2 ГГц;
Lenovo XClarity Controller страница входа
Lenovo XClarity Controller страница входа
Lenovo XClarity Controller
Lenovo XClarity Controller
  • Lenovo XClarity Administrator - централизованное  agent-free управление аппаратными ресурсами, а также Discovery, инвентаризация и мониторинг;
Lenovo XClarity Administrator
Lenovo XClarity Administrator
  • XClarity One - облачная платформа для централизованного мониторинга, управления и аналитики нескольких площадок.
Lenovo XClarity One
Lenovo XClarity One

И это все, о чем хотелось рассказать в рамках данного обзора. Отдельное спасибо каждому, кто дочитал до конца. Посмотреть другие мои статьи и подписаться на канал можно здесь. Хорошего дня!