Найти в Дзене
WIT Company

AMD EPYC 9004: «Вы просите ядер? Их есть у меня!»

Поставили заказчику сервер на новейшем AMD EPYC 9004 (Genoa). Модель процессора не самая старшая, но 96 ядер и 192 потока сводят с ума, к примеру, инсталлятор MS Windows Server 2022, если только в него не интегрированы последние обновления (Build 20348.859 и позже). «Too much» говорит инсталлятор, обнаружив 92 ядра, и перегружается. Microsoft предлагает отключить в BIOS все ядра выше 8, потом инсталлировать, потом накатывать обновление и тогда уже включать ядра обратно. Не все, в общем, поспевают за прогрессом. А в портфеле у AMD есть еще и 128-ядерная модель.

Пробежимся по характеристикам самого процессора
Новейший серверный процессор AMD, собран по чиплетной схеме. Впитал в себя новинки

  • поддержка памяти стандарта DDR5 (DDR5-4800 против DDR4-3200 в серверах предыдущего поколения),
  • шина PCI Express версии 5.0 - очередное удвоение скорости по сравнению с шиной поколения 4.0,
  • Ядра, ядра, ядра… Потоки, потоки, потоки…
  • 128 линий (lanes) PCI Express на один кристалл!!

Эпичненько
Эпичненько

Обновленный дистрибутив инсталлируется на ура:

"И ступай считать ядра, пока не зарябит тебе в очи..."
"И ступай считать ядра, пока не зарябит тебе в очи..."

Серверная память DDR5 ECC Registered:

-4

Но интересно рассказать также о серверной платформе – в данном случае это ASUS RS520A-E12-RS24U. Платформа представляет собой достаточно интересный конструктор с точки зрения организации дисковой подсистемы. Для того, чтобы подключить к материнской плате (процессору) целых 24 NVMe диска, задействовано все!
А именно

  • 8 разъемов Slim SAS x8 на материнской плате
  • Два (их трех) разъемов под райзеры, через которые к системе подключаются (могли бы подключиться!) добавочные платы PCI Express
-5

Схема получается достаточно гибкой - если не нужны все 24 NVMe диска, кабель заменяется райзером, и появляется возможность установить добавочные платы расширения - RAID-контроллер для дисков SAS/SATA, 10-гигабитный сетевой адаптер, всякие ускорители ИИ и прочее.

Посчитаем, кстати, как используются процессорные 128 Lanes PCI Express. 24 x 4 = 96 отданы NVMe дискам, на единственный райзер выведено еще 8 (хотя разъем там x16), и честных 16 линий отведено на разъем OCP 3.0, плюс пара M.2 где каждый – x4. Уже набрали 128, но еще же есть Dual 1GB сетевой адаптер плюс всякая низкоскоростная периферия (USB порты, VGA адаптер). Стало быть, без какого-то коммутатора в южном мосту не обошлось (в документации не приводится блок-схема материнской платы).

Что касается 24-портового бэкплейна – он, как теперь водится, универсальный. К нему одновременно может быть подключен полный 24-портовый SAS/SATA контроллер, при этом в случае использования NVMe дисков в любом слоте расширения все они будут правильно скоммутированы на плату.

Мальчики направо – девочки налево
Мальчики направо – девочки налево

Еще одна приятная деталь - супер удобные поворотные ручки, чтобы вынимать сервер из стойки:

-7

Характерная черта серверов последних поколений – параноидальная забота о безопасности. Если был сброшен BMC или попросту отключались шнуры питания, первоначальная загрузка сервера занимает примерно 12 минут. В это время процессор BMC, простенький ARM-овский чипик, проверяет целостность BIOS и прочих прошивок, считает контрольные суммы, вычисляет и сравнивает хэши.

В сокращенном виде эта новость опубликована на ресурсе habr.com

https://habr.com/ru/news/765210/

Полюбопытствуйте - в самом конце статьи по ссылке есть небольшой опросник на тему, сколько ядер нужно серверам и какая лучшая операционка/ гипервизор!