Найти тему
ServerNews

Xilinx Alveo U25: полку «умных» сетевых карт прибыло

Рынок так называемых «умных» сетевых адаптеров в последние годы активно развивается, поскольку растут и сами сети. Оптимальным решением всё чаще становится выбор сетевого адаптера, не отнимающего ценные вычислительные ресурсы у центральных процессоров.

Столь лакомый кусок рынка, составляющий по разным оценкам, от 10 до 12 миллионов серверов, не мог не привлечь внимания компании Xilinx, которая представила новые экономичные, но при этом весьма производительные сетевые ускорители Alveo U25.

Единого, устоявшегося подхода к реализации ускорения сетевых функций нет. Свои преимущества и недостатки имеет каждый из трёх встречающихся сегодня вариантов — на базе специализированного кремния (ASIC), на базе процессоров общего назначения и на базе ПЛИС (FPGA).

Самым гибким является третий путь, но он же до недавнего времени оставался и самым сложным с точки зрения программирования. Ускорители Xilinx Alveo U25 должны это изменить. Во многом они базируются на наработках Solarflare, компании, стоящей у истоков высокоскоростных сетевых карт с минимальными задержками и выкупленной Xilinx прошлым летом за $400 миллионов.

Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт
Сетевые скорости растут быстрее процессорных, потребность в сетевых ускорителях растёт

По словам представителя Xilinx, Alveo U25 — первый по-настоящему универсальный «умный» сетевой адаптер, позволяющий развёртывать различные сценарии ускорения практически так же быстро, как и карты на базе процессоров общего назначения. Но при этом он обладает несопоставимо более высоким уровнем производительности при энергопотреблении в районе 40 ‒ 50 Ватт. В этот пакет можно уместить 8 или даже 16-ядерный ЦП с архитектурой ARM, что позволяет достичь скорости обработки порядка 32 миллионов сетевых пакетов в секунду на частоте 2 ГГц.

В то же время Alveo U25 может обработать 300 миллионов пакетов в секунду при частоте всего 300 МГц, что позволяет либо на порядок увеличить производительность в заданном диапазоне энергопотребления, либо на порядок сократить само энергопотребление при сохранении уровня производительности.

Рынок «умных» сетевых решений весьма широк
Рынок «умных» сетевых решений весьма широк

Всё дело в развитом параллелизме, который можно синтезировать с помощью FPGA. 8 или даже 16 фиксированных ядер ARM не позволяют достичь такого же уровня параллелизма, как тысячи одновременно работающих обработчиков, синтезированных из ресурсов FPGA. В Alveo U25 используется матрица из серии Zynq, XCU25 с 520 тысячами LUT; в ней также интегрировано 4 ядра ARM Cortex-A53. Объём оперативной памяти DDR4 составляет 6 Гбайт. Два порта SFP28 обеспечивают скорость 25 Гбит/с.

Для минимизации задержки в Alveo U25 реализована технология Solarflare Onload, позволяющая карте работать напрямую с пользовательскими приложениями, минуя уровень ядра операционной системы и её стека TCP/IP. Помимо стандартных сценариев разгрузки, новинка Xilinx поддерживает сценарии машинного обучения и аналитики данных и даже транскодирования видеопотоков на лету, что наверняка найдёт своё применение в активно развивающейся сфере периферийных вычислений.

Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания
Xilinx Alveo U50: первый ускоритель в серии, не требующий подключения дополнительного питания

Ускорители Alveo U25 поддерживают среду разработки Xilinx Vitis, содержащую все необходимые библиотеки, компиляторы и отладчики. Поддерживаются популярные фреймворки TensorFlow и FFmpeg, а также приложения сторонних разработчиков, написанные на языках Python, C, C++ или P4. Компания Xilinx уже поставляет опытные партии Alveo U25 избранным клиентам, массовые поставки новых «умных» сетевых карт должны начаться в третьем квартале.

Napatech Link NT200A02: также базируется на FPGA производства Xilinx
Napatech Link NT200A02: также базируется на FPGA производства Xilinx

Отметим, что крупные веб-провайдеры используют решения собственной разработки: так, Microsoft применяет порядка миллиона карт серии Catapult, Amazon Web Services располагает примерно таким же количеством ARM-адаптеров Nitro, а китайская Alibaba Group активно экспериментирует с сетевыми процессорами X-Dragon.

Но, как уже было отмечено в начале, поле для игры очень широкое: на долю всех остальных поставщиков услуг приходится гораздо больше серверов, от 12 до 14 миллионов, и из них лишь 2 или 3 миллиона уже оснащены сетевыми ускорителями. Ни Baidu, ни Tencent в активном внедрении «умных» сетевых карт пока не замечены, так что у Xilinx c Alveo U25 есть серьёзные шансы на успех.

Правда, конкуренция предстоит жёсткая: в этот же сектор метят такие опытные разработчики, как Mellanox и Broadcom, не дремлют Marvell и Silicom, и весьма агрессивно продвигают свои разработки молодые компании, такие, как Fungible или Pensando.