Консорциум Compute eXpress Link (CXL) сегодня представил спецификацию CXL 3.0, в которой представлены новые функции, такие как поддержка интерфейса PCIe 6.0, объединение памяти и более сложные возможности коммутации и структуры. В целом, новая спецификация будет поддерживать вдвое большую пропускную способность, чем в последних версиях, без добавления каких-либо задержек, сохраняя при этом обратную совместимость с предыдущими версиями спецификации. Новая спецификация появилась после того, как OpenCAPI, последнее значимое открытое соревнование в войне межпроцессорных соединений, объявило вчера, что предоставит свою спецификацию консорциуму CXL, оставив CXL в качестве четкого пути вперед для отрасли.
Напомним, что спецификация CXL - это открытый отраслевой стандарт, который обеспечивает согласованное взаимодействие кэша между процессорами и ускорителями, такими как графические процессоры, интеллектуальные устройства ввода-вывода, такие как DPU, и различные варианты DDR4/DDR5 и постоянной памяти. Межсоединение позволяет процессору работать с теми же областями памяти, что и подключенные устройства, тем самым повышая производительность и энергоэффективность при одновременном снижении сложности программного обеспечения и перемещения данных.
Все крупные производители микросхем приняли спецификацию, а предстоящие процессоры AMD Genoa и Intel Sapphire Rapids поддерживают версию 1.1 (с оговорками для последнего). К ним также присоединились Nvidia, Arm и множество производителей памяти, гиперскейлеров и OEM-производителей.
Новая спецификация CXL 3.0 появилась на свет в связи с тем, что отрасль окончательно и полностью объединилась в рамках этого стандарта. Вчера консорциум OpenCAPI объявил, что он передаст консорциуму CXL свою конкурирующую спецификацию OpenCAPI с когерентным кэшированием для ускорителей и спецификацию near memory Open Memory Interface (OMI) с последовательным подключением. Это положило конец последнему значимому соревнованию за стандарт CXL после того, как консорциум Gen-Z также был поглощен CXL ранее в этом году. Кроме того, стандарт CCIX, по-видимому, перестал существовать после того, как несколько его партнеров поколебались и решили вместо этого развернуть CXL.
CXL 2.0 в настоящее время работает на шине PCIe 5.0, но CXL 3.0 увеличивает ее до PCIe 6.0, чтобы удвоить пропускную способность до 64 Гбит/с (пропускная способность до 256 Гбит/с для соединения x16), но с заявленной нулевой добавленной задержкой. CXL 3.0 использует новый 256-байтовый формат файла с оптимизированной задержкой для уменьшения задержки на 2-5 нс, сохраняя, таким образом, ту же задержку, что и раньше.
Другие заметные улучшения включают поддержку многоуровневой коммутации для обеспечения сетевых топологий между подключенными устройствами, совместного использования памяти и прямого доступа к памяти (DMA) для одноранговой связи между подключенными ускорителями, что в некоторых случаях устраняет нагрузку на процессор.
Спецификация CXL 2.0 поддерживала объединение памяти для динамического выделения и перераспределения областей памяти для разных хостов, что позволяло разделить одно запоминающее устройство на несколько сегментов, но каждый регион мог быть назначен только одному хосту. CXL 3.0 добавляет совместное использование памяти, что позволяет совместно использовать области данных между несколькими хостами с помощью аппаратной согласованности. Это работает путем размещения данных в кэше хоста с добавленной согласованностью аппаратного кэша, чтобы гарантировать, что каждый хост видит самую актуальную информацию.
Спецификация CXL разбивает устройства на различные классы: устройства типа 1 - это ускорители, которым не хватает локальной памяти, устройства типа 2 - это ускорители с собственной памятью (например, графические процессоры, ПЛИС и ASIC с DDR или HBM), а устройства типа 3 состоят из устройств памяти. Кроме того, CXL теперь поддерживает смешивание и сопоставление устройств этих типов на одном корневом порту хоста, что значительно расширяет количество опций для сложных топологий, подобных тем, которые мы рассмотрим ниже.
Обновленная спецификация также поддерживает прямые одноранговые (P2P) обмены сообщениями между подключенными устройствами для удаления центрального процессора хоста из канала связи, что снижает накладные расходы и задержку. Этот тип подключения обеспечивает новый уровень гибкости для связи между ускорителем и памятью и между ускорителем и ускорителем.
Спецификация CXL теперь позволяет каскадировать несколько коммутаторов внутри одной топологии, тем самым увеличивая количество подключенных устройств и сложность структуры за счет включения топологий, отличных от древовидных, таких как Spine/Leaf, архитектуры на основе сетки и кольца.
Новая функция маршрутизации на основе портов (PBR) обеспечивает масштабируемый механизм адресации, который поддерживает до 4096 узлов. Каждый узел может быть любым из существующих трех типов устройств или новым устройством Global Fabric Attached Memory (GFAM). Устройство GFAM - это запоминающее устройство, которое может использовать механизм PBR для обеспечения совместного использования памяти между хостами. Это устройство поддерживает совместное использование различных типов памяти, таких как постоянная память и DRAM, в одном устройстве.
Новая спецификация CXL значительно расширяет возможности использования межсоединений, охватывая большие разрозненные системы в масштабе стойки (и, возможно, за ее пределами). Естественно, эти типы функций вызывают вопрос о том, будет ли это возможно для более ориентированных на хранение целей, таких как, например, подключение к устройству хранения данных на флэш-памяти, и нам сказали, что спецификация также начала вызывать некоторый интерес к этим типам использования.
Консорциум также сообщает нам, что он видит большой интерес со стороны своих членов к использованию пулов памяти DDR4, чтобы снизить стоимость DDR5 на серверах следующего поколения. Таким образом, гиперскейлеры могут использовать память DDR4, которая у них уже есть (и в противном случае была бы выброшена), для создания больших гибких пулов памяти в паре с серверными чипами DDR5, которые не могут вместить более дешевую память DDR4. Такая гибкость подчеркивает лишь одно из многих преимуществ спецификации CXL 3.0, которая будет представлена широкой публике сегодня.
Понравилась статья? Поставьте лайк и подпишитесь на канал!