Компания Ventana представила новый модульный процессор Veyron V2. В нем реализована чиплетная архитектура и возможность создания специализированных процессоров для заказчиков. Он также может похвастаться очень высокой производительностью, по крайней мере, в одном из бенчмарков.
В настоящее время на рынке серверов наблюдается острая конкуренция. Помимо доминирующей архитектуры x86, представленной Intel и AMD, растет интерес к ARM, благодаря ее отличной производительности, а архитектура RISC-V также стремится закрепиться на рынке. Именно в этой области и появился процессор Veyron V2 компании Ventana, заменивший предыдущую модель Veyron V1, которая была недавно выпущена и уже доступна заказчикам. Одной из ключевых причин появления новой модели стала замена итерфейса BoW (Bunch of Wires) на UCI-Express (Universal Chiplet Interconnect Express). Intel предложила эту новую шину в марте 2022 года, и ее поддержали ряд крупных компаний, таких как AMD, ARM, Google, Meta, Microsoft, Qualcomm, Samsung и TSMC. UCI-Express оказалась более эффективным решением для соединения микросхем, что побудило компанию Ventana к работе над новым процессором. Это решение не только упростило герметизацию микросхемы, но и решило проблемы с многослойной 3D-памятью.
Процессор Veyron V2 оснащен 512-разрядными векторными блоками, которые хотя и не являются точным клоном AVX512, но достаточно близки к нему, чтобы их использование не создавало проблем при программировании. Интересным элементом архитектуры является огромный кэш инструкций L1 объемом 512 кБ для каждого ядра процессора, а также кэш данных L1 объемом 128 кБ и дополнительный кэш L2 объемом 1 МБ на ядро. Что касается кэша L3, то он разделяется между 32 чиплетами, а общий объем памяти L3 на чиплет составляет 128 МБ (что соответствует 4 МБ памяти L3 на ядро).
Пропускная способность шины между ядрами составляет 5 ТБ/с, а процессор Veyron V2 может быть собран из четырех-шести чиплетов, что в сумме дает от 128 до 192 ядер. Стоит отметить, что архитектура процессора является модульной, что позволяет использовать наборы микросхем Domain-Specific Acceleration (DSA), адаптированные под конкретные нужды заказчика. Это открывает возможность внедрения в процессор пользовательских ускорителей в соответствии с индивидуальными требованиями. Ventana даже утверждает, что контроллер памяти DDR5 может быть заменен контроллером с поддержкой HBM3, что демонстрирует гибкость архитектуры этого процессора для самых разных задач и приложений.
Ventana объявляет, что процессор Veyron V2, благодаря усовершенствованию архитектуры и увеличению частоты с 3,0 до 3,6 ГГц, достигает на 20% более высокого IPC по сравнению с моделью V1. В результате этих изменений общая производительность увеличивается примерно на 40%. Производство осуществляется по передовому 4 нм техпроцессу в TSMC.
Особый интерес представляют результаты бенчмарка SPECint2017, которые показывают, что 192-ядерный/192-поточный процессор Ventana Veyron V2 с TDP 360 Вт в 2,7 раза превосходит по производительности 56-ядерный/112-поточный процессор Intel Xeon Sapphire Rapids 8480+ с TDP 350 Вт. Более того, Veyron V2 даже превосходит конкурирующее предложение от AMD. По сравнению с процессором AMD EPYC Bergamo 9754 со 128 ядрами и 256 потоками, Veyron V2 достигает аналогичной производительности при одинаковом энергопотреблении (360 Вт). Стоит отметить, что, несмотря на отсутствие поддержки HT/SMT, Veyron V2 выглядит весьма конкурентоспособным по отношению к платформе AMD. Что касается ARM, то 64-ядерная/64-поточная версия Neoverse V2 лишь немного превосходит Xeon.