Корпорация Intel не так уж часто оказывается в роли догоняющего, но ей пришлось примерить на себя эту роль после анонса второго поколения AMD EPYC, а сейчас и IBM анонсировала более продвинутые в плане поддержки новейших интерфейсов и стандартов процессоры POWER10.
Разумеется, команда «синих» сдаваться не собирается и на мероприятии Hot Chips 32 компания раскрыла множество подробностей о процессорах Xeon с микроархитектурой Ice Lake. Их действительно можно назвать «вторым третьим поколением», поскольку звание третьего поколения они делят с анонсированными весной Xeon Cooper Lake.
Несмотря на это, данные серии процессоров отличаются кардинально. Cooper Lake рассчитаны на 4- и 8-сокетные системы, а Ice Lake-SP — на массовые 1- и 2-сокетные. При этом обе серии в определённой степени являются проходными, поскольку большая часть новейших технологий, таких как DDR5, PCIe 5.0, CXL 1.1 и других, будет реализована Intel лишь в поколении Sapphire Rapids в 2021 году.
Платформа Whitley, позволяющая устанавливать до двух Ice Lake-SP, не слишком отличается от классических двухпроцессорных систем на базе Xeon Scalable. Для связи CPU всё так же используется 2, либо 3 линии UPI, системная логика — по-прежнему Lewisburg. Однако в одном такая платформа сможет поспорить с AMD EPYC: Ice Lake-SP будут поддерживать PCI Express 4.0. Системные платы и разъёмы в любом случае потребуются новые, поскольку выросло число каналов памяти. Прототип такой платы уже был показан на Intel Architecture Day 2020.
Архитектурно Cooper Lake являются продолжением серии Cascade Lake Refresh и, в свою очередь, Skylake-SP. А вот ядра Ice Lake-SP базируются на ядрах Sunny Cove, которые были представлены два года назад; впрочем, речь идёт о внедрении продвинутой версии 10-нм техпроцесса Intel (SuperFin). Максимальное число ядер одного CPU осталось равным 28, здесь прорывов Intel не предлагает, однако mesh-компоновка всех блоков изменилась: вместо матрицы 6×6 теперь реализована 6×7.
Одной из причин этому стала смена контроллера памяти. Новый контроллер разработан с нуля и в сумме обеспечивает работу восьми каналов DDR4-3200, что даёт существенный прирост пропускной способности в сравнении с прошлыми поколениями «больших» Xeon, использующими шестиканальный контроллер. Количество точек подключения контроллера памяти к внутренней mesh-структуре возросло с двух до четырёх, это должно снизить латентность в некоторых сценариях.
Контроллер памяти также имеет ряд дополнительных мини-оптимизаций. Часть из них позволяет повысить производительность в специфических сценариях, например, в нагрузках OLTP, но и в целом параметры улучшились. Так, латентность при доступе к кешу соседнего процессора снижена до 70 наносекунд. Оптимизированы сценарии работы с малым количеством ядер и многое другое. Поддерживаются модули Optane DCPMM 200.
Детально об микроархитектуре Sunny Cove мы рассказывали ранее, её можно назвать эволюционным развитием Skylake. Увеличено буквально всё: ядро Sunny Cove может исполнять пять инструкций за такт вместо четырёх, исполнительных портов стало 10 вместо 8, увеличена пропускная способность кеша первого уровня, кеш второго уровня вырос с 1 до 1,25 Мбайт, появился второй блок FMA. И такой подход касается всего ядра, от размера окна внеочередного исполнения до объёма буфера ассоциативной трансляции (TLB).
Однако имеются не только количественные нововведения. В новых процессорах Intel реализовала поддержку новых векторных инструкций AES и VBMI, добавила поддержку GFNI, расширила в очередной раз набор AVX-512. Часть нововведений служит криптографическим задачам, но также внимание уделено и сценариям компрессии/декомпрессии данных. В различных сценариях превосходство над Cascade Lake может варьироваться от полуторакратного до более чем восьмикратного, что впечатляет.
В области технологий обеспечения безопасности Intel следует основной современной тенденции и Ice Lake-SP получили поддержку TME (Total Memory Encryption), то есть полного шифрования оперативной памяти по стандарту AES-XTS 128 бит. Естественно, обещано, что аппаратно сгенерированные ключ будет невозможно извлечь из системы, а накладные расходы на шифрование снизят производительность не более чем на 5% (в предварительных тестах это 2-3%).
В паре с SGX-анклавами получается, судя по всему, неплохая альтернатива AMD SVE и тому, что IBM реализовала в POWER10. Кроме того, значительно внимание уделено механизму когерентности и снижению задержек. В том числе, речь идёт об уменьшении задержек при переключении процессора между разными частотами и уровнями энергопотребления.
Intel придерживается целостного подхода и предпочитает говорить об оптимизации SoC как единой структуры в целом, а не только об отдельных компонентах. Тем не менее, интересно отметить, что система управления питанием процессора получило новую выделенную шину, функции которой отделены от шины общего управления и мониторинга. Подход довольно логичный: по количеству ядер «синие» пока не могут догнать AMD, поэтому уделяют первоочередное внимание повышению эффективности как отдельных ядер, так и процессора в целом.
И достигнутые результаты впечатляют: Ice Lake способен менять частоту ядер примерно за 12 микросекунд, причём процесс происходит без просадок, характерных для Cascade Lake, который может иногда «задумываться», что негативно сказывается на общей производительности. Так же легко новые процессоры меняют режим энергопотребления (P-state). Минимизирована известная проблема (или особенность, если хотите) процессоров Intel, а именно снижение частоты при использовании инструкций AVX, особенно AVX-512. Ряд не слишком «прожорливых» инструкций AVX теперь исполняется на более высоких частотах.
Важной частью Ice Lake-SP стали новые контроллеры PCI Express. В этом поколении о поддержке PCIe 5.0 говорить не приходится, тем более что соответствующей периферии на рынке всё равно ещё нет, но PCIe 4.0 поддерживается полностью. Сами контроллеры PCI Express усовершенствованы, они получили новый блок виртуализации (IOV) и лучше масштабируются на больших нагрузках.
В целом процессоры Intel Xeon Ice Lake-SP являют собой достаточно современный продукт. Конечно, достигнуть многоядерности AMD EPYC 7002 «синим» на этот раз не удалось, но многочисленные оптимизации и улучшения вкупе с поддержкой PCI Express 4.0 должны помочь Intel продержаться до появления действительно инновационных процессоров Sapphire Rapids. Также появление Ice Lake-SP благотворно скажется на скорости внедрения периферии с поддержкой PCI Express 4.0. Но на горизонте уже маячит PCI Express 5.0 и новые стандарты памяти.