После многолетних задержек Intel сегодня официально представила процессоры четвертого поколения Xeon Scalable Sapphire Rapids, как обычные, так и с HBM-наполнением Max, а также серию GPU Max "Ponte Vecchio" для центров обработки данных. Расширенное портфолио Intel из 52 новых CPU будет противостоять линейке AMD EPYC Genoa, дебютировавшей в прошлом году. Компания также сделала сдержанный анонс своей последней линейки модулей постоянной памяти Optane.
В то время как чипы AMD сохраняют лидерство по количеству ядер с максимальным количеством 96 ядер на одном кристалле, чипы Intel Sapphire Rapids позволяют компании увеличить максимальное количество ядер до 60, что на 50% лучше, чем предыдущий пик в 40 ядер в третьем поколении Ice Lake Xeons. Intel утверждает, что это приведет к улучшению общих вычислений на 53% по сравнению с чипами предыдущего поколения, но во время презентаций компания в основном избегала прямых сравнений с чипами AMD. Тем не менее, Intel предоставила образцы для неограниченного обзора третьими лицами, так что она не избегает конкуренции.
Sapphire Rapids в значительной степени опирается на новые технологии ускорения, которые можно либо купить сразу, либо приобрести в рамках новой модели оплаты по факту. Эти новые специально созданные области ускорителей в чипе предназначены для радикального повышения производительности в нескольких видах работ, таких как сжатие, шифрование, перемещение данных и аналитика данных, которые обычно требуют дискретных ускорителей для достижения максимальной производительности.
Несмотря на явное превосходство по количеству ядер, AMD не имеет аналогичных функций ускорения для своих процессоров Genoa. Используя новые ускорители, Intel заявляет о среднем 2,9-кратном повышении производительности на ватт по сравнению с моделями предыдущего поколения в некоторых рабочих нагрузках. Intel также заявляет о 10-кратном улучшении в области выводов и обучения ИИ и 3-кратном улучшении в рабочих нагрузках по анализу данных.
Sapphire Rapids от Intel, которые производятся по техпроцессу "Intel 7", также предлагают множество новых технологий подключения, таких как поддержка PCIe 5.0, памяти DDR5 и интерфейса CXL 1.1 (устройства типов 1 и 2), что дает компании более прочную опору в борьбе с Genoa от AMD. Мы активно работаем над бенчмарками чипов для нашего полного обзора, который мы опубликуем в ближайшие дни, а пока представляем вам краткий обзор новой линейки.
Стек продуктов Intel Sapphire Rapids включает 52 модели, разделенные на "производительные" и "основные" двухсокетные чипы для моделей общего назначения. Есть также специализированные модели для систем с жидкостным охлаждением, односокетных, сетевых, облачных, высокопроизводительных вычислительных систем и систем хранения данных/HCI. В результате создается впечатление, что практически для каждой рабочей нагрузки существует специализированный чип, что создает запутанный стек продуктов.
Эти чипы подразделяются на различные уровни Max, Platinum, Gold, Silver и Bronze, каждый из которых обозначает различные уровни масштабируемости сокетов, поддержки постоянной памяти Optane, функций RAS, емкости анклава SGX и т.п.
Чипы Sapphire Rapids также теперь поставляются с различным количеством включенных ускорителей на борту. На данный момент важно знать, что каждый чип может иметь различное количество включенных "устройств" ускорителя (перечисленных в спецификации выше - считайте, что количество "устройств" сродни "ядрам" ускорителя).
Вы можете приобрести чипы с полным набором всех ускорителей с четырьмя устройствами, а можете выбрать менее дорогие модели чипов с меньшим количеством включенных устройств. Если чип не полностью включен, вы можете активировать ускорители позже с помощью нового механизма оплаты по мере необходимости, который называется Intel on Demand. В моделях "+" по умолчанию включено не менее одного ускорителя каждого типа. Однако есть два класса чипов с двумя разными распределениями ускорителей. Подробнее об этом и о различных типах ускорителей мы расскажем ниже.
Все новые процессоры поддерживают AVX-512, Deep Leaning Boost (DLBoost) и новые инструкции Advanced Matrix Extensions (AMX), причем последние обеспечивают взрывное увеличение производительности в рабочих нагрузках ИИ за счет использования нового набора двумерных регистров, называемых тайлами. Реализация AMX будет использоваться в первую очередь для повышения производительности при обучении ИИ и проведении операций вывода.
Как и прежде, платформа Intel Xeon Scalable 4-го поколения поддерживает конфигурации с 1, 2, 4 и 8 сокетами, в то время как Genoa от AMD масштабируется только до двух сокетов. AMD лидирует по возможностям подключения PCIe, предлагая до 128 линий PCIe 5.0, в то время как Sapphire Rapids достигает максимума в 80 линий PCIe 5.0.
Sapphire Rapids также поддерживает до 1,5 ТБ памяти DDR5-4800, распределенной по восьми каналам на сокет, в то время как Genoa от AMD поддерживает до 6 ТБ памяти DDR5-4800, распределенной по 12 каналам. Intel определила конфигурацию 2DPC (DIMMs per Channel) для DDR5-4400, в то время как AMD еще не завершила квалификацию скорости передачи данных 2DPC (компания планирует выпустить спецификацию 2DPC в этом квартале).
Процессоры Sapphire Rapids варьируются от восьмиядерных моделей до 60 ядер, цены начинаются от $415 и достигают $17 000 за флагманский Xeon Scalable Platinum 8490H. Модель 8490H имеет 60 ядер и 120 потоков, при этом все четыре типа ускорителей полностью включены. Чип также имеет 112,5 МБ кэш-памяти L3 и TDP 350 Вт.
Границы TDP Sapphire Rapids варьируются от 120 до 350 Вт. Показатель 350 Вт значительно выше, чем 280 Вт у предыдущего поколения Ice Lake Xeon от Intel, но неумолимое стремление к повышению производительности заставляет индустрию в целом стремиться к более высоким пределам. Например, Genoa от AMD достигает аналогичного показателя TDP в 360 Вт, хотя и для 96-ядерной модели, и даже может быть сконфигурирован до 400 Вт.
8490H - единственная 60-ядерная модель, и она доступна только со всеми включенными механизмами разгона. Переход к 56-ядерной модели Platinum 8480+ обойдется вам в 10 710 долларов, но она поставляется только с одним из каждого типа ускорителей. Этот процессор имеет тактовую частоту 3,8 ГГц, TDP 350 Вт и 105 МБ кэша L3.
Новые встроенные ускорители Intel являются ключевым новым компонентом процессоров Sapphire Rapids. Как упоминалось выше, вы можете либо приобрести чипы со всеми активированными опциями ускорителей, либо выбрать менее дорогие модели и приобретать лицензии на ускорители по мере необходимости через сервис Intel On Demand. Не все чипы имеют одинаковые опции ускорителей, о чем мы расскажем ниже.
Intel пока не предоставила руководство по ценам на ускорители, но лицензии будут предоставляться через OEM-производителей серверов и активироваться с помощью программного обеспечения и API лицензирования. Вместо того чтобы покупать полную лицензию сразу, вы также можете выбрать функцию оплаты по факту использования с функцией учета использования для измерения объема используемой услуги. Эта функция, вероятно, будет популярна среди CSP.
Идея услуги Intel On Demand заключается в том, чтобы позволить клиентам активировать и оплачивать только те функции, которые им необходимы, а также обеспечить возможность будущего обновления, не требующего покупки новых серверов или процессоров. Вместо этого клиенты могут использовать ускорители для повышения производительности. Это также позволяет Intel и ее партнерам вырезать несколько типов SKU из одного и того же функционального кремния, тем самым упрощая цепочки поставок и снижая затраты.
Эти функции представляют собой продолжение давней истории Intel по внедрению ускорителей с фиксированными функциями в процессорную матрицу. Тем не менее, мощные модули на Sapphire Rapids потребуют программной поддержки для полного использования возможностей производительности. Intel уже работает с несколькими поставщиками программного обеспечения, чтобы обеспечить поддержку в широком спектре приложений, многие из которых вы можете увидеть в альбоме выше.
Intel предлагает четыре типа ускорителей для Sapphire Rapids. Ускоритель потоковой передачи данных (DSA) улучшает перемещение данных, разгружая центральный процессор от операций копирования и преобразования данных. Ускоритель Dynamic Load Balancer (DLB) обеспечивает приоритезацию пакетов и динамическую балансировку сетевого трафика между ядрами CPU при изменении нагрузки на систему.
Intel также имеет ускоритель In-Memory Analytics Accelerator (IAA), который ускоряет производительность аналитики и разгружает ядра ЦП, тем самым улучшая пропускную способность запросов к базам данных и другие функции.
Intel также внедрила свои ускорители Quick Assist Technology (QAT) на борту процессора. Раньше эта функция находилась в чипсете. Этот аппаратный ускоритель разгрузки повышает производительность криптографии и сжатия/декомпрессии. Intel использует ускорители QAT уже довольно давно, поэтому эта технология уже пользуется широкой поддержкой программного обеспечения.
К сожалению, чипы имеют разные возможности ускорения - вы не можете купить четыре "устройства" на все модели. Процессоры Sapphire Rapids состоят из двух типов дизайнов (Die Chops), как указано в таблице SKU. Чипы XCC состоят из четырех матриц, и каждая матрица имеет по одному ускорителю (IAA, QAT, DSA, DLB). Это означает, что на этих чипах можно активировать максимум четыре ускорителя каждого типа (например, 4 IAA, 4 QAT, 4 DSA, 4 DLB).
Напротив, в некоторых чипах используется один кубик MCC, поэтому они имеют только по одному ускорителю IAA и DSA и по два ускорителя QAT и DLB (2 QAT, 2 DLB, 1 IAA, 1 DSA).
Серия Intel Max CPU и серия Ponte Vecchio Max GPU
Недавно компания Intel объявила подробности о предстоящей серии процессоров Xeon Max и серии Intel Data Center GPU Max (Ponte Vecchio). Сегодня состоится официальный запуск.
Модели процессоров Intel Max CPU, оснащенные HBM2e, выходят на рынок с 32-56 ядрами и основаны на стандартном дизайне Sapphire Rapids. Эти чипы являются первыми процессорами x86, в которых используется память HBM2e в комплекте, что позволяет увеличить объем локальной памяти процессора на 64 ГБ. Память HBM поможет в работе с нагрузками, связанными с памятью, которые не так чувствительны к количеству ядер, поэтому модели Max поставляются с меньшим количеством ядер, чем стандартные модели. Целевые рабочие нагрузки включают вычислительную гидродинамику, прогнозирование климата и погоды, обучение и выводы ИИ, аналитику больших данных, базы данных in-memory и приложения для хранения данных.
Процессоры Max могут работать во множестве различных конфигураций, например, с памятью HBM, используемой для всех операций с памятью (только HBM - память DDR5 не требуется), в режиме HBM 'Flat Mode', в котором HBM представляется как отдельная область памяти (это требует обширной программной поддержки), или в режиме HBM 'Caching Mode', в котором HBM2e используется в качестве кэша с поддержкой DRAM. Последний вариант не требует изменений в коде и, вероятно, будет наиболее часто используемым режимом работы.
Процессоры Xeon Max будут конкурировать с процессорами AMD EPYC Milan-X, которые оснащены трехмерным кэшем L3 под названием 3D V-Cache. Модели Milan-X имеют до 768 МБ общего кэша L3 на чип, что обеспечивает невероятную пропускную способность, но это не обеспечивает такую же емкость, как подход Intel с HBM2e. Оба подхода имеют свои сильные и слабые стороны, поэтому нам не терпится испытать процессоры Xeon Max.
Примечательно, что процессор A64FX Arm от Fujitsu использует аналогичную технологию HBM. Процессоры A64FX, оснащенные HBM, используются в суперкомпьютере Fugaku, который был самым быстрым в мире в течение нескольких лет (до тех пор, пока в прошлом году его не сменил Frontier класса exascale на базе AMD). Fugaku по-прежнему занимает второе место в Top500.
Intel также представила свою серию графических процессоров Max, ранее имевшую кодовое название Ponte Vecchio. Ранее Intel уже представила три различных модели GPU, которые поставляются в стандартном форм-факторе PCIe и OAM. Подробнее о серии графических процессоров Max можно прочитать здесь.
В рамках презентации Sapphire Rapids компания Intel без лишнего шума представила последнюю серию модулей Optane Persistent Memory DIMM. Последнее поколение, получившее кодовое название Crow's Pass, но официально известное как Intel Optane Persistent Memory 300, будет поставляться в объемах 128, 256 и 512 ГБ и работать на частоте DDR5-4400. Это значительное улучшение по сравнению с предыдущим пиком DDR4-3200, но это также означает, что системы Sapphire Rapids должны будут разогнать стандартную память до DDR5-4400 с поддерживаемой DDR5-4800, если они планируют использовать Optane.
Intel утверждает, что 300-я серия предлагает на 56% большую последовательную пропускную способность и на 214% большую пропускную способность в случайных рабочих нагрузках, а также поддержку до 4 ТБ Optane на сокет, или 6 ТБ в целом для системы. Как и в предыдущей серии Optane 200, модули DIMM работают при мощности 15 Вт. Однако теперь они поддерживают интерфейс DDR-T2 и 256-битное шифрование AES-XTS.
Во время своего дебюта в 2015 году Intel и партнер Micron превозносили технологию 3D XPoint как обеспечивающую 1000-кратную производительность и выносливость NAND-накопителей в сочетании с 10-кратной плотностью DRAM, но сейчас эта технология подходит к концу. Intel уже прекратила выпуск своих накопителей Optane для клиентских ПК, что вполне логично, поскольку компания продает свой бизнес NAND компании SK Hynix.
Однако Intel сохранила свой бизнес по производству памяти для центров обработки данных, включая модули постоянной памяти DIMM, которые могут функционировать как дополнение к основной памяти - возможность, которую предлагает только Intel. Эти продукты также не увидят будущих поколений после модулей 300-й серии.
В качестве причины сворачивания бизнеса Optane Intel называет переход отрасли на архитектуры на базе CXL, что повторяет мнение бывшего партнера Intel - компании Micron, которая вышла из бизнеса в прошлом году. Sapphire Rapids поддерживает как Optane DIMM, так и интерфейс CXL, но это будет один из последних случаев, когда эти два интерфейса можно увидеть вместе - в будущем CXL станет предпочтительным методом подключения экзотической памяти к чипам.
В настоящее время мы проводим тестирование для нашего обзора Sapphire Rapids, так что следите за полной информацией о производительности и архитектурных деталях в ближайшие дни.