Компания AMD недавно анонсировала процессоры Ryzen 9000 на новой архитектуре Zen 5. Эта архитектура обещает значительное улучшение производительности по сравнению с предыдущими поколениями. В этой статье мы рассмотрим основные особенности и преимущества Ryzen 9000.
Архитектура Zen 5
По сравнению с архитектурой Zen 4, используемой в процессорах Ryzen 7000, архитектура Zen 5 предлагает ряд ключевых улучшений:
- Расширенная пропускная способность конвейера инструкций и векторных операций: вдвое выше, чем у Zen 4.
- Улучшенная точность и скорость предсказания переходов.
- Увеличенный размер буферов переупорядочивания для повышения параллелизма.
- Реструктуризация кэшей L2 и L3 для снижения задержек.
- Поддержка более быстрой памяти DDR5-5600 и удвоенная тактовая частота Infinity Fabric до 2400 МГц.
Процессоры Ryzen 9000 для настольных ПК
Семейство Ryzen 9000 состоит из четырёх моделей для настольных ПК:
- Ryzen 5 9600X — шестиядерный процессор для производительных домашних и игровых ПК среднего уровня. Ожидается прирост производительности до 20% по сравнению с конкурирующими процессорами Intel Core i5-14600K.
- Ryzen 7 9700X — восьмиядерный процессор для создателей контента и продвинутых игровых ПК. Ожидается прирост производительности до 15–25% по сравнению с Intel Core i7-14700K.
- Ryzen 9 9900X — 12-ядерный процессор для рабочих станций и высокопроизводительных настольных систем. Ожидается прирост производительности до 56% по сравнению с Intel Core i9-14900K.
- Ryzen 9 9950X — флагманская 16-ядерная модель, которая, по заявлениям AMD, обеспечит прирост производительности до 56% в приложениях и 23% в играх относительно Intel Core i9-14900KS.
Кроме того, процессоры Ryzen 9000 на архитектуре Zen 5 получили новые инструкции AMD Zen Vector AI, которые ускоряют задачи с использованием искусственного интеллекта на 20%.
Ryzen AI 300 — новая платформа для ноутбуков с ускорением ИИ
AMD также представила новую линейку мобильных процессоров Ryzen AI 300 на архитектуре Zen 5 со встроенным аппаратным ускорением для задач ИИ. Флагман Ryzen AI 9 HX370 имеет 12 ядер и 24 потока, возможность разгона до 5,1 ГГц и мощную интегрированную графику AMD Radeon 890M с 16 ГПУ-ядрами.
Внутреннее устройство Ryzen 9000
В новых Ryzen 9000 чип ввода-вывода (IOD), производящийся по техпроцессу 6 нм, остался неизменным с прошлого поколения. Как и прежде, в его коммуникационные возможности входит 28 линий PCI-E 5.0: 16 — для графики, восемь — для двух NVMe-накопителей, и еще четыре — для связи с чипсетом на плате. Среди дополнительных соединений — четыре порта USB 3.2 Gen 2 10 Гбит/с, и еще один порт USB 2.0 для прошивки BIOS.
Никуда не делась и встроенная графика на базе архитектуры RDNA2 с двумя вычислительными блоками CU. Единственное изменение, относящееся к IOD, относится к режимам работы контроллера оперативной памяти. Для него были проведены оптимизации, расширяющие возможности работы в режиме делителя 1:2. К тому же, теперь по умолчанию поддерживается частота ОЗУ в 5600 МГц, тогда как в прошлом поколении она составляла 5200 МГц.
Процессоры обзавелись новыми вычислительными чиплетами (CCD). Как и прежде, в каждой модели их один или два. Внутри одного CCD находится шесть или восемь активных ядер. То есть, общее количество ядер по сравнению с прошлыми линейками Ryzen не возросло — их может быть 6, 8, 12 или 16.
Вычислительные чиплеты производятся по более тонкой технологии — 4 нм против 5 нм у предшественников. По заявлениям AMD, это позволило понизить энергопотребление на значение до 22%. Плотность транзисторов при этом увеличилась на 6%. Но главное в CCD не это, а новая архитектура вычислительных ядер — Zen 5.
Системы выборки и кэширования
Самые заметные изменения получила подсистема выборки данных. В отличие от Intel, которая в 11 и 12 поколении Core расширила декодер сначала до пяти, а потом до шести полос, AMD пошла другим путем. В Zen 5 она впервые применила декодер с двумя четырехполосными конвейерами.
За счет такого решения появилась возможность заметно поднять эффективность предсказаний: заглянуть в предполагаемое будущее с двойными декодерами и предсказателями можно куда «глубже». Для этого эти блоки получили специальные оптимизации. В том числе новый механизм Zero-Bubble, предназначенный для минимизации потерь производительности при неверных предсказаниях.
Для эффективной работы двойного декодера был значительно увеличен буфер целей ветвлений (BTB): с 1.5 до 16 Кб для первого уровня, с 7 до 8 Кб — для второго. Одновременно подрос буфер трансляции второго уровня (TLB) — с 512 до 2048 записей, а также стек адресов возврата — с 32 до 56 записей.
Кэш инструкций (L1I) составляют все те же 32 Кб, что и в прошлом поколении. Но теперь им могут пользоваться одновременно оба декодера, поэтому его скорость увеличили вдвое. Параллельно этому был усовершенствован кэш микроопераций (L0): его ассоциативность была увеличена с 12- до 16-канальной, а пропускная способность возросла на треть.
Не менее «прокачана» была и подсистема кэшей для данных. Кэш первого уровня (L1) был увеличен с 32 до 48 Кб, а его ассоциативность — с 8 каналов до 12. Кэш второго уровня остался прежнего размера, но его ассоциативность была увеличена вдвое — с 8 каналов до 16. Кратно ассоциативности возросла и пропускная способность обоих кэшей.
Кэш третьего уровня существенных изменений не претерпел: и размер, и ассоциативность остались такими же, как у Zen 4. Однако AMD поработала над его задержкой — теперь она немного меньше, чем поколением ранее.
Целочисленный конвейер
Усовершенствованная система выборки не будет иметь особого смысла без расширения целочисленного конвейера. Поэтому здесь AMD поступила схоже с Intel, и расширила конвейер с восьми исполнительных портов до десяти.
Количество арифметико-логических устройств (ALU) в ядре было увеличено с четырех до шести. Теперь три из них умеют ускорять операции умножения (Multiply), а оставшиеся три — исполнять переходы (Branch). Для сравнения: в Zen 4 первой разновидности не было, а переходами могли заниматься только два блока, из которых лишь один совмещен с ALU.
Возросло и количество блоков генерации адресов (AGU) — с трех до четырех. Благодаря этому новое ядро производит на одну операцию загрузки/выгрузки в кэш больше, чем ранее. А блок переименования целочисленных регистров вместо шести операций за такт теперь умеет выполнять восемь.
Количество планировщиков было сокращено с четырех до двух. Но взамен они стали более чем в два раза производительнее. Вдобавок были расширены их возможности. Для ALU теперь поддерживается 88 записей, для AGU — 56. В Zen 4 они были куда скромнее: до 72 записей (3х24) для ALU вместе с AGU, плюс еще 24 записи только для ALU. Объем регистрового файла тоже вырос — с 224/126 до 240/192 записей, а буфер очереди — с 320 записей до 448.
Что мы получаем в результате как обычный пользователь?
Обычные пользователи получают от нового поколения процессоров Zen 5 следующие преимущества по сравнению с Zen 4:
- Повышенная производительность: процессоры Zen 5 демонстрируют в среднем на 16 % более высокую производительность инструкций за такт (IPC).
- Улучшенная поддержка памяти: поддержка более быстрой памяти DDR5-5600 и удвоенная тактовая частота Infinity Fabric до 2400 МГц.
- Ускорение искусственного интеллекта: новые инструкции AMD Zen Vector AI ускоряют задачи с использованием искусственного интеллекта на 20 %.
- Повышенная производительность на одно ядро: производительность увеличилась на 30–40 % по сравнению с процессорами Ryzen 7000. Это значительное улучшение, которое будет заметно в повседневных задачах и специализированных приложениях.
- Встроенный ИИ-ускоритель: процессоры Ryzen AI 300 имеют встроенное аппаратное ускорение для ИИ-задач, обеспечивая повышенную производительность в таких приложениях.
Ссылки на источники:
https://www.amd.com/en/partner/articles/ryzen-9000-series-processors.html