На выставке Computex 2024 компания AMD представила свои процессоры серии Ryzen AI 300, сделав акцент на производительности искусственного интеллекта и XDNA 2 NPU. Мы уже рассказали об архитектуре NPU AMD XDNA 2 и о том, как она обеспечивает высочайшую производительность среди NPU (Intel NPU 4 на Lunar Lake обещает 48 максимумов).
В этой статье мы более подробно рассмотрим архитектуру процессора Zen 5 и узнаем, какие преимущества она даёт по сравнению с Zen 4.
Ядро AMD Zen 5, предназначенное для будущих процессоров Ryzen серий 9000 и AI 300, обладает рядом улучшений. За счёт архитектурных усовершенствований и уменьшения количества узлов по сравнению с 4-нм техпроцессом TSMC, оно может выполнять больше команд за такт, что увеличивает производительность процессора в среднем на 16% (IPC).
Архитектура Zen 5 обеспечивает значительные улучшения производительности и энергоэффективности благодаря обновлённому интерфейсу, более широким конвейерам выполнения команд и улучшенной иерархии кэша.
Как AMD Zen 5 добивается такого повышения производительности?
В новой версии интерфейса появились следующие изменения:
- Обновлённый механизм выборки, декодирования и отправки инструкций на сервер. Он позволяет отправлять больше команд.
- Улучшен механизм прогнозирования переходов. Теперь он точнее определяет, какой путь выполнения программы выбрать. Для этого увеличено количество прогнозов за цикл.
- Механизм отправки и выполнения команд также был улучшен. Теперь он может обрабатывать до 8 инструкций за цикл. Это стало возможным благодаря использованию унифицированного планировщика и расширенного окна выполнения.
Также была улучшена иерархия кэша. Размер кэша данных увеличился на 50% и достиг 48 килобайт, при этом задержка не возросла.
Пропускная способность данных увеличилась вдвое благодаря поддержке 512-битной загрузки и сохранения.
Математический модуль AVX был расширен до физического конвейера шириной 512 бит. Это позволило сократить задержки и увеличить пропускную способность.
Как насчет задержки?
AMD утверждает, что архитектура Zen 5 обладает рядом усовершенствований, которые в совокупности уменьшают время ожидания и повышают производительность.
Улучшенная точность прогнозирования переходов и увеличение количества прогнозов за цикл минимизируют время ожидания. Двойной перенос и уменьшение задержки в кэшах обеспечивают более быстрый доступ к данным. А более широкие конвейеры выполнения позволяют одновременно обрабатывать больше инструкций, сокращая задержки.
Помимо этого, увеличенная в два раза пропускная способность позволяет передавать данные между кэшами быстрее. Оптимизированный алгоритм планирования помогает минимизировать задержки и лучше использовать ресурсы. А настроенные алгоритмы предварительной выборки данных определяют шаблоны использования и более эффективно выполняют предварительную загрузку информации, сокращая задержки. Все эти улучшения значительно повышают производительность и снижают задержки, что делает Zen 5 мощной процессорной архитектурой.
Марк Пейпермастер, EVP и технический директор AMD, о Zen 5
«Zen 5 вас не разочарует — мы добились впечатляющих улучшений производительности, и это только начало, — заявил Марк Папермастер, руководитель технического направления AMD. — Это фундамент, на котором мы будем строить следующие поколения Zen», — добавил он.
Марк Папермастер также отметил: «Мы очень довольны полученными результатами. Мы гордимся нашим новым модулем математического ускорения».
Марк Пейпермастер подчеркнул, что компания остаётся верной инновациям и не собирается останавливаться на достигнутом.
Мы будем продолжать лидировать и предлагать нашим клиентам удивительные возможности.
Он добавил, что мы применяем широкий подход к нашим IP-проектам, как в плане их развёртывания, так и в плане оптимизации для обеспечения высокой производительности и эффективности. И в Zen 5 мы не изменили этой философии и подходу.
Zen 5 готова к успеху в обработке данных искусственного интеллекта и выполнении общих рабочих нагрузок ЦП.
Марк Папермастер подтвердил наше маниакальное стремление к выполнению задач и предоставлению новых возможностей в обычном режиме.
Будет ли производительность iGPU решающим фактором?
По мере того как архитектура AMD Zen 5 готовится заменить чипы Intel Lunar Lake и чипы Qualcomm Snapdragon X-Elite на базе ARM, возникает важный вопрос: как эти впечатляющие характеристики будут реализованы в реальной производительности?
Ответ кроется в гармоничном сочетании компонентов: ядра Zen 5, процессора XDNA 2 NPU и обновлённого процессора RDNA 3.5 iGPU. Как мы видели на примере предыдущих поколений, графическому процессору всё чаще приходится выполнять основную работу, когда дело доходит до задач, связанных с искусственным интеллектом.
По мере продвижения в эру генеративного искусственного интеллекта, зависимость от производительности графического процессора будет только усиливаться.
Утечки тестов показывают, что RDNA 3.5 iGPU — это значительный шаг вперёд в производительности интегрированной графики. Возможно, он будет конкурировать с некоторыми дискретными графическими процессорами начального уровня.
Мы с нетерпением ждём обзора ASUS ZenBook S16, который был представлен на AMD Tech Day 2024. В нашей следующей статье мы рассмотрим усовершенствования RDNA 3.5 более подробно.