На протяжении многих лет на рынке графических процессоров доминировала архитектура GCN (Graphics Core Next) от компании AMD. Эта архитектура была невероятно успешной и долгоживущей. Но к концу 2010-х годов её архитектурные ограничения стали очевидны: она не могла эффективно использоваться под современные требования к энергоэффективности и производительности на такт.
Ответом на этот вызов стала совершенно новая микроархитектура — RDNA (Radeon DNA). Это было не просто обновление, а полное переосмысление того, как должен работать графический процессор для достижения максимальной эффективности в играх нового поколения.
Переход от GCN к RDNA 1
Архитектура GCN возникла в 2012 году. Особенности :
- Она строилась вокруг концепции Compute Units (CU). Это основные вычислительные элементы, которые выполняют вычисления, необходимые для прорисовки графики и обработки данных.
- Каждый CU содержал четыре векторных блока SIMD (Single Instruction Multiple Data), которые обрабатывали данные параллельно.
- Это отлично подходило для вычислительных задач общего назначения (GPGPU).
- Но такая структура была сложной для типичных игровых нагрузок, где часто требовалось выполнение разнородных инструкций внутри одного потока.
RDNA была разработана в 2019 году. Её особенности:
- Вместо четырех векторных блоков SIMD, каждый новый Compute Unit (CU) в архитектуре RDNA получил один более широкий векторный блок WGP (Workgroup Processor). Этот WGP эквивалентен двум старым CU из GCN. Такая структура значительно упростила планирование инструкций и повысила эффективность использования ресурсов при выполнении сложных шейдерных программ.
- В архитектуре GCN использовался размер "волны" (wavefront) в 64 потоков (Wave64). Все 64 потока выполняли одну инструкцию одновременно. Если в потоке встречалась инструкция ожидания (например, запрос данных из памяти), простаивал весь wavefront. RDNA перешла на меньший размер волны — Wave32. Это позволило диспетчеру задач быстрее переключаться между разными волнами, заполняя паузы выполнения и обеспечивая гораздо более высокую загрузку исполнительных блоков.
- Каждому новому CU/WGP был выделен собственный выделенный кэш инструкций и скалярный кеш, что кардинально снизило задержки при доступе к данным по сравнению с общей памятью L1 в GCN.
- Результатом этих изменений стало то, что видеокарты серии Radeon RX 5700, основанные на первом поколении RDNA, обеспечили прирост производительности на такт (IPC) примерно на 50% по сравнению с аналогичными решениями на GCN, при этом потребляя значительно меньше энергии. Это вернуло AMD в конкурентную гонку в среднем ценовом сегменте.
RDNA 2
Если RDNA 1 была революцией, то RDNA 2, представленная в конце 2020 года вместе с консолями Xbox Series X|S и PlayStation 5, стала эволюционным развитием, доведшим архитектуру до совершенства. Главной целью этого поколения было достижение уровня с конкурентом (NVIDIA Ampere) не только по чистой производительности, но и по внедрению передовых технологий.
Основные нововведения RDNA 2:
- AMD представила свой набор движков трассировки лучей — Ray Accelerator (RA), встроенных в каждый CU. Они взяли на себя тяжесть математических расчетов пересечений луча с геометрией сцены, разгрузив основные вычислительные блоки и сделав рейтрейсинг в реальном времени жизнеспособной технологией на видеокартах Radeon.
- Технология Variable Rate Shading (VRS) позволяет графическому движку изменять качество затенения в разных частях кадра. Например, на однородных или быстро движущихся объектах можно снизить плотность выборки пикселей без видимой потери качества, высвободив ресурсы GPU для других задач.
- Кеш-память Infinity Cache. Вместо простого увеличения разрядности и частоты шины памяти GDDR6 (что привело бы к огромному росту энергопотребления), инженеры разместили прямо на кристалле огромный объём сверхбыстрой кэш-памяти последнего уровня (L3).
- Когда GPU запрашивает данные, он сначала ищет их в быстром Infinity Cache. Попадание в кеш (hit) обеспечивает передачу данных с минимальными задержками и мизерным расходом энергии. Шина памяти задействуется только при промахе (miss). Для разрешения 1440p и даже 4K во многих играх процент попаданий очень высок, что позволяет видеокартам вроде RX 6800 XT и RX 6900 XT достигать производительности уровня NVIDIA RTX 3080/3090, имея при этом более узкую шину памяти (256 бит против 320-бит у конкурентов), но выигрывая в энергоэффективности.
- Режим яркости (Sampler Feedback). Технология, позволяющая загружать текстуры в память более эффективно, отрисовывая только те части, которые видны в кадре, что экономит пропускную способность видеопамяти.
Архитектура RDNA 2 доказала свою универсальность и мощь, став основой для двух самых продаваемых игровых платформ в истории.
RDNA 3
К 2022 году стало ясно, что традиционный монолитный дизайн больших чипов (SoC) достиг своего предела. Удвоение транзисторного бюджета приводило лишь к линейному росту производительности, но экспоненциально увеличивало сложность производства и количество брака. Ответом AMD стала RDNA 3 — первая в мире десктопная графическая архитектура, построенная на базе чиплетов (MCM - Multi-Chip Module).
Преимущества RDNA 3 :
- Вместо одного огромного кристалла, содержащего и вычислительные блоки, и контроллеры памяти, инженеры разделили его на два:
- 1. GCD (Graphics Compute Die). Содержит все шейдерные движки, Infinity Cache и логику вывода изображения. Он производится по самому современному техпроцессу TSMC 5-нм (N5), что обеспечивает максимальную плотность транзисторов и энергоэффективность.
- 2. MCDs (Memory Cache Dies). Несколько (от 2 до 6) небольших кристаллов, производимых по более старому и дешевому процессу TSMC 6-нм (N6). Каждый MCD содержит один 64-битный контроллер памяти GDDR6 и фрагмент общего Infinity Cache.
- Кроме перехода на чиплеты, RDNA 3 принесла улучшения на уровне самих вычислительных блоков. Двойной потоковый процессор (Dual-Issue FP32) позволил каждому ALU выполнять две операции одинарной точности за такт в определенных условиях, что теоретически удваивало производительность на CU по сравнению с RDNA 2.
Однако старт RDNA 3 оказался неоднозначным. Несмотря на выдающуюся производительность и отличную энергоэффективность, новые карты (серия RX 7900) уступали конкурентам в чистых задачах трассировки лучей и имели проблемы с производительностью в некоторых специфических сценариях из-за усложнения межчиплетного взаимодействия.
RDNA 3.5
Осенью 2024 года AMD представила не полноценное четвертое поколение, а промежуточное обновление — RDNA 3.5.
Особенности :
- Эта архитектура легла в основу мобильных APU серии Ryzen AI 300. APU (Accelerated Processing Unit) — это гибридный процессор, который объединяет функции центрального процессора (CPU) и графического процессора (GPU) на одном кристалле. Такая архитектура позволяет одновременно выполнять вычислительные задачи и обработку графики, что повышает производительность и энергоэффективность системы.
- Главная цель этой архитектуры —радикальное повышение эффективности и внедрение функций, необходимых для искусственного интеллекта
- Благодаря множеству мелких улучшений в прорисовки кадра и управлении данными, RDNA 3.5 обеспечивает значительный прирост производительности при том же уровне энергопотребления, что и предыдущее поколение мобильной графики.
RDNA 4
Архитектура RDNA 4 представленая в 2025 году стала новым этапом в развитии игровых графических процессоров.
Особенности архитектуры :
- Главным представителем поколения RDNA 4, доступным глобально с лета 2026 года, стала модель Radeon RX 9070 GRE. Ранее этот ускоритель был эксклюзивом для китайского рынка, но теперь AMD выводит его на мировой уровень как более доступную альтернативу старшим моделям серии.
- Характеристики видеокарты Radeon RX 9070 GRE: Графический процессор — Navi 48 (архитектура RDNA 4) в урезанной конфигурации. Вычислительные блоки — 48 CU (3072 потоковых процессора). Трассировка лучей — Блоки 3-го поколения (48 RT-ядер). ИИ-ускорители — 2-е поколение (96 ядер). Частота— до 2,79 ГГц. Память — 12 ГБ GDDR6, шина 192 бита, пропускная способность 432 ГБ/с. Энергопотребление— 220 Вт.
- По данным внутренних тестов AMD, карта демонстрирует уверенную производительность в разрешении 1440p, опережая конкурентов из линейки GeForce RTX 50 по производительности. Например, она в среднем на 22% быстрее RTX 5060 Ti и на 2% быстрее RTX 5070.
- Одним из главных нововведений RDNA 4 является аппаратная поддержка вычислений формата FP8, помимо привычного INT8. Это позволяет значительно ускорить работу алгоритмов машинного обучения прямо на чипе.
- На это рассчитана новая технология масштабирования изображения FSR Upscaling 4.1, которая доступна исключительно владельцам карт серии RX 9000.
- FSR 4.1 построена на базе набора технологий Redstone. Она обеспечивает более четкую картинку, лучшую прорисовку мелких деталей, плавное движение камеры и меньшее количество артефактов на сложных текстурах (например, листве).
- Вышла и улучшенная версия Ray Regeneration 1.1, повышающая качество освещения и отражений при трассировке лучей.
RDNA 5
Будет представлена к концу 2027 года.
Предположительные особенности:
- Архитектура RDNA 5 перейдет на более совершенный техпроцесс TSMC N3 и предложит совершенно новую иерархию кристаллов.
- Ожидаются флагманские модели с огромным количеством вычислительных блоков (до 200 CU).
- Поддержка памяти GDDR7 объемом до 36–40 ГБ и экстремальной пропускной способностью, которые должны составить конкуренцию будущим продуктам NVIDIA высокого уровня.