Найти в Дзене

AMD FSR 2.0 против DLSS в Deathloop

Оглавление

Сравнительный анализ 8 поколений графических процессоров GeForce и Radeon

FidelityFX Super Resolution 2.0 - это вторая попытка AMD предложить широкую технологию масштабирования игр, чтобы конкурировать с DLSS от Nvidia. В этой статье мы будем использовать игру Deathloop, которая поддерживает DLSS, FSR 1.0 и FSR 2.0, для тестирования и сравнения нескольких графических процессоров текущего и предыдущих поколений, включая GTX 1070 Ti, GTX 1650 Super, RTX 2060, RTX 3080, а на Radeon - RX 570, Vega 64, RX 5700 XT и RX 6800 XT.

С момента выпуска DLSS 2.0 более двух лет назад он неуклонно становится ключевым пунктом продажи графических процессоров Nvidia RTX, многие геймеры покупают графические процессоры GeForce специально для этой функции, и AMD работает над тем, чтобы противостоять этому для своих клиентов Radeon.

Первая попытка AMD, теперь называемая FSR 1.0, была выпущена около года назад, и хотя мы обнаружили, что FSR 1.0 эффективен в некоторых ситуациях, особенно при 4K с использованием режима Ultra Quality, в конечном итоге он оказался не так хорош, как DLSS в целом. Качество изображения при разрешении 1080p было невпечатляющим, а режим производительности выглядел хуже, чем DLSS.

-2

FSR 2.0 - это значительное обновление технологии масштабирования, переходящее от пространственного метода к временному.

Переход к временному масштабированию позволяет FSR 2.0 комбинировать информацию о текущем кадре с данными из предыдущих кадров и векторами движения для восстановления конечного изображения, используя гораздо больше данных, чем это возможно при пространственном масштабировании. Имея доступ ко всем этим данным, FSR 2.0 может выдавать результаты "лучше, чем собственные", как Nvidia также утверждает для DLSS.

FSR 2.0 против DLSS 2.0: как они работают

Отличие FSR 2.0 и DLSS заключается в том, как они подходят к решению задачи восстановления и выбора того, какие биты данных использовать. DLSS использует подход, основанный на ИИ с закрытым исходным кодом, который требует специальных инструкций, эксклюзивных для аппаратного обеспечения Tensor core от Nvidia.

-3

FSR 2.0 вообще не использует искусственный интеллект, вместо этого используется настроенный вручную алгоритм с открытым исходным кодом и поддержкой широкого спектра аппаратных средств, как и FSR 1.0 - тензорные ядра или другие специализированные блоки обработки искусственного интеллекта не требуются. Мы смогли заставить FSR 2.0 работать на оборудовании 5-летней давности без каких-либо проблем, подробнее об этом позже.

-4

Первая возможность оценить FSR 2.0 появилась с Deathloop, игрой, которая также поддерживает FSR 1.0 и DLSS, поэтому мы смогли провести хорошее сравнение между основными современными технологиями масштабирования от двух производителей графических процессоров. Посмотрите видео ниже, чтобы узнать больше подробностей о том, как отличается визуальное качество между FSR 2.0 и BLESS в Deathloop.

Я бы не назвал это "обзором" FSR 2.0 только потому, что мы смотрим на образец одной игры. Нам понадобится больше, чем это, чтобы сделать окончательный выбор в пользу FSR 2.0 против DLSS, но, по крайней мере, это хороший предварительный просмотр того, что может сделать FSR 2.0.

Настройки FSR 2.0

FSR 2.0, как и DLSS, имеет три режима качества, доступных в Deathloop: Качество, Сбалансированный и Производительность, которые соответствуют масштабному коэффициенту 1,5 x, 1,7 x и 2,0 x соответственно, что примерно соответствует тому, что предлагает Nvidia. Это означает, что при разрешении 4K использование качества FSR 2.0 означает, что мы увеличиваем масштаб с 1440p до 4K, в то время как использование режима производительности дает нам масштаб от 1080p до 4K.

-5

FSR 2.0 - это широко поддерживаемое решение для временного масштабирования, что означает, что оно может работать на различных аппаратных средствах, и это именно то, что мы будем делать сегодня. Мы протестировали графические процессоры четырех поколений выпусков AMD и Nvidia, чтобы увидеть, насколько хорошо FSR 2.0 масштабируется на разных архитектурах.

Для сегодняшнего тестирования мы используем тестовую систему Ryzen 9 5950X, оснащенную 16 ГБ оперативной памяти DDR4-3200 с низкой задержкой и работающую с последними общедоступными драйверами для AMD и Nvidia. Мы будем сравнивать FSR 2.0 со следующим лучшим доступным решением для увеличения масштаба для графического процессора, поэтому для карт RTX серии 20 и новее мы будем сравнивать с DLSS, а все остальное - с FSR 1.0.

-6

Чтобы избежать узких мест в процессоре, мы запустили Deathloop с наилучшими настройками качества воспроизведения для каждого графического процессора, включая трассировку лучей, включенную на картах более высокого класса. Deathloop – требовательная игра к памяти графического процессора, и некоторые из протестированных нами карт имеют всего 4 ГБ или 6 ГБ видеопамяти, что вызывает проблемы при самых высоких настройках и в основном создает узкие места для карты - это означает, что мы не видим реальных преимуществ FSR 2.0 или других алгоритмов масштабирования. Для этих графических процессоров мы снизили настройки до соответствующего уровня, который не создает узких мест.

Контрольные показатели

Radeon RX 570: FSR 1 vs. FSR 2 vs. Native

Мы начнем здесь с самой старой и медленной карты в линейке, надежной видеокарты AMD Radeon RX 570 4GB, которая была выпущена еще в 2017 году. Эта игра с трудом запускает Deathloop на 1440p даже при средних настройках, но с увеличением масштаба мы можем повысить производительность при минимальных затратах на визуальные эффекты.

-7

RX 570 почти не выигрывает от FSR 2.0. Мы действительно получаем повышение производительности, но это всего лишь 10-процентный выигрыш от режима качества FSR 2.0 и 27-процентный от режима производительности.

Его все еще стоит использовать, но не мгновенный прирост в 40%+, который мы наблюдали в последних архитектурах. Вы также можете видеть, что FSR 1.0 действительно быстрее, чего не было и в случае с RDNA2. С 6700 XT, как правило, режим качества FSR 2.0 работал лучше, чем режим качества FSR 1.0 Ultra. Но с RX 570 это менее обременительный FSR 1.0, который работает на несколько кадров лучше. Тем не менее, я бы все равно рекомендовал использовать FSR 2.0 здесь, поскольку качество изображения значительно выше при разрешении 1440p.

-8

При разрешении 1080p FSR 2.0 был более способен повысить производительность. Режим качества давал прирост на 14% по сравнению с нативным рендерингом, а режим производительности (который мы действительно не рекомендуем при таком разрешении) был на 26% быстрее. Это действительно помогает RX 570 достичь еще более воспроизводимой частоты кадров, но очевидно, что преимущества этого старого графического процессора ограничены.

GeForce GTX 1650 Super: FSR 1 vs. FSR 2 vs. Native

GeForce GTX 1650 Super также является графическим процессором начального уровня, но он немного новее, но не поддерживает DISKS, поскольку в нем отсутствуют тензорные ядра. Как и RX 570, GTX 1650 Super не сильно выигрывает при 1440p ни с FSR 2.0, ни с 1.0, и кажется, что даже средние настройки здесь немного натянуты.

-9

Режим качества FSR 2.0 был всего на 6 процентов быстрее, и режим производительности почти не улучшился . Для сравнения, FSR 1.0 смог обеспечить гораздо лучшую частоту кадров, а режим качества там обеспечивает более высокую частоту кадров в секунду, чем производительность FSR 2.0.

-10

Однако выигрыш при разрешении 1080p был более приемлемым. Режим качества FSR 2.0 был на 15 процентов быстрее, чем родной, аналогично тому, что было замечено на RX570, а режим производительности увеличил этот показатель до 29 процентов. Не ошеломляющие результаты – и FSR 1.0 определенно быстрее на этом графическом процессоре начального уровня, - но их можно использовать. Мне будет интересно посмотреть, как бюджетные графические процессоры, подобные этому, работают в других играх FSR 2.0, чтобы понять, является ли это скорее игрой или скорее алгоритмом FSR 2.0, но, конечно, кажется, что просто не так много ресурсов GPU для запуска чего-то вроде FSR 2.0.

Radeon RX Vega 64: FSR 1 vs. FSR 2 vs. Native

Давайте вернемся в прошлое и посмотрим на FSR 2.0, работающий на Radeon RX Vega 64, еще одном продукте 5-летней давности. Используя настройки Ultra при разрешении 1440p, FSR 2.0 действительно обеспечил скромное повышение производительности, на 25 процентов для режима качества по сравнению с нативным рендерингом, чего было достаточно, чтобы довести игру в среднем до 60 кадров в секунду.

-11

В отличие от карт начального уровня, которые мы только что рассматривали, мы вернулись к ситуации, когда режим качества FSR 2.0 работает лучше, чем FSR 1.0 Ultra Quality, и по этой причине FSR 2.0, безусловно, является предпочтительным вариантом из-за его гораздо лучшего качества изображения.

-12

При разрешении 1080p я на самом деле увидел меньший выигрыш, чем при разрешении 1440p для FSR 2.0, поскольку кажется, что чистое затенение не обязательно является основным ограничивающим фактором для производительности на Vega 64. Если производительность затенения не является основным узким местом, то снижение разрешения рендеринга может иметь лишь ограниченный выигрыш, что, похоже, и происходит здесь. Другие области производительности, такие как память или геометрия, могут помешать нам добиться дальнейших успехов. Но в любом случае мы все равно получаем повышение производительности.

GeForce GTX 1070 Ti: FSR 1 vs. FSR 2 vs. Native

В архитектуре Nvidia Pascal мы видим аналогичную ситуацию с Vega 64. Используя настройки Ultra при разрешении 1440p, GTX 1070 Ti смог добиться повышения производительности на 20% при переходе от нативного рендеринга к качеству FSR 2.0 и на 41% при использовании производительности FSR 2.0. FSR 1.0 работает лучше на этой архитектуре, особенно при более низких разрешениях рендеринга, но я бы все же предпочел использовать FSR 2.0 из-за его более высокого качества изображения.

-13
-14

При разрешении 1080p снова более скромный прирост в 15 процентов для режима качества, аналогичного Vega. Будет интересно посмотреть, как это работает в других играх, но FSR 1.0 был не намного лучше настройки Ultra Quality. Так что я по-прежнему рад, что FSR 2.0 можно использовать здесь, и это лучший вариант, чем более старая версия FSR от AMD.

Radeon RX 5500 XT 8GB: FSR 1 vs. FSR 2 vs. Native

Давайте взглянем на продукт RDNA первого поколения - RX 5500 XT 8GB. При разрешении 1440p режим качества FSR 2.0 смог обеспечить производительность на 24% выше, чем при обычном рендеринге, что намного больше, чем у RX 570, несмотря на то, что обе карты изначально работали с примерно одинаковыми кадрами в секунду в условиях, которые мы тестировали. Повышение производительности на 45% также было возможно при использовании режима производительности, и в целом это предпочтительнее, чем FSR 1.0.

-15
-16

При разрешении 1080p я также увидел значительный прирост: 21% для режима качества FSR 2.0 и 37% для производительности FSR 2.0, что снова дает результаты, которые предпочтительнее, чем при использовании FSR 1.0. Да, настройка производительности FSR 1.0 дает вам несколько дополнительных кадров в секунду, но ваши глаза не простят вам использование такого низкого качества настройка.

Radeon RX 5700 XT: FSR 1 vs. FSR 2 vs. Native

В рамках того же семейства архитектур давайте теперь посмотрим на гораздо более быструю RX5700 XT. При той же архитектуре и том же объеме памяти FSR 2.0 явно выигрывает от увеличения ресурсов графического процессора. При разрешении 1440p с использованием режима качества FSR 2.0 мы увидели 34-процентный прирост производительности, что выше, чем 24%, которые мы наблюдали у 5500 XT. Больший прирост также был возможен для режима производительности, 61% здесь по сравнению с 45% для RDNA начального уровня.

-17
-18

При разрешении 1080p мы можем повысить производительность на 27% по сравнению с нативным рендерингом в режиме качества FSR 2.0 и на 44% в режиме производительности. С этими продуктами среднего класса на самом деле нет смысла использовать FSR 1.0, поскольку режим Ultra Quality работает медленнее, чем FSR 2.0, что опять же ухудшает качество изображения.

GeForce RTX 2060: FSR 2 vs. DLSS vs. Native

Теперь давайте взглянем на архитектуру Turing, оснащенную тензорным ядром Nvidia, начиная с RTX 2060. С этим графическим процессором производительность FSR 2.0 аналогична тому, что мы видим с RTX 3060 Ti (ниже), в том смысле, что DLSS немного быстрее, чем FSR 2.0 в целом, но не значительно.

-19

Режим качества FSR 2.0 был способен обеспечить довольно невпечатляющий прирост производительности на 18 процентов, но режим меньшего качества улучшил его только до 21 процента, так что это слишком много. Наилучшими результатами для DLSS был режим производительности, который в итоге оказался на 6% быстрее, чем эквивалентная настройка FSR 2.0.

-20

Затем в 1080p аналогичная история. Только 13-процентный прирост производительности в режиме качества FSR 2.0 по сравнению с нативным, при этом режим качества DLSS обеспечивает 19-процентный прирост. При разрешении 1080p это делает DLSS выгодным вариантом, поскольку он также имеет тенденцию выглядеть лучше, но ни один из вариантов не обеспечивает значительного увеличения производительности – хотя я бы, конечно, выбрал его, если бы мне было трудно достичь воспроизводимой частоты кадров.

GeForce RTX 2080: FSR 2 vs. DLSS vs. Native

Некоторые из наиболее интересных результатов получены с RTX 2080. При разрешении 4K FSR 2.0 обеспечивал 26-процентное повышение производительности в режиме качества по сравнению с нативной, однако выигрыш с DLSS был намного больше - 40 процентов для эквивалентного режима.

-21

На этом графическом процессоре DLSS был на 10-12 процентов быстрее при 4K, что является значительным преимуществом и явно делает DLSS выгодным вариантом. Опять же, мы не знаем, как именно работает FSR 2.0, поэтому мы не знаем, какие ресурсы графического процессора он предпочитает, но я думаю, что результаты 2080 немного разочаровывают, особенно когда DLSS очень эффективен.

-22

Аналогичная ситуация и при 1440p. Повышение производительности благодаря качеству FSR 2.0 составило 18 процентов по сравнению с нативным рендерингом, но качество DLSS улучшилось на 26 процентов. Не такая большая разница в пользу DLSS, но технология Nvidia все равно была примерно на 7 процентов быстрее в целом, так что опять же для владельцев 2080 было бы разумно использовать DLSS.

GeForce RTX 3060 Ti: FSR 2 vs. DLSS vs. Native

-23
-24
-25

Radeon RX 6800 XT: FSR 1 vs. FSR 2 vs. Native

-26

Давайте взглянем на некоторые современные высокопроизводительные графические процессоры. При разрешении 4K с RX 6800 XT режим качества FSR 2.0 был эффективным, обеспечивая 28-процентный прирост производительности по сравнению с нативным рендерингом. Использование режима производительности увеличило этот показатель до 61 процента по сравнению с родным, и поскольку большинство режимов либо соответствуют, либо превосходят FSR 1.0, ясно, что на такой высококлассной карте, как эта, играющей с высоким разрешением, вы должны использовать FSR 2.0.

Radeon RX 6700 XT: FSR 1 vs. FSR 2 vs. Native

-27
-28
-29

GeForce RTX 3080: FSR 2 vs. DLSS vs. Native

-30

RTX 3080 использующего те же настройки при разрешении 4K, мы видим больший выигрыш в 38 процентов для качества FSR 2.0 по сравнению с нативным и 74 процента для режима производительности. Однако, как и в случае с другими графическими процессорами Nvidia, которые мы тестировали, DLSS является более быстрым вариантом, обеспечивая на 4-6 процентов более высокую частоту кадров при настройках качества, эквивалентных FSR 2.0. Так что мои общие соображения об использовании DLSS вместо FSR 2.0 на новейших графических процессорах Nvidia верны.

Что Мы Узнали

Очевидно, что FSR 2.0 лучше всего работает на новейших архитектурах графических процессоров, таких как RDNA и RDNA 2 от AMD, а также Ampere от Nvidia. Эти графические процессоры неизменно демонстрировали наилучшие результаты с точки зрения повышения производительности по сравнению с нативным рендерингом. Мы не считаем необоснованным ожидать минимального прироста в 30-40 процентов при использовании режима качества FSR 2.0 на современных графических процессорах.

Во всех ситуациях по-прежнему имело смысл использовать или, по крайней мере, рассмотреть возможность использования FSR 2.0, поскольку мы не видели снижения производительности, и результаты в целом были благоприятными по сравнению с FSR 1.0, но есть некоторые случаи, когда выигрыш меньше, чем ожидалось.

-31

Однако на производительность влияет не только архитектура графического процессора. Как мы видели несколько лет назад при тестировании DLSS, ключевым компонентом также является собственная частота кадров рендеринга: вы получите больший выигрыш, если ваш базовый FPS будет ниже.

Это связано с тем, что FSR 2.0 занимает большую часть общего времени рендеринга кадров при более высоких частотах кадров. Но даже если ваш базовый уровень составляет 100 кадров в секунду или более, FSR 2.0 все равно может обеспечить значительный прирост на новых архитектурах, при условии, что вы не столкнетесь с узкими местами в процессоре.

Также кажется, что FSR 2.0 работает лучше на графических процессорах, которые просто быстрее в целом, как мы видели при сравнении RX 5700 XT и RX 5500 XT: та же архитектура, те же настройки, но выигрыш от 5700 XT был лучше, несмотря на более высокий базовый FPS. Это также то, что AMD предложила при запуске: более длительное время обработки FSR 2.0 для менее мощных графических процессоров.

-32

Имеет смысл, что карты с большим количеством ресурсов могут запускать алгоритм быстрее, тем более что он не использует выделенное оборудование. Когда алгоритм выполняется быстрее, он использует пропорционально меньше времени, необходимого для рендеринга каждого кадра, что может дать преимущество в производительности.

Это также актуально для бюджетных и старых графических процессоров. Таким картам, как RX 570 и GTX 1650 Super, просто требуется больше времени для обработки FSR 2.0, что приводит к более ограниченному повышению производительности даже в "идеальных" условиях для масштабирования. Это усугубляется ограничениями старых архитектур, например, если части FSR 2.0 используют обработку FP16, такую как FSR 1.0, тогда алгоритму придется вернуться к обработке FP32 на графических процессорах, таких как Polaris, которые изначально не поддерживают FP16, что снижает производительность. У нас еще нет полной картины того, какие архитектурные особенности необходимы для максимальной производительности FSR 2.0, но мы были бы удивлены, если бы FP16 не был фактором.

-33

С учетом сказанного, даже пятилетние графические процессоры могут работать и извлекать выгоду из FSR 2.0, чего нельзя сказать о DLSS. Мы, безусловно, получим повышение производительности от 10 до 20 процентов от этого временного алгоритма на этих картах по сравнению с FSR 1.0, несмотря на меньший прирост производительности.

На четырех протестированных нами сегодня графических процессорах, которые также поддерживают DLSS, как поколений Turing, так и Ampere, производительность FSR 2.0 приближается к DLSS при использовании эквивалентных настроек качества. Однако DLSS, как правило, работает лучше, до 12% быстрее в лучшем случае на RTX 2080. Поэтому владельцам графических процессоров Nvidia с картами, оснащенными Tensor, мы рекомендуем использовать DLSS из-за небольшого преимущества в производительности, а также потому, что в некоторых ситуациях он также обеспечивает лучшее качество изображения.

Наконец, стоит повторить, что это для одной игры. Нам нужно будет провести более глубокое тестирование через несколько месяцев, чтобы увидеть, как FSR 2.0 работает в более широком диапазоне. К тому времени у нас также должен быть исходный код FSR 2.0, и, надеюсь, эксперты в этой области смогут погрузиться и дать нам хорошую картину того, что происходит. Но пока мы все еще можем немного узнать об оптимальных ситуациях для FSR 2.0 в Deathloop, так что, надеюсь, это тестирование было полезным.