Видеокарты, меняющие расклад на рынке, выходят нечасто. Но NVIDIA ухитряется четвёртое поколение подряд проворачивать этот трюк: прогресс новинок на фоне прошлого поколения, которое не успевает толком устареть даже за два года, не просто заметен, а ошеломляет. Станет ли RTX 3070 продолжателем этой славной традиции?
До чего дошёл прогресс, до невиданных чудес
NVIDIA третье поколение подряд сильно перекраивает внутреннюю архитектуру чипов, в чём-то опираясь на знаменитый «Тик-так», применяемый в Intel: сперва вводим что-то по-настоящему новое, затем выжимаем из этого все соки. В архитектуре Maxwell, лежащей в основе 800 и 900 серий, поработали над энергоэффективностью и упростили распределение ресурсов внутри исполняющих блоков. Так что разработчикам игр стало чуть проще раскрывать новые GPU на полную.
В 10-й серии всё перевели на более тонкий техпроцесс, заставили работать на совершенно других скоростях и попутно решили все обнаруженные проблемы прошлой архитектуры, включая низкую пропускную способности памяти и недостаточную загрузку вычислительных блоков, приводящую к простою графического конвейера. Результат вы знаете: GTX 1060 стала главной видеокартой среднего сегмента и самой популярной дискреткой для игровых ПК по статистике Steam.
C «Тьюрингами» всё понятно: GPU серии RTX 20 совершили маленькую революцию, позволив задействовать в играх «священный грааль» графики — трассировку освещения в реальном времени. А заодно добавив выделенные блоки для работы нейросетей. Видеокарты получились очень мощными (и дорогими). Но знаете, что ещё круче?
NVIDIA ухитрилась улучшить практически каждый аспект внутреннего устройства микроархитектуры! И между делом перевести всё на гораздо более тонкий техпроцесс.
Если Turing был умным способом преодолеть трудности аппаратной реализации рейтрейсинга, то Ampere ещё и обзавелась соответствующими «мышцами». Как надо работать с трассировкой, в NVIDIA уже понимают. Геймдев-индустрия научилась применять новые эффекты и наверняка снабдила «зелёных» ценной информацией о том, чего не хватает для полного девелоперского счастья. Дело было за малым: придумать, как обеспечить качественно новый уровень производительности. Третий раз к ряду. И такой способ нашёлся!
Как устроена архитектура Ampere
Общая конструкция, если можно так выразиться, осталась той же, что и у «Тьюринга»: никаких новых чудо-ядер и волшебных блоков не добавилось. Однако переход на 8 нанометров (кастомный техпроцесс Samsung, доработанный специально для NVIDIA) позволил вдвое нарастить грубую силу GPU. То есть удвоить количество CUDA-ядер. Прирост производительности в классическом 3D (без лучей) будет процентов 70, если не больше. Это, безусловно, крутое улучшение, но не самое интересное.
Изменились тензорные ядра — теперь они выполняют в 4 раза больше операций за один такт, но самих ядер стало вдвое меньше. Вкупе с другими улучшениями производительность AI-вычислений выросла в 2,4 раза!
Также были улучшены и RT-ядра: о конкретных изменениях информации нет, но, судя по презентации NVIDIA и датамайнингу IT-экспертов, выходит, что новая реализация RT-ядер выполняет примерно вдвое больше работы, чем прежняя за то же время. Для геймеров это означает, что DLSS и рэйтрейсинг получат прирост производительности, а значит графика станет красивее и fps вырастет.
Для работы RT- и тензорных ядер, отвечающих за нейросетевые вычисления, необходима огромная пропускная способность памяти. Кроме того, в таких вычислениях часть данных практически не меняется, но используется при каждой математической операции. Поэтому неплохо иметь не только большие и быстрые кэши, но и возможность точно контролировать, какая именно информация важна для операций и не будет выгружаться из кэша. Всё это удалось сделать NVIDIA.
Теперь разработчикам гораздо проще работать с AI-блоком видеокарты, а сам он стал гораздо производительнее.
Наконец, изменения коснулись и самой памяти, но тут не всё так однозначно. В RTX 3070 стоит «обыкновенная» GDDR6 на 256-битной шине памяти. Старшим же вариантам досталась GDDR6X, которая передаёт 4 бита за такт вместо двух, и подключена она по 320-битной шине. Наверняка её частоты несколько ниже, но общая производительность всё равно будет заоблачной.
RTX 3070: что под капотом и с чем это можно сравнить?
С архитектурой разобрались, теперь поговорим о конкретной модели — NVIDIA GeForce RTX 3070 Founders Edition. Фирменное исполнение с короткой платой и сквозной продувкой одного из радиаторов осталось, но, в отличие от старших карт 30-й серии, оба вентилятора расположены на одной стороне, да и сами размеры видеокарты заметно скромнее. Впрочем, для большинства пользователей это плюс: с размещением в компактном корпусе проблем не будет.
С чем можно сравнить такое железо? Ну, скажем, с прошлым поколением видеокарт NVIDIA. По сравнению с RTX 2070 грубая производительность выросла почти в три раза: с 7,5 Тфлопс FP32 до 20,3. По этому показателю ближе всего RTX 2080 Super. Пропускная способность памяти не изменилась: 448 ГБ/с.
AI-вычисления ускорились на 25% — с 59,7 триллиона операций до 81 с небольшим. Для сравнения, 36 RT-ядер у RTX 2070 выполняли около 45 триллионов операций в секунду. У RTX 3070 и ядер больше — 46, и частоты выше примерно на 7%, и сами ядра производительнее в полтора-два раза. Итого — около 61 трлн вычислений в секунду. Снова показатель напоминает RTX 2080 Super.
Если же сравнивать с актуальным железом «красных», то их нынешний флагман выдаёт около 10 Тфлопс вычислительной мощности и имеет те же 8 ГБ памяти с 448 ГБ/с. Минус лучи. То есть топовый Radeon сейчас может конкурировать с RTX 2070, но 30-й серии он не чета.
С теорией всё понятно: RTX 3070 должна попасть аккурат между дорогущей RTX 2080 Super и безумно дорогой RTX 2080 Ti. А что на практике?
Средние результаты за 6 прогонов, лучший и худший были отброшены
В процессе бенчмаркинга частота GPU держалась в коридоре 1900-1950 МГц и пару раз достигала 1980 МГц. При этом температура видеокарты была около 65 градусов (система охлаждения подняла обороты до 55%) и возвращалась к «комнатным» 33-35 градусам с выключенными вентиляторами за пару минут простоя.
В прошлом поколении большинство видеокарт хорошо отзывалось на увеличение частоты и пропускной способности памяти, наращивая результаты в бенчмарках и играх. Младшая «тридцатка», унаследовавшая конфигурацию 8 ГБ GDDR5 @ 448 ГБ/с от RTX 2070 точно так же показывает улучшение результатов при разгоне памяти даже на 100 МГц. Из чего можно сделать вывод, что вендорские варианты с заводским разгоном до 8 ГГц эффективной частоты вполне могут превзойти RTX 2080 Ti в тесте 3D Mark TimeSpy. Теперь к играм.
Заветные 4K при 60 fps
C условиями тестирования мы определились: гонять такого монстра по Full HD бессмысленно, поэтому будем проводить тесты в 4K. Разумеется, проверим и обычную производительность, и трассировку лучей — чтобы определить, какой вклад вносят улучшения микроархитектуры, а где влияние оказывает исключительно количество вычислительных блоков.
Как видите, по железу RTX 3070 ближе к RTX 2080 Super, а общая производительность новинки сравнима с куда более дорогой и мощной RTX 2080 Ti. И это на сравнительно сыром бета-драйвере!
Новый 12-пиновый 650 ВТ разъём питания кажется маленьким на фоне старых 8-пиновых 150 ВТ. Но RTX 3070 столько и не нужно — достаточно 150 ВТ от блока питания и 75 ВТ с материнской платы.
Даже если RTX 3070 и уступает 2080 Ti сегодня, с небольшим разгоном (совершенно обычным, на +200 МГц памяти и 105% доступного энергопотребления) разница становится и вовсе символической. А ведь наверняка ещё допилят софт!
Технологии, которые пока не потрогать
Есть ещё два момента, которые NVIDIA показала на презентации, но их пока невозможно протестировать лично. Первая технология — NVIDIA Reflex Low Latency — развивает идеи G-Sync по части уменьшения задержек вывода изображения на монитор.
Это программно-аппаратный комплекс, который позволяет измерить время от клика мышью или нажатия клавиши до изменения соответствующих пикселей на экране, не используя дорогостоящее оборудование.
Для игроков это означает улучшение отзывчивости управления в играх.
А разработчики смогут оптимизировать работу движков, уменьшив задержки, возникающие на этапе отрисовки кадров. 360-герцовые мониторы с поддержкой Reflex Low Latency выйдут только в следующем году — обязательно протестируем.
Вторая инновация — это улучшенная система NVIDIA Broadcast, предназначенная для стримеров. Теперь видеокарта может не только заниматься аппаратным кодированием видео, но и обрабатывать картинку с веб-камеры нейросетями. Например, аккуратно вырезать вас с фона и заменять бардак в комнате на что-то приятное глазу.
Надо брать!
Результаты тестирования GeForce RTX 3070 Founders Edition радуют каждого ПК-боярина. Ладно, не каждого: кто месяц назад купил 2080 Ti, тот сейчас, наверное, кусает локти. Потому что вчера ты был в узком кругу тех, кто по-настоящему может играть в 4K с высоким fps на максималках, а теперь любой получит то же самое, потратив вдвое меньше денег.
RTX 3070 холоднее, работает тише, стоит дешевле, а работает не хуже, чем прошлогодний флагман за $1000.
Если вы покупали GTX 1070 3-4 года назад, прошли на ней третьего Ведьмака на ультрах, а теперь готовитесь к выходу Cyberpunk 2077, то вы уже знаете, что выбрать. NVIDIA обещает не только привезти побольше видеокарт перед началом продаж, но и сохранить РРЦ на RTX 3070 Founders Edition на заявленном ранее уровне 45 500 рублей — по крайней мере, для первых партий. И это, пожалуй, лучший способ потратить деньги осенью на себя любимого.
Источник: 4pda.ru
Автор: Иван Крылов
Фотографии: Иван Крылов
# NVIDIA обзор NVIDIA GeForce RTX 3070