- NVIDIA GeForce GTX 1650
В основе GeForce GTX 1650 лежит графический процессор TU117 — очередной держатель переходящего знамени самого компактного представителя серии Turing. Несмотря на то, что в номенклатуре NVIDIA его номер всего лишь на единицу отличается от номера чипа TU116, давшего жизнь успешным видеокартам среднего ценового сегмента (GeForce GTX 1660 и GTX 1660 Ti), новинка относится к совершенно иной весовой категории. Кристалл TU117 содержит 4700 млн транзисторов по сравнению с 6600 млн в TU116 (71 % объема старшей модели) и несет 16 потоковых мультипроцессоров (SM) — основных строительных блоков архитектуры NVIDIA, число которых производитель может свободно варьировать, чтобы выпустить на базе одного GPU несколько ускорителей различного уровня. И представьте себе, графический процессор GeForce GTX 1650 уже попал под нож, не успев дойти до магазинных полок. Из полного набора в 16 потоковых мультипроцессоров у дебютной разновидности TU117 активны только 14 SM, объединяющие 896 32-битных ядер CUDA, 56 блоков наложения текстур и 32 конвейера растеризации (ROP). Но коль скоро в названии новинки нет приставки Ti, у NVIDIA еще осталась возможность выпустить на рынок дискретных видеокарт полнофункциональный вариант TU117 в рамках 16-й серии GeForce.
В результате сложилась, на первый взгляд, парадоксальная ситуация: по транзисторному бюджету TU117 на 300 млн превосходит чип GP106, которым оснащаются среднебюджетные модели GeForce прошлого поколения — GTX 1060 с 3 и 6 Гбайт RAM, и в то же время по конфигурации основных вычислительных блоков занимает промежуточное положение между младшей версией GTX 1060 с одной стороны и GeForce GTX 1050 Ti с другой. Кроме того, референсные спецификации новинки указывают на весьма консервативные тактовые частоты: нижнее значение 1485 МГц и Boost Clock (оценка среднестатистической частоты при типичной нагрузке) на уровне 1665 МГц. Как следствие, и по теоретическому быстродействию GeForce GTX 1650 оказался посередине между GTX 1050 Ti и GTX 1060.
- AMD Radeon RX 570
По сравнению со своим основным конкурентом Radeon RX 580 может предложить покупателю такие преимущества, как больший объем оперативной памяти (8 против 6 Гбайт) и возможность работы в многопроцессорных конфигурациях, которой NVIDIA в текущем поколении лишила видеокарты рангом ниже, чем GeForce GTX 1070. Тем не менее микроархитектуры, лежащие в основе чипов AMD и NVIDIA, разошлись уже настолько, что многие из современных игр отдают явное предпочтение тому или иному из производителей GPU, и в данный момент соотношение среди проектов класса ААА играет не в пользу AMD. При этом, хотя разработчик установил на версию RX 580 с 8 Гбайт RAM рекомендованную цену ниже уровня GeForce GTX 1060 ($229 против $249), в рознице эти модели занимают один и тот же ценовой диапазон.
Сегодня на повестке дня вторая по старшинству видеокарта 500-й серии — Radeon RX 570, которая, будучи наследником Radeon RX 470, разделила с Radeon RX 580 все преимущества второго поколения Polaris. Ей предстоит вступить в борьбу с младшими модификациями GeForce GTX 1060, оснащенными 3 Гбайт RAM и частично деактивированным графическим процессором. Посмотрим, удалось ли AMD сделать более убедительное предложение в секторе видеокарт дешевле $200, чем в категории от $230.
- AMD Radeon RX 580
Графический процессор Polaris 20 представляет собой обновленную версию ядра Polaris 10, установленного в Radeon RX 480. Как следствие, состав вычислительных блоков не претерпел изменений. Как и Polaris 10, полностью функциональная версия Polaris 20 располагает 2304 шейдерными ALU, 144 блоками наложения текстур и 32 ROP, а с оперативной памятью чип соединен 256-битной шиной с пропускной способностью 8 Гбит/с на контакт.
Напомним, что с точки зрения микроархитектуры серия Polaris имеет ряд отличий от предыдущих продуктов AMD на основе логики GCN версии 1.2 (чип Fiji в составе Radeon R9 Nano, R9 Fury и Fury X), среди которых важное место занимает компрессия цвета с соотношением вплоть до 8:1, позволяющая более эффективно расходовать пропускную способность шины RAM. Из прочих оптимизаций внутренней структуры GPU, представленных в GCN 1.3, отметим оптимизацию геометрического движка, способного отсекать на ранних стадиях конвейера полигоны нулевого размера либо не имеющие пикселов в проекции. Работа Compute Unit’а (основной структуры GCN, объединяющей шейдерные ALU и блоки наложения текстур) также подверглась тюнингу в Polaris c целью повышения его удельной производительности.
Функциональные нововведения Polaris включают поддержку форматов чисел с половинной разрядностью — int16 и FP16, которые используются в расчетных задачах, не требующих более точного представления (как, например, машинное обучение).
Выделенный кодек GPU позволяет аппаратно кодировать и декодировать видео в форматах HEVC Main 10 и VP9 с разрешением вплоть до 4К. Контроллер дисплея поддерживает вывод сигнала по интерфейсам DisplayPort 1.3/1.4 и HDMI 2.0b, а также высокий динамический диапазон (HDR). Более детальную информацию об архитектуре GCN 1.3 и чипах Polaris вы можете получить в нашем обзоре Radeon RX 480.
- NVIDIA GeForce GTX 1650 Super
В основе GTX 1650 лежит самый компактный из 12-нанометровых чипов NVIDIA — TU117, вмещающий 16 SM (потоковых мультипроцессоров) и, сообразно внутренней организации архитектуры Turing, 1024 шейдерных ALU (32-битных CUDA-ядра). Тем не менее NVIDIA не посчитала нужным выпустить на широкий потребительский рынок полностью функциональную версию TU117 — она встречается только в недорогих лэптопах и профессиональных картах Quadro T2000. Что касается дискретных ускорителей для настольных ПК, то на производство GeForce GTX 1650 идут чипы, урезанные до 14 SM и, соответственно, 896 ядер CUDA. Даже GeForce GTX 1050 Ti — предыдущий игрок зеленой команды в одной лиге с GTX 1650 — располагает ненамного меньшим комплектом вычислительных ресурсов (768 CUDA-ядер). Архитектура Turing сама по себе имеет массу усовершенствований по сравнению с предшествующим Pascal, тем более в комбинации с повышенными тактовыми частотами, которые стали доступны благодаря фотолитографии 12 нм. Однако быстродействие GeForce GTX 1650 сдерживает плохо развитый back-end чипа: всего лишь 32 ROP и 128-битная шина памяти, которая влечет за собой соответствующий объем RAM — 4 Гбайт. Вдобавок к этому платы с TU117 комплектуются сравнительно неповоротливыми чипами памяти GDDR5 с пропускной способностью 8 Гбит/с на контакт шины. Как следствие, по производительности GTX 1650 в играх оказался где-то в середине между GeForce GTX 1050 Ti и полновесным GTX 1060 с 6 Гбайт оперативной памяти, да и по общему впечатлению младший Turing похож скорее на промежуточный апгрейд GTX 1050 Ti, нежели на бюджетный ускоритель новой волны.
Впрочем, конфигурация видеокарты еще ничего не значит в отрыве от стоимости покупки, но в этом и заключается главная проблема GeForce GTX 1650. Новинка была оценена на $10 дороже, чем GTX 1050 Ti, и принесла очень скромную добавку производительности на доллар по сравнению с предшествующим поколением. Кроме того, продукты NVIDIA не существуют в вакууме, а AMD уже не раз продемонстрировала готовность снижать отпускные цены до предела в тех ситуациях, когда на конкурента невозможно надавить техническими преимуществами. Соседями GeForce GTX 1650 в прайс-листах стали 4-гигабайтные модификации Radeon RX 570, уложившие чип TU117 на лопатки в игровых бенчмарках.
Единственным веским достоинством GeForce GTX 1650 осталась выдающаяся энергоэффективность, на которую работают архитектура Turing и 12-нанометровый техпроцесс. Если делить ассортимент дискретных видеокарт обоих производителей не по цене, а по их мощности, то в специфической нише «до 75 Вт» GeForce GTX 1650 стал королем. Этот факт наверняка принес NVIDIA много выгодных OEM-контрактов со сборщиками готовых компьютеров, да и для розничных покупателей компактные видеокарты, часто без разъема дополнительного питания, тоже представляют интерес.
- AMD Radeon RX 590
Когда идет речь о новом GPU, знакомству с видеокартой и результатам тестирования обычно предшествует обстоятельный рассказ об особенностях его архитектуры и функциях рендеринга. Но в случае Radeon RX 590 нам нечего добавить к тому, что было сказано больше двух лет тому назад о Radeon RX 480 и графическом процессоре Polaris 10, ведь чип Polaris 30, на котором основана новая модель, — это чистый die shrink кремния Polaris 20 по технологической норме 12 нм FinFET. В свою очередь, Polaris 20 представляет собой модификацию родоначальника всего семейства, Polaris 10, оптимизированную с позиции тактовых частот и энергоэффективности. Такая практика характерна скорее для компонентов игровых консолей, нежели дискретных графических карт, в истории которых не так уж много примеров того, чтобы компания трижды выпускала в продажу микросхему с неизменным дизайном. Но не спешите осуждать AMD. Проверенная архитектура Polaris позволила сравнительно быстро начать производство компактного GPU на прогрессивном фотолитографическом узле, в то время как NVIDIA бросила все силы на крупные процессоры семейства Turing для высокопроизводительных и дорогих ускорителей GeForce RTX.
Все, что должно нас волновать в Radeon RX 590 — это тактовые частоты и «сырое» быстродействие, которое этот ускоритель может предложить в текущих задачах, пока передовые технологии NVIDIA еще не освоены разработчиками ПО. В спецификациях GPU конкурента, а также процессоров Vega, верхнее значение тактовой частоты означает тем или иным образом спрогнозированный разгон при типичной вычислительной нагрузке. Чипы Polaris, напротив, характеризуются твердым пределом частоты, выше которого GPU подняться не может, но на видеокартах с достаточным резервом мощности и хорошей системой охлаждения максимальная частота в играх поддерживается практически постоянно. Переход с техпроцесса 14 нм FinFET на 12 нм FinFET позволил обновленному GPU увеличить этот показатель на 205 МГц — с 1340 в Radeon RX 580 до 1545 МГц в Radeon RX 590. Если сравнивать с Radeon RX 480, то рост частоты составил 279 МГц, а проектное быстродействие в операциях с плавающей запятой стандартной точности (FP32) увеличилось на 22 %. В такой форме кремний Polaris обладает на 20% более высокой производительностью по сравнению с Radeon R9 390X и, соответственно, вполне оправдывает позицию новинки в качестве 90-й модели семейства Radeon 500.
- NVIDIA GeForce GTX 1660
В основе GeForce GTX 1660 лежит графический процессор TU116 с частично деактивированными вычислительными блоками. Разница в конфигурации GPU между GTX 1660 и GTX 1660 Ti сводится к двум потоковым мультипроцессорам (SM), которые в сумме содержат 128 32-битных CUDA-ядра и 8 блоков наложения текстур. Таким образом, пропускная способность GeForce GTX 1660 пострадала лишь на 8,3 % в операциях с плавающей точкой и тексельном филлрейте без поправки на тактовые частоты GPU. А частоты, между прочим, у младшей модели только выросли: базовую частоту NVIDIA увеличила на 30 МГц, а Boost Clock — на 15 МГц.
Но таких осторожных изменений было бы недостаточно, чтобы дифференцировать GeForce GTX 1660 и GTX 1660 Ti. Главным признаком, разделяющим две модели, стал тип оперативной памяти. В то время как модификация Ti комплектуется микросхемами GDDR6 с пропускной способностью 12 Гбит/с на контакт, GeForce GTX 1660 вернулся к стандарту GDDR5. Более того, GTX 1660 оснащается чипами с пропускной способностью 8 Гбит/с, а значит, по совокупной ПСП новая видеокарта полностью соответствует стартовым спецификациям GeForce GTX 1060 с 6 Гбайт RAM, а позднейшие версии GTX 1060 с оперативной памятью стандарта 9 Гбит/с даже выигрывают у GTX 1660 по этому параметру. Впрочем, графический процессор TU116 благодаря усовершенствованной компрессии цвета работает с RAM более эффективно.Поскольку ни тактовые частоты, ни конфигурация GPU у GeForce GTX 1660 и GTX 1660 Ti существенно не отличаются, а младшая модель вдобавок несет чипы RAM с более высоким энергопотреблением (по сравнению с GDDR6), два младших ускорителя семейства Turing характеризуются одинаковым резервом мощности — 120 Вт.
Прочие характеристики чипа TU116 в сравнении с полноценными представителями семейства Turing (TU106, TU104 и TU102) мы уже обсуждали в обзоре GeForce GTX 1660 Ti, но стоит заострить внимание на нескольких ключевых особенностях, которые роднят TU116 с его старшими аналогами или, наоборот, проводят между ними непреодолимую границу. В общей сложности, TU116 свойственны все нововведения, которые NVIDIA реализовала в архитектуре Turing, за исключением ядер, выполняющих Ray Tracing, и тензорных ядер, которые занимаются расчетами FMA (Fused-Multiply Add) над матрицами вещественных чисел половинной точности (FP16). Последние находят применение, в первую очередь, в задачах машинного обучения, когда GPU пропускает данные через нейронную сеть, предварительно сформированную локально или на удаленной ферме. Таким образом, GeForce GTX 1660 и GTX 1660 Ti одновременно лишились совместимости и с DXR (расширением Direct3D 12 для трассировки лучей), и с технологией DLSS, которая позволяет GPU выполнять рендеринг в сниженном разрешении с последующим масштабированием кадра силами нейросети.
- NVIDIA GeForce GTX 1660 Super
Оригинальная версия GeForce GTX 1650, как ни крути, стала слабым звеном во всей цепочке ускорителей семейства Turing и на какое-то время затормозила позитивную тенденцию по росту соотношения производительности и цены дискретных GPU NVIDIA. Невзирая на отменную энергоэффективность GeForce GTX 1650, он безнадежно отстает по быстродействию от ближайшего по стоимости красного конкурента — Radeon RX 570, — не говоря уже о скромном объеме в 4 Гбайт оперативной памяти. Такое впечатление, будто NVIDIA готовила GeForce GTX 1650 скорее для OEM-клиентов, нежели для розницы. Но теперь, когда AMD готовит к запуску перспективную замену Radeon RX 570/580 в лице Radeon RX 5500, позиции NVIDIA в бюджетном ценовом сегменте не устоят за счет одной только энергоэффективности.
Так появился GeForce GTX 1650 SUPER, в основу которого лег графический процессор TU116 (вместо TU117), но с крайне урезанной конфигурацией функциональных блоков, включая сокращенный набор ROP и 128-битную шину RAM. Как следствие, GTX 1650 SUPER все-таки не избавится от ограничения в 4 Гбайт оперативной памяти, но в остальном теоретические оценки быстродействия позволяют рассчитывать на рост в 53 % по сравнению с оригинальной версий ускорителя. Тем более, что вместо чипов GDDR5 с пропускной способностью 8 Гбит/с он получит новенькие GDDR6 12 Гбит/с. Вдобавок к увеличенной кадровой частоте в играх немаловажным фактором для некоторых пользователей станет полновесный интегрированный кодировщик видео NVENC, которым располагает TU116, в то время как TU117 достался аналогичный, менее производительный блок от чипов Volta.
NVIDIA держит в тайне информацию о ценах GeForce GTX 1650 SUPER, да и AMD не распространяется заранее о своих планах на Radeon RX 5500. Если вспомнить, как развивалась ситуация со стоимостью Radeon RX 5700 и Radeon RX 5700 XT после анонса GeForce GTX 2060 и 2070 SUPER, NVIDIA и AMD опять могут разыграть интересную многоходовку, но этого мы не увидим по крайней мере до 22 ноября.