Найти тему
EverLast

Nvidia GeForce GTX 1070/Видеокарта, которая способна на.../Смотрим, что внутри у этого монстра

После удачного старта GeForce GTX 1080 компания Nvidia преподнесла второй сюрприз для любителей игр, анонсировав преемника GeForce GTX 970 в виде видеокарты GeForce GTX 1070. Естественно, существенно уменьшив стоимость новинки – до $379 для моделей партнеров и $449 за версию референсного дизайна.

Основное нововведение в GeForce GTX 1070 то же, что и в GeForce GTX 1080 – это техпроцесс изготовления 16 нм. Благодаря ему в графический процессор средних размеров (314 мм2) поместилось 7.2 млрд транзисторов, что позволяет говорить о том, что GP104 по сложности замещает GM204, но по возможностям превосходит его.

Новые возможности

В рамках 16 нм техпроцесса Nvidia удалось значительно повысить рабочие частоты видеоядра, и теперь в режиме GPU Boost достигается невероятное значение – 1.7-1.8 ГГц. Порадует энтузиастов и разгон.

Сделаем небольшую ремарку, объясняющую причины невысокого роста производительности при разгоне. Дело в том, что даже штатный режим GPU Boost постоянно удерживает высокую частоту GPU, поэтому разгон в относительной величине измеряется скромными +150-200 МГц. При этом рассчитывать на легкие 2.0 ГГц в случае GeForce GTX 1070 не приходится. Разработчики компании приложили максимум усилий, чтобы младшая модель ни при каких условиях не догнала бы старшую.

Отсюда и изначально низкий уровень TDP, и скромный запас по максимальному энергопотреблению. Остается надеяться на появление модифицированной версии BIOS, открывающей доступ к повышенному лимиту. Пока же путем правки и записи расширенного TDP сместить лимит не удалось никому. По моим наблюдениям графический процессор должен отлично масштабироваться с поднятием напряжения, достигая частот 2.3-2.4 ГГц на воздухе, но тогда энергопотребление видеокарты будет уже не таким впечатляющим и легко перешагнет 200 Вт.

По сравнению с GeForce GTX 1080 новая модель лишилась памяти GDDR5X, оставшись на старой GDDR5. Кроме того, из-за множества физических оптимизаций Nvidia легко отрезала излишек цены и отправила новинку в сегмент среднего класса.

Конечно, все ранее описанные для GeForce GTX 1080 нововведения в полной мере подходят и для GeForce GTX 1070. Мы лишь повторим, что компания действительно верит в будущее 3D реальности, поэтому многие нововведения направлены на поддержку выходящих вскоре решений. Основные улучшения внутри видеоядра направлены на оптимизацию работы с 3D очками и рассказывать об этом можно бесконечно. Остановимся на главном.

Во-первых, это однопроходное стереоизображение для VR. Благодаря технологии уменьшается работа GPU «по геометрии», чем существенно повышается производительность без падения качества. Во-вторых, драйвер и видеокарта учитывают геометрические особенности линз в 3D очках и используют специальные алгоритмы расчета.

Упомянем и новый режим Sli с двойными мостиками. Изначально многие обозреватели неправильно трактовали заявление Nvidia о новом соединении. GeForce GTX 1080 все еще можно объединять в 3- или 4-Way конфигурации, но акцент постепенно смещается в сторону 2-Way. Обусловлено это достаточной производительностью GP104.

Даже одна видеокарта превосходит GeForce GTX Titan X, а пары хватит для 100 кадров в секунду и 4К разрешения в любой игре. Старые мостики Sli можно использовать по-прежнему, но с новыми доступны большие разрешения.

-2

И раз уж речь зашла о графическом процессоре, рассмотрим его подробнее. По сути перед нами решение среднего класса, а пока не представлены более дорогие и производительные модели, Nvidia GeForce GTX 1080 и GeForce GTX 1070 будут считаться самыми быстрыми видеокартами.

-3

В полном GP104 каждый SM работает в паре с движком Polimorph. Но для соответствия современным запросам в него поставили новый блок Multi-Projection. У GeForce GTX 1070 отключили один блок, оставив 15 потоковых мультипроцессоров вместо 20.

-4

Пара из SM и движка Polimorph образуют блок TPC.

-5

В GP104 содержится четыре GPC, каждый из которых состоит из пяти TPC и суммарно восьми сегментов контроллера памяти на весь чип. Каждый TPC состоит из SM и Polimorph. Каждый SM содержит 128 ядер Cuda и кэш-память размером 256 Кбайт, 96 Кбайт общей памяти и 48 Кбайт L1 кэша, а также восемь текстурных блоков.

Любой SM может работать с очередью, состоящей до 32 команд. На внешнем крае остались восемь 32-битных контроллеров видеопамяти.

-6

Поддержка DX12 выразилась в новом режиме работы планировщика заданий, который прямо связан с тем, что видеоядро Pascal обладает динамическим распределением. И чтобы оно не простаивало в моменты, когда обработка графических данных закончена, планировщик подкидывает ядрам вычислительную задачу. Таким образом сокращается время бездействия графического процессора, причем существенно.