Введение
В продолжении серии статей о тестировании первых 4-ядерных настольных процессоров в современном профессиональном и игровом программном обеспечении мы сегодня затронем вопрос о пользе L3-кеша в процессорах микроархитектуры K10. Напомним, что помимо 4-ядерных Phenom II X4 на чипах Deneb, уже протестированных ранее, во втором поколении микроархитектуры K10 появились ещё и 4-ядерные Athlon II X4 на чипах Propus, отличавшихся от чипов Deneb лишь отключенным L3-кэшем. Ход с отключением дефектного L3-кэша, занимавшего в Phenom II треть площади кристалла, и последующей реализацией полученных чипов под торговой маркой Athlon II позволил AMD существенно снизить стоимость своих 4-ядерных процессоров. Процессоры Athlon II X4 стоили в 1.5-2 раза дешевле Phenom II X4, при этом проигрывали им в производительности лишь 10-15%.
Здесь будет не лишним упомянуть, что как у первого, так и у во второго поколения 4-ядерных процессоров AMD имелись ещё и 3- и 2-ядерные "обрезки", выпускавшиеся под различными названиями (Phenom X3, Phenom II X3, Athlon II X3, Phenom II X2, Athlon II X2). Вся эта история с отключением кэша и ядер тянулась ещё с момента производства самых первых 2-ядерных чипов AMD, когда компания столкнулась со значительным количеством дефектов, для снижения издержек от которых на готовых изделиях приходилось выключать либо одно ядро, либо часть блоков кэш-памяти L2. Причём, второй метод был эффективнее, так как уже на тот момент времени более половины транзисторов в чипах были частью именно кэш-памяти, и если дефекты и имели место, то, вероятнее всего, именно в блоках кэш-памяти. Со временем, конечно, процент выхода годных 2-ядерных кристаллов возрос, но переход к производству 4-ядерных кристаллов, а затем ещё и на более тонком техпроцессе вновь сопровождался ростом количества дефектов. Благо, возможность отключать ядра и кэш-память (теперь уже, правда, L3) никуда не делась и всё ещё оставалась вполне эффективным способом снижения издержек производства. При этом 2- и даже 3-ядерные модели в рамках текущего исследования нам безынтересны, так как априори не обладают достаточной для современных игр производительностью, а вот на Athlon II X4 посмотреть было бы интересно.
В качестве конкурента протестированному ранее Phenom II X4 945 был выбран равный ему по частоте Athlon II X4 640. Так же для сравнения в диаграммы были добавлены результаты Phenom первого поколения, а именно Phenom X4 9950, частота которого ниже, а L3-кэш всё же имеется, пускай и объёмом меньшем, чем у Phenom II. Ну а кратким тест будет потому, что все процессоры будут протестированы исключительно в стоке.
Характеристики, тестовые стенды и методика тестирования
Характеристики участников тестирования сведены в следующую таблицу.
Phenom X4 9950
Athlon II X4 640
Phenom II X4 945
Краткое описание тестового стенда и методики тестирования приведено ниже под спойлерами.
Тестовый стенд
AM2+
- GIGABYTE GA-MA790X-UD3P
- 4x2 ГБ DDR2-1066 CL5 (Kingston HyperX, KHX8500D2)
- ID-Cooling FROSTFLOW X 360
- PowerColor AMD Radeon RX 6800 Fighter
- SSD Apacer AS350 PANTHER на 512 ГБ (Windows 11 и приложения)
- SSD Colorful SL500 на 4 ТБ (игры)
- CHIEFTEC BDF-1000C
Методика тестирования
Производительность будем сравнивать в современном программном окружении, используя актуальные (насколько это возможно) версии тестируемых приложений и игр. Аналогично и с Windows — на оба тестовых стенда была установлена "свеженькая" Windows 11, версия 22H2. Здесь можно было бы возразить, что использование современного ПО ставит участников тестирования в не совсем равные условия, ведь актуальные версии приложений и игр с большой долей вероятности могут использовать наборы инструкций, отсутствующие у "старичков". Как следствие, более актуальные процессоры получат от использования SSE4- и AVX-инструкций дополнительное, якобы несправедливое, преимущество. Но я считаю иначе: новые наборы инструкций — это одно из микроархитектурных улучшений, которое ничем по сути своей не отличается от более высоких тактовых частот или больших объёмов объёма кэш-памяти. В конце концов, появились все эти наборы не просто так, и транзисторный бюджет на их поддержку был потрачен не смеху ради.
Жаль лишь, что во многих случаях использовать максимально современное ПО в тестах не получится, так как поддержка наборов инструкций, отсутствующих у "старичков" много где уже стала обязательной. В особенности сказанное, конечно же, касается игр, но и многие актуальные версии неигрового ПО уже не так просто или вообще невозможно запустить на стареньких процессорах. Тем не менее, небольшой список вполне себе актуального ПО набрать удалось:
- Для тестов синтетических были выбраны AIDA64 и Geekbench 5. Из первой, правда, мы воспользуемся лишь тестами скоростных характеристик памяти, так как бенчмарки вычислительной скорости процессоров мне в Geekbench 5 нравятся больше.
- Некую общую производительность ПК будем измерять с помощью PCMark 10.
- В качестве реального неигрового ПО будут использованы Cinebench R23, Photoshop 2020, Premiere Pro 2022, 7-Zip 22, Blender 3.3, HandBrake 1.5, NAMD 2, Python 3.9.
- И, наконец, игры будет представлены проектами Grand Theft Auto V, Sid Meier's Civilization VI, Shadow of the Tomb Raider, Hitman 2, Metro Exodus, Total War: Three Kingdoms, Borderlands 3, F1 2020.
Тестировать игры будем исключительно в HD-разрешении и (там, естественно, где есть выбор) с использованием современных API (например, DirectX 12).
Тестирование: синтетические и комплексные тесты
AIDA64 Memory Bandwidth & Latency
По результатам тестов скоростных характеристик подсистемы памяти в AIDA64 вновь отмечаем, что во втором поколении 4-ядерных процессоров AMD удалось устранить хорошо известный недостаток встроенного контроллера памяти Phenom первого поколения, а именно невысокую эффективность записи в память. Отсутствие L3-кэша у Athlon II несколько негативно сказалось на скорости записи, но показатели всё ещё заметно выше в сравнении с Phenom первого поколения. Латентность памяти у всех протестированных процессоров примерно на одном уровне.
Geekbench 5
В наборе синтетических тестов Geekbench 5 отсутствие L3-кэша сказалось на однопоточных результатах Athlon II незначительно, а вот в многопоточных тестах влияние L3-кэша уже заметно. Впрочем, частота всё же оказалась важнее — более низкочастотный Phenom первого поколения остался позади Athlon II.
PCMark 10
Аналогичную картину можно наблюдать и в комплексном тесте PCMark 10. За вычетом лишь группы тестов Essentials, которая отражает производительность при обычной работа среднестатистического пользователя. Здесь Athlon II и Phenom первого поколения выступили почти на равных.
Тестирование: профессиональное ПО
Cinebench R23
А вот в профессиональном ПО сразу же в первом тесте видим существенное влияние L3-кэша — с рендерингом в Cinebench R23 Athlon II справился значительно медленнее равночастотного Phenom II. Почти настолько же медленно, как и более низкочастотный Phenom первого поколения.
Photoshop 2020
В Photoshop протестированные процессоры расположились в уже привычную по синтетическим тестам иерархию — Phenom II быстрее Athlon II, который в свою очередь, быстрее Phenom первого поколения. L3-кэш здесь оказался важен примерно настолько же, насколько и частота.
Premiere Pro 2022
А вот в Premiere Pro необходимость в L3-кэше оказалась минимальна, здесь всё решила частота — Athlon II чуть медленнее Phenom II, и оба заметно быстрее Phenom первого поколения.
Visual Studio 2022
Наконец-то первый пример рабочей задачи, где L3-кэш заметно важнее частоты — с компиляцией Blender в Visual Studio Athlon II справился сильно хуже не только Phenom II, но и Phenom первого поколения.
7-Zip 22
Чуть меньше значимость L3-кэша при сжатии данных в 7-Zip — Athlon II здесь всё ещё медленнее Phenom II, но уже чуть быстрее Phenom первого поколения.
Blender 3.3
А вот рендеринг в Blender оказался практически не чувствительным к факту отсутствия у Athlon II L3-кэша — Athlon II здесь лишь немного медленнее Phenom II, при этом оба заметно быстрее Phenom первого поколения.
HandBrake 1.5
H.265-кодирование видео уже острее реагирует на отсутствие L3-кэша, но частота всё же важнее.
NAMD 2
Не пригодился L3-кэш и при решении задачи классической молекулярной динамики в NAMD 2. Зато грубая сила (частота) вновь оказалась не лишней.
Python 3.9
А вычислениям с матрицами в многопоточном режиме в Python 3 L3-кэш, напротив, оказался жизненно необходим — Phenom первого поколения здесь даже немного обошёл Athlon II. Оба, впрочем, заметно отстали от полноценного Phenom II.
В среднем на равной частоте Phenom II оказался быстрее Athlon II на 11%, а Athlon II оказался быстрее более низкочастотного Phenom первого поколения на 6%.
Тестирование: игры
А как дела обстоят в играх?
Grand Theft Auto V (2015, RAGE, DirectX 11)
Sid Meier's Civilization VI (2016, собственный, DirectX 12)
Shadow of the Tomb Raider (2018, Foundation, DirectX 12)
Hitman 2 (2018, Glacier 2, DirectX 12)
Metro Exodus (2019, 4A Engine, DirectX 12)
Total War: Three Kingdoms (2019, TW Engine 3, DirectX 11)
Borderlands 3 (2019, Unreal Engine 4, DirectX 12)
F1 2020 (2020, EGO, DirectX 12)
Среднегеометрические результаты
Здесь влияние объёма L3-кэша пускай и немного, но всё-таки ожидаемо выше — в среднем Phenom II оказался быстрее равночастотного Athlon II на 17% и 10% по средним и минимальным показателям, а Athlon II оказался лишь едва быстрее более низкочастотного Phenom первого поколения (на 1% и 5% по средним и минимальным показателям).
Выводы
Относиться к Athlon II X4 можно по-разному. С одной стороны отсутствие L3-кэша могло ударить по производительности этих процессоров как в профессиональном ПО, так и в играх. С другой — в момент выхода на рынок отставание Athlon II от равночастотного Phenom II в среднем составляло лишь 10–15%. И как показало наше исследование, осталось оно таковым и спустя многие годы. А вот цена Athlon II была заметно ниже таковой у Phenom II, так что по соотношению цена-производительность Athlon II не было равных. Именно Athlon II X4 стали первыми 4-ядерными процессорами, сначала приблизившимися к розничной цене в $100, а затем и опустившимися ниже этой планки. За такие деньги небольшое отставание в производительности от более дорогих 4-ядерных процессоров Athlon-ам можно и простить.