Статья эта родилась в результате поисков наиболее оптимальной платформы для ретро-гейминга и в частности – семейства видеокарт 3dfx Voodoo3/4/5. Первой итерацией на данном пути было сравнение Intel Celeron (Tualatin), Pentium III с альтернативной платформой AMD – K6-III, Athlon XP. Очень быстро я пришёл к выводу, что производительность видеокарт, построенных на VSA-100, сильно зависит от быстродействия центрального процессора, пропускной способности оперативной памяти и системной шины. Такие немощные платформы как Intel Celeron (Tualatin), Pentium III, AMD K6-III+ и даже Athlon XP (Barton) не в состоянии обеспечить достаточную производительность системы в целом для SLI VSA-100, чтобы ограничивающим производительность фактором стала видеокарта. Поэтому чаша весов моего выбора склонилась в сторону Socket 939/940 AMD Athlon 64/Opteron, обеспечивающих, как мне на тот момент казалось, достаточную производительность системы и возможность подключения VSA-100 к PCI66. Платформа LGA775 с правящими на ней представителями микроархитектуры NetBurst и новоявленными Conroe мной не рассматривалась по ряду причин.
Относительно недавние замеры пропускной способности шины PCI на всех собранных мной платформах и сопоставление результатов с альтернативными на Core 2 Duo заставили меня пересмотреть своё отношение к данной платформе в пользу решений с мостом PCIe-PCI-X Intel PXH-V, дающим пропускную способность шины PCI66 близкую к теоретическому пределу в 266 МБ/с.
В результате небольшого перебора материнских плат мой выбор остановился на Asus P5WDG2 WS Pro (Intel 975X Express MCH + Intel ICH7R + Intel 6702 PXH (PXH-V)). Дальнейший поиск заключался в подборе оптимального процессора к ней, так в моей коллекции появились Intel Core 2 Duo E8600, Intel Core 2 Extreme X6800, Intel Core 2 Extreme QX9650 и Intel Core 2 Extreme QX9770. Последние два процессора не упомянуты в списке совместимости материнской платы (впрочем, как и E8600) и были приобретены мной в порядке эксперимента с частотой системной шины и разблокированным множителем. Надо заметить, что для поддержки Asus P5WDG2 WS Pro новых процессоров на ядре Wolfdale была выпущена прошивка 1001, но даже с ней "квады" отказываются стабильно работать на данной материнской плате, как на 400 МГц (1600 MT/s), так и на 333 МГц FSB (1333 MT/s). Большого удивления это не вызвало, т.к. Asus P5WDG2 WS Pro официально поддерживает лишь 266 МГц FSB (1066 MT/s), а всё остальное уже разгон. Но статистика разгона этих процессоров убедительно показывает, что на других чипсетах такой проблемы нет, и FSB этих процессоров может достигать 500+ МГц.
Цель данной статьи – объективно сравнить и показать какой из процессоров является оптимальным для данной платформы (Asus P5WDG2 WS Pro), а также сопоставить полученные результаты с платформой следующего поколения – LGA1366 Intel Xeon X5698 + Supermicro X8SAX (Intel X58 Express IOH + Intel ICH10R + Intel 6702 PXH (PXH-V)).
Прошу прощения у читателей, что вводная часть получилась несколько затянутой, но это было необходимо, чтобы пояснить предысторию и причины моего выбора.
Итак, встречаем:
Конфигурация № 1
- CPU: LGA 775 Intel Core 2 Duo E8600
- RAM: 2048 MB DDR2-800 (PC2-6400) OCZ Reaper EB Edition
- Motherboard: ASUS P5WDG2 WS Pro
- Video: 512 MB LeadTek PX7950GT (nVidia Geforce 7950GT) PCIe
- SSD: 128GB AMD Radeon R5SL128G
- OS: Microsoft Windows XP SP3 Rus
Конфигурация № 2:
- CPU: LGA 775 Intel Core 2 Extreme QX9770
- RAM: 2048 MB DDR2-800 (PC2-6400) OCZ Reaper EB Edition
- Motherboard: ASUS P5WDG2 WS Pro
- Video: 512 MB LeadTek PX7950GT (nVidia Geforce 7950GT) PCIe
- SSD: 128GB AMD Radeon R5SL128G
- OS: Microsoft Windows XP SP3 Rus
Конфигурация № 3:
- CPU: LGA 1366 Intel Xeon X5698
- RAM: 3072 MB DDR3-1333 (PC3-10700) Corsair
- Motherboard: Supermicro X8SAX
- Video: 512 MB LeadTek PX7950GT (nVidia Geforce 7950GT) PCIe
- SSD: 128GB AMD Radeon R5SL128G
- OS: Microsoft Windows XP SP3 Rus
Во всех трёх представленных платформах использовались одни и те же видеокарта и SSD, конфигурации 1 и 2 идентичны за исключением процессора, а также во всех трёх конфигурациях присутствовала звуковая карта Creative Audigy 2 ZS без установки драйверов в операционной системе.
Проведённые на всех трёх конфигурациях тесты можно разделить на 2 большие части – математические и графические. Математические тесты взяты из давнего конкурса «Битва ветеранов» сайта www.overclockers.ru, номенклатура и результаты математических тестов представлены в Таблице 1.
Таблица 1 – математические тесты.
Тестовый пакет
Тест
E8600 (333x10)
E8600 (400x10)
QX9770 (333x12)
X5698 (133x33)
Atomic CPU Test
CPU
24155
29441
19531
38560
FPU
10812
12967
8654
18003
Cache/RAM
20270
24351
16234
26690
CPU MathMark v3.0
Simpe Math
3,047
2,531
2,546
2,625
Complex Math
3,203
2,672
2,688
2,516
Total Time
6,25
5,203
5,234
5,141
MathMark v1.1
6,325
5,254
6,365
4,712
Nuclearus Multi Core
ALU Speed
5935
7138
6445
9909
FPU Speed
5990
7200
7250
10171
MultyThread Speed
13103
15904
23853
21968
Total Score
10599
12842
17830
17770
Super PI v1.1
1M
00m14s
00m11s
00m15s
00m34s
32M
15m42s
13m04s
error
31m01s
Tester v0.107
Test 1
3,594
3
2,25775
3,656
Test 2
581774
695510
329522
487517
Test 3
151799
182360
81680
253799
Test 4
132345
159382
158436
151416
Test 5
246548
296320
295117
289639
Score
53723
67523
51131
73170
WinRAR
1449
1743
1730
2489
xlobus v0.099b3
Test 1
2889
3459
2695
4183
Test 2
6619
7968
6018
9413
Test 3
3667
4413
3926
4904
Test 4
3186
3824
3139
5303
Test 5
2144
2580
2229
3951
All
18505
22244
18007
27754
Из Таблицы 1 мы видим, насколько QX9770 отстаёт даже от Е8600 на равной с ним частоте системной шины (333 МГц), исключением является Nuclearus Multi Core, где высокий итоговый балл обеспечивается наличием большего количества ядер, чем у соперников. И ещё восхищает мощь ALU и FPU процессора X5698, способного соперничать с четырёхъядерным процессором предыдущего поколения в многопоточных задачах. По поводу Super PI v1.1 есть несколько замечаний:
- QX9770 в режиме счёта 32M знаков постоянно выкидывал операционную систему в синий экран «смерти» (BSOD), так что вместо результата в соответствующей ячейке таблицы значится «error»;
- Не понятны причины драматического отставания – более двух раз (!) – X5698 от соперников, видимо, что-то в алгоритме этой программы не позволяет оптимизировать вычисления.
WinRAR, показывает преимущество X5698 в пропускной способности интерфейсов, будь то шина памяти DDR3, системная шина QPI или SATA2, он везде король.
Набор графических тестов состоит из Direct3D приложений нескольких поколений: Final Reality (DirectX5), 3DMark2000 (DirectX7), 3DMark2001SE (DirectX 8.1), 3Dmark03 (DirectX 8.1 + 9).
Почему именно такой набор графических тестов? Потому что игры с соответствующими API, их планируется запускать на данном «железе».
В таблицах 2 – 5 важны не итоговые баллы, которые получены по какой-то формуле с весовыми коэффициентами, а численные результаты каждого из «игровых» и графических тестов, которые напрямую коррелируют с производительностью каждого из процессоров.
Как и в таблице 1, мы снова наблюдаем что QX9770 в большинстве тестов слабее E8600 с частотой системной шины 333 МГц, а X5698 то становится чемпионом, то встаёт между E8600 (333 МГц) и E8600 (400 МГц). В целом, графические тесты хорошо соотносятся с чисто процессорными. Специфические для каждого тестового пакета комментарии зафиксированы под соответствующей ему таблицей результатов.
Таблица 2 – тестовый пакет Final Reality (DirectX5)
Тестовый пакет
Тест
E8600 (333x10)
E8600 (400x10)
QX9770 (333x12)
X5698 (133x33)
Final Reality
2D image processing
75,52
91,14
88,87
81,71
Radial blure
648,82
776,81
759,27
792,23
Chaos zoomer
261,72
540,01
496,64
107,95
3D performance
10,68
11,74
11,7
12,13
25 pixel
329,17
521,09
560,61
396,14
Robots
313,13
375,94
371,32
411,95
Fill rate
17,68
17,5
17,69
16,93
City scene
367,42
442,88
438,49
495,45
Visual appearance
100
100
100
100
Bus transfer rate
23,94
35,52
71,86
21,72
2D transfer rate test
958,04
454,29
118,7
799,87
3D transfer rate test
100,85
121,27
830,11
152
AGP transfer rate
717,83
800,25
889,4
902,23
Overall score
32,12
39,13
43,88
34,44
В 2D-тесте «Chaos zoomer» X5698, как и в Super PI v1.1 неожиданно становится аутсайдером, вероятно на данном алгоритме сбоит предсказание переходов. Заодно мы наблюдаем редкий случай, когда QX9770 оказывается лучше E8600 (333x10).
В 3D-тесте «25 pixel» QX9770 обгоняет все процессоры по числу FPS.
В тесте закраски поверхностей полигонов (Fill rate) X5698 показывает наихудшую производительность, с чем мы ещё неоднократно столкнёмся в аналогичных тестах 3DMark.
«2D transfer rate test» - аномально низкий результат QX9770, а пальму первенства занимает, внезапно, E8600 (333x10).
«3D transfer rate test» - результат QX9770 улетает в космос, остальные три конфигурации расположились пропорционально производительности CPU и пропускной способности системной шины.
Таблица 3 – тестовый пакет 3DMark2000 (DirectX7)
Тестовый пакет
Тест
E8600 (333x10)
E8600 (400x10)
QX9770 (333x12)
X5698 (133x33)
3DMark 2000
3DMark Result
39823
47661
44656
50437
CPU Speed
1303
1490
1570
1495
Game 1 - Helicopter - Low Detail
686,6
825,7
763,5
973,8
Game 1 - Helicopter - Medium Detail
534,3
639,1
597,4
757,8
Game 1 - Helicopter - High Detail
432,2
514,5
487,7
534
Game 2 - Adventure - Low Detail
977,5
1165,6
1080,5
1088,9
Game 2 - Adventure - Medium Detail
424,8
510,3
490,4
520,1
Game 2 - Adventure - High Detail
263,3
316,6
301,8
328,5
Fill Rate (Single-Texturing)
7766,8
7767,4
7767
7654,9
Fill Rate (Multi-Texturing)
11366,1
11367
11366,5
11191,8
High Polygon Count
(1 Light)
111653
121343
118011
116936
High Polygon Count
(4 Lights)
90890
101160
98043
108103
High Polygon Count
(8 Lights)
72688
82706
80096
92275
8MB Texture Rendering Speed
3100
3694,8
3347,8
3974,3
16MB Texture Rendering Speed
1666,9
2022,9
1883,6
2471,3
32MB Texture Rendering Speed
897
1086,8
1006,1
1355,1
64MB Texture Rendering Speed
464,5
562,9
522,7
705,1
Bump Mapping (Emboss, 3-pass)
1814,4
2178,9
2068,2
1868,5
Bump Mapping (Emboss, 2-pass)
2383,3
3077,1
2923,8
2630,9
Bump Mapping (Emboss, 1-pass)
4496,9
4633,6
4636
4564,5
Bump Mapping (Environment)
3850,7
3851,1
3852,7
3788,4
В тесте «CPU Speed» QX9770 набирает больше всего очков, но не настолько, чтобы воспринимать это всерьёз. За исключением E8600 (333x10), результаты этого теста колеблются вокруг отметки 1500 баллов. К сожалению, 3DMark не фиксирует частоту генерации кадров, как для «игровых» тестов.
Здесь же наблюдаются низкий Fill Rate у X5698, и его уход на второе место в ряде тестов, где E8600 (400x10) становится первым.
Таблица 4 – тестовый пакет 3DMark2001SE (DirectX 8.1)
Тестовый пакет
Тест
E8600 (333x10)
E8600 (400x10)
QX9770 (333x12)
X5698 (133x33)
3DMark 2001
3DMark Score
49331
55203
44306
57498
Game 1 - Car Chase - Low Detail
759,1
836,7
671,3
885
Game 1 - Car Chase - High Detail
239,9
293,2
195,9
326,5
Game 2 - Dragothic - Low Detail
787,6
840,4
744,7
814,4
Game 2 - Dragothic - High Detail
407,8
441,1
394,6
445,7
Game 3 - Lobby - Low Detail
787,3
924,4
641,1
971,4
Game 3 - Lobby - High Detail
359,1
431,7
302,4
478,5
Game 4 - Nature
292,7
293,4
293,9
288,9
Fill Rate (Single-Texturing)
5279,8
5279,8
5263,5
5279,8
Fill Rate (Multi-Texturing)
12145
12145
12120,6
12145
High Polygon Count (1 Light)
260,6
272,2
256,1
274,3
High Polygon Count (8 Lights)
63,4
63,5
65,4
63,2
Environment Bump Mapping
639,4
651,8
605,9
345,5
DOT3 Bump Mapping
863
864,6
852,1
741,3
Vertex Shader
515,2
520
448
512
Pixel Shader
655,7
785,9
564
457,1
Advanced Pixel Shader
991,9
993,7
961
986,6
Point Sprites
98,3
98,2
98,1
98,2
В данном тестовом пакете результаты E8600 (400x10) начинают сближаться с X5698.
В «Game 4 – Nature» - X5698 оказывается на последнем месте, что не имеет особого значения, так как у всех процессоров частота отрисовки зашкаливает за 200 fps.
Причина «просадок» Fill Rate X5698 заключается в разрядности цветовой палитры, в 32-битном цвете разница между процессорами E8600 (333x10), E8600 (400x10) и X5698 исчезает. И только у QX9770 Fill Rate немного ниже остальных.
QX9770 становится худшим в тесте «High Polygon Count (1 Light)», но лучшим в «High Polygon Count (8 Lights)».
X5698 проваливает тест «Environment Bump Mapping», показывая чуть ли не вдвое меньшую частоту кадров.
Таблица 5 – тестовый пакет 3Dmark03 (DirectX 8.1 + 9)
Тестовый пакет
Тест
E8600 (333x10)
E8600 (400x10)
QX9770 (333x12)
X5698 (133x33)
3DMark03
3DMark Score
23445
23994
22594
24074
GT1 - Wings of Fury
718,9
757,5
659,8
772,2
GT2 - Battle of Proxycon
165,0
165,6
161,6
165,4
GT3 - Troll's Lair
144,5
146,1
142,2
146,1
GT4 - Mother Nature
136,7
141,0
131,9
140,5
CPU Score
2231
2683
2709
2864
CPU Test 1
250,1
304,8
238,7
334,6
CPU Test 2
39,3
46,6
58,6
48,2
Fill Rate (Single-Texturing)
4815,3
4815,3
4814,8
4815,8
Fill Rate (Multi-Texturing)
12143,8
12142,6
12145,0
12141,4
Vertex Shader
62,5
64,9
59,6
66,2
Pixel Shader 2.0
259,7
259,7
262,6
259,4
Ragtroll
84,3
84,3
84,4
83,9
Результаты E8600 (400x10) продолжают сближаться с X5698, что подтверждает и итоговые баллы.
Отдельно стоит отметить «CPU Score», оценка которого формируется из результатов «CPU Test 1» и «CPU Test 2».
QX9770 оказывается последним в «CPU Test 1» и первым в «CPU Test 2», что помогает ему выглядеть лучше E8600 (400x10) в рейтинге.
Результаты «Синтетики» и вовсе практически идентичны, разве что в «Vertex Shader» QX9770 отстаёт от лидера (X5698) на целых 11%.
Итоги сего эксперимента таковы:
- Intel Core 2 Extreme QX9770 является наихудшим процессором для ASUS P5WDG2 WS Pro, ему не хватает 400 МГц по шине, которые материнская плата не в состоянии обеспечить. Не спасает ситуацию и разблокированный множитель. Возможно, этот процессор прекрасно раскрылся бы на другом чипсете, например, X48, но это – уже тема другого исследования и другого исследователя.
- Intel Core 2 Duo E8600 прекрасно показал себя на этой платформе, временами соперничая даже с LGA1366 Intel Xeon X5698 + Supermicro X8SAX (Intel X58 Express IOH + Intel ICH10R + Intel 6702 PXH (PXH-V)).
- Платформа LGA1366 Intel Xeon X5698 + Supermicro X8SAX (Intel X58 Express IOH + Intel ICH10R + Intel 6702 PXH (PXH-V)) является избыточной для ретро-гейминга. Основным ограничивающим производительность фактором является видеокарта. Но, к сожалению, Geforce 7950GT – самое производительное решение, поддерживающее операционные системы семейства Windows 9x. С другой стороны, избыточную производительность всегда можно перенаправить на повышение качества изображения. Но это тоже уже выходит за рамки данной статьи.