Добавить в корзинуПозвонить
Найти в Дзене

Часть 3. Обзор рабочей станции DIGITALRAZOR PERFORMANCE PRO. Тестирование

Приветствуем вас! В этой статье, состоящей из трех частей, будет рассказано об опыте работы и результатах тестирования новой рабочей станции, которую приобрел весной 2021 года наш клиент. Автор опишет конфигурацию рабочей станции, её функционал, и представит результаты тестирования и продемонстрирует производительность в практических примерах, на основе текущих проектов. Статья будет интересна тем, кто хочет узнать о порядке разработки нового ПК и о том, как тщательно подобрать компоненты будущей системы для ее эффективной работы. В первой части публикации был сделан подробный разбор по выбору комплектующих в части программного обеспечения. Также были разобраны требования и пожелания к системе, и сделано описание комплектующих систем. Во второй части статьи автор разобрал особенности конфигураций для поддержки Linux, а также описал возможности платформы Supermicro, которая была выбрана для данной рабочей станции. Затем был описан процесс заказа ПК и его доставки до клиента. В заключите
Оглавление

Приветствуем вас! В этой статье, состоящей из трех частей, будет рассказано об опыте работы и результатах тестирования новой рабочей станции, которую приобрел весной 2021 года наш клиент.

Автор опишет конфигурацию рабочей станции, её функционал, и представит результаты тестирования и продемонстрирует производительность в практических примерах, на основе текущих проектов.

Статья будет интересна тем, кто хочет узнать о порядке разработки нового ПК и о том, как тщательно подобрать компоненты будущей системы для ее эффективной работы.

В первой части публикации был сделан подробный разбор по выбору комплектующих в части программного обеспечения. Также были разобраны требования и пожелания к системе, и сделано описание комплектующих систем.

Во второй части статьи автор разобрал особенности конфигураций для поддержки Linux, а также описал возможности платформы Supermicro, которая была выбрана для данной рабочей станции. Затем был описан процесс заказа ПК и его доставки до клиента.

В заключительной — третьей — части публикации будет подробно описан процесс тестирования рабочей станции, с целью показать производительность ПК и его компонентов.

Так как компьютер приобретался для работы и исследований, то было бы грех не протестировать на двух платформах сразу. ОС Windows 10 не является основной рабочей средой, но проводить тесты для большинства пользователей лучше используя возможности данной платформы. Сейчас практически все основное ПО разрабатывается с учетом поддержки Windows. При этом, если это внутренние разработки компаний, как у нашего клиента, заказавшего обозреваемую рабочую станцию, которые планируется выпустить на рынок для продажи, они будут разрабатываться с учетом последующего портирования на платформу Windows.

За годы тестирования различного оборудования у нас был сформирован набор тестов, которые отлично показывают производительность рабочих станций и их компонентов.

В данном разделе, вы увидите результаты тестирования процессоров Intel Core i9-10900KF, Intel Core i9-10940X, Intel Core i7-11700K и сравнение их производительности.

Со спецификациями всех трех процессоров, вы можете ознакомиться пройдя по ссылке https://ark.intel.com/content/www/us/en/ark/compare.html?productIds=212047,198014,199331

Характеристики тестовых стендов

В нашем тестировании мы взяли за основу тесты проведенные нами в предыдущих статьях, и сравнили их с результатами тестов, полученных на обозреваемой рабочей станции. Здесь мы приведем основные характеристики рабочих станций из предыдущих обзоров.

Рабочая станция DIGITALRAZOR PERFORMANCE X

  • Центральный процессор Intel Core i9-10940X
  • Материнская плата ASUS WS X299 SAGE
  • Оперативная память 128 Гб DDR4-2400
  • SSD M.2 Samsung SSD 970 EVO Plus 2 Tb
  • NVIDIA GeForce RTX 3090 Founders Edition

Игровой компьютер DIGITALRAZOR PERFORMANCE M

  • Центральный процессор Intel Core i7-11700K
  • Материнская плата GIGABYTE Z590 AORUS ELITE AX
  • Оперативная память 64 Гб DDR4-3200
  • SSD M.2 Samsung SSD 970 EVO Plus 256 Gb
  • GIGABYTE AORUS GeForce RTX 3090 MASTER 24G

Каждая из систем была протестирована в базовых настройках драйверов и программного обеспечения. Мы старались тестировать, используя свежие версии драйверов для чипсетов, видеокарт и других компонентов системы. Но так как тесты проводились в разные периоды, результаты могут различаться в определенных моментах, о чем мы упомянем отдельно.

Для всех систем, которые мы собираем и тестируем, в первую очередь используется набор тестов SPECwpc, который позволяет моделировать различные рабочие нагрузки: от компиляции программного обеспечения, до интерактивной графики в приложениях САПР. На его основе у нас собрано много различных результатов тестов и экспериментов. Рассмотрим результаты проведенного тестирования рабочей станции.

Рис. 19. SPECwpc. Результаты группы тестов Media & Entertainment. Больше — лучше.
Рис. 19. SPECwpc. Результаты группы тестов Media & Entertainment. Больше — лучше.

Первая группа тестов SPECwpc измеряет производительность CPU в скорости визуализации 3D сцен и кодировании/декодировании видео. В основе лежат тесты на основе ядер визуализации Blender Cycles и LuxRender CPU, и инструментария кодирования/декодирования видео Handbrake.

Как видно из представленной на рисунке 9 диаграммы, процессоры 10-го поколения идут показывают практически идентичный результат. Но процессор 11-го поколения, наоборот, демонстрирует большее превосходство над своими предшественниками в целом, о чем мы писали в отдельной статье.

Процессоры Intel 10- и 11-го поколений превосходно показывают свою производительность над процессором AMD Ryzen Threadripper 2-го поколения. Но преимущество процессоров AMD проявляется в обработке больших массивов пикселей, и кодировании/декодировании видео, в тесте Handbrake (ffmpeg), процессор Ryzen демонстрирует лучший результат в сравнении с процессорами Intel.

Производительность в рабочих нагрузках, связанных с визуализацией 3D-графики показывает немного иной результат, здесь, процессоры Intel оказались в фаворитах, и рабочая станция на базе Intel Core i9-10900KF демонстрирует очень близкий к Intel Core i9-10940X результат, что показывает достаточно хорошую проработку архитектуры процессоров для достижения высокой производительности в вычислениях с плавающей запятой.

Рис. 20. SPECwpc. Результаты группы тестов Life Sciences. Больше — лучше.
Рис. 20. SPECwpc. Результаты группы тестов Life Sciences. Больше — лучше.

В задачах связанных с научными вычислениями в биологии и медицине (Life Sciences), рабочая станция показала превосходный результат в графическом тесте Medical-02 из набора SPEC Viewperf 13. Но этот результат был получен благодаря превосходной графической подсистеме на базе NVIDIA GeForce RTX 3090. В наборе тестов Radinia, разработанном профессором Кевином Скадроном из Университета Вирджинии, рабочая станция показала практически схожий с системами на базе Intel Core i7-11700K и Intel Core i9-7900X результат, но уступила системам на базе многоядерных процессоров Intel Core i9-10940X и AMD Ryzen Threadripper 2950X. Это легко объясняется, так как процессоры i9-10940X и Ryzen Threadripper 2950X обладают большим количеством ядер/потоков в сравнении с рассматриваемыми представителями младших поколений.

В тесте на моделирование масштабируемой молекулярной динамики NAMD процессор Intel Core i9-10900KF показал самый низкий результат, но если необходимо решать подобные задачи, то стоит присмотреться к процессору большей производительности, например серии -X от Intel или Threadripper от AMD, поддерживающих 12 и больше ядер.

Еще один тест на вычисления молекулярной динамики — LAMMPS. Данный тест состоит из 5 проходов с различными свойствами молекул, он работает параллельно и использует MPI из тестов SPECworkstation. В данном тесте процессор Intel Core i9-10900KF также не показал превосходящего над своими конкурентами результата, что интересно процессор 7-го поколения в обоих тестах на моделирование молекулярной динамики показал более достойный результат, но это мы можем списать на особенности ПО и его адаптации для работы с различными архитектурами CPU.

Рис. 21. SPECwpc. Результаты группы тестов Financial Services. Больше — лучше.
Рис. 21. SPECwpc. Результаты группы тестов Financial Services. Больше — лучше.

В группе тестов в области финансовых вычислений, процессор Intel Core i9-10900KF не показывает высокой производительности. Он хорошо показал себя в тестах на основе алгоритмов Monte Carlo, но уступает своим конкурентам в тестах Black-Scholes и Binomial. Эти тесты очень требовательны к многопоточности и хорошо себя показывают на процессорах с большим количеством ядер/потоков и мультипроцессорных конфигурациях.

Рис. 22. SPECwpc. Результаты группы тестов General Operations. Больше — лучше.
Рис. 22. SPECwpc. Результаты группы тестов General Operations. Больше — лучше.

В общих задачах, таких как компиляция приложений на Python, компрессия файлов и компиляции приложений на Octave, процессор Intel Core i9-10900KF показывает превосходный результат. Он практически не уступает своим конкурентам, и даже превзошел результаты процессоров Intel Core i9-10940X и AMD Ryzen Threadripper. Данный момент очень странный, так как низкая производительность может быть обусловлена особенностями платформ, на которых производилось тестирование и программного обеспечения самого теста.

Рис. 23. SPECwpc. Результаты группы тестов Energy. Больше — лучше.
Рис. 23. SPECwpc. Результаты группы тестов Energy. Больше — лучше.

В группе тестов посвященных задачам в области энергетики, рабочая станция заняла твердую среднюю позицию в большинстве тестов. Что интересно, в тесте Convolution, который выполняет разрозненную фильтрацию размером 100х100 пикселей в изображении 20000х20000 пикселей, процессор Core i9-10900KF показал очень достойный результат. Но в моделях, требующих многопоточности, новый процессор уступил свои конкурентам, но незначительно, заняв стабильное положение по отношению к лидерам теста.

Если подвести итоги теста, рабочая станция на базе материнской платы от Supermicro показывает достойный результат для большинства операций, клиент уже на практике оценил преимущества данной системы и остался доволен многими показателями. Особенно в визуализации 3D-графики и композитинге видео. Набор тестов SPEC Workstation превосходно показывает, как может показать себя система в различных рабочих нагрузках.

С развитием интерактивных и игровых движков, стало актуальным тестировать возможности рабочих станций в игровых приложениях, ведь многие из них основаны на Unreal Engine или Unity. На Windows я всегда стараюсь выполнить тестирование системы с помощью набора синтетических тестов 3DMark, и проанализировать производительность системы в целом или её отдельных компонентов. В данном тестировании мы сделали несколько тестов, проведенных с включенным режимом Hyper-Threading и когда режим Hyper-Threading отключен.

Рассмотрим результаты тестов, проведенных с помощью 3DMark Steam Edition. В качестве основы, я использую четыре теста: Time Spy, Fire Strike, Sky Diver, PCI-Express Feature Test.

Рис. 24. Результаты теста 3DMark Time Spy в разрешении Full HD.
Рис. 24. Результаты теста 3DMark Time Spy в разрешении Full HD.

В тесте Time Spy рабочая станция оказалась наиболее производительным решением, набрав 17628 баллов. Благодаря оптимизации материнской платы для работы с интенсивными вычислениями на CPU, новый процессор показал наилучший результат, обойдя даже старшую модель в лице Intel Core i9-10940X.

Рис. 25.Результаты теста 3DMark Fire Strike Extreme в разрешении Full HD.
Рис. 25.Результаты теста 3DMark Fire Strike Extreme в разрешении Full HD.

В тесте Fire Strike, который моделирует игры на основе DirectX 11, выполняемые на современных игровых ПК. Тест включает два набора графических тестов, физический тест и стресс тест для CPU и GPU. В данном тесте наоборот, процессор AMD вышел в лидеры, а процессор Intel Core i9-10900KF показал схожий с процессором Intel Core i7-11700K результат. А старший процессор Intel Core i9-10940X показал уверенный средний результат.

Рис. 26.Результаты теста 3DMark Sky Diver в разрешении Full HD.
Рис. 26.Результаты теста 3DMark Sky Diver в разрешении Full HD.

Набор Sky Diver также производит серию тестов на основе DirectX 11, но рассчитан на встроенную графику и на возможности CPU. В данном тесте, процессор Intel Core i9-10900KF показал результат, близкий к процессору Intel Core i7-11700K и AMD Ryzen 9 5900X. Но лидером в данном тесте, оказался процессор Core i9-10940X, за счет большего количества ядер/потоков.

Если вы хотите узнать, как влияет технология Intel Hyper-Threading (HT) на производительность в вычислениях и играх, то мы провели несколько тестов с помощью 3D Mark и получили такие результаты.

Рис. 27. Результаты теста 3DMark Time Spy в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.
Рис. 27. Результаты теста 3DMark Time Spy в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.

В тесте Time Spy без режима HT процессор в тесте набрал всего 16603 балла, что на 1200 баллов меньше, чем с режимом HT.

Рис. 28. Результаты теста 3DMark Fire Strike в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.
Рис. 28. Результаты теста 3DMark Fire Strike в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.

В тесте Fire Strike мы видим аналогичный результат, отключение режима Hyper-Threading приводит к снижению производительности, хотя в данном тесте, снижение не настолько сильно.

Рис. 29. Результаты теста 3DMark Sky Diver в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.
Рис. 29. Результаты теста 3DMark Sky Diver в разрешении Full HD в различных режимах работы процессора и технологии Hyper-Threading.

В тесте Sky Diver, мы также видим снижение производительности, если режим HT отключен. Причем в данном тесте, снижение значительно, и видно, что тест ориентирован на многопоточные вычисления.

Рис. 30. Результаты теста 3DMark PCI Express Feature Test в разрешении Full HD.
Рис. 30. Результаты теста 3DMark PCI Express Feature Test в разрешении Full HD.

И финальным тестом, является сравнение производительности шины PCI Express. Процессоры Intel Core 10-го поколения, поддерживают шину PCI Express 3.0, а процессоры Intel Core 11-го поколения и AMD Ryzen, поддерживают PCI Express 4.0. Тест PCI Express Feature Test наглядно показывает производительность новой системы, в которой использована шина PCI Express 3.0 x16. PCI Express 3.0 уступает PCI Express 4.0 практически в два раза, что снижает возможности для работы над задачами, связанными с ИИ и МО.

Для нас было важно понять, насколько процессор быстр в вычислениях связанных с визуализацией. Мы обратились к проверенным годами тестам на основе Blender Cycles и ряду синтетических тестов, на основе коммерческих ядер визуализации. Первым мы протестировали ядро визуализации Cycles, набирающее широкую популярность среди CG-художников. В тесте, мы использовали ядро Cycles как в версии Blender 2.83.13 LTS, так и Blender 2.92.

Рис. 31. Результаты тестов визуализации сцен с помощью Blender 2.83 и ядра визуализации Cycles.
Рис. 31. Результаты тестов визуализации сцен с помощью Blender 2.83 и ядра визуализации Cycles.

В первом тесте, мы сравнили производительность процессоров в визуализации четырех сцен, созданных в разных версиях Blender и обладающими различными свойствами. Процессор который мы выбрали, в версии 2.83.13 показал себя очень производительным решением, в сравнении с конкурентами и старшими моделями. Наиболее производительным, среди протестированных, является процессор AMD Ryzen 9 5900X. Старший процессор, в лице Core i9-10940X, превосходит 10900KF, но это достигается за счет большего количества ядер. Но если сравнить с процессором 11-го поколения, а именно с Core i7-11700K, то процессор 11-го поколения выполняет вычисления с той же производительностью, что и Core i9-10900KF. Это легко объяснить, ведь в 11 поколении процессоров Core, Intel провела большую оптимизацию архитектуры, и процессоры при меньшем количестве ядер, и меньшем энергопотреблении, получили большую производительность, что хорошо сказывается на производительности в таких задачах, как визуализация 3D графики.

Рис. 32. Сравнение производительности в визуализации 3D сцен с применением Blender 2.83.13 и Blender 2.92.0.
Рис. 32. Сравнение производительности в визуализации 3D сцен с применением Blender 2.83.13 и Blender 2.92.0.

Мы сравнили производительность ядра Cycles в двух различных версиях Blender. За основу были взяты версии Blender 2.83.13 LTS и Blender 2.92.0. Первая версия, ориентирована на продолжительный цикл поддержки (Long Term Support), а вторая, ориентирована на быстрое обновление и добавление нового функционала и отладку. В LTS версию часто включаются исправления из минорных версий, таких как 2.9X. В данном примере вы видите. Как видно из графика на рисунке 22, пакет Blender 2.83.13 уступает в скорости визуализации комплексных сцен. А новая редакция Blender 2.92.0, наоборот, уже обладает определенными оптимизациями в ядре визуализации и дает в некоторых сценах, заметный прирост, это хорошо заметно по тесту в сценах Spring и Grossbery, в которых активно используется процедурная геометрия, такая как трава, и мех. В сценах BMW и Classroom, прирост был небольшим, но ощутимым, так как сократить время визуализации на 30 — 40 секунд, это очень хороший показатель для визуализации анимации.

Если отключить Hyper-Threading, то мы увидим, насколько снижается производительность в многопоточных алгоритмах, таких как визуализация. Конечно, производительность снижается не ровно на 50%, но ощутимо, поэтому мы рекомендуем использовать режим Hyper-Threading при визуализации трехмерной графики и видео, а также в рабочих нагрузках с интенсивными вычислениями.

Рис. 33. Производительность Blender Cycles при активной технологии Hyper-Threading и в состоянии, когда Hyper-Threading, выключен.
Рис. 33. Производительность Blender Cycles при активной технологии Hyper-Threading и в состоянии, когда Hyper-Threading, выключен.

На рисунке выше, приведена диаграмма в которой показана производительность двух версий Blender с включенным режимом Hyper-Threading и когда данная технология отключена.

Если же сравнивать коммерческие решения, то здесь, в фаворите остаются известные бенчмарки на основе ядер визуализации V-Ray Renderer и Corona Renderer.

Рис. 34. Производительность визуализации с помощью ядра V-Ray CPU.
Рис. 34. Производительность визуализации с помощью ядра V-Ray CPU.

Мы протестировали V-Ray в двух режимах, CPU и гибридном — CPU+GPU. Первый тест показал, что процессор Intel Core i9-10900KF превосходит AMD Rayze 9 5900X в производительности, и выполняет больше выборок при визуализации изображения. Новый процессор Intel Core i7-11700K показал результат выше, это также можно объяснить и оптимизацией архитектуры CPU и ядра визуализации. Наиболее производительным процессором, в данном тесте является Intel Core i9-10940X. Благодаря 14 ядрам (28 потоков), данный процессор показал наибольшую производительность.

Для тестирования в гибридном режиме, мы использовали графический ускоритель NVIDIA GeForce RTX 3090 Founders Edition. Ядро визуализации V-Ray GPU CUDA работает как в режиме GPU, так и CPU+GPU.

В гибридном режиме, рассматриваемая рабочая станция показала наиболее производительный результат. При этом, не уступая рабочей станции на базе Intel Core i9-10940X.

Рис. 35. Производительность визуализации с помощью гибридного режима ядра V-Ray CPU+GPU.
Рис. 35. Производительность визуализации с помощью гибридного режима ядра V-Ray CPU+GPU.

В данном тесте, чем больше выполнено итераций, тем чище и качественнее будет получено изображение. Поэтому, наиболее производительным оказался процессор Core i9-10940X, благодаря 28 потокам, выполнить визуализацию в гибридном режиме, у него вышло лучше. Что интересно, и что можно списать на несовершенство ПО, процессор Intel Core i7-11700K показал меньшую производительность. Следующим тестом, является бенчмарк ядра визуализации Corona Renderer.

Рис. 36. Производительность визуализации с помощью ядра Corona Renderer в Corona Benchmark.
Рис. 36. Производительность визуализации с помощью ядра Corona Renderer в Corona Benchmark.

В Corona Benchmark, процессор Cire i9-10900KF показал превосходный результат, опередив даже Core i7-11700K, что закономерно, благодаря большему количеству ядер/потоков, его обошли процессоры Core i9-10940X и Ryzen 9 5900X.

Еще один тест, не самый распространенный в тестировании, но который может показать производительность процессора и GPU — Indigo Benchmark (Рис. 37).

Рис. 37. Результаты теста Indigo Bench для процессора Intel Core i9-10900KF и NVIDIA GeForce RTX 3090 Founders Edition.
Рис. 37. Результаты теста Indigo Bench для процессора Intel Core i9-10900KF и NVIDIA GeForce RTX 3090 Founders Edition.

Ядро визуализации Indigo отлично умеет имитировать поток света для создания естественных изображений.

В отличие от традиционных средств визуализации, которые работают с цветами RGB, Indigo использует вычисления освещения на основе спектральных цветов.

В тесте Bedroom процессор Intel Core i9-10900KF вычислял по 2.071 M samples/sec, а в тесте Supercar, данный процессор набрал 4.483 M samples/sec.

В GPU версии ядра, новая система показала хорошую производительность. Это достигнуто благодаря установленной в систему NVIDIA GeForce RTX 3090. В тесте Bedroom система набрала 20.433 M samples/sec, а в тесте Supercar система набрала 50.332 M samples/sec. Учитывая тот факт, что графический ускоритель был установлен в систему с шиной PCI-Express 3.0 x16, система показала немного меньший результат в сравнении с аналогичными системами, но на базе PCI-Express 4.0 x16, что было подтверждено в списке результатов Indigo Bench.

Отдельного внимания заслуживает сравнение производительности системы в двух различных операционных системах. Вместе с клиентом, мы протестировали рабочую станцию с помощью набора тестов Geekbench 5 на Red Hat Enterprise Linux 8.4. Результаты тестов, доступны по ссылке.

Рис. 38. Результаты тестов системы набором тестов Geekbench 5.
Рис. 38. Результаты тестов системы набором тестов Geekbench 5.

В однопоточном режиме, тест CPU показал результат в 1522 балла, а в многопоточном 11627 баллов. При этом, если сравнить с одним из проведенных тестов на базе ОС семейства Windows 10, то здесь, система под управлением данной ос, немного уступила, набрав 1411 в однопоточном режиме, и 11269 в многопоточном режиме. Подробнее о референсе, вы можете узнать пройдя по ссылке. Приведем пример, системы, собранные на материнских платах от GIGABYTE, показывают большую производительность в многопоточных вычислениях. Мы же придерживались пожеланий о большей продолжительности работы системы, что требует некоторого снижения производительности всех компонентов компьютера или сохранение базовых конфигураций.

В целом, мы остались довольны результатом тестирования и получили результаты, которые ожидали.

В качестве заключения

Сейчас для трехмерной графики и анимации, а также для обработки и монтажа видео в 4K (до 6K), необходима рабочая станция с процессором обладающим 8/16 ядрами/потоками, и выбор процессора с 10 ядрами был достаточно выгодным решением.

При этом клиент также использует системы виртуализации, такие как VirtualBox и vmware Workstation, которые используются для экспериментов и исследований с новыми версиями ПО.

Клиент остался удовлетворен качеством сборки, аккуратным корпусом с удобным расположением необходимых компонентов, предоставили высокую гибкость в дополнении системы различными элементами, и с определенной перспективой на будущее развитие.

Напоминаем, гарантийный период на нашу продукцию, составляет 36 месяцев, что позволяет обращаться к нам за помощью, в расчетный период. Данную систему, мы рассчитывали на 4 года эксплуатации, и к следующему обновлению, которое уже планируется еще более сложное и будет включать даже специализированное оборудование для работы передачей данных по сети на скорости в 10 Gbit/sec и выше, она проработает стабильно.

Заказчик проверил систему на продолжительных интенсивных задачах, связанных с визуализацией анимации. Система с uptime равным 30 суток, справилась с поставленными задачами превосходно, при этом, мониторинг температуры и нагрузки показал, что компьютер не входил за заданные диапазоны, что говорит о высокой надежности всех выбранных компонентов.

Спасибо за уделенное время нашему обзору — надеемся, что он был полезен! Подписывайтесь на наш канал и делитесь публикацией в социальных сетях!