В декабре 2021 года, мы провели тестирование и опубликовали обзор нашей новой рабочей станции DIGITALRAZOR NANO PRO на базе Intel NUC Elements. Мы провели обширное тестирование оборудования, а ряд невошедших материалов и результатов тестов, вынесли в отдельную статью.
Мы были впечатлены возможностями Intel NUC, мобильного процессора Intel Xeon E-2286M и графического ускорителя NVIDIA RTX A6000, установленных в системе формфактора UCFF.
В данной статье представлены результаты дополнительных тестов CPU и GPU. Будут рассмотрены результаты тестов полученные с помощью: Geekbench 5, UNIGENE 2, Indigo Renderer, MAXON Cinebench R15 и R20.
Мы подробно рассмотрим то, какие тесты, процессор и GPU прошли успешно, а также, в каких областях они лучше проявили себя. Наше углубленное изучение, мы начнем с результатов набора тестов Geekbench 5.
Синтетические тесты Geekbench 5
Набор тестов Geekbench позволяет протестировать производительность CPU и GPU в ряде распространенных нагрузок. Данный тест позволяет узнать производительность процессора в однопоточном и многопоточном режимах, и в вычислениях общего назначения на GPU.
Чем больше баллов набирает тест, тем производительнее процессор и графический ускоритель.
Набор тестов включает тестирование процессора в рабочих нагрузках подобных шифрованию данных, целочисленным вычислениям, вычислениям с плавающей запятой, трассировке лучей, работе с HDR изображениями, кодировании/декодировании видео и других.
В многопоточном режиме работы, мы видим явное различие в производительности мобильного процессора и закономерное отставание от настольного процессора. Производительность процессора Xeon E-2286M на 3000 баллов ниже в сравнении с настольным Core i9-10900KF. Но что интересно, процессор Xeon превзошел более производительный процессор Core i9 в группе тестов по шифрованию. Это можно объяснить оптимизацией процессоров и программного обеспечения для шифрования данных на аппаратном уровне. Но в остальных тестах, напрямую связанных с многопоточными вычислениям, процессор Xeon E-2286M уступил настольному процессору Core i9-10900KF, что хорошо объясняется как количеством ядер/потоков, так и частотой.
В группе тестов с вычислениями на GPU, система DIGITALRAZOR NANO PRO показывает закономерный для энергоэффективной и компактной системы результат, но незначительно уступающий практически аналогичной полноценной настольной системе.
Графический ускоритель NVIDIA RTX A6000 показывает высокую производительность в вычислениях общего назначения в приложениях, на основе CUDA, OpenCL и Vulkan.
Благодаря оптимизированной и эффективной системе охлаждения, NVIDIA RTX A6000 не перегревается во время работы, а система охлаждения практически бесшумна. Также, благодаря двуслотовому исполнению, GPU без проблем и препятствий помещается в компактных корпусах формата UCFF. Но потоки воздуха будут направлены отдельно от модуля Intel NUC, через GPU, что позволяет создавать эффективнее сквозное охлаждение системы в целом.
В наборе тестов GPU Compute на основе Vulkan, заметно значительное расхождение в результате теста. Ускоритель NVIDIA RTX A6000 уступил NVIDIA GeForce RTX 3090 почти наполовину, это можно списать на особенности драйвера игрового GPU и на оптимизации для вычислений с помощью API Vulkan. Сам API Vulkan только начинает свое активное внедрение в приложения, и оптимизация драйвера под него может занимать определенное время.
Тесты GPU в SPEC Workstation 3
В первоначальном тесте мы исследовали производительность центрального процессора Xeon E-2286M, в дополнительном тестировании мы провели тестирование графической подсистемы с помощью группы тестов входящей в SPEC Workstation 3.
Для унификации, все тесты мы выполнили с применением API OpenCL. Результат был также ожидаем, и схож с тем, что мы видели в тестах Geekbench 5. Если даже графический ускоритель NVIDIA RTX A6000 уступает NVIDIA GeForce RTX 3090, то в вычислениях общего назначения, оба графических ускорителя NVIDIA обошли GPU от AMD.
Графический ускоритель NVIDIA GeForce RTX 3090 наиболее производителен в задачах вычислений в области визуализации, что демонстрирует тест LuxRender, а также в задачах вычислений в моделировании белков, согласно результату теста FAH. Но в алгоритмах глубокого обучения, что моделирует набор тестов на основе фреймворка CAFFE, графический ускоритель AMD Radeon RX показал немногим большую производительность.
Тест в UNIGINE 2
Графическую подсистему также было интересно протестировать в популярных тестах на основе игровых движков. Одним из таких тестов является SUPERPOSITION на основе игрового движка UNIGINE 2.
В игровом движке UNIGINE 2 использованы все современные технологические решения, активно использующие возможности GPU и CPU для вычислений и визуализации, а также возможности графических API DirectX и OpenGL.
Мы использовали тесты на основе DirectX, с конфигурацией High, в разрешениях Full HD. Как показано на графике выше, результат GPU NVIDIA GeForce RTX 3090 превзошел конкурентов в тесте с разрешением Full HD. А графический ускоритель NVIDIA RTX A6000 немного уступил игровому GPU. Но это ожидаемо, профессиональные GPU ориентированы на меньшее энергопотребление и меньшую частоту, но более продолжительный срок службы во время эксплуатации в дата-центрах и рабочих станциях, используемых для интенсивных вычислений 24/7. Также драйвер оптимизирован для выполняемых нагрузок, например, вычислениях и работу в графических и интерактивных приложениях.
Для сравнения производительности в различных графических API с различными разрешениями, мы провели три дополнительных тестирования. Тесты были выполнены с разрешениями Full HD, 4K и 8K в конфигурации High.
Для разрешения Full HD:
- DirectX - 23759 балла
- OpenGL - 18834 балла
Для разрешения 4K:
- DirectX - 15103 балла
- OpenGL - 13518 балла
Для разрешения 8K:
- DirectX - 6628 балла
- OpenGL - 6312 балла
Как можно заметить, в Full HD, производительность теста на основе API DirectX значительно превосходит тест на основе OpenGL, но если говорить о более высоком разрешении, графический ускоритель NVIDIA RTX A6000 показывает максимально близкие к NVIDIA GeForce RTX 3090 результаты. Это особенно заметно в разрешении 8K.
Данный тест показал, что компактные системы очень хорошо справляются с интенсивными графическими вычислениями в высоком разрешении, в приложениях на основе DirectX и OpenGL.
Результатов тестов MAXON Cinebench
Финальным комплексным тестом, в нашем тестировании стали тесты MAXON Cinebench R15 и R20. Этот легендарный тест позволяет определить производительность CPU в вычислениях с помощью ядра визуализации, используемого в системе компьютерной графики и анимации MAXON Cinema 4D. Мы использовали тесты R15 и R20. Каждый из тестов, проводился на различных системах, как мобильных компьютерах, так и полноценных настольных рабочих станциях от разных производителей.
Тест R15 является ветераном в тестировании, но у нас накопилось много результатов, на различных системах. Что и послужило причиной сравнить производительность компьютера с помощью его возможностей. Он также хорошо себя показал в переходе Cinema 4D к новым возможностям оборудования и программного обеспечения.
Благодаря тому, что в Intel NUC используется мобильный восьмиядерный процессор, его производительность в тесте R15 была на одном уровне с протестированными нами ранее мобильными процессорами Intel Core-i9 9880H (MSI Prestige P65 Creator 9SF) и Intel Core-i7 9750H (MSI Workstation WS65 T9M). Процессор Intel Core-i7 9750H создан в конфигурации 6 ядер/12 потоков, и является менее производительным в наших тестах, но процессор Intel Core-i9 9880H (MSI Prestige P65 Creator 9SF) создан в конфигурации 8 ядер/16 потоков, что аналогично использованному в протестированном нами Xeon E-2286M.
Но так как процессоры Core, установлены в ноутбуки, их производительность была ниже, в сравнении с процессором Intel NUC. Но все мобильные процессоры уступили, и значительно, полноценному настольному процессору Intel Core i9-10940X (PRO T7 STUDIO).
В новом тесте, MAXON Cinebench R20 мы получили аналогичные результаты, процессор Intel Xeon E-2286M продемонстрировал очень хорошую производительность для мобильного ноутбука, а процессоры для настольных компьютеров, превзошли его за счет более высокой производительности и большего количества ядер.
Если же рассматривать результаты тестов для визуализации 3D-сцены в однопоточном режиме, то все процессоры показали идентичные результаты. Как в тестах R15, так и тестах R20 мы видим равномерный результат. Предыдущее поколение программного обеспечения, показывает более высокий результат, это ожидаемо, для программного обеспечения предыдущих версий на современных CPU, а вот тест R20, уже ближе нам, и показывает скорость визуализации сцены на CPU с современными архитектурами и их модификациями.
Результаты тестов в Indigo Benchmark
Еще один популярный тест, основанный на ядре системы визуализации Indigo Renderer - Indigo Benchmark. Данный тест показывает производительность CPU и GPU в визуализации трехмерных моделей.
В тестах CPU, процессор Intel Xeon E-2286M показал следующий результат:
- Bedroom - 1.295 M samples/sec
- Supercar - 3.095 M samples/sec
В тестах GPU, графический ускоритель NVIDIA RTX A600 показал следующие результаты:
- Bedroom - 19.237 M samples/sec
- Supercar - 48.142 M samples/sec
Как и процессор, так и графический ускоритель, показали ожидаемый для компактной системы результат. Мы получили очень хороший результат тестов для рабочей станции формфактора UCFF и SFF.
Заключение и итоги тестирования
Тестирование нашей новой рабочей станции DIGITALRAZOR NANO PRO очень вдохновило и впечатлило. Компактный формат и высокая производительность не оставили нас впокое. Модульная платформа Intel NUC предоставляет гибкие возможности, как профессиональным пользователям, так и геймерам.
Благодаря тому, что в Intel NUC используются мобильные процессоры линеек Core i7 и Core i9 с литерой H, и Intel Xeon E с литерой M, данные системы показали себя очень хорошо в решении повседневных рабочих задач и вычислительных нагрузок с меньшим потреблением энергии. Это особенно заметно в задачах, выполняемых на небольшом числе потоков или при непостоянных вычислительных нагрузках.
Мы ожидаем более высокую оптимизацию и возможности по управлению энергопотреблением в Intel NUC на базе процессоров Intel Core 12-го поколения, выходящих в этом году. Благодаря наличию высокопроизводительных P-ядер и энергоэффективных E-ядер, и оптимизации под Microsoft Windows 11, станет возможным более эффективное управление системой и распределением вычислительных задач между ядрами процессора и потоками.
Возможность использовать дискретные графические ускорители предоставляет высокую производительность в играх, профессиональных графических приложениях, и вычислениях общего назначения, как с использованием CUDA, так и с OpenCL и Vulkan.
Применение компьютеров в форм-факторе SFF и UCFF превосходно подходят для работы в ограниченных по площади пространствах или для установки в специальных помещениях. Также, подобные системы удобно размещать в дата-центрах или для управления видеостенами. Они энергоэффективны и компактны, но при этом, очень функциональны.
Возможности модуля Intel NUC и всей платформы в целом, впечатляют, на их основе можно создавать комплексные вычислительные системы, например создавать небольшую ферму визуализации и выполнять на ней все необходимые вычисления. Они могут быть удобно размещены как в стойке, так и на рабочем столе. Для Intel NUC реализована поддержка со стороны операционных систем Windows и Linux, что вполне подходит для создания универсальных систем с множеством узлов.