Каждый производитель аппаратного обеспечения, будь то графические ускорители или процессоры, стремится представить свои решения в наиболее выгодном свете. Но иногда применяемые для этого методы трудно назвать корректными.
Издание Serve The Home (STH) считает, что опубликованные вчера результаты сравнительного тестирования процессоров Intel Xeon Platinum 9282 и AMD EPYC 7742 в реальных задачах не являются в полной мере объективными. И это мнение имеет под собой достаточно веские основания.
Intel утверждает, что система с двумя Xeon Platinum 9282 быстрее аналогичной платформы на базе AMD EPYC 7742 более чем на 30%. Однако, по мнению STH, результаты, показанные в одном из тестов, а конкретно в пакете GROMACS, нельзя назвать полностью корректными.
Во-первых, в тестировании был использован GROMACS версии 2019.3, который корректно работает со вторым поколением Xeon Scalable, но не умеет определять архитектуру AMD Rome (Zen 2) и правильно пользоваться её возможностями. Такая поддержка появилась только в GROMACS 2019.4, который вышел в начале октября.
Во-вторых, значимые отличия были обнаружены в конфигурации тестовых систем. На обоих платформы был включен SMT, но для AMD суммарное количество потоков GROMACS составило 128, по количеству процессорных ядер, а вот в системе с Xeon их было уже 224. Впрочем, по словам STH, у GROMACS действительно есть проблемы при работе на системах со слишком большим числом потоков, и даже с двумя 7742 это может быть непросто.
В-третьих, разными были настройки суб-кластеризации NUMA и турбо-частот. Последние были включены для EPYC и отключены у Xeon, хотят тут оценить реальную степень влияния на результат трудно. Переключение с/на AVX-512 в ходе работы может влиять на турбо-частоты и общую производительность. Что касатеся NUMA, то, по данным STH, для EPYC суммарно получилось 8 доменов, а для Xeon — 4. Разбивка на домены обычно позволяет ускорить общение памяти с ядрами, так что выбор такого разделения неоднозначен.
В итоге Intel удалось добиться победы, но превосходство составило всего 20%. STH приводит и другие различия в условиях тестирования, но, кажется, ключевым было именно использование не самой актуальной версии ПО. Как обычно, от программной оптимизации и тонкой настройки платформ производительность зависит куда сильнее, нежели от простого количества ядер. Не исключено, что сами тесты были сделаны давным-давно, но сумели погрязнуть в бесконечных корпоративных согласованиях.
Справедливости ради отметим, что и AMD не брезгует подобной тактикой выставления своих продуктов в выгодном свете. На Computex 2019 она показала сравнение будущих чипов Rome с актуальными Xeon в бенчмарке NAMD, не предоставив полного описания условий тестирования. Тут же выяснилось, что компания использовала для CPU Intel неоптимизированную версию ПО.