Сегодня для широко используемой библиотеки мультимедиа с открытым исходным кодом FFmpeg был объединен еще один оптимизированный путь кода AVX-512... По сравнению с чистым кодом C, путь кода AVX2 который был в 10,98 раза быстрее, этот новый путь кода AVX-512 работает в 18 раз быстрее обычного кода C. Последний код FFmpeg, подвергшийся обработке AVX-512, — это функция uyvytoyuv422 для преобразования формата UYVY в YUV422. Оптимизированный путь кода AVX-512 с помощью рукописного ассемблера здесь является большим преимуществом. AVX-512, в частности, обнаружен с процессорами Intel Xeon или всеми процессорами AMD Ryzen и EPYC, начиная с Zen 4. Тесты производительности, опубликованные для этого патча, проводились с AMD Ryzen 9 7950X. Прирост очень существенный: производительность этого пути кода AVX-512 в 18,02 раза выше производительности обычного пути C, тогда как производительность только пути AVX2 составляет 10,98 раза. Cриш Адига, автор патча, объяснил: Скалярный цикл заменен замаскиров
Последняя оптимизация AVX-512 для FFmpeg демонстрирует серьезное улучшение на AMD Ryzen
20 февраля 202520 фев 2025
8
1 мин