Abdullah Abid, Unsplash
В блоге AMD накануне появился материал, подготовленный инженерами компании вместе со специалистом из Microsoft, в нём рассказывается, как повысить производительность Radeon RX 7900 XTX в генеративном ИИ практически десятикратно. Суть заключается в использовании модели, оптимизированной инструментом Microsoft Olive. Компании тесно сотрудничали, чтобы Olive мог наилучшим образом оптимизировать модели для ускорения на оборудовании AMD с использованием API платформы Microsoft DirectML и специальных компонентов драйвера AMD. В материале приводится инструкция по оптимизации модели для использования с популярным набором Stable Diffusion web UI от AUTOMATIC1111. В результате Radeon RX 7900 XTX переходит от 1,87 итераций в секунду при работе с неоптимизированной реализацией PyTorch до 18,59 итераций при работе с оптимизированной моделью.
Источник: AMD
Специалисты Wccftech бегло оценили соотношение скорости генерации к цене для AMD Radeon RX 7900 XTX и NVIDIA GeForce RTX 4080, ориентируясь на зарубежные цены сегодняшнего дня и данные из июльского теста Puget Systems. Текущий потребительский флагман AMD может быть выгоднее примерно на 8%, но по скорости итераций RTX 4080 быстрее на 4,4%. Однако, с другой популярной реализацией Stable Diffusion от SHARK видеокарта RX 7900 XTX может быть даже быстрее конкурента, а значит ещё выгоднее.