Новый патч LLVM добавил V_FMA_F32, 3-операндную инструкцию FMA, и представил формат инструкций VOPD3 для RDNA 5. Оба этих изменения должны облегчить компиляторам использование выполнения с двойной выдачей, обходя строгие правила сопряжения, которые в противном случае ограничивали бы максимальную пропускную способность FP32 в определенных рабочих нагрузках. — tomshardware.com Ожидается, что следующее поколение графических процессоров Radeon от AMD станет значительным шагом вперед по сравнению с RDNA 4, и одна из проблем, которую, по-видимому, решает команда Red, — это выполнение с двойной выдачей (dual issue execution). Это способность графического процессора выполнять две инструкции за один такт — карты AMD обладают этой функцией с RDNA 3, но строгие правила сопряжения не всегда позволяли компиляторам использовать ее, ограничивая теоретическую пиковую производительность. Новый патч LLVM теперь предполагает, что AMD решит эту проблему в RDNA 5. Coelacanth’s Dream, издание, ориентированн
Будущие графические процессоры AMD RDNA 5 могут получить улучшенную архитектуру «dual-issue» и более эффективное использование шейдерных блоков
15 марта15 мар
26
2 мин