14,7 тыс подписчиков
Сделал для вас перевод на язык обычных людей (в телеге не хватает макс. количества знаков, поэтому текст в вк, дзен и telegraph) подробного разбора возможностей rDNA 4, которые стали известны благодаря изучению программистом кода "компилятора для компиляторов" LLVM, куда AMD уже вносят изменения для обеспечения совместимости с Radeon 8000. В этом коде многое еще не прозрачно, мы не знаем, что поменяется при работе с лучами и не видим ряда железных изменений типа изменений в объеме кешей, количестве ядер, частот и т.д.. Это все вы узнаем только после официальной презентации. Но, уже сейчас можно сделать несколько глобальных выводов.
Первый вывод. Работа с кешем и памятью переработана наиболее кардинально со времен GCN. Если кто-то делал глубокие оптимизации под Nvidia (начиная с 700-го поколения Maxwell), а потом плевался от ограниченности GCN и rDNA (вплоть до rDNA 3-го поколения), то с rDNA 4 все изменится. Будете рулить регистрами и ожиданием данных с хирургической точностью. А если все это будет делаться компилятором/движком игры автоматически, то можно ожидать "халявного" устранения задержек и повышения эффективности работы с памятью без внимания программиста. Как бы AMD на фоне таких новостей не начали резать [слово_удалено] вслед за Nvidia... (не будем подсказывать, мы то знаем, что AMD-шники нас почитывают).
Второе. RDNA4 добавляет 8-битные и 16-битные инструкции скалярной загрузки. Воу, воу, это точно GPU или это уже CPU?
Третье. При разборе кода rDNA 4 были обнаружены новые инструкции SWMMAC, которые могут увеличить производительность при работе с разряженными матрицами в отдельных случаях до двух раз.
Ну и ряд других оптимизаций для работы с ИИ, помимо поддержки FP8 и BF8. Это прикольно с учетом того, сколько сейчас ИИ-функций появляется в софте от Adobe и не только, а возможно и в играх пригодится.
Текст писал [имя_удаленно].
1 минута
29 января 2024
117 читали