Найти в Дзене
2 подписчика

Пост из блога Адама Савицкого (Adam Sawicki) — программиста, специализирующегося на графическом программировании, разработке игр и работе с низкоуровневыми графическими API. Рассмотрю подробно основные материалы и проекты, представленные на сайте.


Основные проекты и статьи
D3D12info - Инструмент анализа GPU возможностей
Это open-source проект для анализа возможностей видеокарт в DirectX 12. Включает три компонента:

D3D12info — консольное приложение, выводящее все возможности DX12 в текстовом или JSON формате
D3D12infoGUI — графический интерфейс с веб-отчетами
D3D12infoDB — онлайн база данных с возможностями разных GPU
Проект решает проблему отсутствия аналога vulkaninfo для DirectX 12. Особенно полезна Feature Table, показывающая поддержку функций по поколениям GPU от AMD, Nvidia, Intel и Qualcomm.

Технические проблемы и решения
Проблема с Godot 4.3: Описано решение зависаний движка на ноутбуке ASUS TUF Gaming с двумя AMD GPU. Решение — принудительное использование интегрированной графики через параметр --gpu-index 1.
DirectX 12 Agility SDK: Детальный разбор обновлений SDK версии 1.716.0-preview, включая новые функции и возможности.

FP8 форматы данных для машинного обучения
Наиболее подробная статья посвящена 8-битным числам с плавающей точкой (FP8), используемым в AI/ML для экономии памяти и ускорения вычислений. Описаны четыре основных формата:

FLOAT8E4M3FN

1 бит знака + 4 бита экспоненты + 3 бита мантиссы
Поддерживает ±0, ±NaN, но без бесконечностей
Диапазон значений: от ±0.001953 до ±448
FLOAT8E4M3FNUZ
Аналогичная структура, но только один ноль
Увеличенное смещение экспоненты для меньших значений
Максимальное значение: ±240
FLOAT8E5M2
1 бит знака + 5 битов экспоненты + 2 бита мантиссы
Полное соответствие стандарту IEEE (с ±∞, NaN)
Больший диапазон: от ±0.0000153 до ±57344
FLOAT8E5M2FNUZ
Модификация предыдущего формата без бесконечностей
Один ноль и специальное значение NaN
Особенности форматов FP8
Применение в ML:

E4M3 предпочтителен для весов и инференса (прямой проход)
E5M2 (bf8) — для градиентов и обучения (обратный проход)
Производительность близка к fp16/bf16 при вдвое меньшем размере
Визуализация: Автор создал уникальные таблицы 16×16, показывающие все 256 возможных значений каждого формата с цветовой кодировкой для разных типов чисел.
Пост из блога Адама Савицкого (Adam Sawicki) — программиста, специализирующегося на графическом программировании, разработке игр и работе с низкоуровневыми графическими API.
1 минута