! Какой-то индус написал минимальную реализацию GPU на Verilog для тех, кто хочет понять, как это устроено на уровне железа. Что внутри: - собственная ISA (11 инструкций: арифметика, LDR/STR, branch) - SIMD-модель: диспетчер, compute cores, ALU/LSU/PC на каждый поток - контроллеры памяти с throttling по bandwidth - рабочие ядра: сложение и умножение матриц - симуляция через cocotb с execution trace Архитектура намеренно упрощена - нет pipelining, warp scheduling, branch divergence, memory coalescing - но это делает её читаемой. Можно даже заказать производство на ближайшей 130нм фабрике, вроде бы работает. 9 тыс ⭐ на гитхабе github.com/adam-maj/tiny-gpu