CUDA Toolkit v13 вышла в тираж. Основным нововведением здесь является программирование с использованием массивов (tile-based programming). Ближайшим аналогом тут является Python, где работая с NumPy можно делать простые запросы к целым массивам или матрицам, а система сама справится с низкоуровневым выполнением. В отличие от SIMT программирования, где оперирование идёт индивидуальными потоками, Tile модель позволяет задействовать целые блоки данных, а компилятор и среда выполнения уже сами распределяют нагрузку по потокам и железу. Так же это даёт код написанный один раз сегодня запускать на железе будущего, ибо компилятор будет сам заниматься оптимизациями под него. Что ещё и буст в продуктивности. Также, wheels с нужными файлами теперь будут идти в одной папке. Например site-packages/nvidia/cu13/include, вместо site-packages/nvidia/cublas плюс site-packages/nvidia/cuda_cccl. Что ещё нового: * Упрощение для разработки под системы на Arm, единый тулкит * Новые математические библи