1 месяц назад
NVIDIA завезли нативный Python в CUDA — теперь писать под GPU можно без C++ или Fortran
NVIDIA завезли нативный Python в CUDA — теперь писать под GPU можно без C++ или Fortran Коротко по фишкам: — cuPyNumeric — NumPy-совместимая библиотека, но на GPU. Ускорение до x50 без переделки кода. — Новая модель CuTile — параллелизм проще, без ручных потоков...
3 месяца назад
CUDA для Python-разработчиков: почему стоит заглянуть под капот фреймворков
Развитие глубокого обучения и машинного обучения привело к тому, что многие инженеры и исследователи освоили работу на GPU (графических процессорах), не обязательно обладая экспертным знанием CUDA. Такие фреймворки, как PyTorch, TensorFlow или JAX, абстрагируют большинство сложных моментов: нам достаточно вызвать методы вроде tensor.cuda(), и под капотом запускаются оптимизированные CUDA-ядра. Но что, если нужно добиться ещё большей производительности и гибкости? Тогда понимание основ CUDA-программирования выходит на передний план...