Когда
речь заходит о системах глубокого обучения, многие представляют себе
лишь программную часть, сложные алгоритмы, нейронные сети, огромные
объёмы данных. Однако за всей этой магией стоит кропотливая работа
инженеров-аппаратчиков, которые создают специализированные решения для
ускорения вычислений. Одним из таких решений является технология Deep
Learning Boost (DL Boost), разработанная для оптимизации и повышения
производительности операций, критически важных для глубокого обучения.
Суть
проблемы, которую решает DL Boost, заключается в том, что стандартные
процессоры и видеокарты, изначально спроектированные для вычислений с
высокой точностью (например, 32-битная точность, или FP32), не всегда
являются оптимальными для задач глубокого обучения. На этапе так
называемого "инференса" (применения уже обученной модели для получения
предсказаний) высокая точность часто оказывается избыточной. Достаточно
использовать меньшую точность, например, 8-битные целые числа (INT8),