Ученые из российской компании Smart Engines обнаружили метод повышения эффективности работы нейронных сетей. Основанный на новой схеме квантования, этот подход увеличивает скорость работы на 40%. Эта инновация уже применяется для решения задач компьютерного зрения, включая поиск объектов и распознавание текста. Кроме того, она может быть важным элементом нового поколения беспилотных автономных систем, расширяя возможности бортовых компьютеров. Результаты исследования представляют собой значительный прорыв в оптимизации работы нейронных сетей. В настоящее время они чаще всего запускаются на специализированных видеокартах, но не все устройства обладают ими. Однако каждое устройство имеет центральный процессор, и использование 8-битных нейронных сетей для него является стандартом. Новая модель, основанная на 4,6-битных сетях, увеличивает скорость работы на 40%, при этом сохраняя высокое качество, благодаря более эффективному использованию центральных процессоров мобильных устройств. Суть
Российские ученые значительно ускорили работу нейронных сетей
25 апреля 202425 апр 2024
7
1 мин