Найти в Дзене
Techdigest

Нейросеть для распознавания жестов позволит управлять электроникой взмахами

Ученые из Санкт-Петербургского федерального исследовательского центра РАН создали интеллектуальную систему, которая по видео распознает управляющие жесты человека. Новое программное обеспечение позволяет дистанционно управлять цифровой техникой и «умными» устройствами, обеспечивая более высокую точность по сравнению с существующими аналогами. Система способна распознавать 34 основных жеста, включая такие действия, как «лайк», звонок, постановка точки, выбор предмета, а также знак «rock» («козу»). Для обучения нейросети использовался масштабный корпус из более чем миллиона изображений людей разного пола, возраста и национальности. Эти данные доступны для исследователей по всему миру. Программное обеспечение работает в несколько этапов: сначала определяет человека на изображении, затем находит его руки. Для повышения точности применяется нейросетевая модель, создающая трехмерную карту глубины, что позволяет распознавать жесты даже при сложном фоне. Точность системы превышает 99,6%. Разра

Ученые из Санкт-Петербургского федерального исследовательского центра РАН создали интеллектуальную систему, которая по видео распознает управляющие жесты человека. Новое программное обеспечение позволяет дистанционно управлять цифровой техникой и «умными» устройствами, обеспечивая более высокую точность по сравнению с существующими аналогами.

Система способна распознавать 34 основных жеста, включая такие действия, как «лайк», звонок, постановка точки, выбор предмета, а также знак «rock» («козу»). Для обучения нейросети использовался масштабный корпус из более чем миллиона изображений людей разного пола, возраста и национальности. Эти данные доступны для исследователей по всему миру.

Программное обеспечение работает в несколько этапов: сначала определяет человека на изображении, затем находит его руки. Для повышения точности применяется нейросетевая модель, создающая трехмерную карту глубины, что позволяет распознавать жесты даже при сложном фоне. Точность системы превышает 99,6%.

Разработчики отмечают, что их решение может использоваться как самостоятельный интерфейс для управления цифровыми помощниками, так и в составе мультимодальных приложений, взаимодействующих с пользователем через речь, текст и эмоции. Особенно актуально это для медицины и пищевой промышленности, где критически важно соблюдать гигиену при управлении оборудованием.

Исследование выполнено при поддержке гранта РНФ, а программное обеспечение уже получило свидетельство о государственной регистрации.

💡 Читайте также:

Понравился материал?

Подписывайтесь на наши каналы в Дзене, VK, OK и Telegram и заходите на наш сайт Techdgst.ru, где мы публикуем еще больше новостей о технологиях и науке.