Найти тему
СберПро

Читай по губам: как жесты и мимика помогут управлять предметами в будущем

Оглавление

2023 год стал поворотным в развитии нейросетей. Искусственный интеллект перестал быть абстракцией и перешёл в сегмент прикладных инструментов. К примеру, ряд нейросетей уже активно применяются в промышленности и в системах управления «умным» домом. В частности, решения для распознавания речи человека, способные понимать по… мимике.

Разбираемся, как эти возможности нейросетей можно использовать в бизнесе.

Как работает система распознавания мимики

Нейросеть такого класса работает по принципу SSI (silent speech interfaces — с англ. «технологии безмолвного доступа»). Система обрабатывает речевые сигналы через артикуляцию, то есть нейросеть помимо голоса анализирует ещё и мимику человека, буквально читая по губам.

Несмотря на перспективность этого направления развития ИИ, сейчас решения такого класса слишком чувствительны к отвлекающим шумам. К примеру, нейросеть не всегда точно передаёт информацию, если в записи были помехи или спикер говорил недостаточно чётко.

Однако, даже несмотря на недоработки, новый инструмент можно применять:

  1. Для помощи в общении людей с ограниченными способностями;
  2. На промышленных предприятиях, если вокруг очень шумно;
  3. Для улучшения работы цифровых помощников и «умного» дома;

Где разрабатывают интерфейс безмолвного доступа

Решения такого рода пока не стали массовыми, но прецеденты уже есть.

Российские разработчики в апреле 2023 года заявили, что создали нейросеть, которая одновременно считывает информацию через звук и мимику. Гибридная технология повысила чёткость распознавания речи до более 90%. Исследователи уверены, что в будущем инструмент будут использовать в автопилотировании, работе с тяжёлой техникой и информационных киосках в торговых центрах.

А за океаном не так давно разработали «умные» очки. На них установлены эхолокаторы, которые фиксируют движения человека и сгибы кожи. Так они распознают речь и переводят информацию в текст. Очки могут расшифровать речь в шумном месте, шёпот и артикуляцию без звука.

О том, как ещё можно использовать нейросети для бизнеса, читайте на СберПро Медиа.

#ИИ #Технологии #Нейросети