Большинство моделей наушников с активным шумоподавлением блокируют все окружающие фоновые шумы. Но человеку не всегда нужно полностью «выключать» внешние звуки. Исследователи разработали инновационную систему, позволяющую пользователям гибко настраивать, какие именно звуки будут подавляться наушниками в конкретный момент. Эту технологию они назвали «семантическим слухом».
- С помощью алгоритмов машинного обучения наушники распознают различные категории звуков - шум машин, человеческую речь, музыку и т.д. Пользователь через мобильное приложение выбирает, какие из них нужно заглушать или пропускать.
- Это позволяет динамически корректировать настройки наушников под конкретную ситуацию. Например, глушить транспортный шум в офисе, но пропускать его на улице. Таким образом, благодаря технологии "семантического слуха" появляется возможность индивидуально подстраивать шумоподавление наушников под свои нужды.
Через мобильное приложение или голосовые команды можно выбрать из 20 категорий звуков окружающей среды. Сюда входят: музыка, пение птиц, шум пылесоса, речь, детский плач и другие. Система будет пропускать только отобранные звуки.
- По словам руководителя проекта профессора Голлакоты, реализация такой технологии требует высочайшей скорости обработки данных - от 0,01 секунды. Это необходимо, чтобы сохранить синхронность звука с происходящим вокруг.
Данная разработка открывает принципиально новые возможности индивидуальной настройки шумоподавления в наушниках под конкретные потребности и ситуации. Разработанная система «семантического слуха» для наушников сталкивается с рядом технических ограничений, затрудняющих ее практическое применение.
1. Из-за недостатка времени распознавание звуков происходит не в облаке, а на подключенном смартфоне. Это снижает вычислительную мощность.
2. Система должна эмулировать пространственные характеристики звука и задержки для обеспечения реалистичного восприятия.
- Испытания продемонстрировали способность технологии выделять отдельные целевые звуки на городских улицах и в помещениях. Однако иногда возникают проблемы с различением схожих аудиопотоков. По мнению разработчиков, решением может стать расширение объема данных для обучения нейросетевых алгоритмов. В ближайшем будущем планируется коммерциализация системы. Но пока она имеет ряд технических ограничений для массового внедрения...
- Разработка подобных инновационных аудиотехнологий открывает по-настоящему революционные перспективы в сфере персонализированного шумоподавления и работы со звуком. Возможность гибко фильтровать фоновые шумы в режиме реального времени кардинально меняет сам подход.
- Однако практическая реализация таких систем сталкивается с рядом сложностей из-за колоссальных вычислительных требований и необходимости мгновенной обработки данных. Для полноценного внедрения необходимы дополнительные исследования и усовершенствование алгоритмов.
Тем не менее, по мере развития технологий искусственного интеллекта, расширения вычислительных мощностей, подобные решения станут работать всё лучше. И уже совсем скоро каждый сможет настраивать окружающее звуковое пространство под свои индивидуальные предпочтения.
Уважаемые читатели! Если вам понравилась статья, а также интересна тематика канала - поставьте лайк публикации и подпишитесь на канал «НЕОФАКТОР» - МИР ИНТЕРЕСЕН - будем рады доставлять качественный познавательный контент в вашу ленту событий и новостей!