18 подписчиков
Команда из Вашингтонского университета разработала инновационную систему искусственного интеллекта под названием «Target Speech Hearing», которая значительно улучшает восприятие речи в шумных местах. Эта система предназначена для пользователей в наушниках и позволяет им «фиксироваться» на говорящем, просто посмотрев на него в течение трех-пяти секунд. После этого система подавляет все остальные звуки и передает в реальном времени только голос отмеченного говорящего, даже если пользователь перемещается по шумной зоне и больше не смотрит на говорящего.
Одним из преимуществ системы является ее совместимость с существующими гарнитурами, что делает ее доступной для широкой аудитории. Код проверки концепции уже размещен на GitHub и доступен под лицензией на некоммерческое использование, что позволяет исследователям и разработчикам изучить и протестировать технологию. Тем не менее, сама система пока не доступна для коммерческой продажи.
В основе «Target Speech Hearing» лежит программное обеспечение машинного обучения, которое анализирует вокальные модели выбранного говорящего и затем фиксирует его голос. Эта технология открывает новые возможности для использования в различных сферах, включая конференции, шумные рабочие среды и общественные места.
#AI #технологии #США
1 минута
4 июня 2024