21 подписчик

на говорящем, просто посмотрев на него в течение трех-пяти секунд. После этого система подавляет все остальные звуки и передает в реальном времени только голос отмеченного говорящего, даже если пользователь перемещается по шумной зоне и больше не смотрит на говорящего.

Одним из преимуществ системы является ее совместимость с существующими гарнитурами, что делает ее доступной для широкой аудитории. Код проверки концепции уже размещен на GitHub и доступен под лицензией на некоммерческое использование, что позволяет исследователям и разработчикам изучить и протестировать технологию. Тем не менее, сама система пока не доступна для коммерческой продажи.

В основе «Target Speech Hearing» лежит программное обеспечение машинного обучения, которое анализирует вокальные модели выбранного говорящего и затем фиксирует его голос. Эта технология открывает новые возможности для использования в различных сферах, включая конференции, шумные рабочие среды и общественные места.

#AI #технологии #США

Источник

🔳 @itvibenews

1 минута

4 июня 2024