«До сих пор не существовало единого подхода к распознаванию голоса в шумной среде, который был бы одинаково надежен в лабораторных тестах и в реальных условиях. Надеемся, что публикация нашего метода ускорит прогресс в области голосовых интерфейсов, поможет избежать типичных ошибок и приведет к появлению большего количества удобных и надежных голосовых устройств», — пояснил руководитель направления голосовой активации «Яндекса» Дмитрий Солодуха, чьи слова приводит пресс-служба компании. Как отмечают Солодуха и его коллеги, системы распознавания речи в умных устройствах и виртуальных ассистентах используют алгоритмы эхоподавления и шумоподавления для того, чтобы удалить лишние шумы и распознать голос их пользователя на фоне музыки и прочих посторонних звуков. В процессе работы этих алгоритмов часто ухудшается и качество речи, что снижает вероятность успешного распознавания команд. Для решения этой проблемы специалисты «Яндекса» разработали нейросетевой механизм внимания, который получае
Разработчики из России научили ИИ лучше распознавать голос человека на фоне шума
30 июля 202530 июл 2025
4
1 мин