Искусственный интеллект, согласно отчету VentureBeat, начал фильтровать несвязанные звуки в Google Meet calls. Функция шумоподавления, впервые объявленная Google в апреле, использует AI для идентификации и противодействия фоновым шумам, которые могут затруднить понимание вызова.
Ссылка на первоисточник статьи
Шумоподавление
Функция шумоподавления по существу удаляет любой звук, который не является человеческим голосом, говорящим рядом с микрофоном. Как показано в видео ниже, это может превратить вызов в шумной, многолюдной среде в тот, который также может быть в тихой комнате у себя дома. AI работает, быстро анализируя все звуки, передаваемые через вызов. Используя методы машинного обучения в облаке Google, он помечает и идентифицирует данные, представляющие то, что говорит оратор, и удаляет все остальное. И конечно не обошлось без подводных камней: как отмечается в комментариях к видео, технология может непреднамеренно удалить преднамеренные звуки (такие как игра на гитаре и другие).
” Чтобы помочь ограничить перерывы в вашей встрече, Meet теперь может разумно отфильтровать фоновые отвлекающие факторы — такие как лай вашей собаки или нажатия клавиш, когда вы делаете заметки о встрече", - объяснил Google в своем объявлении. Шумоподавление станет доступно в ближайшие недели для клиентов G Suite Enterprise и G Suite Enterprise for Education, — начиная с веб-пользователей и позже для мобильных устройств”
Согласно тому, что директор G Suite по управлению продуктами Серж Лачапелл рассказал VentureBeat о том, что технология все еще разрабатывается. Вот почему возникают случайные искажения голоса говорящего, когда ИИ пытается устранить несвязанный шум. Технология, вероятно, будет часто обновляться в ближайшем будущем, в частности, чтобы лучше различать различные виды человеческих звуков. Например, машинные шумы для AI легче для устранения, чем крик ребенка в фоновом режиме. Новая функция все еще совершенствуется, но будет включена по умолчанию для всех пользователей (с возможностью отключить ее при желании).
AI звуки
Существует большой потенциал для ИИ, способного различать, какие звуки актуальны во время разговора. Функция шумоподавления дополняет еще один из проектов Google, — AI используется для сглаживания видеосообщений Duo. Для Duo Google создал новый алгоритм WaveNetEQ, который может научиться заполнять короткие пробелы в передаче звука звуками, которые достаточно близко совпадают, чтобы пользователи думали, что ни один из битов данных не был потерян во время вызова.
Более непосредственным применением технологии шумоподавления может стать Google Assistant. Ошибочная активация голосовых помощников является очень распространенным случаем, причем почти две трети пользователей голосовых помощников делают это по крайней мере один раз в месяц. И это только тогда, когда они замечают. Распознавание человеческого динамика, когда есть много конкурирующих шумов, является одной из причин, по которой Google запустил управление Google Assistant “hotword sensitivity”. Этот элемент управления позволяет пользователям изменять точность, необходимую для пробуждения голосового помощника. В сочетании с недавним обновлением системы голосового соответствия, которая позволяет Google Assistant лучше определять, кто является спикером, это может быть настоящим благом для многих филиалов Google. Конечно, реальная проверка технологии шумоподавления в Meet может заключаться в том, насколько хорошо клон Zoom может работать на Google Meet, как только Google завершит развертывание этой функции.
Статья подготовлена аналитическим контакт-центром Skewes
Оценив статью лайком, вы поможете другим пользователям больше узнавать о новинках и разработках голосового ИИ.