В мае Google показала нейросетевой алгоритм, способный переводить речь человека с одного языка на другой — с сохранением особенностей голоса. Это было круто, но бесполезно для тех, у кого есть проблемы с речью. Теперь компания создала похожий ИИ, предназначенный специально для таких людей.
Алгоритм Parrotron способен преобразовывать то, что говорят люди с дефектами произношения, в понятную синтезированную речь. Google скормила нейросети около 30 тысяч пар высказываний, поэтому ей не нужны визуальные подсказки вроде движений губ — она всё делает сама.
По словам Google, частота ошибок нового ИИ составляет всего 25%, в то время как старый ошибался в 89% случаев. Но компания уже пытается уменьшить этот процент. Останется поместить этот алгоритм в какое-нибудь удобное устройство, и люди с нарушениями речи смогут свободно общаться с кем угодно.
Здесь можно послушать примеры работы ИИ — они находятся в разделе 3.2: https://google.github.io/tacotron/publications/parrotron/
Подписывайтесь на наш канал, чтобы читать новости из будущего!