Найти в Дзене
TedNote

Нейросети научились читать по губам.

Возможность автоматически идентифицировать человека по его лицу, постановка диагноза и прогнозирование инсульта точнее врачей, даже воспитание кошек и многое другое на что способен ИИ, это далеко не предел. Искусственный интеллект обучили распознавать речь по губам. Подобные попытки были и раньше, имея результаты с точность до 93.4%(Lipnet 2017), однако это были тепличные лабораторные условиях. Также, один из примеров описывался в статье на канале: Журнал "Код". Однако тут абсолютно новый алгоритм, который превосходит все существующие способы распознавания речи и вполне может применяться на практике. Для того, чтобы помочь глухонемым пользоваться голосовым поиском, или для тотальной слежки, превращая весь мир во всем известную Оруэлловскую антиутопию? -Решать Вам. Для ознакомления прикрепляю видео и ссылку на статью в электронной библиотеке arxiv.org. Демонстрация синтеза речи из немого видео. arxiv.org Vocoder-Based Speech Synthesis from Silent Videos
Оглавление

Возможность автоматически идентифицировать человека по его лицу, постановка диагноза и прогнозирование инсульта точнее врачей, даже воспитание кошек и многое другое на что способен ИИ, это далеко не предел.

Искусственный интеллект обучили распознавать речь по губам. Подобные попытки были и раньше, имея результаты с точность до 93.4%(Lipnet 2017), однако это были тепличные лабораторные условиях.

Сравнение работы LipNet с работой других программ, которые распознают буквы, слова или словосочетания
Сравнение работы LipNet с работой других программ, которые распознают буквы, слова или словосочетания

Также, один из примеров описывался в статье на канале: Журнал "Код".

-2

Однако тут абсолютно новый алгоритм, который превосходит все существующие способы распознавания речи и вполне может применяться на практике. Для того, чтобы помочь глухонемым пользоваться голосовым поиском, или для тотальной слежки, превращая весь мир во всем известную Оруэлловскую антиутопию? -Решать Вам.

Для ознакомления прикрепляю видео и ссылку на статью в электронной библиотеке arxiv.org.

Демонстрация синтеза речи из немого видео.

arxiv.org

Vocoder-Based Speech Synthesis from Silent Videos