Технология полностью автоматизирована и работает на основе методов машинного обучения, созданная командой ВКонтакте. Также в VK мессенджере стали доступны анимированные реакции и другие новые функции.
Теперь речь из полученных или отправленных видеосообщений можно прочитать. Достаточно нажать на значок «Аа», после чего искусственный интеллект распознает слова собеседника и преобразует её в текст. Инструмент будет полезен, когда неудобно слушать или смотреть ролик. Кроме того, он позволит вернуться к нужной информации в переписке: расшифрованные видеосообщения можно находить при помощи поиска по тексту.
В процессе участвуют три нейросети: акустическая распознаёт звуки, языковая формирует из звуков слова, а пунктуационная определяет границы предложений и расставляет знаки препинания. Технология обучается на субтитрах фильмов и способна понимать неразборчивую речь и неформальную лексику, убирать паузы из записи, разбивать текст на предложения и смысловые блоки. Распознавание речи пол