Найти в Дзене

Соцсеть «ВКонтакте» научилась переводить голосовые сообщения в текст

Разработчики социальной сети «ВКонтакте» реализовали технологию расшифровки голосовых сообщений. Это избавит от необходимости их прослушивания, что не всегда удобно.

Фото - pixabay.com
Фото - pixabay.com

О новой возможности сообщается в блоге компании. Расшифровкой займется берет на себя специально обученная нейросеть. В отличие от существующих алгоритмов преобразования голоса в текст, она учитывает нагрузку платформы, русскоязычный сленг и сложные условия записи.

– Запись обрабатывается тремя нейросетями и возвращается в переписку в виде текста. Почему нейросети три? Одна отвечает за распознавание речи, вторая находит подходящие слова, а третья расставляет знаки препинания. Так вы увидите в расшифровке связный текст, – комментируют создатели новой функции.

Фото - vk.com/blog
Фото - vk.com/blog

Для обучения нейросетей, не нарушая конфиденциальности переписки пользователей, тестировщики записывали специально подготовленные фразы. Качество распознавания оценивалось с помощью обратной связи.

Новая функция появилась только у некоторых пользователей мобильного приложения, но в течение недели будет доступна уже всем. Чтобы распознавание работало, аудиосообщение не должно превышать 30 секунд. Функция работает как с отправленными, и с полученными записями.

Напомним, ранее мы писали, что обновление мессенджера Telegram подарило пользователям несколько новых возможностей, включая видеоредактор.