Найти тему
76 подписчиков

MuAViC — распознаём речь на видео с разных языков.


В корпусе модели 1200 часов аудиовизуальной речи на 9 языках. Он полностью транскрибирован (переведён из голоса в текст) и охватывает 6 направлений перевода с английского на X (любой) и назад.

Демо для локалки
MuAViC — распознаём речь на видео с разных языков.  В корпусе модели 1200 часов аудиовизуальной речи на 9 языках.
00:43
Около минуты