Удобное решение для распознавания коротких голосовых сообщений есть, а для длинных аудиофайлов (совещания, вебинары)? Я не нашёл. Единственное, что нашёл - скрипт для Yandex SpeechKit. Дополил его под свои нужды, и вуаля: на входе — mp3 любого размера (до 4 часов), на выходе — расшифровка с таймкодами.
О распознавании длинных аудиофайлов в текст
12 декабря 202212 дек 2022
62
~1 мин