Платформа внедрила усовершенствованные алгоритмы искусственного интеллекта для автоматического распознавания речи и создания субтитров в видеоматериалах. Точность анализа и расшифровки повысилась на 25%, а нейросети теперь способны понимать тысячи новых слов, включая мемы, имена собственные, акронимы и специализированные термины. Новые алгоритмы машинного обучения позволяют генерировать текстовые субтитры, синхронизированные с видео. Они проходят многоэтапную обработку, начиная с фильтрации фонового шума и заканчивая преобразованием речи в текст. Затем включаются модели пунктуации и нормализации, чтобы получить удобочитаемый текст. Наконец, ИИ синхронизирует текст с аудиодорожкой. Эти улучшения делают субтитры доступными и понятными как в профессиональных, так и в любительских видео. В ближайшем будущем нейросети научатся разделять речь разных участников на отдельные реплики, что облегчит восприятие и чтение субтитров. Популярность субтитров продолжает расти. За последний месяц доля по
В VK Видео улучшили распознавание речи на 25%: новые возможности для пользователей
13 сентября 202413 сен 2024
4
1 мин