Студенты НИТУ МИСИС и МГУ имени М.В. Ломоносова создали видеоредактор с автоматической генерацией тифлокомментариев (звукового описания) происходящего в кадре. Инструмент поможет незрячим или плоховидящим людям понимать, что происходит в фильме, не прерывая просмотра. При разработке видеоредактора с тифлокомментариями использованы три разные state-of-the-art (флагманские) модели глубокого обучения, каждая из которых призвана решить определенную задачу. Первая анализировала аудиоряд и видеопоток для поиска тех моментов в фильме, где было бы уместно вставить озвучку происходящего. Вторая модель генерировала текстовое описание текущего кадра, а третья — озвучивала подготовленный текст. «Главная особенность предложенного нами решения заключается в возможности проверить результат генерации и исправить недочеты прямо в браузере. На сегодняшний день даже лучшие модели могут ошибаться. Наша разработка даёт пользователю возможность корректировать результат на каждом этапе — от выделения интерес
Студенты Университета МИСИС создали систему адаптации фильмов для незрячих людей
7 апреля 20237 апр 2023
19
1 мин