Подразделение Tongyi Lab, относящееся к Alibaba, представило Fun-CineForge — первую в мире модель для озвучивания фильмов, которая одновременно соединяет несколько модальностей и открыта для исследователей и разработчиков. На практике это означает, что модель умеет не просто озвучивать текст, а точно передавать эмоции и синхронизировать речь с движением губ. Система решает четыре главные задачи дубляжа. Это синхронизация губ, эмоциональная выразительность, последовательность голосов персонажей и точное временное выравнивание, даже когда говорящий скрыт или отсутствует на экране. Fun-CineForge способна озвучивать сцены с несколькими героями, сохраняя целостность диалогов, и это серьёзное отличие от привычных ИИ-систем. Модель опирается на набор данных CineDub, составленный из более 350 китайских и английских фильмов и сериалов. Автоматизированный процесс построения корпуса использует метод «цепочки мыслей», что снижает ошибки транскрипции до 1-2% и ошибки разделения говорящих до 1,2%. Д
В Alibaba заявили о создании ИИ-модели для безупречного дубляжа фильмов и сериалов
17 марта17 мар
1 мин