Обычный дубляж основан на сопоставлении речевых звуков — фонем - с формой губ актера, когда он или она говорит, известные как висемы, - «визуальная фонема». Это тяжелая работа, требующая умных сценариев и умелого художника по вокалу, и аудитория очень быстро обнаруживает, когда это не совсем правильно.
Используя другой подход к проблеме, исследователи из Disney Research и Университета Восточной Англии проанализировали движения губ во время речи, а не просто смотрели на отдельные статические снимки. Эти движения известны как «динамические висемы».
Анализируя последовательность форм, сделанных губами, и загружая все это в компьютер, технология может автоматически создавать новые фразы, которые идеально соответствуют рту актера — буквально помещая слова в рот.
Оказывается, например, что фраза «чистые образцы» визуально такая же, как и «более умные дураки», «не нуждаются в горшках» и «любят наблюдать за тобой»
«Динамические висемы являются более точной моделью визуальной артикуляции ре