Движения губ имеют огромное значение в человеческом общении, привлекая почти половину нашего визуального внимания во время разговора. Однако антропоморфные роботы часто не могут достичь синхронизации губ и звука, что приводит к неуклюжим и безжизненным движениям губ. В основе этой проблемы лежат два фундаментальных барьера. Во-первых, роботизированным губам, как правило, не хватает механической сложности, необходимой для воспроизведения тонких движений человеческого рта; во-вторых, существующие методы синхронизации зависят от вручную заданных движений и правил, что ограничивает адаптивность и реализм. В работе, представленной в научном журнале Science описывается процесс обучения с участием людей. Проводилась оценка с участием людей, используя Amazon SageMaker AI, сервис, предоставляемый Amazon
Web Services (AWS), для оценки синхронизации движений губ и речи. Таким образом, цель состояла не столько в том, чтобы доказать, что движения губ робота достигли определенного уровня реализм