Найти в Дзене
PRO роботов

Искусственный интеллект озвучивает фотографии

Сервис MyHeritage получил известность в прошлом году, представив технологию дипфейков Deep Nostalgia, ставшую вирусной. Она позволяла "оживить" старые фото и на сегодняшний день обработала более 100 млн изображений, загруженных пользователями.

Теперь MyHeritage подарил "ожившим" фотографиям голос. LiveStory стала результатом сотрудничества компании со стартапом D-ID, который работает над созданием запатентованной технологии реконструкции видео на основе ИИ и методов глубокого обучения.

Технологии D-ID, доступные разработчикам через API, использовались для рядя СМИ, в образовании, маркетинге и т. д. Warner Bros., например, работала с D-ID, чтобы позволить пользователям персонализировать трейлер фильма с анимированными фотографиями, а также в рамках выставки, посвященной Гарри Поттеру.

Запатентованная технологией Speaking Portrait от D-ID сначала генерирует видео на основе загруженной фотографии, а затем объединяет его с генератором синтетического голоса. Повествование истории происходит на основе введенного текста пользователя.

Чтобы губы соответствовали словам, D-ID обучила нейронную сеть на базе видеозаписей говорящих людей. По словам компании, ее технология способна работать с любым языком. Реализация MyHeritage, однако, поддерживает 31 язык, включая десятки диалектов, с мужскими и женскими вариантами голоса.

Попробовать сервис можно здесь: https://www.myheritage.com/livestory?lang=RU

#пророботов #proроботов #искусственныйинтеллект