55 подписчиков

ElevenLabs представила Avatars — генерацию студийных говорящих видео аватаров

СегодняСегодня

1 мин

Функция работает в связке с ElevenCreative Studio, где видео можно довести до ума на таймлайне с дорожками для картинки, субтитров, озвучки, музыки и звуковых эффектов.

Здесь же доступен Studio Agent — встроенный ИИ-соредактор, который по описанию сам расставляет клипы, голоса и подписи, формируя черновой монтаж через диалог.

🔻Под капотом Avatars работает не на одной модели, а на наборе специализированных движков:

За оживление статичных изображений отвечают Creatify Aurora, HeyGen Avatar 4 и OmniHuman 1.5, а за синхронизацию губ в готовом видео — Sync 3 и Sync Lipsync 2 Pro с поддержкой вывода до 4K.💬

Особенно выделяется Aurora — диффузионно-трансформерная (DiT) модель, которая выходит за рамки простого липсинка: она добавляет контекстное моргание, дыхание и естественную мим

🔻Под капотом Avatars работает не на одной модели, а на наборе специализированных движков:

Теперь пользователю достаточно написать текст, выбрать или склонировать голос и задать визуальный образ — система сама собирает из этого готовый ролик с говорящим персонажем, без съёмок, студии и монтажёра.

Функция работает в связке с ElevenCreative Studio, где видео можно довести до ума на таймлайне с дорожками для картинки, субтитров, озвучки, музыки и звуковых эффектов.

Здесь же доступен Studio Agent — встроенный ИИ-соредактор, который по описанию сам расставляет клипы, голоса и подписи, формируя черновой монтаж через диалог.

🔻Под капотом Avatars работает не на одной модели, а на наборе специализированных движков:

За оживление статичных изображений отвечают Creatify Aurora, HeyGen Avatar 4 и OmniHuman 1.5, а за синхронизацию губ в готовом видео — Sync 3 и Sync Lipsync 2 Pro с поддержкой вывода до 4K.💬

Особенно выделяется Aurora — диффузионно-трансформерная (DiT) модель, которая выходит за рамки простого липсинка: она добавляет контекстное моргание, дыхание и естественную мимику, а также подстраивает движения рук и корпуса под тон и интонацию голоса.

Это та же модель, что уже используется для видеоконтента Comcast, Alibaba и тысяч брендов на платформе Creatify.

Готовый результат можно локализовать более чем на 70 языков, повысить разрешение до 4x через Topaz Upscale и экспортировать в MP4 (H.264/H.265) или отправить напрямую в проект Studio.

На бесплатном тарифе доступна только генерация изображений с лимитом в 3 запроса в день, а видео требует платной подписки.💰