Найти в Дзене

День экспериментов: цифровые аватары и суровая правда о нейросетях

В нашем агентстве любой день недели — рабочий. Пока команда допиливала шортсы для «Тактических решений» и вела SEO-раскопки, я решил поиграть в бога: создать своего цифрового аватара. Давно хотел протестировать нашумевший сервис HeyGen, и вот этот день настал. Спойлер: получилось страшно. И смешно. Началось всё неожиданно хорошо. Я загрузил образец голоса, и нейросеть подхватила его почти идеально. Чуть-чуть подправил интонации — и вуаля, мой цифровой клон заговорил почти как я. В этот момент я подумал: «Вот оно, будущее! Сейчас видео запишем, и можно уходить в отпуск». Как же я ошибался. Как только дело дошло до генерации видео, магия развеялась. На меня с экрана смотрело нечто. Аватар выглядел так, будто его воскресили из «Долины Ужасов» компьютерной графики 90-х. Я попробовал классическое решение — снять себя в студии с идеальным светом и фоном, чтобы облегчить нейросети жизнь. Но даже это не гарантирует результат. А вишенка на торте — скорость. Минутное видео генерируется почти 20
Оглавление

В нашем агентстве любой день недели — рабочий. Пока команда допиливала шортсы для «Тактических решений» и вела SEO-раскопки, я решил поиграть в бога: создать своего цифрового аватара. Давно хотел протестировать нашумевший сервис HeyGen, и вот этот день настал.

Спойлер: получилось страшно. И смешно.

Этап 1: Голос. Эйфория.

Началось всё неожиданно хорошо. Я загрузил образец голоса, и нейросеть подхватила его почти идеально. Чуть-чуть подправил интонации — и вуаля, мой цифровой клон заговорил почти как я. В этот момент я подумал: «Вот оно, будущее! Сейчас видео запишем, и можно уходить в отпуск».

Как же я ошибался.

Этап 2: Видео. Долина ужасов.

Как только дело дошло до генерации видео, магия развеялась. На меня с экрана смотрело нечто. Аватар выглядел так, будто его воскресили из «Долины Ужасов» компьютерной графики 90-х.

  • Движения: Резкие, пластиковые, неестественные.
  • Эмоции: Странные гримасы, не имеющие ничего общего с тем, что я говорил.
  • Рот: Отдельная песня. Он просто жил своей жизнью, как у куклы чревовещателя.

Я попробовал классическое решение — снять себя в студии с идеальным светом и фоном, чтобы облегчить нейросети жизнь. Но даже это не гарантирует результат. А вишенка на торте — скорость. Минутное видео генерируется почти 20 минут, и это в «ускоренном» режиме, который стоит вдвое дороже.

Экономика эксперимента: почём нынче аватары?

А теперь к самому интересному — к деньгам. Если вы захотите делать хотя бы полчаса такого контента в месяц, готовьтесь выложить около $50. Можно, конечно, сэкономить и генерировать видео из фото, но тогда синхронизация губ будет такой, что лучше бы её и не было.

Итог по HeyGen: на данном этапе это скорее забавная игрушка, чем рабочий инструмент. Снять ролик самому всё ещё быстрее и качественнее. Но я не сдаюсь. Буду продолжать эксперименты — вдруг получится найти подход к этому пластиковому упрямцу.

А в это время в офисе...

Пока я сражался с цифровым двойником, агентство жило своей жизнью:

  • Сергей изучал отчёты, пытаясь понять, почему один рилс взлетел, а другой нет.
  • Екатерина раздавала дедлайны по проекту нового офтальмолога.
  • Марина в сотый раз доказывала клиенту по телефону, что «мемы — это тоже часть стратегии, да, даже с котиками!».
  • А я, в перерывах между генерациями, успевал следить за шортсами и дописывать SEO-сценарий.

Вечером — традиционный созвон в Zoom, где мы раздаём «волшебные пендали» и хвалим друг друга за маленькие победы.

Вывод дня

Нейросети — это круто и перспективно, но волшебной кнопки «сделать красиво» всё ещё не существует. HeyGen умеет клонировать голос, но с видео пока беда.

Кстати, все самые сочные подробности, неудачные дубли аватара и инсайты, которые не попадают в посты, я публикую в нашем Telegram-канале «ИИ и Мы». Подписывайтесь, если хотите видеть всю «кухню» наших экспериментов!