Найти в Дзене
ПсихоЮрист

Делаем видео с помощью нейросети. Удиви друзей и знакомых!

Давно собирался разобрать на каком-нибудь примере, вот и добрался. Сперва немного вступительная словоблудия. *напускает важный вид* Мы с вами уже двумя ногами стоим в той эпохе, где собрать 2-3-минутный клип или ролик - цена 1-2 тысяч рублей и нескольких часов времени. Без каких-либо специфических знаний/профессий. Буквально год назад такой клип нужно было либо снимать вживую, либо собирать в 3D-редакторе. Но сегодня мы достигли... ээм... Скучно? Я знаю. Поэтому к черту все эти прелюдии и переходим к делу. Для генерации видео я использую два основных инструмента. Доступно пока в режиме бета-теста бесплатно по адресу https://sora.chatgpt.com/explore, но только если вы не из России и не из Европы. Явные плюсы: Минусы: Как получить доступ к нейросервисам Google - описывалось тут: Шикарное качество (полноценное HD), четкая речь, поддержка русского языка. Но меньшая динамика по сравнению с Sora. Результата добиться можно, но нужны сложные, детальные промпты-инструкции. Если в сфере фот
Оглавление

Давно собирался разобрать на каком-нибудь примере, вот и добрался.

Сперва немного вступительная словоблудия.

*напускает важный вид*

Мы с вами уже двумя ногами стоим в той эпохе, где собрать 2-3-минутный клип или ролик - цена 1-2 тысяч рублей и нескольких часов времени. Без каких-либо специфических знаний/профессий. Буквально год назад такой клип нужно было либо снимать вживую, либо собирать в 3D-редакторе. Но сегодня мы достигли... ээм...

Скучно? Я знаю. Поэтому к черту все эти прелюдии и переходим к делу.

Чем генерируем?

Для генерации видео я использую два основных инструмента.

1. Sora от OpenAI (от создателей ChatGPT).

Доступно пока в режиме бета-теста бесплатно по адресу https://sora.chatgpt.com/explore, но только если вы не из России и не из Европы.

Явные плюсы:

  • ШИКАРНАЯ работа в комплексе: звук, музыка, речь, иногда еще и корректный (если небольшой) русский текст в виде субтитров или надписей. С текстом иногда косячит, поэтому лучше отдельно прописывать "без субтитров". Чтобы не чистить.

Минусы:

  • "Блуждающие" водяные знаки по всему экрану. Я не советую удалять их, если ваше видео могут принять за реальное с каким-нибудь резонансом, но применительно к Sora они нереально бесят. В PRO-версии их нет, но полный доступ ко всем возможностям ChatGPT стоит от $20 (и там немного!) до... $200. Спасибо, не надо.
  • Не поддерживает "референсные фото" с людьми. Вы не сможете загрузить друга и слепить с ним видео. Но можете слелать Камео с живого человека, используя приложение (Ограничения по странам те же). + есть вариант создать персонажа из УЖЕ сгенерированных видео, чтобы продолжать с ним историю, да использовать его в других сценах. Если будет интересно - расскажу позже.

2. Veo 3.1 от Google

Как получить доступ к нейросервисам Google - описывалось тут:

Шикарное качество (полноценное HD), четкая речь, поддержка русского языка. Но меньшая динамика по сравнению с Sora. Результата добиться можно, но нужны сложные, детальные промпты-инструкции.

Если в сфере фото универсал на все случаи жизни это Nano Banano (ссылка на разбор была выше), то в мире видео - такого универсала пока нет. Каждый в в одном силен, в другом - слаб.

Оба инструмента без плясок...

Альтернатива и доступ из РФ без шаманства с бубном - уже знакомый вам VeoSeeBot в Телеграм. Увы, с видео поиграться бесплатно не выйдет.

Генерация Veo 3 обойдется в 60 р./8 сек, Sora 2 c водяными знаками - 36 р./10 сек, Sora 2 Pro с поддержкой сценариев и видео до 25 секунд - от 60 до... 480 р./генерация. В зависимости от параметров. Но для базовых задач хватит "дешевых" вариантов.

Применительно к видео я все же придерживаюсь того, что если вам 2-3 генерации - можно и так. А если чего-то большее, то разумнее заморочиться с доступом напрямую. Ибо шибко накладны все эти "прокладки".

Зачем это делать?

Вот чесслово - под каждой статьей, посвященной нейрогенерациям медиа-контента, куча всяких "злодеев". У которых в каждой идее статья, а то и не одна. Из УК РФ, если что.

Смотрите на использование видео шире и веселее.

Контент для соц.сетей (если кто ведет), рабочие какие-то моменты (котов всяких в рекламе уже задолбались видеть), добрые шутки над знакомыми и так далее.

Мы про приличное и законное. Все остальное предостерегаю и не рекомендую!

Что будем делать?

Сегодня у нас азы и база. Давайте экранизируем мой любимый анекдот.

Я его уже упоминал в контексте борьбы с мошенничеством:

Продублирую ниже:

Заблудился Лёха мужик в лесу. Ходит, кричит "Ау...., ау....., ау......"
Из сугроба вылазит медведь и хлопает мужика по плечу: "Мужик, чего орешь?".
Мужик: "Да вот кричу, может кто услышит"
Медведь: "Ну я услышал. Тебе легче стало?"

Сделаем из короткого анекдота короткий же, но зловещий и эпический триллер.

Кто не в курсе про "Леху и Медведя" - могут ознакомиться с нашим остробессюжетным триллером тут:

Первым делом превратим анекдот в промпт.

Ролик в стиле триллера, с драматической музыкой.
Лес. Зима. Мужчина в крутке с надписью "Лёха" на спине ходит по лесу и орет "Эй!! Аууу!! Ээээй!!!"
Следующий кадр: в берлоге просыпается медведь под фоновые крики мужчины.
Следующий кадр - медведь кладет лапу на плечо мужчине, мужчина вздрагивает и оборачивается.
Медведь говорит "Ну и че ты орешь?".
Мужчина говорит "Заблудился я!"
Медведь спрашивает "Так а орешь зачем?!"
Мужчина говорит "Ну может услышит кто?"
Медведь говорит "Ну вот я услышал. Легче стало?"
Мужчина испуганно оседает.

В Sora есть режим Storyboard (доступен не всем, почему-то в "бесплатном" формате напрямую, но с гарантией есть у платных). Там вы прописываете отдельно каждую сцену с указанием времени сцены, но... сбоев там больше, почему-то.

Важно диалоги прописывать без излишеств. Избегайте "Отвечает" и так далее, не понимает. "Говорит", "спрашивает" (для интонации вопроса), "восклицает", "кричит" - работают. Дополнительно можно написать еще и положение головы/глаз. Например, "мужчина смотрит на медведя/в пол/в небо и говорит".

Закидываем промпт в Sora и получает вот такой фрагмент.

-2

К сожалению, в Дзене есть сложности с представлением коротких видео (они все пойдут в ленту, которую я не хочу забивать) - поэтому буду показывать результат gif-ками. Сводный результат со звуком уже будет нормальный в конце статьи.

Но это слишком короткий ролик. Так дело не пойдет!

"Продлить" его в Sora нельзя - "референс" из скрина генератор не примет, но можно создать персонажа. Это отдельный материал.

Сегодня мы сравним попутно возможности Veo 3.1, а заодно поймем, как сделать "продолжение" короткого видео или же старт с нужного момента.

Выбираем скрин, где видно лицо героя и часть медведя.

Вот такой:

-3

Идем в уже знакомую нам по прошлой статье Nano Banano, прикладываем этот скрин и пишем:

Мужчина убегает от медведя по лесу, вид спереди на мужчину, позади за ним несется медведь

Примитивно, но Банана понимает и дает нам вот такое красивое:

-4

Далее в Veo 3.1 пишем простейший промпт, прикладывая уже сгенерированный выше кадр:

Мужчина убегает от медведя, хрипло дышит, медведь рычит, играет зловещая драматическая музыка. Мужчина падает, медведь его настигает, экран гаснет и доносится громкий крик.

Получаем вот это:

-5

Все отлично, но... медведь, одежда изменилась, да и погода. Это не ошибка нейронки, это косяк ее оператора: потому что в референсе у нас этого не было. Но то мелочи. Главное, что вы знаете, почему это произошло =)

Ну и куда же нам без обложки для ролика?

Снова возвращаемся в Nano Banano, берем наш старый кадр с мужчиной и медведем, и пишем следующее:

Сделай с этими персонажами кинематографичный постер "Не буди медведя". Испуганный мужчина, бегущий по лесу, гонящийся за ним медведь и силуэт в левом нижнем углу, прикладывающий палец к губам "тс-с-с". Соотношение сторон 16:9.

Получаем вот это:

-6

И всё. Сегодня без портянок!

Далее собираем в CapCut или любом другом удобном для вас редакторе. Результат вот такой:

Музыка и звуки в первой и второй части - сгенерирована комплексно вместе с роликами. Отдельно добавлен только крик, рык взят из неудачного дубля.

Такие вот "нейронные" дела.

Давим "Нравлика" и не забываем подписываться везде по ссылкам ниже 👇

ВКонтакте || Телеграм || MAX || Одноклассники || RuTube

💸 Донаты приветствуются: поддержать автора канала можно по кнопке ниже или по этой ссылке. Как мы все в курсе - финансово Дзен совсем стал "не торт".

Ну и не забывайте посмотреть другие видео, которые сделаны с помощью нейросетей в разделе "Видео". Немного лучшего ниже:

И даже они уже бесконечно... устарели.