Давно собирался разобрать на каком-нибудь примере, вот и добрался.
Сперва немного вступительная словоблудия.
*напускает важный вид*
Мы с вами уже двумя ногами стоим в той эпохе, где собрать 2-3-минутный клип или ролик - цена 1-2 тысяч рублей и нескольких часов времени. Без каких-либо специфических знаний/профессий. Буквально год назад такой клип нужно было либо снимать вживую, либо собирать в 3D-редакторе. Но сегодня мы достигли... ээм...
Скучно? Я знаю. Поэтому к черту все эти прелюдии и переходим к делу.
Чем генерируем?
Для генерации видео я использую два основных инструмента.
1. Sora от OpenAI (от создателей ChatGPT).
Доступно пока в режиме бета-теста бесплатно по адресу https://sora.chatgpt.com/explore, но только если вы не из России и не из Европы.
Явные плюсы:
- ШИКАРНАЯ работа в комплексе: звук, музыка, речь, иногда еще и корректный (если небольшой) русский текст в виде субтитров или надписей. С текстом иногда косячит, поэтому лучше отдельно прописывать "без субтитров". Чтобы не чистить.
Минусы:
- "Блуждающие" водяные знаки по всему экрану. Я не советую удалять их, если ваше видео могут принять за реальное с каким-нибудь резонансом, но применительно к Sora они нереально бесят. В PRO-версии их нет, но полный доступ ко всем возможностям ChatGPT стоит от $20 (и там немного!) до... $200. Спасибо, не надо.
- Не поддерживает "референсные фото" с людьми. Вы не сможете загрузить друга и слепить с ним видео. Но можете слелать Камео с живого человека, используя приложение (Ограничения по странам те же). + есть вариант создать персонажа из УЖЕ сгенерированных видео, чтобы продолжать с ним историю, да использовать его в других сценах. Если будет интересно - расскажу позже.
2. Veo 3.1 от Google
Как получить доступ к нейросервисам Google - описывалось тут:
Шикарное качество (полноценное HD), четкая речь, поддержка русского языка. Но меньшая динамика по сравнению с Sora. Результата добиться можно, но нужны сложные, детальные промпты-инструкции.
Если в сфере фото универсал на все случаи жизни это Nano Banano (ссылка на разбор была выше), то в мире видео - такого универсала пока нет. Каждый в в одном силен, в другом - слаб.
Оба инструмента без плясок...
Альтернатива и доступ из РФ без шаманства с бубном - уже знакомый вам VeoSeeBot в Телеграм. Увы, с видео поиграться бесплатно не выйдет.
Генерация Veo 3 обойдется в 60 р./8 сек, Sora 2 c водяными знаками - 36 р./10 сек, Sora 2 Pro с поддержкой сценариев и видео до 25 секунд - от 60 до... 480 р./генерация. В зависимости от параметров. Но для базовых задач хватит "дешевых" вариантов.
Применительно к видео я все же придерживаюсь того, что если вам 2-3 генерации - можно и так. А если чего-то большее, то разумнее заморочиться с доступом напрямую. Ибо шибко накладны все эти "прокладки".
Зачем это делать?
Вот чесслово - под каждой статьей, посвященной нейрогенерациям медиа-контента, куча всяких "злодеев". У которых в каждой идее статья, а то и не одна. Из УК РФ, если что.
Смотрите на использование видео шире и веселее.
Контент для соц.сетей (если кто ведет), рабочие какие-то моменты (котов всяких в рекламе уже задолбались видеть), добрые шутки над знакомыми и так далее.
Мы про приличное и законное. Все остальное предостерегаю и не рекомендую!
Что будем делать?
Сегодня у нас азы и база. Давайте экранизируем мой любимый анекдот.
Я его уже упоминал в контексте борьбы с мошенничеством:
Продублирую ниже:
ЗаблудилсяЛёхамужик в лесу. Ходит, кричит "Ау...., ау....., ау......"
Из сугроба вылазит медведь и хлопает мужика по плечу: "Мужик, чего орешь?".
Мужик: "Да вот кричу, может кто услышит"
Медведь: "Ну я услышал. Тебе легче стало?"
Сделаем из короткого анекдота короткий же, но зловещий и эпический триллер.
Кто не в курсе про "Леху и Медведя" - могут ознакомиться с нашим остробессюжетным триллером тут:
Первым делом превратим анекдот в промпт.
Ролик в стиле триллера, с драматической музыкой.
Лес. Зима. Мужчина в крутке с надписью "Лёха" на спине ходит по лесу и орет "Эй!! Аууу!! Ээээй!!!"
Следующий кадр: в берлоге просыпается медведь под фоновые крики мужчины.
Следующий кадр - медведь кладет лапу на плечо мужчине, мужчина вздрагивает и оборачивается.
Медведь говорит "Ну и че ты орешь?".
Мужчина говорит "Заблудился я!"
Медведь спрашивает "Так а орешь зачем?!"
Мужчина говорит "Ну может услышит кто?"
Медведь говорит "Ну вот я услышал. Легче стало?"
Мужчина испуганно оседает.
В Sora есть режим Storyboard (доступен не всем, почему-то в "бесплатном" формате напрямую, но с гарантией есть у платных). Там вы прописываете отдельно каждую сцену с указанием времени сцены, но... сбоев там больше, почему-то.
Важно диалоги прописывать без излишеств. Избегайте "Отвечает" и так далее, не понимает. "Говорит", "спрашивает" (для интонации вопроса), "восклицает", "кричит" - работают. Дополнительно можно написать еще и положение головы/глаз. Например, "мужчина смотрит на медведя/в пол/в небо и говорит".
Закидываем промпт в Sora и получает вот такой фрагмент.
К сожалению, в Дзене есть сложности с представлением коротких видео (они все пойдут в ленту, которую я не хочу забивать) - поэтому буду показывать результат gif-ками. Сводный результат со звуком уже будет нормальный в конце статьи.
Но это слишком короткий ролик. Так дело не пойдет!
"Продлить" его в Sora нельзя - "референс" из скрина генератор не примет, но можно создать персонажа. Это отдельный материал.
Сегодня мы сравним попутно возможности Veo 3.1, а заодно поймем, как сделать "продолжение" короткого видео или же старт с нужного момента.
Выбираем скрин, где видно лицо героя и часть медведя.
Вот такой:
Идем в уже знакомую нам по прошлой статье Nano Banano, прикладываем этот скрин и пишем:
Мужчина убегает от медведя по лесу, вид спереди на мужчину, позади за ним несется медведь
Примитивно, но Банана понимает и дает нам вот такое красивое:
Далее в Veo 3.1 пишем простейший промпт, прикладывая уже сгенерированный выше кадр:
Мужчина убегает от медведя, хрипло дышит, медведь рычит, играет зловещая драматическая музыка. Мужчина падает, медведь его настигает, экран гаснет и доносится громкий крик.
Получаем вот это:
Все отлично, но... медведь, одежда изменилась, да и погода. Это не ошибка нейронки, это косяк ее оператора: потому что в референсе у нас этого не было. Но то мелочи. Главное, что вы знаете, почему это произошло =)
Ну и куда же нам без обложки для ролика?
Снова возвращаемся в Nano Banano, берем наш старый кадр с мужчиной и медведем, и пишем следующее:
Сделай с этими персонажами кинематографичный постер "Не буди медведя". Испуганный мужчина, бегущий по лесу, гонящийся за ним медведь и силуэт в левом нижнем углу, прикладывающий палец к губам "тс-с-с". Соотношение сторон 16:9.
Получаем вот это:
И всё. Сегодня без портянок!
Далее собираем в CapCut или любом другом удобном для вас редакторе. Результат вот такой:
Музыка и звуки в первой и второй части - сгенерирована комплексно вместе с роликами. Отдельно добавлен только крик, рык взят из неудачного дубля.
Такие вот "нейронные" дела.
Давим "Нравлика" и не забываем подписываться везде по ссылкам ниже 👇
ВКонтакте || Телеграм || MAX || Одноклассники || RuTube
💸 Донаты приветствуются: поддержать автора канала можно по кнопке ниже или по этой ссылке. Как мы все в курсе - финансово Дзен совсем стал "не торт".
Ну и не забывайте посмотреть другие видео, которые сделаны с помощью нейросетей в разделе "Видео". Немного лучшего ниже:
И даже они уже бесконечно... устарели.