Решил проверить, можно ли собрать в нейросетях рекламный автомобильный ролик без команды, камеры, коптера и большого бюджета.
В итоге у меня получился ИИ-видеоролик для Ford Mustang, на который ушло 2 вечера и 2.990₽ (даже боюсь предположить, сколько может это стоить в классическом офлайн-продакшене). И это притом, что я не режиссёр, не оператор и не специалист по видеорекламе.
Ниже — весь процесс, инсайты, ошибки и итоговая смета.
Как создать ИИ-видеоролик: этапы
- Подготовка — поиск референсных изображений: машины и локации
- Генерация изображений в Nano Banana 2: визуальный паспорт авто, карта локаций (различные виды и ракурсы местности), итоговые ключевые кадры
- Генерация видео в VEO 3.1 Fast
- Генерация аудио: фоновый трек (SUNO), закадровый голос (ElevenLabs), характерные звуки и другие эффекты (Интернет)
- Финальный монтаж в CapCut
💡Инсайт для новичков: сначала переведите идею на язык нейросетей
Перед тем, как отправить свой запрос (ПРОМПТ-запрос) к нейросети на генерацию изображения, видео, музыки (чего угодно) обязательно "проконсультируйтесь" с тем же ChatGPT (как в моём случае): опишите задачу, вашу идею, какой результат хотите получить и в каком виде, попросите дать рекомендацию и, наконец, написать ПРОМПТ.
Почему это важно: у вас в голове может быть "красивый вечерний свет" или "красивое движение камеры", а нейросети лучше понимают более точные формулировки вроде golden hour, low-angle shot, tracking shot и так далее.
То есть текстовая нейросеть здесь выступает как переводчик: помогает превратить вашу идею в понятный рабочий ПРОМПТ.
Этап 1. Подготовка: поиск референсов машины и локации
Для примера я выбрал автомобиль (мечты... :) — Ford Mustang GT и локацию — альпийский серпантин. Определил примерную длительность (около 60 секунд) и настроение ролика (скорость, свобода, драйв).
Затем я скачал понравившиеся референсы:
Этап 2. Генерация изображений в Nano Banana 2
2.1 Визуальный паспорт авто
Сначала я сгенерировал сам Ford Mustang:
- разные ракурсы
- разная посадка камеры
- крупные планы элементов кузова
2.2. Карта локаций
Потом отдельно собрал саму среду:
- разные планы дороги
- повороты серпантина
- виды сверху
- перспективные кадры
2.3. Ключевые кадры
И только после этого начал интегрировать машину в среду, чтобы получить финальные ключевые кадры (keyframes) — статичные сцены:
Именно на основе этих кадров были сгенерированы видеоотрезки.
Этап 3. Генерация видео в VEO 3.1 Fast
Когда ключевые кадры были готовы, я перешёл в VEO 3.1 Fast и начал "оживлять" сцены.
В итоге для создания финального ролика были задействованы 23 видеофрагмента, НО(!) чтобы их получить, пришлось сделать около 50 генераций. Ниже — скрин папки с некоторыми видеоотрезками:
Почему понадобилось столько попыток? Три причины:
- мои ошибки в написании ПРОМПТов
- ошибки самих нейросетей (периодически могут появляться артефакты — различные объекты, предметы, искажения и проч.)
- некоторые кадры получались неплохими (композиция, планы, ракурсы), но просто недостаточно эффектными
То есть в процессе создания ИИ-видео больше всего времени уходит на то, чтобы сравнить и отобрать наиболее подходящий видеофрагмент (а, при необходимости, повторить генерацию, чтобы получить лучший вариант).
Этап 4. Генерация аудио
Отдельно я собрал звук. Здесь было несколько задач:
- фоновый музыкальный трек
- звуки взаимодействия с машиной, например открывание двери, звук двигателя и т.п.
- закадровый голос
Фоновую музыку я сгенерировал в нейросети SUNO (попросил сгенерировать динамичный инструментальный трек без вокала, под автомобильный ролик).
Дополнительные звуки подбирал и добавлял уже как часть общей звуковой сборки (что-то нашёл в Интернете, что-то сгенерировал). Именно они делают ролик более "живым": без них даже хорошая картинка ощущается сырой. Закадровый голос сделал в ElevenLabs.
Этап 5. Финальный монтаж видеоролика в CapCut
Когда изображения, видео и звук были готовы, я собрал всё в CapCut. На этом этапе уже решается финальное впечатление:
- порядок кадров
- ритм монтажа
- стыковка фрагментов
- синхронизация со звуком
- добавление эффектов и переходов (если нужно)
То есть нейросети делают заготовки, но именно монтаж превращает это в ролик, который можно показать как законченную работу.
Сколько в итоге стоил ролик
Если не спешить, можно сделать и дешевле (и даже полностью бесплатно) — за счёт предоставляемых бонусных кредитов в некоторых сервисах. Но мои 2.990₽ — это цена за скорость.
Как сделать рекламный ИИ-ролик в нейросетях: ВЫВОДЫ
После этого эксперимента мои выводы такие:
- Любой человек без профильного образования может за два вечера и 2.990₽ собрать рекламный ролик, который ещё недавно потребовал бы команды, техники и заметно бОльшего бюджета
- ИИ уже отлично подходит для решения быстрых рекламных задач (для СММ, в частности), но пока не заменяет классический продакшен полностью. Думаю, что это вопрос времени...
- Сам процесс всё ещё строится на итерациях, отборе удачных кадров / видеоотрезков и финальном монтаже, благодаря которому можно некоторые "косяки" нейросети закрыть. То есть кнопки "сделать красиво и с первого раза" здесь пока (увы!) нет
- Главные проблемы ИИ тоже никуда не делись (но их стало меньше): артефакты в движении, нестабильность деталей и не всегда точный контроль сцены. Поэтому если нужен ролик под жёсткий бренд-гайд и полный контроль каждого кадра, классическая съёмка всё ещё сильнее
- Если задача — быстро и недорого собрать эффектный визуал для соцсетей, лендинга или теста гипотезы, ИИ уже выглядит как вполне рабочий инструмент