Как сделать рекламный ИИ-ролик Ford Mustang с помощью нейросетей за 2.990₽ — без съёмок, студии и команды

13 апреля13 апр

4 мин

🎥Видео Ford Mustang GT Решил проверить, можно ли собрать в нейросетях рекламный автомобильный ролик без команды, камеры, коптера и большого бюджета. В итоге у меня получился ИИ-видеоролик для Ford Mustang, на который ушло 2 вечера и 2.990₽ (даже боюсь предположить, сколько может это стоить в классическом офлайн-продакшене). И это притом, что я не режиссёр, не оператор и не специалист по видеорекламе. Ниже — весь процесс, инсайты, ошибки и итоговая смета. Перед тем, как отправить свой запрос (ПРОМПТ-запрос) к нейросети на генерацию изображения, видео, музыки (чего угодно) обязательно "проконсультируйтесь" с тем же ChatGPT (как в моём случае): опишите задачу, вашу идею, какой результат хотите получить и в каком виде, попросите дать рекомендацию и, наконец, написать ПРОМПТ. Почему это важно: у вас в голове может быть "красивый вечерний свет" или "красивое движение камеры", а нейросети лучше понимают более точные формулировки вроде golden hour, low-angle shot, tracking shot и так далее. Т

Оглавление

Как создать ИИ-видеоролик: этапы
💡Инсайт для новичков: сначала переведите идею на язык нейросетей
Этап 1. Подготовка: поиск референсов машины и локации

🎥Видео Ford Mustang GT

Решил проверить, можно ли собрать в нейросетях рекламный автомобильный ролик без команды, камеры, коптера и большого бюджета.

В итоге у меня получился ИИ-видеоролик для Ford Mustang, на который ушло 2 вечера и 2.990₽ (даже боюсь предположить, сколько может это стоить в классическом офлайн-продакшене). И это притом, что я не режиссёр, не оператор и не специалист по видеорекламе.

Ниже — весь процесс, инсайты, ошибки и итоговая смета.

Как создать ИИ-видеоролик: этапы

Подготовка — поиск референсных изображений: машины и локации
Генерация изображений в Nano Banana 2: визуальный паспорт авто, карта локаций (различные виды и ракурсы местности), итоговые ключевые кадры
Генерация видео в VEO 3.1 Fast
Генерация аудио: фоновый трек (SUNO), закадровый голос (ElevenLabs), характерные звуки и другие эффекты (Интернет)
Финальный монтаж в CapCut

💡Инсайт для новичков: сначала переведите идею на язык нейросетей

Перед тем, как отправить свой запрос (ПРОМПТ-запрос) к нейросети на генерацию изображения, видео, музыки (чего угодно) обязательно "проконсультируйтесь" с тем же ChatGPT (как в моём случае): опишите задачу, вашу идею, какой результат хотите получить и в каком виде, попросите дать рекомендацию и, наконец, написать ПРОМПТ.

Почему это важно: у вас в голове может быть "красивый вечерний свет" или "красивое движение камеры", а нейросети лучше понимают более точные формулировки вроде golden hour, low-angle shot, tracking shot и так далее.

То есть текстовая нейросеть здесь выступает как переводчик: помогает превратить вашу идею в понятный рабочий ПРОМПТ.

Этап 1. Подготовка: поиск референсов машины и локации

Для примера я выбрал автомобиль (мечты... :) — Ford Mustang GT и локацию — альпийский серпантин. Определил примерную длительность (около 60 секунд) и настроение ролика (скорость, свобода, драйв).

Затем я скачал понравившиеся референсы:

Референсное изображение "Альпийский серпантин"

Этап 2. Генерация изображений в Nano Banana 2

2.1 Визуальный паспорт авто

Визуальный паспорт автомобиля "Ford Mustang GT"

Сначала я сгенерировал сам Ford Mustang:

разные ракурсы
разная посадка камеры
крупные планы элементов кузова

2.2. Карта локаций

Потом отдельно собрал саму среду:

разные планы дороги
повороты серпантина
виды сверху
перспективные кадры

2.3. Ключевые кадры

И только после этого начал интегрировать машину в среду, чтобы получить финальные ключевые кадры (keyframes) — статичные сцены:

Ключевые кадры (keyframes) для ИИ-ролика

Именно на основе этих кадров были сгенерированы видеоотрезки.

Этап 3. Генерация видео в VEO 3.1 Fast

Когда ключевые кадры были готовы, я перешёл в VEO 3.1 Fast и начал "оживлять" сцены.

В итоге для создания финального ролика были задействованы 23 видеофрагмента, НО(!) чтобы их получить, пришлось сделать около 50 генераций. Ниже — скрин папки с некоторыми видеоотрезками:

Почему понадобилось столько попыток? Три причины:

мои ошибки в написании ПРОМПТов
ошибки самих нейросетей (периодически могут появляться артефакты — различные объекты, предметы, искажения и проч.)
некоторые кадры получались неплохими (композиция, планы, ракурсы), но просто недостаточно эффектными

То есть в процессе создания ИИ-видео больше всего времени уходит на то, чтобы сравнить и отобрать наиболее подходящий видеофрагмент (а, при необходимости, повторить генерацию, чтобы получить лучший вариант).

Этап 4. Генерация аудио

Отдельно я собрал звук. Здесь было несколько задач:

фоновый музыкальный трек
звуки взаимодействия с машиной, например открывание двери, звук двигателя и т.п.
закадровый голос

Фоновую музыку я сгенерировал в нейросети SUNO (попросил сгенерировать динамичный инструментальный трек без вокала, под автомобильный ролик).

Дополнительные звуки подбирал и добавлял уже как часть общей звуковой сборки (что-то нашёл в Интернете, что-то сгенерировал). Именно они делают ролик более "живым": без них даже хорошая картинка ощущается сырой. Закадровый голос сделал в ElevenLabs.

Этап 5. Финальный монтаж видеоролика в CapCut

Финальный монтаж ИИ-видеоролика в CapCut

Когда изображения, видео и звук были готовы, я собрал всё в CapCut. На этом этапе уже решается финальное впечатление:

порядок кадров
ритм монтажа
стыковка фрагментов
синхронизация со звуком
добавление эффектов и переходов (если нужно)

То есть нейросети делают заготовки, но именно монтаж превращает это в ролик, который можно показать как законченную работу.

Сколько в итоге стоил ролик

Если не спешить, можно сделать и дешевле (и даже полностью бесплатно) — за счёт предоставляемых бонусных кредитов в некоторых сервисах. Но мои 2.990₽ — это цена за скорость.

Как сделать рекламный ИИ-ролик в нейросетях: ВЫВОДЫ

После этого эксперимента мои выводы такие:

Любой человек без профильного образования может за два вечера и 2.990₽ собрать рекламный ролик, который ещё недавно потребовал бы команды, техники и заметно бОльшего бюджета
ИИ уже отлично подходит для решения быстрых рекламных задач (для СММ, в частности), но пока не заменяет классический продакшен полностью. Думаю, что это вопрос времени...
Сам процесс всё ещё строится на итерациях, отборе удачных кадров / видеоотрезков и финальном монтаже, благодаря которому можно некоторые "косяки" нейросети закрыть. То есть кнопки "сделать красиво и с первого раза" здесь пока (увы!) нет
Главные проблемы ИИ тоже никуда не делись (но их стало меньше): артефакты в движении, нестабильность деталей и не всегда точный контроль сцены. Поэтому если нужен ролик под жёсткий бренд-гайд и полный контроль каждого кадра, классическая съёмка всё ещё сильнее
Если задача — быстро и недорого собрать эффектный визуал для соцсетей, лендинга или теста гипотезы, ИИ уже выглядит как вполне рабочий инструмент

💬Для связи: Telegram // Max