Кто сейчас не пробует на вкус нейросети?
Только ленивый. Картинки, видео, озвучка, тексты, сценарии, лонгриды, карточки для маркеплейсов, ии-блогинг и другие задачи бизнес и специалисты "закрывают" с помощью искусственного интеллекта. В этом году прогнозируют его "звездный час". Спрос на ИИ-креаторов и ИИ-артистов в позитивной динамике. Обучающие курсы по созданию ИИ-визуала размножаются на клеточном уровне.
В последнее время я очень глубоко погрузилась в тему ИИ креатива и «проглотила» много разнообразных обучающих уроков по созданию видео. Если с генерацией картинок мне все уже было понятно и я успешно применяю свои навыки на деле, то по созданию видео у меня было много вопросов, тем более сейчас большое количество видеогенераторов с разным набором инструментов и возможностями как техническими, так и творческими.
На сегодняшний день вариантов по созданию видеоролика два: первый - это когда собирается большой продакшн - продюсер, сценарист, режиссер, видеооператор, стилисты, визажисты, герои, ассистенты на локации и снимают в реальности за очень большой чек; второй - когда ИИ-креатор собирает всю эту историю с помощью нейросетей за меньший чек. Мы с вами рассматриваем второй.
У меня была задача опробовать формат видео 21:9. Почему именно такой? Потому что он самый кинематографичный и воспринимается зрителем как что-то настоящее, а не вот этот вот вертикальный клиповый скролл-формат, на котором задерживаются максимум на 10 сек, а то и на 3 сек. Он тоже имеет место быть, просто задачи разные.
Мне больше нравится тот формат, что побольше, где можно насладиться атмосферой и считать смысл, а не за 3 секунды пойматься на хук "А вам так слабо?" и попытаться уловить все 10 движений, которые по 1 сек. ''нарезаны" в видео.
Но, как оказалось, короткие видео с помощью искусственного интеллекта сделать гораздо проще, чем видео более 15 секунд, но давайте перейдем к делу и разберем алгоритм создания видеоролика на моем примере.
Если у вас задача побаловаться и получить двигающуюся картинку из готовой фотографии, то вы идете в любой чат-бот, их много бесплатных, и развлекаетесь, но будьте готовы, что если на ожившей картинке вы будете улыбаться, то скорее всего вы себя не узнаете. Если вам интересно, как создать видео с сюжетом и смыслом, то читаем дальше.
ШАГ 1. ИДЕЯ
Да, идея - это первый шаг. И много зависит от того, для кого вы делаете этот ролик. Если для заказчика, то отталкиваемся от его продукта (как в моем случае) или услуги, или ценности, которую он планирует донести до аудитории.
Если ролик вы делаете для себя, хотите реализовать свою фантазию, то берете за основу главную мысль и ведете ее по дальнейшему алгоритму.
Если не для заказчика и своих идей нет, вдохновляйтесь на Пинтересте или других площадках, фильмы и книги тоже годятся.
В моем случае была задача создать имиджевый видеоролик для жакета архитектурной формы, где форма - главная ценность продукта. Нужно было обыграть концепт и воплотить его в видео через историю.
Мыслим по схеме: кто - что делает - с кем делает - почему делает - зачем делает - как это будет выглядеть - что в итоге - какой в этом смысл.
Так идея переходит в концепцию.
Теперь вам нужен сценарий. Чувствуете, как вы встаете на режиссерские рельсы?
На этом этапе вам уже помогут текстовые модели искусственного интеллекта: ChatGPT, Claude, Gemini. Сформулируйте модели задачу: "Хочу создать видеоролик, у меня есть такая-то мысль, такое-то видение, помоги разработать идею и написать сценарий..." И он поможет. Пробуйте разные модели, увидите как они по-разному себя ведут. Выбирайте для себя ту, с которой вы лучше другу друга понимаете.
Я побеседовала со всеми тремя этими моделями ИИ - Chat GPT, Gemini, Claude, позадавала вопросы, попросила подкинуть идеи и написать сценарий.
В итоге от всех получила примерно одинаковые усредненные скучные варианты, сделав вывод, что человеческой фантазии обученным алгоритмам не видать, а то, что они знают, это уже где-то было до 2026 года.
Но вы обязательно попробуйте, это неотъемлемая часть процесса. Даже если вы не получите гениальной идеи или сценария, вектор определенно будет задан, потом сами доработаете.
Скажу вам често, забегая вперед, начальная и финальная версии сценария и раскадровок будут отличаться. Не потому, что вы плохой сценарист, а потому что нейросети не смогут воплотить все ваши творческие фантазии.)
ШАГ 2. ПЕРСОНАЖ(и)
Идея сформулирована, в ней прописан стиль, есть сценарий, в сценарии фигурируют герои - персонажи. Где их взять? СОЗДАТЬ.
Мультипликационный, фантастический или реалистичный видеоролик будет - вы проработали на этапе идеи. В моем случает все должно быть реалистично.
- Гиперреализм - любимое мое слово в промпте. Кто не знает, что такое промпт - это текстовый запрос, техническое задание нейсросети, описывающее, что именно нужно сделать. И гиперреализм - это самый сложный формат, особенно, если вы создаете его с реальным человеком.
Вы не создадите видеоролик, особенно если он длинный по хронометражу, так, чтобы ваш персонаж во всех движениях был похож на себя, если кропотливо и детально не проработаете все его черты и эмоции до оживления картинок. Мы сейчас говорим про видеоролик, созданный полностью нейросетями, а значит будем оживлять созданные нами изображения.
Итак, модель у меня была, я как раз создала для своей базы моделей новую девушку. Под концепцию она очень хорошо подходила.
Сначала я подобрала к жакету образ - леггинсы со штрипками, мюли, серьги, кольцо и золотой клатч, который пригодился в следующем, вертикальном видео в студии. Оба видео связаны общей темой и создают единое смысловое поле.
Затем я сделала моей модели макияж, маникюр, прическу, одела ее в нужный образ, «отсняла» ее в студии на нейтральном фоне и морально подготовила к имиджевой съемке в саванне.
Идея с леопардом возникла из кольца - аксессуара, который я подобрала для образа к жакету, сразу увидела переход сцен через него в начале видео. Леопард - саванна - лаунж- закат - логичная цепочка.
Все манипуляции с моделью - от ее создания до последнего штриха в ее образе были выполнены в нейросети Nano Banana - самая реалистичная на сегодняшний день модель. Как бы не был хорош Midjourney, но для наших целей он слишком фантазийный художник.
Итак, персонажа создали, накрасили, одели, подготовили к следующему этапу - внедрению в сценарий.
ШАГ 3. СТОРИБОРД (раскдаровка)
К этому моменту у вас уже есть сценарий и самое время сделать по нему раскадровку. Вариантов три - хорошо, когда есть выбор.
1 вариант - попросить текстовую нейросеть написать 1 промпт для Nano Banana чтобы она сгенерировала сториборд в одном изображении - некий коллаж с набором сюжетных картинок в нужной последовательности - той, по которой вы потом будете "собирать" видео. Если вам по сценарию нужно 15 сцен, значит в раскадровке их и должно быть 15. Будьте готовы к тому, что сюжеты сцен могут быть не годными, генераций потребуется несколько. С каждой генерации выбираете нужные вам кадры и создаете их по отдельности, так как по коллажу видеогенераторы вам видео не создадут.
2 вариант - пропустить генерацию сториборда и перейти сразу к созданию отдельных кадров, то есть на каждый кадр/сцену вы пишете сами или с помощью текстовых помощников отдельный промпт и генерируете картинку в той же Nano Banana. И так 15 сюжетных сцен. Далее все по очередности их оживляете и "собираете" на постпродакшене видео.
3 вариант - наиболее творческий. Тот, по которому я создавала именно это видео. Его суть в том, что ты не прописываешь детальный покадровый сценарий, а пишешь историю на ходу, в зависимости от того, как видеоредактор сгенерирует ключевые кадры.
Ты представляешь общую картину и замысел, а детали дорабатываешь в процессе. Я сама набросала раскадровку из 5 базовых планов (крупный, средний, дальний, боковой, сверху), от которых нужно было отталкиваться, создала в Nano Banana изображения, подготовила промпты и пошла в видеогенераторы.
И вот здесь начался самый интересный творческий процесс…
ШАГ 4. ГЕНЕРАЦИЯ ВИДЕО
Весь смысл создания видео сводится к тому, что ты оживляешь подготовленные картинки, статику превращаешь в движение. Но делаешь это не единоразово, все видео целиком с одного захода, так нейросети еще не умеют, а делаешь все последовательно, создавая части будущего видео, потом собирая его в монтажной программе.
Я использовала два видеогенератора, которые на данный момент являются самыми прогрессивными Kling 3.0 и Seedance 2.0.
В Kling 3.0 есть несколько режимов - Image to Video, где вы подгружаете 1 картинку, пишете в промпте что должно происходить в этом фрагменте видео, отправляете запрос и получаете результат; следующий режим - Keyframes, в котором вы подгружаете 2 изображения, где действие будет трансформироваться из первого изображение во второе, также прописываете задачу и отправляете, третий режим - Motion, где вы подгружаете изображение и видео, это если вам нужно, чтобы персонаж с фото двигался как на видео. Третий вариант удобен для генерации танцевальных видео, в моем случае он не понадобился.
Что касается Seedance 2.0, то эта модель более реалистична и справляется с созданием видео сразу из нескольких изображений. Здесь очень важно правильно написать структурный промпт с таймингом, движением камеры, стилем и точными формулировками, которые нейросеть правильно поймет, иначе будет "видеокаша". И всегда результат будет не предсказуем. Поэтому делаем много кусочков видео, из разных генераций потом "нарежете" наиболее удачные эпизоды.
Промпты для оживления видео также пишем в диалоге с текстовой нейросетью.
Основные части видео были созданы мной в Seedance, но пару сцен мне пришлось таки сделать в Kling, потому как первый упорно не хотел давать мне то движение, которое мне было нужно. У этих двух моделей разная степень реализма и цветокоррекция, поэтому на постпродакшене пришлось повозиться со сведением единого колора. Но пробуйте обе!
Все удачные видео скачиваем, складываем в папочку и готовимся к монтажу.
ШАГ 5. ЗВУК
Если раньше мы брали чьи-то готовые музыкальные треки и накладывали их на видеоряд, то сегодня нейросети позволяют создать индивидуальную музыку конкретно для вашего видео/проекта.
Вам достаточно попросить текстовые помощники проанализировать стиль ваших изображений (подгрузите ему серию и пропишите концепцию) и написать запрос для генератора звуков Suno, чтобы создать музыкальный трек. Он может быть как с голосом, так и только инструменталка. И качество звука Suno выдает на высшем уровне.
ШАГ 6. МОНТАЖ
Самый удобный и простой вариант смонтировать видео и наложить на него звук - это CapCut - бесплатное универсальное приложение для редактирования видео. Интуитивно простой интерфейс, видеоуроки в интернете в доступе. Подстраивайте действия на ваших видеофрагментах под битовый ритм музыки, делайте цветокоррекцию, если она нужна, сохраняйте в любом качестве.
Кстати, о качестве. Видеогенераторы - инструмент не из дешевых, чем выше качество вы задаете в настройках модели для генерации видео (720, 1080, 2K, 4K, 8K), тем больше денег вы отдадите, а генерация не одна, их много и далеко не все удачные. Поэтому рекомендация - создаем наши фрагменты в качестве 720 (но из изображений 2K), а затем при сохранении готового видео из CapCut выбираем нужное качество (2K, 4K, 8K, HDR).
И да, видео форматом 21:9 или 16:9 лучше смотреть на большом мониторе, в совокупности со звуком долби диджитал (очень странно выглядит написание не на английском), атмосфера и эмоция передаются очень круто.
И мои важные выводы на сегодняшний день:
- 1 - без человеческого воображения, фантазии, креативности и тотального контроля над нейросетями, результат будет неудовлетворительный или усредненный;
- 2 - качество видео напрямую зависит от хорошо проработанных и подготовленных изображений;
- 3 - правильно заданные вопросы и правильно написанные промпты - 90% успеха.
Что касается моего видео. Я сделала несколько генераций основных сцен, которые набросала вначале, затем дописала промежуточные действия, которых мне не хватало, долго мучилась с продеванием перстня в цепочку и с ловлей леопардом этого перстня в воздухе, но в итоге что получилось, то получилось. Конечно, всегда есть что "почистить" и к чему стремиться. Главное - понимать алгоритм действий и набор инструментов.
Основной сюжет этого видеоролика построен на слогане "Содержание меняется - форма остается". Если помните, в начале статьи в шаге 1 я рассказала вам о ценности продукта - архитектурной форме. Посмотрите само видео и поймете, куда делось содержание. Пишите в комментариях кто как понял.
В статье видео не подгружается, оно будет здесь.
Лайки за мои старания приветствуются.)
Так же меня можно наблюдать на разных площадках из списка ниже, подписывайтесь!
https://max.ru/c/-71027215291831/AZ4H-mmIBA4
https://www.instagram.com/angel_dance_photo?igsh=MW5sNHJuZTV3bHVzaQ%3D%3D&utm_source=qr
https://vk.ru/angel_dance_photo