Найти в Дзене
Большое путешествие

Как создать ИИ-ролик на психологическую тему?

Нам понадобится один единственный агрегатор нейронок. Рекомендую syntx.ai Берите сразу тариф ELITE - там есть безлимитные инструменты - которые очень пригодятся многократно и достаточное количество токенов. Работать будем с тремя вкладками:
1. На первой будем генерировать Сценарий и Промты: https://syntx.ai/text/gemini 2. На второй изображения: https://syntx.ai/image/banana 3. На третьей видео: https://syntx.ai/video/seedance Рекомендую в первую очередь использовать эти нейронки - это топ на текущую дату. Запрос для создания сценария в Gemini Ты опытный сценарист вирусных роликов в психологической теме. Составь сценарий для видео, которое я буду генерировать с помощью ии. Закадровый текст не более 500 символов. Вот идея:
"вы можете говорить клиенту одно, но ваше тело может показывать совсем другое и клиент будет реагировать на ваше тело, а не на слова, либо у него возникнет раздвоение - что терапевт говорит одно, а телом показывает другое - чему верить? - про невербальные сообщени
Оглавление

Нам понадобится один единственный агрегатор нейронок. Рекомендую syntx.ai

Берите сразу тариф ELITE - там есть безлимитные инструменты - которые очень пригодятся многократно и достаточное количество токенов.

Работать будем с тремя вкладками:
1. На первой будем генерировать Сценарий и Промты:
https://syntx.ai/text/gemini

2. На второй изображения: https://syntx.ai/image/banana

3. На третьей видео: https://syntx.ai/video/seedance

Рекомендую в первую очередь использовать эти нейронки - это топ на текущую дату.

1. Создадим сценарий

Запрос для создания сценария в Gemini

Ты опытный сценарист вирусных роликов в психологической теме. Составь сценарий для видео, которое я буду генерировать с помощью ии. Закадровый текст не более 500 символов. Вот идея:

"вы можете говорить клиенту одно, но ваше тело может показывать совсем другое и клиент будет реагировать на ваше тело, а не на слова, либо у него возникнет раздвоение - что терапевт говорит одно, а телом показывает другое - чему верить? - про невербальные сообщения.
например, "я очень вам рада" и при этом закрытая поза и отвернутый в сторону корпус, отведенный взгляд и замешательство клиента.
и в конце что-нибудь про учитесь замечать во время работы свои настоящие реакции и свои телесные сигналы."

Gemini предложит сценарий - подкрутите его уже сами под себя.
На будущее: Если ролик планируется дольше 30 секунд, то закиньте запрос в несколько нейронок. Объедините лучшие сцены в один сценарий.

2. Создаем первое изображение

ЭТО ВАЖНО! Прямо в чате Gemini со сценарием продолжаем писать (не создаем новый чат!):


Составь промт для создания первого кадра-изображения через Nano Banana, чтобы дальше я могла получить цельную мини-историю, задавая ракурс, движение камеры и действия персонажей.
Изображения в стиле анимации в духе утонченного иллюстраторского стиля.
На изображении должно быть: / здесь описание первого кадра /

Мне нравится дополнять промт следующим описанием стиля:

Artistic style: elegant psychological illustration, soft, textured brushstrokes, light watercolor washes, subtle ink outlines, a muted, earthy palette (ochre, terracotta, sage green), noticeable paper grain, an intimate and thoughtful atmosphere, a two-dimensional illustrative style inspired by contemporary book illustration.

Получаются изображения в таком стиле:

Ваш промт необходимо проверить. Воспользуйтесь Google переводчиком. При необходимости скорректируйте промт.

Я использовала промты на английском. Промты на русском Nano Banana понимает прекрасно. Я просто перестраховываюсь.

2.1 Переходим на вторую вкладку Nano Banana

При создании изображений и видео каждый раз начинаем новый чат (слева в списке чатов).

В Нано Банане справа в настройках указываем:

-3

В 90% случаев эта нейронка создаст идеальный кадр. Если генерирует вообще не то, что нужно, пробуйте в следующем порядке:
1.
Sora
Она прекрасна. Но она не делает 9:16 - потом в Нано Банане просто дорисуете в нужный формат (пишите мне, если нужно будет подсказать, как это сделать. Там все просто).

Посему в настройках так:

-4

2. Imagen4

Также, как и в Нано Банане указываем соотношение сторон 9:16

3. Seedream

-5

Кайф же, да? В одном агрегаторе попробовали несколько нейронок!

Если это не помогло - корректируем промт с помощью Gemini - возвращаемся на первую вкладку и просим:

Nano Banano с помощью промта:
"здесь указываем промт, с помощью которого генерировали изображение"
генерирует
"описываем, что не нравится".
Скорректируй промт, чтобы на изображении было "так то".

3. Оживляем видео с помощью Seedance

ЭТО ВАЖНО! Чтобы избежать отклонений генерации видео через некоторые AI в психологической тематике, в промтах нужно:

  1. Убрать прямое упоминание людей («терапевт», «клиент»).
  2. Убрать конкретные социальные роли и контексты («терапия», «сессия»).
  3. Можно сделать акцент на абстрактных формах, энергиях и метафорах.

Самый простой и рабочий способ обойти фильтры, сменив профессиональный контекст на бытовой и дружеский. Используйте слова "подруга" и "друг", "общение между двумя друзьями".

Итак, переходим на третью вкладку Seedance.

К сообщению прикрепляем сгенерированное изображение.

-6

В промте рекомендую использовать короткое простое понятное описание.

Например:

В комнате женщина сидит на кресле. В кадр заходит мужчина и садится в кресло напротив женщины.

В настройках отключите Аудио - оно всё равно будет в данной модели. Но, чтобы не переплачивать - можно отключить.

-7

Для более сложных сцен используйте ДВА кадра - первый, с чего начинается сцена. И последний - к чему сцена должна прийти.

4. Создаем последний кадр сцены

Необходимо сгенерировать кадр, которым закончится сцена.

Со всеми дальнейшими генерациями изображений справится Нано Банана.

Итак, находимся на второй вкладке с Nano Banana

Прикрепляем к сообщению наше первое сгенерированное изображение:

-8

И пишем промт, желательно простыми словами. Если система вас не понимает, то идем в Gemini и просим составить промт для изменения изображения.

Также, с этого изображения можно взять крупный план женщины или мужчины для создания новых сцен.
Прикрепляем референс (изображение основу) к сообщению в Нано Банане. И вот пример промта:

Close-up portrait of a warm smiling woman, soft golden glow emanating from her chest area, symbolizing sincerity. Elegant 2D illustration style, gentle watercolor textures, fine ink outlines, warm muted palette, visible paper grain. Intimate and kind atmosphere

Получаем:

-9

5. Создание видео с первым и последним кадром

В Gemini к сообщению прикрепляем получившиеся изображения и пишем:

Теперь напиши промт для создания видео в Seedream, чтобы получить следующее:
мужчина и женщина сидят друг напротив друга. женщина смотрит в сторону. она перекрещивает руки на груди кладет ногу на ногу. холодные тона начинают заполнять комнату. Мужчина сидит спиной к нам. Мы видим часть его лица. Взгляд выражает замешательство и непонимание.

В Seedream прикрепляем ОБА кадра и промт.

6. Дополнение для продвинутого уровня:

1. Для плавного перехода из одной сцены в другую - берите не сгенерённую картинку последнего кадра для видео. А делайте принтскрин последнего кадра из ВИДЕО сцены - и берите его, как первый кадр для следующей сцены. Если тут не понятно - пишите в комментах, расскажу другими словами.

2. В Syntx есть улучшающий качество видео инструмент - Topaz AI.

Все итоговые сцены, которые вы будете собирать в ролик - прогоните через Топаз.

3. Для изображений тоже есть похожий инструмент - Clarity.

7. Если в сцене говорят персонажи

Здесь несколько вариантов. Рассмотрим тот, где нужен один голос во всём ролике, а не так, чтобы получилось, что в одной сцене был один голос, а в другой сцене другой голос у одного персонажа.

Воспользуемся Синтезатором речи. Он неплох, если долго мучиться.

Правда его нет в браузере, он в телеграм-боте Syntax.

В боте нужно выбрать меню -> /audio -> синтез речи

-10

И дальше по шагам. Вносим реплику:

-11

Нажимаем Выбрать голос

-12

И дальше период проб и ошибок. Когда определились с голосом, необходимо отладить опции:

-13

Здесь нужно играться.

Скорость - тут понятно.

Стабильность - если ползунок ближе к нулю, то это может привести к неожиданным и бурным реакциям персонажа. Ползунок ближе к 100% - голос будет однообразным и могут не передавать гамму эмоций.

Сходство - сходство с голосом примера.

Стилистическое преувеличение - 100% может добавить причмокиваний и даже "тарабарщин". Syntx советует держать на уровне 0%.

Делитесь, какие синтезаторы речи вам нравятся больше всего?

8. Озвучка персонажа в видео

Два хороших пути:

8.1 Генерация готового видео + наложение озвученной Реплики

Когда нужны определенные сложные движения - сгенерируйте сначала видео. А потом наложите аудио через Синхронизатор губ. Он тоже пока что только в Телеграм-боте:
Меню -> /video -> Синхронизатор губ

-14

8.2 Изображение + Аудио

1. Heygen - средненько, может подойти для обучающей тематики.

2. Hedra

3. D-ID Аватары

4. Higgsfield Speak - крутейший, но дорогущий. Протестируйте промты сначала на более дешевых.

5. Есть еще вариант генерации видео сразу с голосом сразу через VEO 3.1. Но голос у персонажа в разных сценах может быть разным. Пример промта ниже - просто переделайте под себя:

Анимация: Естественная «живая» мимика: мягкий блеск глаз, опечаленная мимика, лёгкие движения бровей и головы. На фразе «Срочный ремонт нужен» — Дед Мороз с досадой показывает на сани, стоящие позади него. На слове «доставка» — Дед Мороз показывает легким движением руки на мешок с подарками, стоящий слева от него. На фразе «Посмотришь?» — Дед Мороз смотрит прямо в камеру с надеждой.
Голос: Тёплый, добрый, слегка хрипловатый пожилой мужской голос, глубокий мягкий бас с ноткой волшебного смешка. Чёткое, приятное, выразительное русское произношение. Интонация серьезная и искренняя, с небольшими эмоциональными паузами, как в живой речи.
Звук и атмосфера: Лёгкий праздничный эмбиент: тихий звон колокольчиков и вьюги. Громкость: голос +6 дБ над фоном.
Липсинк: Высокоточная синхронизация губ под русские фонемы, естественные движения челюсти, щёк и губ без рывков и эффекта «наклейки рта».
Текст (говорит Дед Мороз): Молодой человек, не до шуток! Срочный ремонт нужен. А у меня доставка по всему часовому поясу!... Посмотришь?]

9. Создание музыки

В Gemini пишем запрос:

Cоставь промт до 200 символов для suno, чтобы он написал музыку, подходящюю для фона данного полного ролика

В SUNO указываем промт и настройки:

-15

Пишите, пожалуйста, обязательно, что необходимо добавить в статью? Или рассказать в отдельной статье?