Экспертное руководство от лучших мировых практик
ГЛАВНЫЙ ПРИНЦИП: «Сценарий для AI - это не текст для чтения. Это технический чертёж для генерации»
В отличие от Голливуда, где сценарий читают люди - здесь твой сценарий должен быть понятен нейросети, монтажёру и зрителю одновременно.
ШАГ 1: ИДЕЯ И СТРУКТУРА (Story Architecture)
Структура - это не ограничение. Это скелет, без которого тело падает.
Три акта работают везде: в «Крёстном отце», в рекламе Nike за 60 секунд и в твоём AI-ролике. Это не теория - это закон восприятия человеческого мозга.
ТРЁХАКТНАЯ СТРУКТУРА
АКТ 1 - ЗАВЯЗКА (25% хронометража)
↓
Ответь на три вопроса: КТО? ГДЕ? КАКАЯ ПРОБЛЕМА?
Зритель должен понять мир и почувствовать напряжение.
АКТ 2 - РАЗВИТИЕ (50% хронометража)
↓
Конфликт нарастает. Герой пытается - не получается.
Ставки растут. Зритель не может оторваться.
АКТ 3 - РАЗВЯЗКА (25% хронометража)
↓
Кульминация — самый сильный момент.
Решение. Финальный образ, который остаётся в памяти.
Пример на реальном ролике (60 сек, тема: онлайн-обучение):
АКТ 1 (0-15 сек):
Человек за столом ночью. Стопка книг. Усталость на лице.
Смотрит на экран с надписью: "Вакансия закрыта."
→ КТО: уставший специалист. ГДЕ: дома. ПРОБЛЕМА: нет роста.
АКТ 2 (15-45 сек):
Открывает ноутбук. Начинает учиться.
Сначала непонимание - потом первые успехи.
Смена дня и ночи за окном. Время летит. Прогресс.
АКТ 3 (45-60 сек):
Новое рабочее место. Уверенный взгляд.
Финальный кадр: те же руки - но теперь они создают, а не листают отказы.
ФОРМУЛА КОРОТКОГО РОЛИКА (до 2 минут)
Это более точная версия трёх актов для социальных сетей и AI-контента:
Разбор каждого элемента:
🪝 КРЮЧОК (0–3 сек) - самое важное
Первые 3 секунды решают: смотрят дальше или листают.
Используй один из приёмов:
ВИЗУАЛЬНЫЙ ШОК: Неожиданный образ, который вызывает вопрос
ПРОВОКАЦИЯ: Утверждение, с которым хочется поспорить
НЕЗАВЕРШЁННОСТЬ: Начни действие - не покажи конец
КРУПНЫЙ ПЛАН: Лицо, глаза, деталь - создаёт мгновенную связь
Примеры крючков:
❌ Слабо: "Привет! Сегодня я расскажу о нейросетях..."
✅ Сильно: Крупный план - палец нажимает кнопку.
Весь экран вспыхивает. Тишина.
Текст на экране: "Это заменило 3 сотрудников."
❌ Слабо: Логотип компании, музыка, название
✅ Сильно: Человек смотрит в камеру. Пауза.
"Я потратил 5 лет чтобы понять то, что ты узнаешь за следующие 60 секунд."
😣 ПРОБЛЕМА (3–10 сек) - зритель должен узнать себя
Не объясняй проблему - ПОКАЖИ её.
Нейросеть генерирует образы, а не лекции.
❌ "Многие люди не умеют управлять временем"
✅ Визуальный ряд:
- Будильник 6:00. Снова нажать "отложить"
- Стол в хаосе. Незакрытые вкладки браузера
- Человек смотрит в потолок в 2 ночи
🔄 ПУТЬ (10–50 сек) - сердце ролика
Это самая длинная часть. Здесь живёт эмоция.
Покажи трансформацию через КОНТРАСТ:
ДО → ПОСЛЕ
БЫЛО → СТАЛО
БОЛЬ → ОБЛЕГЧЕНИЕ
НЕЗНАНИЕ → ПОНИМАНИЕ
Структура пути (для 40 секунд = ~8 сцен по 5 сек):
Сцена 1-2: Герой делает первый шаг (неуверенно)
Сцена 3-4: Первые трудности, момент сомнения
Сцена 5-6: Прорыв - что-то меняется
Сцена 7-8: Уверенное движение вперёд
✅ РЕШЕНИЕ (50–90 сек) - эмоциональная выплата
Зритель ждал этого с первой секунды.
Не торопи. Дай образу "дышать" 3–5 секунд.
Финальный кадр этого блока = самый сильный визуал ролика.
📣 ПРИЗЫВ (последние 3–5 сек) - одно действие
Одна кнопка. Один текст. Одно действие.
Никогда не давай два призыва одновременно.
❌ "Подписывайся, ставь лайк, делись с друзьями,
пиши в комментариях и переходи по ссылке"
✅ "Ссылка в описании → забери бесплатный гайд"
✅ "Подпишись - каждую неделю один мощный инструмент"
ШАГ 2: КАК ПИСАТЬ СЦЕНАРИЙ ДЛЯ AI-РОЛИКА
ПРАВИЛО №1: ОДИН КАДР = ОДНА МЫСЛЬ
Нейросеть - это не режиссёр. Она не додумает за тебя. Она делает ровно то, что написано.
Каждая сцена сценария = один промпт = один видеофрагмент.
Перегруженный промпт даёт размытый, нелогичный результат.
❌ ПЛОХО - всё в одной сцене:
"Мужчина идёт по улице, разговаривает по телефону, начинается дождь, он достаёт зонт и заходит в кафе"
Что сгенерирует AI: хаос из движений, артефакты, потеря качества
✅ ХОРОШО - каждое действие = отдельная сцена:
СЦЕНА 1 (3 сек):
Мужчина идёт по ночной улице. Медленная съёмка.
Нет телефона, нет дождя - только движение.
СЦЕНА 2 (2 сек):
Крупный план - капли дождя падают на мокрый асфальт.
Отражение фонарей в луже.
СЦЕНА 3 (3 сек):
Мужчина открывает дверь освещённого кафе.
Тепло изнутри против холода снаружи.
Почему это работает:
AI генерирует каждый фрагмент с максимальным качеством
В монтаже ты контролируешь ритм и переходы
Можно заменить одну сцену, не переделывая весь ролик
ПРАВИЛО №2: СТРУКТУРА КАЖДОЙ СЦЕНЫ
Каждая сцена = 5 обязательных элементов.
Пропустишь один - получишь брак при генерации.
1. НОМЕР СЦЕНЫ + ТАЙМ-КОД
2. ТИП КАДРА (план + ракурс + движение камеры)
3. ОБЪЕКТ/СУБЪЕКТ (кто или что в кадре, с деталями)
4. ДЕЙСТВИЕ (точное, одно, без лишних слов)
5. АТМОСФЕРА (свет + цвет + звук + настроение)
Шаблон с примером:
СЦЕНА 3 | 0:08–0:12 | ПУТЬ | 4 сек
📷 КАДР: Medium shot, slow dolly in
👤 ОБЪЕКТ: Молодая женщина, 25–30 лет,
тёмные волосы, белая рубашка
🎬 ДЕЙСТВИЕ: Смотрит в окно.
Снаружи дождь. Она не двигается.
💡 СВЕТ: Тёплый жёлтый свет лампы изнутри /
холодный синий свет дождя снаружи
🎨 НАСТРОЕНИЕ: Меланхолия, ожидание, тихая тоска
🔊 ЗВУК: Тихое фортепиано (C minor) +
звук дождя за стеклом
Сравни с плохим вариантом:
❌ ПЛОХО:
"Женщина у окна. Дождь."
Что получишь: Generic stock video качество.
Никакого характера, никакой эмоции.
✅ ХОРОШО (как выше):
Получишь: кинематографичный кадр
с чётким контрастом тепло/холодно,
правильной глубиной резкости,
атмосферным светом.
ПРАВИЛО №3: ВИЗУАЛЬНОЕ МЫШЛЕНИЕ
«Нолан, Вильнёв, Финчер никогда не пишут "красивая сцена". Они пишут что именно красиво, почему и как это снять»
Перед каждой сценой задай себе 4 вопроса:
🎯 Что зритель должен ПОЧУВСТВОВАТЬ?
→ Определи эмоцию ПЕРВОЙ. Потом строй кадр под неё.
Пример: хочу передать одиночество
→ Широкий кадр. Маленькая фигура.
Большое пустое пространство вокруг.
👁️ Что зритель должен УВИДЕТЬ?
→ Один главный объект в кадре.
Всё остальное - фон, контекст.
Пример: одиночество человека в городе
→ Человек на скамейке.
Вокруг - размытые силуэты прохожих.
🧩 Как эта сцена связана с предыдущей и следующей?
→ Каждый кадр - звено цепи.
Смотри на три сцены сразу.
Пример:
Сцена 2: крупный план грустных глаз
Сцена 3: человек на скамейке (эта сцена)
Сцена 4: пустая скамейка, человек ушёл
→ Логика: эмоция → причина → последствие
⏱️ Сколько секунд нужно для этой мысли?
→ Простой кадр (деталь, текстура): 2–3 сек
→ Эмоциональный кадр (лицо, реакция): 3–5 сек
→ Масштабный кадр (пейзаж, локация): 4–6 сек
→ Никогда не держи кадр дольше, чем нужно
ПРАВИЛО №4: ЯЗЫК ДЕТАЛЕЙ
Нейросеть - буквальная машина. Пиши как технический специалист, думай как поэт.
❌ АБСТРАКТНО - AI не знает что генерировать:
"Красивый закат. Красиво и атмосферно."
✅ КОНКРЕТНО - AI знает каждый пиксель:
"Golden hour. Солнце в 5° над горизонтом.
Небо: оранжевый переходит в пурпурный к зениту.
На переднем плане: силуэт человека на холме.
Высокая трава колышется от ветра слева направо.
Anamorphic lens flare от солнца.
Shallow depth of field. Film grain."
Детали которые ВСЕГДА усиливают промпт:
СВЕТ: откуда идёт / какого цвета / мягкий или жёсткий
ВРЕМЯ: точное время суток → определяет цвет неба и теней
КАМЕРА: тип объектива / расстояние / движение / скорость
ТЕКСТУРА: материал поверхностей (мокрый асфальт / запотевшее стекло / грубый бетон)
ЦВЕТ: не "синий" а "холодный стальной синий с серым оттенком"
ДВИЖЕНИЕ: быстро/медленно/плавно/резко/вправо/вверх
ГЛУБИНА: что в фокусе / что размыто / расстояние до объекта
Пример: одна и та же сцена - два уровня:
НОВИЧОК:
"Человек бежит по лесу. Страшно."
ПРОФЕССИОНАЛ:
"Medium tracking shot. Man in dark jacket
running through dense forest at night.
Moonlight filtering through tree canopy.
Motion blur on branches.
Hard breathing, breaking twigs - sound design.
Cold blue moonlight. Deep shadows.
Handheld camera, slight shake.
Fear, desperation. Film grain. 4K."
ШАГ 3: ПОЛНЫЙ ШАБЛОН СЦЕНАРИЯ
Заполняй СНАЧАЛА паспорт ролика. Это твой компас.
Без него сцены будут разваливаться.
📋 ПАСПОРТ РОЛИКА
НАЗВАНИЕ: _____________________________
ХРОНОМЕТРАЖ: _________ сек / мин
ЖАНР: _____________________________
ЦЕЛЕВАЯ АУДИТОРИЯ:_____________________________
ГЛАВНАЯ ЭМОЦИЯ: ОДНО слово: ________________
КЛЮЧЕВОЕ СООБЩЕНИЕ: одно предложение: ________
ВИЗУАЛЬНЫЙ СТИЛЬ: _____________________________
ЦВЕТОВАЯ ПАЛИТРА: _____________________________
РЕФЕРЕНСЫ: фильм / ролик / фото: _______
СЦЕНА 1 | 0:00–0:03 | КРЮЧОК | 3 сек
📷 КАДР: [тип кадра + движение камеры]
👤 ОБЪЕКТ: [кто/что + детали внешности/текстуры]
🎬 ДЕЙСТВИЕ: [одно точное действие]
💡 СВЕТ: [тип + источник + цветовая температура]
🎨 НАСТРОЕНИЕ: [эмоция + цветовая палитра]
🔊 ЗВУК: [музыка + SFX + ambient]
🔗 ПЕРЕХОД: [как переходим к следующей сцене]
🤖 AI ВИДЕО ПРОМПТ:
"[готовый промпт на английском]"
📸 ФОТО ПРОМПТ (для референса):
"[готовый промпт для Midjourney/Flux/GPT]"
СЦЕНА 2 | 0:03–0:10 | ПРОБЛЕМА | 7 сек
[повторяй структуру для каждой сцены]
Пример заполненного паспорта (реальный):
НАЗВАНИЕ: "Один шаг"
ХРОНОМЕТРАЖ: 60 секунд
ЖАНР: Мотивационный / Личный бренд
ЦЕЛЕВАЯ АУДИТОРИЯ: Предприниматели 25–40, переживающие кризис
ГЛАВНАЯ ЭМОЦИЯ: НАДЕЖДА
КЛЮЧЕВОЕ СООБЩЕНИЕ: Один правильный шаг меняет всё
ВИЗУАЛЬНЫЙ СТИЛЬ: Denis Villeneuve / минимализм, широкие планы
ЦВЕТОВАЯ ПАЛИТРА: Начало: холодный серо-синий, Конец: тёплый золотой
РЕФЕРЕНСЫ: Arrival (2016), реклама Apple "Think Different"
ШАГ 4: РАСКАДРОВКА (Storyboard)
Раскадровка - это сценарий переведённый в кадры. Здесь ты становишься режиссёром.
ПРАВИЛО 1: 180 ГРАДУСОВ - ЗАКОН ПРОСТРАНСТВА
В AI-генерации это значит:
Если в сцене 3 герой смотрит ВПРАВО - в сцене 4 (то, на что он смотрит) объект должен быть СЛЕВА. Иначе монтаж будет выглядеть дёргано и непрофессионально.
ПРАВИЛО 2: ПРАВИЛО ТРЕТЕЙ - ЗАКОН КОМПОЗИЦИИ
Примеры в промптах:
❌ "человек стоит по центру кадра"
✅ "человек расположен в левой трети кадра, правые две трети - пустое пространство, rule of thirds composition"
❌ "горизонт посередине кадра"
✅ "low horizon line at bottom third, dramatic sky fills upper two thirds"
ПРАВИЛО 3: МОНТАЖНАЯ ЛОГИКА - ЗАКОН НЕПРЕРЫВНОСТИ
Три главных правила монтажа которые обязан знать каждый:
ПРАВИЛО КРУПНОСТИ:
Не режь от крупного сразу к крупному.
Крупный → Средний → Общий (или обратно)
Исключение: смэш-кат (намеренный шок)
❌ Крупный план глаз → Крупный план рук
✅ Крупный план глаз → Средний план человека → Общий план комнаты
ПРАВИЛО ДВИЖЕНИЯ:
Объект движется вправо → в следующем кадре
он должен входить слева
Сцена 5: машина едет → (вправо)
Сцена 6: та же машина въезжает в кадр ← (слева)
В промпте пишем:
Сцена 5: "car driving right to left"
Сцена 6: "car entering frame from left side"
ПРАВИЛО ВЗГЛЯДА:
Персонаж смотрит вправо → следующий кадр показывает то, что справа
Сцена 7: женщина смотрит вправо →
Сцена 8: то, на что она смотрит (с её точки зрения)
ПРАВИЛО 4: ВИЗУАЛЬНЫЙ РИТМ - ЗАКОН ЭМОЦИИ
БЫСТРЫЙ РИТМ (1–2 сек на кадр):
→ Напряжение, экшн, паника, энергия
→ Используй в кульминации и крючке
СРЕДНИЙ РИТМ (3–4 сек на кадр):
→ Стандартное повествование
→ Основная часть большинства роликов
МЕДЛЕННЫЙ РИТМ (5–8 сек на кадр):
→ Размышление, эмоция, красота, вес момента
→ Используй в финале и важных точках
ПРОФЕССИОНАЛЬНЫЙ ПРИЁМ - РИТМИЧЕСКАЯ АРКА:
Медленно → ускорение → кульминация (быстро)
→ резкая остановка → финальный долгий кадр
Зритель физически чувствует эту волну.
Пример ритмической схемы для 60-секундного ролика:
Сцена 1: 4 сек (медленный старт - крючок)
Сцена 2: 3 сек
Сцена 3: 3 сек
Сцена 4: 2 сек ← начинаем ускоряться
Сцена 5: 2 сек
Сцена 6: 1 сек ← максимальный темп
Сцена 7: 1 сек
Сцена 8: 1 сек ← кульминация
Сцена 9: 5 сек ← резкое замедление (эффект удара)
Сцена 10: 6 сек ← финальный образ дышит
ШАГ 5: ОТ СЦЕНАРИЯ К AI-ГЕНЕРАЦИИ
Полный рабочий процесс:
Важно на каждом этапе:
ШАГ 4 → 5 (Фото в видео):
Генерируй фото в том же соотношении сторон что и видео.
Для Reels/TikTok: 9:16 вертикаль
Для YouTube: 16:9 горизонталь
Для квадрата: 1:1
ШАГ 5 (Генерация видео):
Каждый фрагмент = 3–6 секунд максимум.
Длиннее → AI теряет стабильность, артефакты.
Лучше 10 идеальных фрагментов по 5 сек,
чем один плохой на 50 секунд.
ШАГ 6 (Звук):
Генерируй музыку ПЕРВОЙ - она задаёт темп монтажа.
Режь видео ПОД музыку, а не наоборот.
ШАГ 6: СЕКРЕТЫ ЛУЧШИХ СЦЕНАРИСТОВ МИРА
ААРОН СОРКИН - «Социальная сеть», «Человек, который изменил все», «Игры разума»
"Каждая сцена должна делать одно из двух: двигать историю вперёд ИЛИ раскрывать характер. Лучшие сцены делают оба."
Применение в AI-ролике:
Задай вопрос к каждой сцене:
→ Эта сцена двигает историю?
→ Эта сцена показывает кто такой герой?
Если ответ "нет" на оба - удали сцену.
Она ворует время зрителя.
ПРИМЕР:
❌ Сцена: "Красивые горы. Закат. Очень красиво."
Это декорация - ни смысла, ни характера.
✅ Сцена: "Человек стоит на вершине горы.
Смотрит вниз на город который он покинул.
Руки в карманах. Спокойствие."
Это характер
КРИСТОФЕР НОЛАН - «Начало», «Интерстеллар», «Оппенгеймер»
"Начни с эмоции. Потом найди историю, которая создаёт эту эмоцию."
Применение в AI-ролике:
НЕПРАВИЛЬНЫЙ порядок (как делают новички):
Придумал тему → написал сцены → надеется на эмоцию
ПРАВИЛЬНЫЙ порядок (как делает Нолан):
Определил эмоцию → построил под неё каждый кадр
ПРИМЕР:
Тема: онлайн-курс по программированию
❌ Новичок думает:
"Покажу ноутбук, код, умного человека, результат"
✅ Нолан думает:
Эмоция = СВОБОДА
→ Как выглядит свобода визуально?
→ Открытое пространство, человек идёт вперёд,
горизонт без границ, тёплый свет
→ Теперь строю сцены под этот образ
КВЕНТИН ТАРАНТИНО - «Криминальное чтиво», «Бесславные ублюдки»
"Детали создают мир. Зрители замечают всё."
Применение в AI-ролике:
Детали - это не украшение. Это достоверность.
Зритель не скажет "какая классная текстура асфальта"
Но без неё скажет "что-то не так, выглядит дёшево"
ПРИМЕР - одна сцена, два уровня детализации:
❌ Без деталей:
"Человек пьёт кофе утром"
✅ С деталями (Тарантино-подход):
"Крупный план. Керамическая кружка с трещиной.
Пар поднимается спиралью. Руки обхватывают кружку - видно кольцо на безымянном пальце.
За окном - размытый серый город просыпается.
Первый глоток. Закрытые глаза. Секунда покоя."
Разница: первый кадр - stock footage.
Второй кадр - кино.
ДЭВИД ФИНЧЕР - «Бойцовский клуб», «Семь», «Исчезнувшая»
"Каждый кадр - это решение. Нет ни одного случайного пикселя."
Применение в AI-ролике:
Финчер переснимал одну сцену по 50–99 дублей.
Не потому что актёры ошибались - а потому что он видел что можно лучше.
В AI-генерации у тебя нет 99 дублей.
Но есть итерация промптов.
ПРАВИЛО ФИНЧЕРА ДЛЯ AI:
→ Никогда не принимай первую генерацию как финал
→ Смотри на результат и задай один вопрос:
"Что именно не так?"
→ Исправь КОНКРЕТНЫЙ элемент в промпте
→ Генерируй снова
ИТЕРАЦИЯ ПРОМПТА - ПРИМЕР:
Версия 1: "man walking in rain, night, city"
Результат: скучно, generic
Версия 2: + "neon reflections in puddles,
heavy rain, shallow DOF,
lonely atmosphere"
Результат: лучше, но свет неправильный
Версия 3: + "cold blue street lights,
single warm window in background,
contrast warm/cold,
anamorphic lens, film grain"
Результат: кино.
Три итерации = разница между любительским и профессиональным контентом.
⚡ ЧЕКЛИСТ ПЕРЕД ГЕНЕРАЦИЕЙ
Проверь каждую сцену перед тем как нажать «генерировать»:
СЦЕНАРИЙ:
□ Паспорт ролика заполнен полностью?
□ Главная эмоция определена одним словом?
□ Каждая сцена несёт смысл (Соркин-тест)?
□ Крючок в первые 3 секунды есть?
□ Финальный кадр - самый сильный образ?
КАЖДАЯ СЦЕНА:
□ Длительность указана (макс. 5–6 сек)?
□ Тип кадра и движение камеры прописаны?
□ Один объект / одно действие / одна мысль?
□ Освещение и время суток указаны?
□ Настроение и цветовая палитра есть?
ПРОМПТЫ:
□ Промпт написан на английском?
□ Есть технические теги (shot type, lens, lighting)?
□ Детали прописаны конкретно (не "красиво")?
□ Указаны качественные теги (4K, cinematic, film grain)?
МОНТАЖНАЯ ЛОГИКА:
□ Правило 180° соблюдено?
□ Правило крупности соблюдено?
□ Направление движения совпадает между сценами?
□ Ритм соответствует эмоции (быстро/медленно)?
□ Референсы собраны для каждой сцены?
🎯 Главный секрет: Профессиональный AI-ролик - это не вопрос инструментов. Это вопрос подготовки. 80% работы делается ДО того как ты открыл нейросеть. Чем детальнее сценарий и раскадровка - тем меньше правок, тем выше качество, тем быстрее результат.
В моём Telegram-канале и в канале MAX всегда больше полезной и инструментарной информации.