В этом посте я поделюсь своим опытом создания коротких уютных видео с вязаными персонажами — теми самыми лисичками, мышками и цветами, которые оживают в кадре. Весь процесс строится на сотрудничестве с нейросетями и внимании к деталям. Поехали! 🧶✨
Шаг 1. Создание референса (образца)
Всё начинается с фотографий моих готовых вязаных игрушек. Именно они становятся «актёрами» в будущих видео.
Что важно:
- У каждого персонажа должна быть фотография, желательно на нейтральном контрастном фоне (необязательно на однотонном, современные технологии легко "узнают" объект и на фоне пейзажа)
- Фото должно быть чётким, с хорошим освещением, чтобы нейросеть «узнала» фактуру вязки
- Желательно, чтобы персонаж был сфотографирован в позе, близкой к той, что вы хотите видеть на итоговой картинке. Так нейросети не придётся угадывать, как выглядит хвост или лапки вашего персонажа в нужной позиции
- Если на итоговом изображении несколько персонажей должны быть вместе, лучше сразу сделать их общее фото
Шаг 2. Промт для генерации изображения
Самый важный и творческий этап. Промт (текстовое описание) должен быть максимально конкретным. Помните уроки в школе по русскому языку, когда надо было описать в сочинении, что изображено на картине художника? Вот, представьте, что у вас сейчас такой урок. Только вот картинка есть пока что исключительно в вашей голове. Опишите для программы, что там должно быть на переднем и заднем планах, какое освещение, какой стиль, текстуры и формы предметов. Может быть, это нестандарные пропорции? Может быть, внезапный сюжет, непривычный в жизни? Может быть, оригинальная стилизация окружения? Пишите как можно подробнее. Для начала - просто как поток мыслей. Вторым этапом структурируйте идею в промт.
Я использую отдельные сервисы для генерации промтов и для генерации изображений — так мне удобнее. Но есть платформы, которые позволяют делать всё в одном диалоговом окне. Выбирайте тот способ, который комфортнее вам.
Структура моего стандартного промта:
- Привязка к исходнику: Based on the uploaded photo of [one/two] characters. — это сигнал нейросети, что нужно взять за основу моих персонажей, а не придумывать новых. Я всегда пишу именно characters = персонажи, а не лисы, львы и прочее, чтобы нейросеть не пыталась изменить сами игрушки на свой вкус, а принимала их именно такими, какие они есть в реальности, добавляя только элементы окружения.
- Формат: Vertical format, 9:16. — как пример, такой формат используется для создания рилсов/шортсов. Иногда при редактировании изображения нейросеть всегда берет тот формат, какой был загружен как исходник или это отдельная настройка внутри нейросети, зависит от конкретной программы, которую вы используете.
- Локация и атмосфера: cozy sunlit kitchen with crochet-knitted wallpaper... — я подробно описываю мир, в котором происходит действие. Чем больше деталей, тем лучше нейросеть понимает контекст.
- Действие (для статичного изображения): Both characters are seated comfortably, eating — описание позы и того, что персонаж делает в кадре.
- Самый важный пункт — сохранение точного образа персонажей:
CRITICAL: Preserve exact character appearance, body proportions, colors, facial features, and yarn texture from the original reference images. Do not alter or distort the characters' bodies. All objects must be correctly scaled to their hands.
Это «заклинание», которое я добавляю в конец каждого промта, чтобы мои игрушки оставались собой, именно такими, какими были связаны.
Пример рабочего промта (для фото, где персонажи выбирают семена для посадки в кладовке). На вход была картинка 1 (в статье выше).
Based on the uploaded photo of two characters. Transform the scene: both characters are now standing in a cozy storage room (closet) filled with gardening supplies. The room has crochet-knitted wallpaper covering all walls, and a crochet-knitted lamp hangs from the ceiling above, glowing warmly.
Both characters are wearing tiny crochet-knitted aprons — like gardeners, soft yarn texture, matching their style.
The room is filled with crochet-knitted shelves and wooden or woven baskets. In the foreground, a large collection of small clay pots (terracotta, correctly scaled to the characters' size) are stacked or scattered around them. Next to the pots, many tiny seed packets are spread out — with pictures or labels of peppers (pertsy), tomatoes (pomidorki), and melons (dyni).
One character is kneeling or bending down, carefully looking through the seed packets, holding one in their paws, studying it with curiosity. The other character is examining or holding a clay pot, maybe turning it in their hands, choosing the right one.
In the background, visible on the shelves: bags of soil (small scale), tiny bottles of fertilizer, small spray bottles, miniature gardening tools (shovels, trowels), and watering cans — all correctly sized for the characters. Crochet-knitted boxes and storage containers fill the remaining shelf space.
CRITICAL: Preserve exact character appearance, body proportions, colors (paws, fur, clothing), facial features, and yarn texture from the original reference images. Do not alter or distort the characters' bodies. All objects (pots, seeds, tools, bags) must be correctly scaled to the characters' hands and size. The scene should look natural, cozy, and magical — like a gardening planning moment.
Warm, soft lighting from the knitted lamp above, slight shadows, cozy clutter atmosphere. Photorealistic, detailed textures — visible yarn on knitted items, realistic clay pots, paper seed packets.
Шаг 3. Генерация и отбор изображений
Когда промт готов, я загружаю фото в нейросеть и запускаю генерацию. Один и тот же промт может выдавать разные результаты, поэтому я делаю несколько попыток, чтобы выбрать лучший вариант.
На что обращаю внимание:
- Сохранились ли пропорции персонажа?
- Не исказились ли черты мордочки?
- Правильно ли масштабированы предметы (кружка не больше головы, ложка не меньше лапки)?
- Соответствует ли освещение и атмосфера задуманному?
Иногда нейросеть «капризничает», и приходится менять промт — убирать лишние детали, упрощать задачу или, наоборот, добавлять больше конкретики.
Важно: если нейросеть начинает повторять одни и те же ошибки, для новых генераций лучше запускать отдельный чат — это помогает «сбросить» контекст и получить свежие варианты.
Шаг 4. Создание видео
Когда у меня есть готовое изображение, отобранное на шаге 3, я превращаю его в видео. Тут уже в качестве референса теперь выступает не исходная фотография игрушки, а именно то сгенерированное изображение, которое мне понравилось.
К нему я дописываю часть с движением.
Что добавляется в промт:
- Описание движения: что именно делают персонажи (идут, перебирают семена, намазывают масло, поворачивают голову)
- Темп: slow, meditative pace — я почти всегда прошу замедленный темп, потому что у меня такой стиль. У вас может быть свой.
- Плавность: smooth fluid motions, 24fps
В промте для видео можно управлять не только персонажами, но и тем, как зритель смотрит на сцену. Я часто добавляю инструкции для камеры:
- camera slowly pulls back / dolly out — камера плавно отдаляется, показывая больше пространства
- camera pans to the right — поворачивается, меняя ракурс
- camera moves forward as if walking toward the cabin — создаёт эффект присутствия
Погода тоже помогает создать настроение:
- snow begins to fall gently — снегопад начинается или усиливается
- wind picks up, snow swirls — ветер, метель
- daylight slowly fades into evening — день сменяется вечером
И конечно, спецэффекты, которые делают мир живым:
- steam rises from the mug — пар от горячего чая
- lights twinkle softly — мерцание гирлянд
- fog fades in — появление тумана для загадочности
Всё это прописывается прямо в промт, и нейросеть старается воплотить задуманное.
Пример промта для видео (из сюжетов про Масленицу и блины https://dzen.ru/shorts/699c203fca21df6e3bd09b87?share_to=link):
Live-action vertical video from a static image. Two characters are in a cozy, sunlit kitchen making pancake batter. Vertical format, 9:16, full-height kitchen view with crochet-knitted chandelier above and crochet-knitted rug below.
The character on the left holds the bottle of milk and slowly pours it into a mixing bowl — a steady stream of milk flows from the bottle, splashing gently into the bowl. They hold the bottle with both hands, concentrating on pouring.
The character on the right holds a whisk and begins mixing the batter in the bowl — they move the whisk in circular motions, the batter swirling smoothly. Their movements are rhythmic and focused.
SOUND DESIGN: No voices or character sounds. Only ambient kitchen sounds — milk pouring and splashing into the bowl, whisk gently tapping against the bowl, liquid mixing rhythmically, soft clink of whisk against ceramic, faint background hum of the kitchen. Characters remain completely silent.
Natural daylight streams through a nearby window. Warm kitchen atmosphere, shallow depth of field, 24fps, photorealistic, smooth fluid motions.
CRITICAL: Maintain exact character appearance, body proportions, colors (paws, fur, clothing), facial features, and yarn texture from the original reference images. Do not alter or distort the characters' bodies. All objects must remain correctly scaled to their hands. Preserve the vertical format, lighting, and all kitchen details (chandelier, rug, milk bottle, bowl, whisk, etc.).
Саунд-дизайн
В промте для генерации видео можно прописывать, какие звуки должны быть слышны. Это не отдельный этап, а часть описания сцены.
Я всегда указываю, что персонажи молчат: SOUND DESIGN: No voices or character sounds. Characters remain completely silent.
И дальше перечисляю, какие звуки должны быть: например, only ambient kitchen sounds — milk pouring, whisk tapping, soft clink of spoons или only nature sounds — birds chirping, gentle breeze, water trickling.
Можно добавить динамику: sound fades in: first just wind, then birds join as camera moves.
Главное — прописать звуки так же подробно, как и картинку, чтобы нейросеть понимала, какую атмосферу создавать.
Шаг 5. Отбор видео
Процесс похож на отбор изображений: я генерирую несколько вариантов и выбираю те, где:
- Движения получились естественными и плавными
- Персонажи не «плывут», не вытягиваются, теряя пропорции
- Предметы остаются в руках, не летают в воздухе или исчезают
- Сохраняется общая атмосфера кадра
Иногда приходится делать много попыток, чтобы добиться нужного результата. А иногда приходится брать не идеальный :) Видео это уже сложнее, чем изображение. Изображение вы можете легко подправить вручную в том же Photoshop, а видео...у меня лично не тот скилл. Поэтому на него всегда уходит больше времению
Шаг 6. Звук и музыка
Звук — это половина атмосферы. Здесь два направления:
1. Фоновые шумы (sound design)
В самих видео персонажи всегда молчат. Я писала об этом уже выше. Есть только звуки окружающего мира:
- На кухне: бульканье молока, стук ложки, шипение масла
- В саду: пение птиц, шелест листвы, журчание воды
- В мастерской: тиканье часов, потрескивание дров
2. Музыка
Музыку я так же генерирую с помощью нейросетей. Пишу отдельные промты под разные настроения:
Пример для кухонной сцены:
*"Acoustic folk-pop, cozy and gentle, soft fingerpicked guitar, warm piano, no vocals, loop-friendly, 60 seconds."*
Пример для весеннего сада:
*"Ethnic folk fusion, gentle bells, soft accordion, uplifting but calm, no vocals, loop-friendly, 60 seconds."*
Пример для ночного сюжета:
*"Mystical ambient, soft drone, distant owl hoots, no vocals, loop-friendly, 60 seconds."*
Я всегда указываю NO VOCALS — instrumental only, чтобы речь не перебивала тишину вязаного мира. Но нейросети сейчас легко пишут песни на любой вкус, так что всё заивит только от вашей фантазии.
Шаг 7. Монтаж
Сгенерированные видеофрагменты я собираю в редакторе. Я использую CapCut — удобное приложение и для телефона, и для компьютера.
Что делаю в монтаже:
Тут без особых затей, использую только два приёма для основного видео:
- Склейка: соединяю несколько коротких видео в один сюжет (например, подготовка теста → выпекание → поедание блинов)
- Звук: накладываю фоновые шумы и музыку, регулирую громкость (музыка тише, природные звуки чуть громче)
И для заставки в конце добаляю текст и простую анимацию его "проявления".
Шаг 8. Публикация и описание
Финальный шаг — публикация. Тут, конечно, больше элемент SMM-копирайтинга, в чём я совершенно не специалсит, но его тоже можно делегировать нейросети, поэтому напишу и про него.
Т.к. промт для генерации описания видео пишу в том же чате, где обсуждались промты для генерации самых изображений и видео, мне не приходится особо объяснять ИИ, что в видео происходит. Поэтому даю задачу в духе "Дай эмоциональный заголовок, 2–3 предложения о том, что происходит в видео и добавь тематические хэштеги"
Пример полученного описания:
"Весенние хлопоты в мастерской 🌷 Лисички собирают букеты розовых тюльпанов, а мышка с крыльями проверяет конфеты. Вокруг — тающий снег, проталины и первые цветы."#ВязаныйМир #МастерскаяЖивыхИгрушек #Лисы #Весна2026 #Тюльпаны
Важно, чтобы описание было коротким, но ёмким — алгоритмы должны сразу понять, о чём видео, и показать его тем, кому оно может понравиться.
Честно, я редко беру прям именно то что ИИ тут насочиняет, но пару фраз выдернуть можно.
Итоги
Создание таких видео — процесс творческий и технический одновременно. Нейросети — мощный инструмент, но они не умеют читать мысли. Чем точнее и конкретнее вы описываете то, что хотите увидеть, тем ближе результат к задуманному. Это требует как терпения, так и...навыков руководителя :)
Основные принципы:
- Промт — это не магия, а инструкция. Чем она понятнее, тем лучше результат
- Сохранение пропорций персонажа нужно прописывать отдельно и каждый раз
- Иногда лучше упростить задачу, чем заставить нейросеть сделать сложное
- Отбор и терпение — важная часть процесса. Редко что получается с первого раза
- Музыка и звук - половина успеха, делают картинку живой и наполняют атмосферой
Надеюсь, мой опыт будет полезен! Если у вас есть вопросы — задавайте, с радостью отвечу ❤️
Спасибо, что дочитали статью. Комментируйте и ставьте лайки.
Нажмите здесь, чтобы подписаться на канал.