148 подписчиков

Как стать героем любого видео: пошаговый гайд по Veo3 и нейросетям

5 октября 20255 окт 2025

102

12 мин

Хотите создавать видео с собой в главной роли без камеры и съёмочной группы? Представьте: вы в кадре из голливудского фильма, чилите на яхте в Средиземном море, летаете в облаках или снимаетесь в рекламе премиального бренда. Всё это возможно прямо сейчас благодаря нейросетям Veo3, Midjourney и инструментам для работы с изображениями. Недавно видеогенератор от Google Veo3 выпустил обновление — теперь можно генерировать видео по исходному изображению. Да, в Kling это доступно уже больше года, но Veo3 делает реалистичные движения, эмоции, и персонаж в кадре говорит голосом, похожим на ваш. Ограничений нет — всё зависит от вашей фантазии. В этом туториале покажем пошагово: как сделать реалистичные картинки с собой, как их доработать и улучшить, как создать видео, где вы говорите, и как сделать голос максимально похожим на ваш. Все манипуляции будем проводить в SYNTX — агрегаторе 90+ нейросетей, где всё собрано в одном месте без VPN, с оплатой рублями и без головной боли с разными подпискам

Оглавление

Шаг 1: Создание качественной картинки с собой
Шаг 2: Доработка и улучшение изображений
Шаг 3: Создание видео в Veo3 через SYNTX

Недавно видеогенератор от Google Veo3 выпустил обновление — теперь можно генерировать видео по исходному изображению. Да, в Kling это доступно уже больше года, но Veo3 делает реалистичные движения, эмоции, и персонаж в кадре говорит голосом, похожим на ваш. Ограничений нет — всё зависит от вашей фантазии.

В этом туториале покажем пошагово: как сделать реалистичные картинки с собой, как их доработать и улучшить, как создать видео, где вы говорите, и как сделать голос максимально похожим на ваш. Все манипуляции будем проводить в SYNTX — агрегаторе 90+ нейросетей, где всё собрано в одном месте без VPN, с оплатой рублями и без головной боли с разными подписками.

Шаг 1: Создание качественной картинки с собой

От того, насколько качественную картинку сделаете, насколько она детализирована и насколько персонаж похож на вас, зависит результат финального видео. Нужно сделать максимально хороший исходник, который будем оживлять.

Важное правило: Старайтесь генерировать, чтобы лицо было ближе к камере. Чем дальше лицо, тем оно будет не похоже и смазанней. Это касается и изображений, и видео. Если лицо далеко или в полный рост где-то в поле — там будет полнейшая каша. Хотите хорошего сходства — генерируйте близко к камере или хотя бы по пояс.

Два способа создания изображения

Способ 1: Higgsfield с обучением на ваших фото

Higgsfield недавно добавил инструмент обучения модели Lora на своих фотографиях — делает очень хорошо, одна картинка из пяти получается с отличным попаданием по лицу.

Как обучить модель:

Переходите в раздел Character
Выбираете Create Character (там даже new написано)
Загружаете от 7 своих фотографий, где чётко видно лицо — не прикрытое волосами, очками, где лицо хорошо просматривается

Лучше сделать так: встать и попросить кого-то пофотографировать, или сделать селфи крупно своего лица с разных ракурсов и с разными эмоциями. Никакой суперпрофессиональной съёмки не нужно — просто селфи с нормальным освещением, чтобы свет (солнце или лампы) попадал по-разному на лицо.

Важное замечание: Если много боковых фотографий, Higgsfield по умолчанию будет генерировать фотки, где вы боком, придётся каждый раз прописывать, чтобы человек смотрел в камеру. Поэтому много боковых не делайте или прописывайте это в промте.

После загрузки нажимаете "Загрузить изображение" — в течение получаса моделька обучается на ваших фотографиях. После обучения появится отдельная модель с вашими фотографиями в разделе Character. Можно создать много моделей разных людей — себя, родственников, кого угодно.

Два варианта генерации:

Вариант А: По шаблонам

Higgsfield даёт кучу шаблонов для генерации изображений. Выбираете шаблон (например, "селфи на 0.5" или "на пляже"), тыкаете на него — он автоматически подтянет промт. Все изображения заточены под максимальный реализм, как будто фотография на мыльницу или iPhone.

Минус: Здесь не получится чего-то сверхъестественного — вы на драконе, в облаках с кинематографичным освещением. Всё будет похоже на реальные фотографии. Если нужно что-то яркое, кинематографичное, необычное — переходим к способу 2.

Выбираете шаблон, нажимаете генерацию — стоит два кредита. Соотношение сторон выбираете 16:9 (для Veo3). Есть модель Basic (хуже качество, быстрее, один кредит) и улучшенная модель (лучше качество, чуть дольше, два кредита).

Вариант Б: По промту

Если генерируете по промту, не ограничены рамками шаблона — можете создать что угодно, но в рамках реализма.

Промты советуем писать через ChatGPT (доступен в SYNTX — GPT-5, GPT-4o, Claude, Gemini и другие языковые модели). Работайте с референсами: находите изображение, которое нравится, закидываете в ChatGPT, он описывает, вы корректируете (заменить парня на девушку, возраст 30 лет, белая кожа), он пишет промт — идёте генерировать.

По стоимости: Подходит подписка за 9 долларов — даёт 150 кредитов, это 75 генераций изображений по два кредита. Если в России — можно оплатить через зарубежную карту или проще использовать SYNTX, где оплата рублями через СБП без заморочек.

Способ 2: Midjourney с Omni Reference (для ярких кинематографичных образов)

Если хочется чего-то яркого, интересного, киношного, необычного — идём в Midjourney. Он доступен в SYNTX с полным функционалом.

Midjourney генерирует любое изображение с персонажем, похожим на вас, благодаря функции Omni Reference. Правда, не со всеми лицами работает идеально — моё лицо получалось один из десяти хорошо. Но дальше покажем, как легко доработать.

Как генерировать в Midjourney через SYNTX:

Открываете SYNTX (веб-версию или Telegram-бот)
Переходите в раздел генерации изображений
Выбираете Midjourney
Нажимаете на значок плюсика, загружаете свою фотографию
Перетаскиваете фотографию в Omni Reference
Выставляете силу Omni Reference на 400 (оптимально по опыту)

По умолчанию будет 100 — можете попробовать и потом добавлять. Больше 400 не уводите, начинает генерировать странности.

Настройки генерации:

Соотношение сторон: 16:9 (для Veo3)
Режим: RAW (лучше для реализма)
Версия: 7 (самая последняя на момент 2025 года)

Промты через ChatGPT по референсам:

Работа с референсами — это очень удобно. Все ролики, где показаны кадры с бокалом, где дюна — сделаны по референсам. Находите изображение, которое нравится, закидываете в ChatGPT (доступен в SYNTX), просите написать промт для Midjourney, делаете корректировки, он пишет промт — идёте генерировать.

Часто одной генерации не отделаться — надо делать много генераций. Сохраняете то, что понравилось, через Upscale (желательно Upscale Subtle для лучшего качества).

Кстати, Midjourney сейчас очень прокачали — добавили генерацию видео. 2025 год вообще прорывной в генерации видео.

Шаг 2: Доработка и улучшение изображений

Если лицо на картинке немного не похоже или качество хромает — есть два способа исправить.

Способ 1: Face Swap через Deep Fake

Если сгенерировали картинку, которая вроде похожа, но не совсем — дорабатываем через Face Swap (Deep Fake).

Рекомендация: сервис Pixi — бесплатный, даёт каждый день 30 бесплатных кредитов, одна генерация — один-два кредита. Если не делаете пачками каждый день, 30 кредитов хватит с головой.

Как работает:

Загружаете своё селфи (входная картинка — откуда берётся ваше лицо)
Загружаете сгенерированную картинку (куда нужно перенести лицо)
Нажимаете Swap — буквально 10 секунд, и готово

Если где-то челюсть не похожа, ухо не похоже — есть дополнительные настройки (какие-то платные, какие-то бесплатные). Можете исправить линию волос, взгляд, другие детали.

Таким образом улучшаем схожесть персонажа на вас.

Способ 2: Upscaler для детализации

Второй инструмент доработки — Upscaler. В SYNTX недавно завезли собственный Upscaler. Также можно использовать Topaz через Creo, но Topaz стоит 80 баксов в месяц, а в SYNTX уже включён в подписку.

Когда использовать Upscaler:

Нужно добавить детализацию
Когда Face Swap немного плохо лёг, отличается, нужно сгладить углы и шероховатости

Настройки Upscaler (на примере Topaz):

Сила креатива: средняя (не на 100%, чтобы сохранить схожесть)
Резкость: примерно 30% от всего ползунка
Сила: несколько генераций, смотрите, как получается

Добавляется детализация, сглаживаются углы, где Deep Fake чуть-чуть плохо лёг — справляется очень хорошо.

Шаг 3: Создание видео в Veo3 через SYNTX

Теперь у нас есть качественное изображение с нами на картинке. Нужно оживить его, чтобы мы в кадре говорили, желательно нашим голосом.

Генерируем в Veo3. Без разницы, где это делать — на официальном сайте или в агрегаторах. Но удобнее всего в SYNTX, потому что:

Оплата рублями через СБП без заморочек
Без VPN и зарубежных карт
Часто используются разные видеогенераторы — всё в одном месте
Тариф Elite за 4900 рублей даёт безлимит Veo3 Fast и Sora 2 — генерируйте сколько угодно

Как генерировать Veo3 в SYNTX:

Открываете SYNTX (веб-версию или Telegram-бот)
Находите в главном меню "Видео будущего"
Нажимаете Veo3
Загружаете исходную картинку
Вводите промт: что персонаж должен делать и что говорить

Промты пишем через ChatGPT (доступен в SYNTX — GPT-5, GPT-4o и другие):

Не нужен какой-то специальный бот. Здесь что-то лёгкое: персонаж движется, что-то делает, что-то говорит.

Пример промта:

"Сделай мне промт для нейронки Veo3. Парень должен посмотреть в камеру и сказать [текст на русском языке]. После он должен засмеяться."

ChatGPT пишет промт, вы его пересматриваете, копируете, вставляете в Veo3.

Настройки модели:

Выбираете Veo3 или Veo3 Fast
Veo3 — улучшенная модель, но съест много денег (в четыре раза больше, около 100 кредитов)
Veo3 Fast — всего 19 кредитов, недорого и качество отличное
Соотношение сторон: только 16:9 (горизонталка)

На тарифе Elite в SYNTX — безлимит Veo3 Fast. Генерируете хоть 1000 видео в день без ограничений за 4900 рублей в месяц. Официально Veo3 стоит 250 долларов (25 000 рублей) с ограничениями и сгорающими кредитами.

Сохраняете настройки, отправляете на генерацию.

Результат: Видео получается качественным, реалистичным, эмоции передаются хорошо. Как говорилось, от исходного изображения зависит качество финального видео — если изображение близко, детализировано, хорошо, то и видео получается отличным.

Важно: Голос пока не похож на ваш. Сейчас покажем, как исправить.

Чтобы сохранить видео, нажимаете на "Прямая ссылка" и сохраняете — так видео будет в полном качестве, не в урезанном.

Шаг 4: Создание озвучки вашим голосом

Как сделать так, чтобы персонажи, которых сгенерировали и которые похожи на вас, говорили вашим голосом?

Покажем на примере CapCut (можно использовать любой видеоредактор — DaVinci Resolve, Adobe Premiere и т.д.).

Шаг 1: Экспорт звука из видео

Загружаете ваше видео с Veo3 в CapCut
Нарезаете ролик (если нужно)
Нажимаете "Экспортировать"
Выбираете не видео, а Звук
Сохраняете аудио — только звук нужен, картинка не нужна

Шаг 2: Клонирование голоса через ElevenLabs

Нейронка ElevenLabs — одна из лучших, которая клонирует голос и делает озвучку. Большой плюс — работает с русским языком (большая часть нейронок с русским не работает).

Клонирование голоса делается за 2 минуты:

Заходите в ElevenLabs
Нажимаете плюсик
Выбираете Clone Voice
Загружаете своё аудио — можно вырезать со своего видео или записать на диктофон (буквально минута-две хватит для обучения)

Важный совет: Записывайте с той интонацией, с которой хотите, чтобы были ваши видео. Если запишете монотонно, будет тяжело добиться, чтобы голос говорил эмоционально и классно.

После загрузки моделька обучается — за несколько минут она появится в вашем списке голосов.

Шаг 3: Замена голоса через Voice Changer

Выбираете Voice Changer в ElevenLabs
Загружаете аудио, которое экспортировали из видео Veo3 (где персонаж говорит не вашим голосом)
Выбираете вашу обученную модель голоса
Отправляете на генерацию — занимает 10-15 секунд максимум

Получается голос, похожий на ваш. Если иногда не похож, потыкайте настройки схожести, выберите автоматическое удаление заднего шума.

Шаг 4: Замена аудио в видеоредакторе

Сохраняете новую аудиодорожку с вашим голосом
Загружаете её в CapCut (или другой редактор) дополнительной дорожкой
Убираете звук из оригинального видео
Оставляете звук с вашим клонированным голосом

Готово! Теперь персонажи говорят голосом, похожим на ваш.

Почему делать всё это удобнее в SYNTX

Весь процесс создания видео с собой требует работы с несколькими нейросетями:

Midjourney для генерации изображений
Veo3 для создания видео
GPT-5 / ChatGPT для написания промтов
Upscaler для улучшения качества
ElevenLabs для клонирования голоса

Можно подписываться на каждую нейросеть отдельно:

Midjourney: 3500 рублей в месяц
Veo3: 25 000 рублей в месяц
GPT-5: около 2000 рублей в месяц
Topaz Upscaler: 8000 рублей в месяц

Итого: около 38 500 рублей в месяц + кредиты сгорают в конце месяца.

Или использовать SYNTX:

Тариф Elite за 4900 рублей:

Безлимит Veo3 Fast — генерируйте сколько угодно видео
Безлимит Sora 2 — ещё один топовый видеогенератор
Midjourney с полным функционалом
GPT-5, GPT-4o, Claude, Gemini — все языковые модели
Upscaler встроен
Kling 1.6, Runway, Luma, Pika, Hailuo — все топовые видеогенераторы
Suno 5 для музыки, синтез речи, 200+ голосов
90+ нейросетей в одном месте

Экономия: 33 600 рублей в месяц. За год — более 400 000 рублей.

Токены не сгорают — остаток переносится на следующий месяц. Оплата рублями через СБП, без VPN, без зарубежных карт. Единый интерфейс для всех нейросетей — не нужно привыкать к интерфейсу каждой отдельно.

Практические советы для лучших результатов

Для изображений:

Фотографируйтесь с разных ракурсов, с разными эмоциями
Хорошее освещение — свет должен попадать по-разному
Не много боковых фотографий — будет генерировать боком
Лицо ближе к камере — чем дальше, тем хуже сходство
По пояс или крупнее — в полный рост лицо будет кашей

Для видео:

Пишите промты через ChatGPT по референсам — работайте с примерами
Veo3 Fast достаточно для 95% задач — не переплачивайте за обычный Veo3
Используйте безлимит на тарифе Elite — генерируйте 50-100 вариантов, выбирайте лучшее
Исходное изображение решает всё — чем качественнее, тем лучше видео

Для голоса:

Записывайте с интонацией, которую хотите в итоге слышать
Минуты-две аудио хватит для обучения ElevenLabs
Если голос не похож — покрутите настройки схожести
Автоматическое удаление шума помогает

Итоговая схема работы

Подготовка: Делаете 7-10 селфи с разных ракурсов, с хорошим освещением
Генерация изображения: Higgsfield (реализм) или Midjourney через SYNTX (кинематограф)
Доработка: Face Swap через Pixi + Upscaler в SYNTX для детализации
Создание видео: Veo3 Fast в SYNTX (безлимит на тарифе Elite)
Промты: Пишете через GPT-5 в SYNTX по референсам
Озвучка: Экспорт аудио → клонирование голоса в ElevenLabs → замена в редакторе
Финал: Видео с вами в главной роли, с вашим голосом, в любой локации

Заключение

Создание видео с собой в главной роли — это уже не фантастика, а реальность. Можете стать героем фильма, рекламы, оказаться на яхте или в облаках. Всё зависит от фантазии и умения работать с нейросетями.

SYNTX делает этот процесс максимально простым и доступным:

Все нейросети в одном месте
Оплата рублями без VPN
Тариф Elite за 4900 рублей с безлимитом Veo3 Fast и Sora 2
Экономия десятков тысяч рублей в месяц
Токены не сгорают

Попробуйте сами: bit.ly/syntxai99 — получите бонусные токены при регистрации, протестируйте возможности, создайте первое видео с собой. Начните с базового тарифа, а когда поймёте потенциал — переходите на Elite и генерируйте без ограничений.

2025 год — прорывной в генерации видео. Технологии доступны прямо сейчас. Осталось только начать создавать.