Хотите создавать видео с собой в главной роли без камеры и съёмочной группы? Представьте: вы в кадре из голливудского фильма, чилите на яхте в Средиземном море, летаете в облаках или снимаетесь в рекламе премиального бренда. Всё это возможно прямо сейчас благодаря нейросетям Veo3, Midjourney и инструментам для работы с изображениями.
Недавно видеогенератор от Google Veo3 выпустил обновление — теперь можно генерировать видео по исходному изображению. Да, в Kling это доступно уже больше года, но Veo3 делает реалистичные движения, эмоции, и персонаж в кадре говорит голосом, похожим на ваш. Ограничений нет — всё зависит от вашей фантазии.
В этом туториале покажем пошагово: как сделать реалистичные картинки с собой, как их доработать и улучшить, как создать видео, где вы говорите, и как сделать голос максимально похожим на ваш. Все манипуляции будем проводить в SYNTX — агрегаторе 90+ нейросетей, где всё собрано в одном месте без VPN, с оплатой рублями и без головной боли с разными подписками.
Шаг 1: Создание качественной картинки с собой
От того, насколько качественную картинку сделаете, насколько она детализирована и насколько персонаж похож на вас, зависит результат финального видео. Нужно сделать максимально хороший исходник, который будем оживлять.
Важное правило: Старайтесь генерировать, чтобы лицо было ближе к камере. Чем дальше лицо, тем оно будет не похоже и смазанней. Это касается и изображений, и видео. Если лицо далеко или в полный рост где-то в поле — там будет полнейшая каша. Хотите хорошего сходства — генерируйте близко к камере или хотя бы по пояс.
Два способа создания изображения
Способ 1: Higgsfield с обучением на ваших фото
Higgsfield недавно добавил инструмент обучения модели Lora на своих фотографиях — делает очень хорошо, одна картинка из пяти получается с отличным попаданием по лицу.
Как обучить модель:
- Переходите в раздел Character
- Выбираете Create Character (там даже new написано)
- Загружаете от 7 своих фотографий, где чётко видно лицо — не прикрытое волосами, очками, где лицо хорошо просматривается
Лучше сделать так: встать и попросить кого-то пофотографировать, или сделать селфи крупно своего лица с разных ракурсов и с разными эмоциями. Никакой суперпрофессиональной съёмки не нужно — просто селфи с нормальным освещением, чтобы свет (солнце или лампы) попадал по-разному на лицо.
Важное замечание: Если много боковых фотографий, Higgsfield по умолчанию будет генерировать фотки, где вы боком, придётся каждый раз прописывать, чтобы человек смотрел в камеру. Поэтому много боковых не делайте или прописывайте это в промте.
После загрузки нажимаете "Загрузить изображение" — в течение получаса моделька обучается на ваших фотографиях. После обучения появится отдельная модель с вашими фотографиями в разделе Character. Можно создать много моделей разных людей — себя, родственников, кого угодно.
Два варианта генерации:
Вариант А: По шаблонам
Higgsfield даёт кучу шаблонов для генерации изображений. Выбираете шаблон (например, "селфи на 0.5" или "на пляже"), тыкаете на него — он автоматически подтянет промт. Все изображения заточены под максимальный реализм, как будто фотография на мыльницу или iPhone.
Минус: Здесь не получится чего-то сверхъестественного — вы на драконе, в облаках с кинематографичным освещением. Всё будет похоже на реальные фотографии. Если нужно что-то яркое, кинематографичное, необычное — переходим к способу 2.
Выбираете шаблон, нажимаете генерацию — стоит два кредита. Соотношение сторон выбираете 16:9 (для Veo3). Есть модель Basic (хуже качество, быстрее, один кредит) и улучшенная модель (лучше качество, чуть дольше, два кредита).
Вариант Б: По промту
Если генерируете по промту, не ограничены рамками шаблона — можете создать что угодно, но в рамках реализма.
Промты советуем писать через ChatGPT (доступен в SYNTX — GPT-5, GPT-4o, Claude, Gemini и другие языковые модели). Работайте с референсами: находите изображение, которое нравится, закидываете в ChatGPT, он описывает, вы корректируете (заменить парня на девушку, возраст 30 лет, белая кожа), он пишет промт — идёте генерировать.
По стоимости: Подходит подписка за 9 долларов — даёт 150 кредитов, это 75 генераций изображений по два кредита. Если в России — можно оплатить через зарубежную карту или проще использовать SYNTX, где оплата рублями через СБП без заморочек.
Способ 2: Midjourney с Omni Reference (для ярких кинематографичных образов)
Если хочется чего-то яркого, интересного, киношного, необычного — идём в Midjourney. Он доступен в SYNTX с полным функционалом.
Midjourney генерирует любое изображение с персонажем, похожим на вас, благодаря функции Omni Reference. Правда, не со всеми лицами работает идеально — моё лицо получалось один из десяти хорошо. Но дальше покажем, как легко доработать.
Как генерировать в Midjourney через SYNTX:
- Открываете SYNTX (веб-версию или Telegram-бот)
- Переходите в раздел генерации изображений
- Выбираете Midjourney
- Нажимаете на значок плюсика, загружаете свою фотографию
- Перетаскиваете фотографию в Omni Reference
- Выставляете силу Omni Reference на 400 (оптимально по опыту)
По умолчанию будет 100 — можете попробовать и потом добавлять. Больше 400 не уводите, начинает генерировать странности.
Настройки генерации:
- Соотношение сторон: 16:9 (для Veo3)
- Режим: RAW (лучше для реализма)
- Версия: 7 (самая последняя на момент 2025 года)
Промты через ChatGPT по референсам:
Работа с референсами — это очень удобно. Все ролики, где показаны кадры с бокалом, где дюна — сделаны по референсам. Находите изображение, которое нравится, закидываете в ChatGPT (доступен в SYNTX), просите написать промт для Midjourney, делаете корректировки, он пишет промт — идёте генерировать.
Часто одной генерации не отделаться — надо делать много генераций. Сохраняете то, что понравилось, через Upscale (желательно Upscale Subtle для лучшего качества).
Кстати, Midjourney сейчас очень прокачали — добавили генерацию видео. 2025 год вообще прорывной в генерации видео.
Шаг 2: Доработка и улучшение изображений
Если лицо на картинке немного не похоже или качество хромает — есть два способа исправить.
Способ 1: Face Swap через Deep Fake
Если сгенерировали картинку, которая вроде похожа, но не совсем — дорабатываем через Face Swap (Deep Fake).
Рекомендация: сервис Pixi — бесплатный, даёт каждый день 30 бесплатных кредитов, одна генерация — один-два кредита. Если не делаете пачками каждый день, 30 кредитов хватит с головой.
Как работает:
- Загружаете своё селфи (входная картинка — откуда берётся ваше лицо)
- Загружаете сгенерированную картинку (куда нужно перенести лицо)
- Нажимаете Swap — буквально 10 секунд, и готово
Если где-то челюсть не похожа, ухо не похоже — есть дополнительные настройки (какие-то платные, какие-то бесплатные). Можете исправить линию волос, взгляд, другие детали.
Таким образом улучшаем схожесть персонажа на вас.
Способ 2: Upscaler для детализации
Второй инструмент доработки — Upscaler. В SYNTX недавно завезли собственный Upscaler. Также можно использовать Topaz через Creo, но Topaz стоит 80 баксов в месяц, а в SYNTX уже включён в подписку.
Когда использовать Upscaler:
- Нужно добавить детализацию
- Когда Face Swap немного плохо лёг, отличается, нужно сгладить углы и шероховатости
Настройки Upscaler (на примере Topaz):
- Сила креатива: средняя (не на 100%, чтобы сохранить схожесть)
- Резкость: примерно 30% от всего ползунка
- Сила: несколько генераций, смотрите, как получается
Добавляется детализация, сглаживаются углы, где Deep Fake чуть-чуть плохо лёг — справляется очень хорошо.
Шаг 3: Создание видео в Veo3 через SYNTX
Теперь у нас есть качественное изображение с нами на картинке. Нужно оживить его, чтобы мы в кадре говорили, желательно нашим голосом.
Генерируем в Veo3. Без разницы, где это делать — на официальном сайте или в агрегаторах. Но удобнее всего в SYNTX, потому что:
- Оплата рублями через СБП без заморочек
- Без VPN и зарубежных карт
- Часто используются разные видеогенераторы — всё в одном месте
- Тариф Elite за 4900 рублей даёт безлимит Veo3 Fast и Sora 2 — генерируйте сколько угодно
Как генерировать Veo3 в SYNTX:
- Открываете SYNTX (веб-версию или Telegram-бот)
- Находите в главном меню "Видео будущего"
- Нажимаете Veo3
- Загружаете исходную картинку
- Вводите промт: что персонаж должен делать и что говорить
Промты пишем через ChatGPT (доступен в SYNTX — GPT-5, GPT-4o и другие):
Не нужен какой-то специальный бот. Здесь что-то лёгкое: персонаж движется, что-то делает, что-то говорит.
Пример промта:
"Сделай мне промт для нейронки Veo3. Парень должен посмотреть в камеру и сказать [текст на русском языке]. После он должен засмеяться."
ChatGPT пишет промт, вы его пересматриваете, копируете, вставляете в Veo3.
Настройки модели:
- Выбираете Veo3 или Veo3 Fast
- Veo3 — улучшенная модель, но съест много денег (в четыре раза больше, около 100 кредитов)
- Veo3 Fast — всего 19 кредитов, недорого и качество отличное
- Соотношение сторон: только 16:9 (горизонталка)
На тарифе Elite в SYNTX — безлимит Veo3 Fast. Генерируете хоть 1000 видео в день без ограничений за 4900 рублей в месяц. Официально Veo3 стоит 250 долларов (25 000 рублей) с ограничениями и сгорающими кредитами.
Сохраняете настройки, отправляете на генерацию.
Результат: Видео получается качественным, реалистичным, эмоции передаются хорошо. Как говорилось, от исходного изображения зависит качество финального видео — если изображение близко, детализировано, хорошо, то и видео получается отличным.
Важно: Голос пока не похож на ваш. Сейчас покажем, как исправить.
Чтобы сохранить видео, нажимаете на "Прямая ссылка" и сохраняете — так видео будет в полном качестве, не в урезанном.
Шаг 4: Создание озвучки вашим голосом
Как сделать так, чтобы персонажи, которых сгенерировали и которые похожи на вас, говорили вашим голосом?
Покажем на примере CapCut (можно использовать любой видеоредактор — DaVinci Resolve, Adobe Premiere и т.д.).
Шаг 1: Экспорт звука из видео
- Загружаете ваше видео с Veo3 в CapCut
- Нарезаете ролик (если нужно)
- Нажимаете "Экспортировать"
- Выбираете не видео, а Звук
- Сохраняете аудио — только звук нужен, картинка не нужна
Шаг 2: Клонирование голоса через ElevenLabs
Нейронка ElevenLabs — одна из лучших, которая клонирует голос и делает озвучку. Большой плюс — работает с русским языком (большая часть нейронок с русским не работает).
Клонирование голоса делается за 2 минуты:
- Заходите в ElevenLabs
- Нажимаете плюсик
- Выбираете Clone Voice
- Загружаете своё аудио — можно вырезать со своего видео или записать на диктофон (буквально минута-две хватит для обучения)
Важный совет: Записывайте с той интонацией, с которой хотите, чтобы были ваши видео. Если запишете монотонно, будет тяжело добиться, чтобы голос говорил эмоционально и классно.
После загрузки моделька обучается — за несколько минут она появится в вашем списке голосов.
Шаг 3: Замена голоса через Voice Changer
- Выбираете Voice Changer в ElevenLabs
- Загружаете аудио, которое экспортировали из видео Veo3 (где персонаж говорит не вашим голосом)
- Выбираете вашу обученную модель голоса
- Отправляете на генерацию — занимает 10-15 секунд максимум
Получается голос, похожий на ваш. Если иногда не похож, потыкайте настройки схожести, выберите автоматическое удаление заднего шума.
Шаг 4: Замена аудио в видеоредакторе
- Сохраняете новую аудиодорожку с вашим голосом
- Загружаете её в CapCut (или другой редактор) дополнительной дорожкой
- Убираете звук из оригинального видео
- Оставляете звук с вашим клонированным голосом
Готово! Теперь персонажи говорят голосом, похожим на ваш.
Почему делать всё это удобнее в SYNTX
Весь процесс создания видео с собой требует работы с несколькими нейросетями:
- Midjourney для генерации изображений
- Veo3 для создания видео
- GPT-5 / ChatGPT для написания промтов
- Upscaler для улучшения качества
- ElevenLabs для клонирования голоса
Можно подписываться на каждую нейросеть отдельно:
- Midjourney: 3500 рублей в месяц
- Veo3: 25 000 рублей в месяц
- GPT-5: около 2000 рублей в месяц
- Topaz Upscaler: 8000 рублей в месяц
Итого: около 38 500 рублей в месяц + кредиты сгорают в конце месяца.
Или использовать SYNTX:
Тариф Elite за 4900 рублей:
- Безлимит Veo3 Fast — генерируйте сколько угодно видео
- Безлимит Sora 2 — ещё один топовый видеогенератор
- Midjourney с полным функционалом
- GPT-5, GPT-4o, Claude, Gemini — все языковые модели
- Upscaler встроен
- Kling 1.6, Runway, Luma, Pika, Hailuo — все топовые видеогенераторы
- Suno 5 для музыки, синтез речи, 200+ голосов
- 90+ нейросетей в одном месте
Экономия: 33 600 рублей в месяц. За год — более 400 000 рублей.
Токены не сгорают — остаток переносится на следующий месяц. Оплата рублями через СБП, без VPN, без зарубежных карт. Единый интерфейс для всех нейросетей — не нужно привыкать к интерфейсу каждой отдельно.
Практические советы для лучших результатов
Для изображений:
- Фотографируйтесь с разных ракурсов, с разными эмоциями
- Хорошее освещение — свет должен попадать по-разному
- Не много боковых фотографий — будет генерировать боком
- Лицо ближе к камере — чем дальше, тем хуже сходство
- По пояс или крупнее — в полный рост лицо будет кашей
Для видео:
- Пишите промты через ChatGPT по референсам — работайте с примерами
- Veo3 Fast достаточно для 95% задач — не переплачивайте за обычный Veo3
- Используйте безлимит на тарифе Elite — генерируйте 50-100 вариантов, выбирайте лучшее
- Исходное изображение решает всё — чем качественнее, тем лучше видео
Для голоса:
- Записывайте с интонацией, которую хотите в итоге слышать
- Минуты-две аудио хватит для обучения ElevenLabs
- Если голос не похож — покрутите настройки схожести
- Автоматическое удаление шума помогает
Итоговая схема работы
- Подготовка: Делаете 7-10 селфи с разных ракурсов, с хорошим освещением
- Генерация изображения: Higgsfield (реализм) или Midjourney через SYNTX (кинематограф)
- Доработка: Face Swap через Pixi + Upscaler в SYNTX для детализации
- Промты: Пишете через GPT-5 в SYNTX по референсам
- Озвучка: Экспорт аудио → клонирование голоса в ElevenLabs → замена в редакторе
- Финал: Видео с вами в главной роли, с вашим голосом, в любой локации
Заключение
Создание видео с собой в главной роли — это уже не фантастика, а реальность. Можете стать героем фильма, рекламы, оказаться на яхте или в облаках. Всё зависит от фантазии и умения работать с нейросетями.
SYNTX делает этот процесс максимально простым и доступным:
- Все нейросети в одном месте
- Оплата рублями без VPN
- Тариф Elite за 4900 рублей с безлимитом Veo3 Fast и Sora 2
- Экономия десятков тысяч рублей в месяц
- Токены не сгорают
Попробуйте сами: bit.ly/syntxai99 — получите бонусные токены при регистрации, протестируйте возможности, создайте первое видео с собой. Начните с базового тарифа, а когда поймёте потенциал — переходите на Elite и генерируйте без ограничений.
2025 год — прорывной в генерации видео. Технологии доступны прямо сейчас. Осталось только начать создавать.