Google выпустила Veo 3.1 — обновление, которое серьезно меняет возможности AI-генерации видео. Основные изменения касаются звука, контроля над сценами и инструментов редактирования.
Тестировали модель неделю и поняли — это попытка Google переиграть OpenAI. Разбираем ключевые нововведения и показываем, где Veo 3.1 превосходит Sora 2, а где пока отстает.
Что изменилось в Veo 3.1: основные направления
Veo 3.1 развивается в трех направлениях: звук, управление сценами и качество картинки.
Нативный звук
Теперь Veo 3.1 генерирует звук одновременно с видео. Раньше AI-видео были немыми — аудио добавляли отдельно.
Что умеет генерировать:
- Диалоги с правильным движением губ
- Звуки окружения по контексту сцены
- Музыку под настроение ролика
- Звуковые эффекты для действий
Пример: Попросили видео "шеф-повар нарезает овощи на кухне". Veo 3.1 добавил звуки нарезки, шипение сковороды и фоновую музыку ресторана.
Тестировать новые возможности можно через Telegram-бот с доступом к Veo 3.1 без VPN и сложной регистрации.
Продвинутое управление сценами
Усовершенствованную функцию image-to-video, которая обеспечивает более высокое качество аудиовизуального ряда и точнее следует пользовательским запросам.
Ingredients to Video — загружаете несколько изображений (персонажи, объекты, стили), и система создает связный ролик с этими элементами.
Frames to Video — определяете первый и последний кадр, AI генерирует плавный переход между ними.
Extend — продлеваете существующее видео, система анализирует последнюю секунду и создает логичное продолжение.
Эти инструменты решают главную проблему AI-видео — отсутствие контроля над сюжетом.
Улучшения картинки
Модель лучше понимает физику материалов, освещение и взаимодействие персонажей. Особенно заметно в коммерческих сценах — текстуры металла, ткани и жидкостей выглядят реалистичнее.
Flow: обновленный видеоредактор
Google добавила в Flow функции, которые превращают его в серьезного конкурента профессиональных редакторов.
Insert/Remove объектов — добавление или удаление элементов сцены с автоматической реконструкцией фона.
Интеллектуальный монтаж — система автоматически подбирает освещение, тени и перспективу для новых объектов.
Аудио во всех инструментах — теперь каждая функция Flow генерирует соответствующее звуковое сопровождение.
Пример: загрузили видео с улицей, удалили машину — система не только убрала объект, но и восстановила асфальт, разметку и тени от других предметов.
Доступность и цены: кто может пользоваться
Veo 3.1 и версия Veo 3.1 Fast доступны в приложении Gemini, а также через Gemini API и Vertex AI. VEO 3.1 ценообразование следует структуре Gemini API: VEO 3.1 Standard стоит приблизительно $0.40 за секунду сгенерированного видео с аудио, в то время как VEO 3.1 Fast стоит около $0.15 за секунду для более быстрой генерации.
Бесплатный доступ:
- 100 кредитов в месяц через Flow (хватает на 5 видео)
- Доступ через приложение Gemini (только для подписчиков AI Pro)
Платные тарифы:
- Gemini AI Pro: $20/месяц с ограниченным доступом
- Veo 3.1 Standard: $0.40 за секунду генерации
- Veo 3.1 Fast: $0.15 за секунду (быстрее, но ниже качество)
Альтернативный вариант — использовать Telegram-бот с доступом к Veo 3.1 без VPN и с оплатой российскими картами через СБП. Это удобнее официальных сервисов для российских пользователей.
Для разработчиков:
- Gemini API для интеграции в приложения
- Vertex AI для корпоративных решений
- Документация и примеры кода
Сравнение стоимости с конкурентами показывает, что Veo 3.1 в настоящее время является самой дорогой моделью генерации видео, наравне с Sora 2 и только позади Sora 2 Pro.
Veo 3.1 vs Sora 2: детальное сравнение
Качество видео и реализм
Veo 3.1 побеждает в:
- Veo 3.1 выглядит более "рекламного качества" по материалам, микро-бликам и контролируемому освещению
- Детализация текстур и поверхностей
- Правильное поведение жидкостей и физика материалов
- Профессиональное освещение в коммерческих сценах
Sora 2 сильнее в:
- Естественность движений персонажей
- Сохранение идентичности героев в длинных роликах
- Sora 2 более верно интерпретировал многоэтапные промпты, синхронизировал сцены с голосовым повествованием (включая китайский)
Звук и аудио
Veo 3.1:
- Veo 3.1 лучше справляется с синхронизацией губ, чем любая другая доступная модель. В режиме текст-в-видео она генерирует связное окружающее аудио, которое соответствует элементам сцены
- Профессиональная обработка звука
- Многослойное аудио (диалог + эффекты + музыка)
Sora 2:
- Лучшая синхронизация с повествованием
- Поддержка множества языков включая русский
- Sora 2 создает более "полный" нарративный пакет, потому что закадровый голос естественно интегрируется с порядком сцен
Длительность и форматы
Veo 3.1:
- Максимум 8 секунд за генерацию
- Поддержка как горизонтального (16:9), так и вертикального (9:16) форматов
- Возможность создания роликов до 60 секунд через функцию Extend
Sora 2:
- До 20-25 секунд в новом Storyboard режиме
- Лучше подходит для социальных сетей
- Более быстрая генерация (30 секунд против 45 у Veo)
Контроль и редактирование
Veo 3.1 — явный лидер:
- Точечное редактирование сцен
- Контроль первого и последнего кадра
- Инструменты Insert/Remove
- Референсные изображения для консистентности
Sora 2:
- Функция Cameo для вставки себя в видео
- Простота использования
- Социальные функции и remix
Подробные инструкции по работе с Sora 2 доступны на форуме Yes AI, где разобраны все тонкости создания качественных промптов.
Доступность и цена
Veo 3.1:
- Доступен через API для разработчиков
- Более высокая стоимость генерации
- Профессиональные инструменты
Sora 2:
- Sora 2 использует токенную систему — около $0.15 за видео, независимо от длины
- Invite-only доступ
- Социальное приложение в стиле TikTok
Практические кейсы: где использовать каждую модель
Veo 3.1 лучше для:
Коммерческой рекламы
- Презентации товаров с профессиональным освещением
- Рекламные ролики для брендов
- Демонстрация продуктов в действии
Образовательного контента
- Обучающие видео с четким звуком
- Визуализация сложных процессов
- Корпоративные презентации
Профессионального производства
- Видео для сайтов и лендингов
- Контент для B2B-сегмента
- Материалы, требующие постпродакшена
Sora 2 оптимальна для:
Социальных сетей
- TikTok и Instagram Reels
- Вирусный контент
- Персональные видео с Cameo
Сторителлинга
- Если вы создаете живописный или иллюстративный контент, Sora 2 в настоящее время обеспечивает более надежный художественный контроль
- Анимированные истории
- Стилизованный контент
Быстрого прототипирования
- Тестирование идей для роликов
- Создание референсов для команды
- Массовое производство контента
Технические ограничения и подводные камни
Общие проблемы обеих моделей
Ни одна из них не идеальна — их самый большой недостаток? Подсчет пальцев. Я попробовал промпт: "Парень считает от 1 до 10 на пальцах", и обе полностью испортили соответствие чисел правильным пальцам.
Другие ограничения:
- Сложная физика жидкостей (преломление света в стеклах)
- Мелкий текст и надписи
- Сложные взаимодействия множества объектов
- Длинные цепочки действий
Специфичные проблемы Veo 3.1
Image-to-video с диалогами страдает от тех же проблем, что и стандартная генерация image-to-video. Veo 3.1 настолько приоритизирует связность, что игнорирует соблюдение промптов и референсные изображения
Когда Veo 3.1 подводит:
- Работа с референсными изображениями людей
- Сложные многоэтапные промпты
- Стилизованный контент (аниме, мультипликация)
Ограничения Sora 2
- Invite-only доступ создает барьеры
- Модерация контента более строгая
- Меньше инструментов для точного контроля
- Проблемы с очень длинными промптами
Будущее развития: что ждать дальше
Планы Google для Veo
В ближайших обновлениях ожидаются: увеличение максимальной длительности до 60 секунд, улучшенный контроль над движениями камеры, расширенные возможности редактирования уже созданного контента, интеграция с другими продуктами OpenAI
Краткосрочные улучшения:
- Увеличение длительности роликов
- Больше контроля над камерой
- Интеграция с YouTube и другими сервисами Google
- Улучшение работы с референсными изображениями
Конкуренция с OpenAI
Релиз Veo 3.1 в тот же день, что и апгрейд Sora 2 Storyboard, показывает серьезность намерений Google. Компания не собирается отдавать рынок AI-видео без боя.
Ключевые направления конкуренции:
- Длительность роликов (Google стремится к 60+ секундам)
- Качество звука (уже преимущество Google)
- Профессиональные инструменты (Flow против социального приложения Sora)
- API для разработчиков (Google лидирует в доступности)
Практические рекомендации: что выбрать
Выбирайте Veo 3.1, если:
- Создаете коммерческий или корпоративный контент
- Нужны профессиональные инструменты редактирования
- Важно качество звука и детализация
- Готовы платить за премиум-функции
- Разрабатываете приложения с AI-видео
Выбирайте Sora 2, если:
- Фокус на социальных сетях и вирусном контенте
- Нужна быстрая генерация для массового производства
- Важна простота использования
- Создаете стилизованный или художественный контент
- Бюджет ограничен
Используйте обе модели:
Многие профессионалы уже применяют гибридный подход: После тестирования я оставляю оба в своем наборе инструментов. Sora 2 для быстрых постов, Veo 3.1 для клиентской работы
Оптимальная стратегия:
- Sora 2 для брейнсторминга и быстрых прототипов
- Veo 3.1 для финальных версий и коммерческого использования
- Flow для постпродакшена и точной настройки
Доступ без ограничений: альтернативные платформы
Пока официальные платформы имеют ограничения по доступу и цене, появляются альтернативные сервисы. Telegram-бот с доступом к Veo 3.1 и Sora 2 предоставляет возможность тестировать новые функции без VPN и сложной регистрации.
Преимущества альтернативных платформ:
- Нет географических ограничений
- Поштучная оплата без подписок
- Быстрый доступ к новым функциям
- Техподдержка на русском языке
Veo 3.1 представляет эволюционное, но значимое улучшение AI-генерации видео. Google сделала ставку на профессиональные инструменты и качество звука, в то время как OpenAI фокусируется на массовом рынке и социальных функциях.
Veo 3.1 — это прагматичное и хорошо продуманное обновление: его непосредственная ценность заключается в уменьшении разрыва между идеей и финальной сценой. Выбор между Veo 3.1 и Sora 2 зависит от конкретных задач, но тренд очевиден — AI-видео становится инструментом профессионального уровня, способным конкурировать с традиционным производством.
Нейросети дают не просто удобство — они ускоряют работу и открывают новые форматы контента. Главное — использовать их с умом и под задачу.
Читайте также: