42 подписчика

🚩Google вчера показал видеомодель, которая редактирует ролики голосом

20 мая20 мая

1 мин

Просто текстом — и не ломая всё остальное в кадре. На Google I/O 2026 официально представили Gemini Omni — мультимодальную модель для создания видео. Пока доступна облегчённая версия — Omni Flash. И уже она выглядит как смена правил. Что умеет. Генерирует видео из чего угодно — текста, картинок, рисунков, словесного описания. Внутри использует Veo, Genie и Gemini Nano. Главная техническая фишка — модель понимает законы физики: учитывает гравитацию и кинетическую энергию объектов. То есть это не «красивая болтанка пикселей», а попытка реалистичной физики в кадре. Но самое интересное не это. Главное — редактирование готового видео обычным текстовым запросом. Вы пишете «замени фон на закат» — и модель меняет только фон. Все персонажи, объекты, ракурс — на своих местах. Раньше каждое изменение требовало либо перегенерации с нуля (и тогда герой выходил уже другим человеком), либо ручного монтажа. Тут модель понимает контекст. Просили поменять одно — она меняет одно. Где уже работает. Omn

🚩Google вчера показал видеомодель, которая редактирует ролики голосом.

Просто текстом — и не ломая всё остальное в кадре.

На Google I/O 2026 официально представили Gemini Omni — мультимодальную модель для создания видео. Пока доступна облегчённая версия — Omni Flash. И уже она выглядит как смена правил.

Что умеет. Генерирует видео из чего угодно — текста, картинок, рисунков, словесного описания. Внутри использует Veo, Genie и Gemini Nano. Главная техническая фишка — модель понимает законы физики: учитывает гравитацию и кинетическую энергию объектов. То есть это не «красивая болтанка пикселей», а попытка реалистичной физики в кадре.

Но самое интересное не это.

Главное — редактирование готового видео обычным текстовым запросом. Вы пишете «замени фон на закат» — и модель меняет только фон. Все персонажи, объекты, ракурс — на своих местах. Раньше каждое изменение требовало либо перегенерации с нуля (и тогда герой выходил уже другим человеком), либо ручного монтажа.

Тут модель понимает контекст. Просили поменять одно — она меняет одно.

Где уже работает. Omni Flash доступна в приложении Gemini и встроена в инструменты для авторов YouTube Shorts. То есть короткие вертикальные ролики Google планирует генерить и править прямо внутри своей платформы.

Мой вывод. Если это работает так, как показывают, монтажные программы для коротких роликов теряют половину смысла. Зачем резать таймлайн, если можно написать «убери человека слева, удлини сцену на две секунды, добавь дождь» — и получить результат.

Я подожду первых независимых тестов и сравнений с Sora и Veo. Но направление движения очевидное: видео уходит туда же, куда ушли тексты и картинки — в диалог.

А вы бы что попробовали сгенерировать первым делом, если бы получили доступ прямо сейчас? Напишите в комментариях.