Просто текстом — и не ломая всё остальное в кадре. На Google I/O 2026 официально представили Gemini Omni — мультимодальную модель для создания видео. Пока доступна облегчённая версия — Omni Flash. И уже она выглядит как смена правил. Что умеет. Генерирует видео из чего угодно — текста, картинок, рисунков, словесного описания. Внутри использует Veo, Genie и Gemini Nano. Главная техническая фишка — модель понимает законы физики: учитывает гравитацию и кинетическую энергию объектов. То есть это не «красивая болтанка пикселей», а попытка реалистичной физики в кадре. Но самое интересное не это. Главное — редактирование готового видео обычным текстовым запросом. Вы пишете «замени фон на закат» — и модель меняет только фон. Все персонажи, объекты, ракурс — на своих местах. Раньше каждое изменение требовало либо перегенерации с нуля (и тогда герой выходил уже другим человеком), либо ручного монтажа. Тут модель понимает контекст. Просили поменять одно — она меняет одно. Где уже работает. Omn
🚩Google вчера показал видеомодель, которая редактирует ролики голосом
20 мая20 мая
1 мин