Компания представила семейство моделей Gemini Omni. Первая версия — Gemini Omni Flash — создаёт видеоролики длиной до 10 секунд из любых типов данных и понимает физику реального мира. Новая модель Google Omni объединяет мультимодальные возможности экосистемы Gemini с глубоким знанием устройства мира. Она воспроизводит гравитацию, динамику жидкостей и учитывает исторический и научный контекст при генерации сцен. Главное отличие от предыдущей модели Veo — функция преобразования одного видео в другое. Пользователь может редактировать исходные кадры через диалог на естественном языке, и алгоритм сохраняет логику сцены и последовательность действий персонажей при каждом новом запросе. Также доступна генерация цифрового аватара с озвучкой собственным голосом. По словам руководителя команды Николь Брихтовой, похожая функция интеграции внешности в прошлогодней модели Nano Banana пользовалась огромным спросом. С её помощью создали больше 50 млрд изображений. Пока ролики ограничены 10 секундами