Google готовит к анонсу Gemini Omni — новую мультимодальную AI-модель семейства Gemini для работы с текстом, кодом, изображениями, видео и данными. Ее могут представить на конференции Google I/O уже 19-20 мая. Gemini Omni позиционируется как самостоятельная AI-модель Google, а не как обновление видеогенератора Veo. Модель должна работать с текстом, изображениями, кодом, видео, аудио, таблицами и большими массивами данных в одном диалоге. 👁 Пример видео, сгенерированного в Gemini Omni, можно посмотреть тут. Ключевая особенность Gemini Omni — редактирование видео с помощью текстовых команд: нейросеть сможет менять ролик по запросу пользователя прямо в чате. Пользователь сможет загрузить видео и попросить Gemini Omni изменить сцену, ракурс, стиль, качество изображения, звук или применить монтажный шаблон. По предварительным данным, модель превосходит Google Veo по качеству изображения, стабильности сцены при смене ракурса и реалистичности звука. ・・・・・・・・・・・・・ Возможности Gemini Om
Google Gemini Omni: мультимодальная AI-модель для генерации видео, текста, изображений и редактирования видео
11 мая11 мая
19
1 мин