922 подписчика

Google Gemini Omni: мультимодальная AI-модель для генерации видео, текста, изображений и редактирования видео

11 мая11 мая

1 мин

Google готовит к анонсу Gemini Omni — новую мультимодальную AI-модель семейства Gemini для работы с текстом, кодом, изображениями, видео и данными. Ее могут представить на конференции Google I/O уже 19-20 мая. Gemini Omni позиционируется как самостоятельная AI-модель Google, а не как обновление видеогенератора Veo. Модель должна работать с текстом, изображениями, кодом, видео, аудио, таблицами и большими массивами данных в одном диалоге. 👁 Пример видео, сгенерированного в Gemini Omni, можно посмотреть тут. Ключевая особенность Gemini Omni — редактирование видео с помощью текстовых команд: нейросеть сможет менять ролик по запросу пользователя прямо в чате. Пользователь сможет загрузить видео и попросить Gemini Omni изменить сцену, ракурс, стиль, качество изображения, звук или применить монтажный шаблон. По предварительным данным, модель превосходит Google Veo по качеству изображения, стабильности сцены при смене ракурса и реалистичности звука. ・・・・・・・・・・・・・ Возможности Gemini Om

Google готовит к анонсу Gemini Omni — новую мультимодальную AI-модель семейства Gemini для работы с текстом, кодом, изображениями, видео и данными.

Ее могут представить на конференции Google I/O уже 19-20 мая.

Gemini Omni позиционируется как самостоятельная AI-модель Google, а не как обновление видеогенератора Veo. Модель должна работать с текстом, изображениями, кодом, видео, аудио, таблицами и большими массивами данных в одном диалоге.

👁 Пример видео, сгенерированного в Gemini Omni, можно посмотреть тут.

Ключевая особенность Gemini Omni — редактирование видео с помощью текстовых команд: нейросеть сможет менять ролик по запросу пользователя прямо в чате.

Пользователь сможет загрузить видео и попросить Gemini Omni изменить сцену, ракурс, стиль, качество изображения, звук или применить монтажный шаблон. По предварительным данным, модель превосходит Google Veo по качеству изображения, стабильности сцены при смене ракурса и реалистичности звука.

・・・・・・・・・・・・・

Возможности Gemini Omni: видео, код, данные и интеграция через API

Модель рассчитана на несколько направлений:

1️⃣ Создание и редактирование видео, изображений и сценариев;

2️⃣ Анализ документов, таблиц и больших объёмов информации;

3️⃣ Написание и проверка кода;

4️⃣ Интеграция в приложения через Gemini API;

5️⃣ Работа с сервисами Google, включая Google Cloud и, вероятно, Google Sheets;

6️⃣ Автоматизация бизнес-процессов, отчетности, маркетинга и аналитики.

・・・・・・・・・・・・・

После релиза нейросеть Gemini Omni будет добавлена в @yes_ai_bot

Следите за новостями на канале https://dzen.ru/id/66db0403156c6d0428df202d