Похоже, Google снова пытается перехватить повестку в ИИ. Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами. Gemini Omni позиционируется как самостоятельная AI-модель Google, а не как обновление видеогенератора Veo. Модель должна работать с текстом, изображениями, кодом, видео, аудио, таблицами и большими массивами данных в одном диалоге. Пользователь сможет загрузить видео и попросить Gemini Omni изменить сцену, ракурс, стиль, качество изображения, звук или применить монтажный шаблон. По предварительным данным, модель превосходит Google Veo по качеству изображения, стабильности сцены при смене ракурса и реалистичности звука. Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы: - добавить эффекты в видео со смартфона - сделать картину из грубого наброска - собрать образовательный подкаст по ф
Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash
2 дня назад2 дня назад
1 мин