Добавить в корзинуПозвонить
Найти в Дзене
Social Mebia Systems

«Банановая революция» Google: новый Gemini 2.5 Flash Image штурмует трон AI картинок

Новый король изображения 27 августа Google представила Gemini 2.5 Flash Image — свой самый передовой генеративный и редакторский модельный инструмент для работы с изображениями. Всего за сутки он стал лидером рейтингов, оставив позади GPT‑4o, Flux.1 и других сильных конкурентов. Главное преимущество — точное и естественное редактирование, вплоть до замены текстур, изменения освещения, цветокоррекции и удаления объектов простыми текстовыми командами. По сути, речь идёт о «фоторедакторе будущего», доступном каждому. Стоимость одной операции — менее 30 копеек в пересчёте на рубли, что делает софт типа Photoshop уязвимым перед новой волной AI‑решений. Секрет успеха: консистентность и «мировое знание» Одной из главных проблем для генеративных моделей всегда оставалась стабильность внешности персонажей при смене сцен или многократной перегенерации. Gemini 2.5 Flash Image научился сохранять одинаковые черты лица, стиль и детали объектов в разных условиях съёмки. Кроме того, модель интегриров

Новый король изображения

27 августа Google представила Gemini 2.5 Flash Image — свой самый передовой генеративный и редакторский модельный инструмент для работы с изображениями. Всего за сутки он стал лидером рейтингов, оставив позади GPT‑4o, Flux.1 и других сильных конкурентов.

Главное преимущество — точное и естественное редактирование, вплоть до замены текстур, изменения освещения, цветокоррекции и удаления объектов простыми текстовыми командами. По сути, речь идёт о «фоторедакторе будущего», доступном каждому. Стоимость одной операции — менее 30 копеек в пересчёте на рубли, что делает софт типа Photoshop уязвимым перед новой волной AI‑решений.

Секрет успеха: консистентность и «мировое знание»

Одной из главных проблем для генеративных моделей всегда оставалась стабильность внешности персонажей при смене сцен или многократной перегенерации. Gemini 2.5 Flash Image научился сохранять одинаковые черты лица, стиль и детали объектов в разных условиях съёмки.

  • Пользователь может загрузить одно фото, а на выходе получить серию портретов от 1950‑х до 2000‑х годов — и всё это без «потери» индивидуальности.
  • Для дизайнеров и брендов это возможность создавать целые серии рекламных материалов с неизменным героем.

Кроме того, модель интегрирована с «мировым знанием» Gemini. Она способна понимать контекст рукописных зарисовок, интерпретировать объекты в образовательных или игровых сценариях и даже прогнозировать логическое развитие сцены (например, шарик, приближающийся к кактусу, в следующем кадре может «лопнуть»).

Инструменты для бизнеса и творчества

Google выкатил сразу набор приложений в AI Studio, где можно бесплатно испытать новые возможности:

  • Past Forward — «перемещение во времени» для портретов;
-2
  • Pixshop — текстовые команды для точной ретуши (изменение цвета зубов, света, фона и т. д.);
  • Codrawing — образовательный помощник по детским рисункам;
  • HomeCanvas — интеграция товаров в интерьеры и креативное совмещение нескольких изображений.
-3

Уже сейчас маркетологи используют его для создания рекламных сетов, а любители — для мемов и фотомонтажа с высокой скоростью и точностью. В связке с видеомоделью Veo 3 технология позволяет получать полноценные ролики, где трёхмерная вариативность кадров обеспечивается генератором картинок Gemini.

Стоимость и доступность

Модель уже доступна разработчикам через Gemini API, Google AI Studio и корпоративную платформу Vertex AI.

  • Цена — $30 за 1 млн токенов.
  • Одна картинка требует около 1290 выходных токенов, что соответствует примерно $0,039 или около 0,28 юаня/3 руб.

Таким образом, профессиональная генерация изображений стала дешевле, чем у многих конкурентов, а входной порог для применения — минимален.

Ограничения и вызовы

Несмотря на успех, часть пользователей уже пожаловалась на строгую цензуру — модель отказывается генерировать сцены с оружием или потенциально опасными предметами. Также отмечаются различия в стилизации: по уровню художественного стиля Gemini пока уступает некоторым конкурентам вроде GPT‑4o.

Итог: AI‑редактор нового поколения

Gemini 2.5 Flash Image — это шаг к будущему, где редактирование изображений превращается в обычный диалог. Для бизнеса — это инструмент точного бренд‑контента и дешёвого A/B‑тестирования визуалов. Для обычных пользователей — новый уровень креативной свободы.

Мировая гонка в области AI‑редактирования только набирает обороты: Midjourney, OpenAI и китайские Qwen уже выпускают собственные редакторы. Но именно Google с «банановым» проектом показала, как объединить консистентность, скорость и низкую цену.

Теперь у рынка новый ориентир — и Photoshop действительно впервые рискует оказаться в числе проигравших.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/