OpenAI представила ChatGPT Images / GPT Image 1.5 как флагманский визуальный модель:
- Сильные стороны по задумке:
- точное следование инструкциям («указал — исправил ровно там»);
- лучшее сохранение деталей и стиля при редактировании;
- до 4 раз быстрее предыдущей версии;
- доступен всем пользователям ChatGPT (включая бесплатных) и через API;
- В бенчмарках:
- на LMArena в текст‑в‑картинку GPT Image 1.5 выходит на первое место, обгоняя Google Nano Banana Pro;
- в задачах редактирования картинок chatgpt-image-latest тоже занимает первое место, сам GPT Image 1.5 — в топ‑4;
- на Artificial Analysis — «двойной» лидер.
То есть по сухой статистике модель выглядит почти идеальной.
Реальные тесты: «высокие баллы, низкая практическая польза»
Как только модель вышла в открытый доступ, сообщество засыпало её примерами «в реале».
Ключевые претензии:
- Логика и «понимание» задач слабее, чем у Nano Banana Pro.
В тестах с рукописными заметками GPT Image 1.5 делает внешне аккуратную картинку, но содержательно даёт неверный результат. У Google Nano Banana Pro решения правильные. - В соцсетях модель прямо называют:
- «типичный high‑score, low‑IQ кейс»;
- «очередной неловкий и бессмысленный релиз OpenAI».
Многие считают, что Nano Banana Pro по‑прежнему лидер для серьёзных задач, несмотря на рейтинги.
Это накладывается на недавнюю волну критики в адрес GPT‑5.2 и усиливает впечатление, что OpenAI «захлёбывается» в попытках быстро ответить на наступление Google.
Что реально умеет GPT Image 1.5 (там, где он силён)
При всём негативе, модель действительно серьёзно прокачали:
1. Точность редактирования и многошаговые правки
- Очень хорошо работает режим «указал — поправил ровно это»:
- добавить детей на фон,
- изменить стиль лица одного персонажа, не трогая остальных,
- заменить собаку на плюшевую игрушку,
- одеть всех в одинаковые свитера с логотипом.
- Можно многократно дорабатывать одну и ту же сцену:
- менять фон (день рождения → студия OpenAI),
- достраивать персонажей и объекты,
- потом перенести итоговую сцену, например, на принт футболки и снова «надеть» её на героя.
- При этом модель довольно хорошо сохраняет композицию и общую «пластику» сцены.
Для дизайнерских правок, маркетинговых креативов и e‑commerce‑каталогов это реально полезно.
2. Креативность и стилизации
GPT Image 1.5 уверенно:
- делает стилизованные постеры, «ретро‑обложки», рекламные плакаты;
- превращает фотографию в:
- постер «золотого Голливуда»,
- обложку VHS‑аэробики 80‑х,
- чучело‑игрушку, новогоднюю подвеску, и т.п.;
- генерирует «выверенные» концептуальные стили (глам‑кукла, camp‑эстетика, ретро‑газировка, иконичные живописные образы вроде «Девушки с жемчужной серёжкой»).
Здесь у модели действительно много фантазии и контроля над деталями.
3. Управляемость сценой и объектами
- Сложные сцены с множеством объектов (например, скейтбордист в конкретном городе, с конкретной техникой съёмки и светом) дорабатываются точно по инструкции:
- менять цвета одежды,
- заменять грузовик на пожарную машину,
- добавлять толпу зрителей, птицу, дирижабль и т.д.
- Модель хорошо переносит получившийся результат на другие носители (постеры, принты, одежда), сохраняя ключевые элементы.
4. Улучшение людей и «массовых кадров»
По сравнению с первой версией GPT Image:
- лица стали более естественными и детализированными;
- «массовые сцены» (толпа у моста, многолюдная улица) выглядят современнее и правдоподобнее, без яркого «старого генеративного» артефактного стиля;
- лучше передаётся атмосфера любительской фотографии, а не только «глянцевого рендера».
5. Текст на картинках и UI/код‑сцены
- Рендеринг текста (особенно на английском) стал заметно лучше: мелкие шрифты, структура блоков, подписи.
- Модель способна правдоподобно отрисовывать:
- инфографику (например, карточку калорийности),
- интерфейсы приложений и IDE,
- макеты лендингов и простых приложений.
Это делает её более пригодной для задач прототипирования и продуктового дизайна.
Где GPT Image 1.5 откровенно слаб
OpenAI сама признаёт ряд проблем:
- Специфические художественные стили
- Некоторые стили (особенно «тонко определённые» аниме/манга‑стили) стали хуже по сравнению с предыдущей версией.
- В примерах с японской аниме‑графикой новый модель более детализирован, но хуже попадает в ожидаемый визуальный язык.
- Групповые фото и консистентность лиц
- Модель всё ещё плохо справляется с точной «фотошопной» правкой большого числа людей на одном кадре.
- При попытке, например, «надеть на всех одинаковые футболки и заставить их улыбаться» лица сильно «плывут» и меняются.
- Многоязычный текст
- С рендерингом китайского (и других не‑латинских письменностей, включая арабский и иврит) по‑прежнему большие проблемы.
- Для задач «картинка с корректными надписями на китайском» GPT Image 1.5 почти непригоден — здесь конкуренты, вроде Qwen‑Image, выглядят лучше.
- Общая «интеллектуальная точность» против Nano Banana Pro
- На примерах с рукописными заметками и сложными визуально‑логическими задачами GPT Image 1.5 часто проигрывает Nano Banana Pro по корректности, хотя визуально выдаёт привлекательные результаты.
- Поэтому для задач, где важна именно правильность интерпретации, а не только картинка, разработчики часто предпочитают Google‑модель.
Бизнес‑аспект: цена и ставка OpenAI
- GPT Image 1.5 в API подешевел на ~20% по сравнению с GPT Image 1.0 (за вход/выход‑токены).
- OpenAI явно позиционирует его как инструмент для:
- брендинга и маркетинга (логотипы, визуальные концепции, рекламные креативы),
- e‑commerce (массовая генерация продуктовых изображений, вариаций сцен, ракурсов),
- креативных приложений.
Одновременно это — попытка парировать успех Google Nano Banana Pro и готовящегося Gemini 3 Flash, которые активно «отъедают» mindshare у разработчиков.
Почему вокруг столько негатива
Комьюнити реагирует жёстко по трём причинам:
- Контраст с ожиданиями.
OpenAI подавала обновление как «рождественский коронный номер» на фоне конкуренции с Google. На этом фоне любая слабость сразу выглядит как провал. - Фон GPT‑5.2.
До этого GPT‑5.2 тоже встретили прохладно: улучшения есть, но «вау‑эффекта» не случилось. Возникает ощущение «серии неубедительных апдейтов». - Сравнение с Nano Banana Pro.
Конкретные side‑by‑side примеры (особенно для реалистичных портретов, e‑commerce и сложного визуального понимания) часто складываются не в пользу GPT Image 1.5, а разработчики смотрят именно на такие живые кейсы, а не на рейтинги.
Отсюда мемы с «плак‑фрог» в стиле официального тизера OpenAI и комментарии вроде «OpenAI is finished» — эмоциональная, но показательная реакция части саппорт‑аудитории.
Если кратко: GPT Image 1.5 технически стал намного лучше, особенно в управляемом редактировании и креативных задачах, но в «интеллектуальном» понимании картинки и ряде практических сценариев он сейчас объективно уступает Nano Banana Pro. Поэтому по ощущениям это не «убийца конкурентов», а промежуточный, местами противоречивый шаг OpenAI на фоне усиливающегося давления со стороны Google и китайских моделей.
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/