Найти в Дзене
Social Mebia Systems

Что обещал OpenAI

OpenAI представила ChatGPT Images / GPT Image 1.5 как флагманский визуальный модель: То есть по сухой статистике модель выглядит почти идеальной. Реальные тесты: «высокие баллы, низкая практическая польза» Как только модель вышла в открытый доступ, сообщество засыпало её примерами «в реале». Ключевые претензии: Это накладывается на недавнюю волну критики в адрес GPT‑5.2 и усиливает впечатление, что OpenAI «захлёбывается» в попытках быстро ответить на наступление Google. Что реально умеет GPT Image 1.5 (там, где он силён) При всём негативе, модель действительно серьёзно прокачали: 1. Точность редактирования и многошаговые правки Для дизайнерских правок, маркетинговых креативов и e‑commerce‑каталогов это реально полезно. 2. Креативность и стилизации GPT Image 1.5 уверенно: Здесь у модели действительно много фантазии и контроля над деталями. 3. Управляемость сценой и объектами 4. Улучшение людей и «массовых кадров» По сравнению с первой версией GPT Image: 5. Текст на картинках и UI/код‑сц

OpenAI представила ChatGPT Images / GPT Image 1.5 как флагманский визуальный модель:

  • Сильные стороны по задумке:
  • точное следование инструкциям («указал — исправил ровно там»);
  • лучшее сохранение деталей и стиля при редактировании;
  • до 4 раз быстрее предыдущей версии;
  • доступен всем пользователям ChatGPT (включая бесплатных) и через API;
  • В бенчмарках:
  • на LMArena в текст‑в‑картинку GPT Image 1.5 выходит на первое место, обгоняя Google Nano Banana Pro;
  • в задачах редактирования картинок chatgpt-image-latest тоже занимает первое место, сам GPT Image 1.5 — в топ‑4;
  • на Artificial Analysis — «двойной» лидер.

То есть по сухой статистике модель выглядит почти идеальной.

Реальные тесты: «высокие баллы, низкая практическая польза»

Как только модель вышла в открытый доступ, сообщество засыпало её примерами «в реале».

Ключевые претензии:

  • Логика и «понимание» задач слабее, чем у Nano Banana Pro.
    В тестах с рукописными заметками GPT Image 1.5 делает внешне аккуратную картинку, но содержательно даёт неверный результат. У Google Nano Banana Pro решения правильные.
  • В соцсетях модель прямо называют:
  • «типичный high‑score, low‑IQ кейс»;
  • «очередной неловкий и бессмысленный релиз OpenAI».
    Многие считают, что
    Nano Banana Pro по‑прежнему лидер для серьёзных задач, несмотря на рейтинги.

Это накладывается на недавнюю волну критики в адрес GPT‑5.2 и усиливает впечатление, что OpenAI «захлёбывается» в попытках быстро ответить на наступление Google.

Что реально умеет GPT Image 1.5 (там, где он силён)

При всём негативе, модель действительно серьёзно прокачали:

1. Точность редактирования и многошаговые правки

  • Очень хорошо работает режим «указал — поправил ровно это»:
  • добавить детей на фон,
  • изменить стиль лица одного персонажа, не трогая остальных,
  • заменить собаку на плюшевую игрушку,
  • одеть всех в одинаковые свитера с логотипом.
  • Можно многократно дорабатывать одну и ту же сцену:
  • менять фон (день рождения → студия OpenAI),
  • достраивать персонажей и объекты,
  • потом перенести итоговую сцену, например, на принт футболки и снова «надеть» её на героя.
  • При этом модель довольно хорошо сохраняет композицию и общую «пластику» сцены.

Для дизайнерских правок, маркетинговых креативов и e‑commerce‑каталогов это реально полезно.

2. Креативность и стилизации

GPT Image 1.5 уверенно:

  • делает стилизованные постеры, «ретро‑обложки», рекламные плакаты;
  • превращает фотографию в:
  • постер «золотого Голливуда»,
  • обложку VHS‑аэробики 80‑х,
  • чучело‑игрушку, новогоднюю подвеску, и т.п.;
  • генерирует «выверенные» концептуальные стили (глам‑кукла, camp‑эстетика, ретро‑газировка, иконичные живописные образы вроде «Девушки с жемчужной серёжкой»).

Здесь у модели действительно много фантазии и контроля над деталями.

3. Управляемость сценой и объектами

  • Сложные сцены с множеством объектов (например, скейтбордист в конкретном городе, с конкретной техникой съёмки и светом) дорабатываются точно по инструкции:
  • менять цвета одежды,
  • заменять грузовик на пожарную машину,
  • добавлять толпу зрителей, птицу, дирижабль и т.д.
  • Модель хорошо переносит получившийся результат на другие носители (постеры, принты, одежда), сохраняя ключевые элементы.

4. Улучшение людей и «массовых кадров»

По сравнению с первой версией GPT Image:

  • лица стали более естественными и детализированными;
  • «массовые сцены» (толпа у моста, многолюдная улица) выглядят современнее и правдоподобнее, без яркого «старого генеративного» артефактного стиля;
  • лучше передаётся атмосфера любительской фотографии, а не только «глянцевого рендера».

5. Текст на картинках и UI/код‑сцены

  • Рендеринг текста (особенно на английском) стал заметно лучше: мелкие шрифты, структура блоков, подписи.
  • Модель способна правдоподобно отрисовывать:
  • инфографику (например, карточку калорийности),
  • интерфейсы приложений и IDE,
  • макеты лендингов и простых приложений.

Это делает её более пригодной для задач прототипирования и продуктового дизайна.

Где GPT Image 1.5 откровенно слаб

OpenAI сама признаёт ряд проблем:

  1. Специфические художественные стили
  • Некоторые стили (особенно «тонко определённые» аниме/манга‑стили) стали хуже по сравнению с предыдущей версией.
  • В примерах с японской аниме‑графикой новый модель более детализирован, но хуже попадает в ожидаемый визуальный язык.
  1. Групповые фото и консистентность лиц
  • Модель всё ещё плохо справляется с точной «фотошопной» правкой большого числа людей на одном кадре.
  • При попытке, например, «надеть на всех одинаковые футболки и заставить их улыбаться» лица сильно «плывут» и меняются.
  1. Многоязычный текст
  • С рендерингом китайского (и других не‑латинских письменностей, включая арабский и иврит) по‑прежнему большие проблемы.
  • Для задач «картинка с корректными надписями на китайском» GPT Image 1.5 почти непригоден — здесь конкуренты, вроде Qwen‑Image, выглядят лучше.
  1. Общая «интеллектуальная точность» против Nano Banana Pro
  • На примерах с рукописными заметками и сложными визуально‑логическими задачами GPT Image 1.5 часто проигрывает Nano Banana Pro по корректности, хотя визуально выдаёт привлекательные результаты.
  • Поэтому для задач, где важна именно правильность интерпретации, а не только картинка, разработчики часто предпочитают Google‑модель.

Бизнес‑аспект: цена и ставка OpenAI

  • GPT Image 1.5 в API подешевел на ~20% по сравнению с GPT Image 1.0 (за вход/выход‑токены).
  • OpenAI явно позиционирует его как инструмент для:
  • брендинга и маркетинга (логотипы, визуальные концепции, рекламные креативы),
  • e‑commerce (массовая генерация продуктовых изображений, вариаций сцен, ракурсов),
  • креативных приложений.

Одновременно это — попытка парировать успех Google Nano Banana Pro и готовящегося Gemini 3 Flash, которые активно «отъедают» mindshare у разработчиков.

Почему вокруг столько негатива

Комьюнити реагирует жёстко по трём причинам:

  1. Контраст с ожиданиями.
    OpenAI подавала обновление как «рождественский коронный номер» на фоне конкуренции с Google. На этом фоне любая слабость сразу выглядит как провал.
  2. Фон GPT‑5.2.
    До этого GPT‑5.2 тоже встретили прохладно: улучшения есть, но «вау‑эффекта» не случилось. Возникает ощущение «серии неубедительных апдейтов».
  3. Сравнение с Nano Banana Pro.
    Конкретные side‑by‑side примеры (особенно для реалистичных портретов, e‑commerce и сложного визуального понимания) часто складываются не в пользу GPT Image 1.5, а разработчики смотрят именно на такие живые кейсы, а не на рейтинги.

Отсюда мемы с «плак‑фрог» в стиле официального тизера OpenAI и комментарии вроде «OpenAI is finished» — эмоциональная, но показательная реакция части саппорт‑аудитории.

Если кратко: GPT Image 1.5 технически стал намного лучше, особенно в управляемом редактировании и креативных задачах, но в «интеллектуальном» понимании картинки и ряде практических сценариев он сейчас объективно уступает Nano Banana Pro. Поэтому по ощущениям это не «убийца конкурентов», а промежуточный, местами противоречивый шаг OpenAI на фоне усиливающегося давления со стороны Google и китайских моделей.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/