31 подписчик

Что обещал OpenAI

19 декабря 202519 дек 2025

6 мин

OpenAI представила ChatGPT Images / GPT Image 1.5 как флагманский визуальный модель: То есть по сухой статистике модель выглядит почти идеальной. Реальные тесты: «высокие баллы, низкая практическая польза» Как только модель вышла в открытый доступ, сообщество засыпало её примерами «в реале». Ключевые претензии: Это накладывается на недавнюю волну критики в адрес GPT‑5.2 и усиливает впечатление, что OpenAI «захлёбывается» в попытках быстро ответить на наступление Google. Что реально умеет GPT Image 1.5 (там, где он силён) При всём негативе, модель действительно серьёзно прокачали: 1. Точность редактирования и многошаговые правки Для дизайнерских правок, маркетинговых креативов и e‑commerce‑каталогов это реально полезно. 2. Креативность и стилизации GPT Image 1.5 уверенно: Здесь у модели действительно много фантазии и контроля над деталями. 3. Управляемость сценой и объектами 4. Улучшение людей и «массовых кадров» По сравнению с первой версией GPT Image: 5. Текст на картинках и UI/код‑сц

OpenAI представила ChatGPT Images / GPT Image 1.5 как флагманский визуальный модель:

Сильные стороны по задумке:
точное следование инструкциям («указал — исправил ровно там»);
лучшее сохранение деталей и стиля при редактировании;
до 4 раз быстрее предыдущей версии;
доступен всем пользователям ChatGPT (включая бесплатных) и через API;
В бенчмарках:
на LMArena в текст‑в‑картинку GPT Image 1.5 выходит на первое место, обгоняя Google Nano Banana Pro;
в задачах редактирования картинок chatgpt-image-latest тоже занимает первое место, сам GPT Image 1.5 — в топ‑4;
на Artificial Analysis — «двойной» лидер.

То есть по сухой статистике модель выглядит почти идеальной.

Реальные тесты: «высокие баллы, низкая практическая польза»

Как только модель вышла в открытый доступ, сообщество засыпало её примерами «в реале».

Ключевые претензии:

Логика и «понимание» задач слабее, чем у Nano Banana Pro.
В тестах с рукописными заметками GPT Image 1.5 делает внешне аккуратную картинку, но содержательно даёт неверный результат. У Google Nano Banana Pro решения правильные.
В соцсетях модель прямо называют:
«типичный high‑score, low‑IQ кейс»;
«очередной неловкий и бессмысленный релиз OpenAI».
Многие считают, что Nano Banana Pro по‑прежнему лидер для серьёзных задач, несмотря на рейтинги.

Это накладывается на недавнюю волну критики в адрес GPT‑5.2 и усиливает впечатление, что OpenAI «захлёбывается» в попытках быстро ответить на наступление Google.

Что реально умеет GPT Image 1.5 (там, где он силён)

При всём негативе, модель действительно серьёзно прокачали:

1. Точность редактирования и многошаговые правки

Очень хорошо работает режим «указал — поправил ровно это»:
добавить детей на фон,
изменить стиль лица одного персонажа, не трогая остальных,
заменить собаку на плюшевую игрушку,
одеть всех в одинаковые свитера с логотипом.
Можно многократно дорабатывать одну и ту же сцену:
менять фон (день рождения → студия OpenAI),
достраивать персонажей и объекты,
потом перенести итоговую сцену, например, на принт футболки и снова «надеть» её на героя.
При этом модель довольно хорошо сохраняет композицию и общую «пластику» сцены.

Для дизайнерских правок, маркетинговых креативов и e‑commerce‑каталогов это реально полезно.

2. Креативность и стилизации

GPT Image 1.5 уверенно:

делает стилизованные постеры, «ретро‑обложки», рекламные плакаты;
превращает фотографию в:
постер «золотого Голливуда»,
обложку VHS‑аэробики 80‑х,
чучело‑игрушку, новогоднюю подвеску, и т.п.;
генерирует «выверенные» концептуальные стили (глам‑кукла, camp‑эстетика, ретро‑газировка, иконичные живописные образы вроде «Девушки с жемчужной серёжкой»).

Здесь у модели действительно много фантазии и контроля над деталями.

3. Управляемость сценой и объектами

Сложные сцены с множеством объектов (например, скейтбордист в конкретном городе, с конкретной техникой съёмки и светом) дорабатываются точно по инструкции:
менять цвета одежды,
заменять грузовик на пожарную машину,
добавлять толпу зрителей, птицу, дирижабль и т.д.
Модель хорошо переносит получившийся результат на другие носители (постеры, принты, одежда), сохраняя ключевые элементы.

4. Улучшение людей и «массовых кадров»

По сравнению с первой версией GPT Image:

лица стали более естественными и детализированными;
«массовые сцены» (толпа у моста, многолюдная улица) выглядят современнее и правдоподобнее, без яркого «старого генеративного» артефактного стиля;
лучше передаётся атмосфера любительской фотографии, а не только «глянцевого рендера».

5. Текст на картинках и UI/код‑сцены

Рендеринг текста (особенно на английском) стал заметно лучше: мелкие шрифты, структура блоков, подписи.
Модель способна правдоподобно отрисовывать:
инфографику (например, карточку калорийности),
интерфейсы приложений и IDE,
макеты лендингов и простых приложений.

Это делает её более пригодной для задач прототипирования и продуктового дизайна.

Где GPT Image 1.5 откровенно слаб

OpenAI сама признаёт ряд проблем:

Специфические художественные стили

Некоторые стили (особенно «тонко определённые» аниме/манга‑стили) стали хуже по сравнению с предыдущей версией.
В примерах с японской аниме‑графикой новый модель более детализирован, но хуже попадает в ожидаемый визуальный язык.

Групповые фото и консистентность лиц

Модель всё ещё плохо справляется с точной «фотошопной» правкой большого числа людей на одном кадре.
При попытке, например, «надеть на всех одинаковые футболки и заставить их улыбаться» лица сильно «плывут» и меняются.

Многоязычный текст

С рендерингом китайского (и других не‑латинских письменностей, включая арабский и иврит) по‑прежнему большие проблемы.
Для задач «картинка с корректными надписями на китайском» GPT Image 1.5 почти непригоден — здесь конкуренты, вроде Qwen‑Image, выглядят лучше.

Общая «интеллектуальная точность» против Nano Banana Pro

На примерах с рукописными заметками и сложными визуально‑логическими задачами GPT Image 1.5 часто проигрывает Nano Banana Pro по корректности, хотя визуально выдаёт привлекательные результаты.
Поэтому для задач, где важна именно правильность интерпретации, а не только картинка, разработчики часто предпочитают Google‑модель.

Бизнес‑аспект: цена и ставка OpenAI

GPT Image 1.5 в API подешевел на ~20% по сравнению с GPT Image 1.0 (за вход/выход‑токены).
OpenAI явно позиционирует его как инструмент для:
брендинга и маркетинга (логотипы, визуальные концепции, рекламные креативы),
e‑commerce (массовая генерация продуктовых изображений, вариаций сцен, ракурсов),
креативных приложений.

Одновременно это — попытка парировать успех Google Nano Banana Pro и готовящегося Gemini 3 Flash, которые активно «отъедают» mindshare у разработчиков.

Почему вокруг столько негатива

Комьюнити реагирует жёстко по трём причинам:

Контраст с ожиданиями.
OpenAI подавала обновление как «рождественский коронный номер» на фоне конкуренции с Google. На этом фоне любая слабость сразу выглядит как провал.
Фон GPT‑5.2.
До этого GPT‑5.2 тоже встретили прохладно: улучшения есть, но «вау‑эффекта» не случилось. Возникает ощущение «серии неубедительных апдейтов».
Сравнение с Nano Banana Pro.
Конкретные side‑by‑side примеры (особенно для реалистичных портретов, e‑commerce и сложного визуального понимания) часто складываются не в пользу GPT Image 1.5, а разработчики смотрят именно на такие живые кейсы, а не на рейтинги.

Отсюда мемы с «плак‑фрог» в стиле официального тизера OpenAI и комментарии вроде «OpenAI is finished» — эмоциональная, но показательная реакция части саппорт‑аудитории.

Если кратко: GPT Image 1.5 технически стал намного лучше, особенно в управляемом редактировании и креативных задачах, но в «интеллектуальном» понимании картинки и ряде практических сценариев он сейчас объективно уступает Nano Banana Pro. Поэтому по ощущениям это не «убийца конкурентов», а промежуточный, местами противоречивый шаг OpenAI на фоне усиливающегося давления со стороны Google и китайских моделей.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/