OpenAI на днях выпустила долгожданное обновление своей модели генерации изображений — GPT Image 2. Главным прорывом новой версии стала способность корректно отображать текст на изображениях: модель наконец-то научилась генерировать читаемые надписи без искажений, пропущенных букв и «каши» вместо слов — причём не только на английском, но и на других языках, включая русский. Это открывает совершенно новые возможности для создания постеров, рекламных баннеров, мемов, инфографики и любого визуального контента, где текст играет ключевую роль. То, что раньше требовало ручной доработки в графических редакторах, теперь можно получить сразу «из коробки» — и это настоящий game changer для дизайнеров, маркетологов нейрокреаторов и контент-мейкеров.
В чем отличия от старой модели GPT Image 1.5
GPT Image 2 — обновлённая модель генерации изображений от OpenAI. В основе лежит переработанная архитектура с однопроходным рендерингом (вместо прежних двух этапов) и значительно расширенная база знаний о реальном мире. Принцип работы прост: пользователь вводит текстовое описание — модель выдаёт готовое изображение. Также доступен режим редактирования: можно загрузить существующее фото и попросить заменить фон, изменить одежду, скорректировать выражение лица или применить другой стиль — при этом модель сохранит исходного человека на снимке.
Ключевые улучшения по сравнению с GPT Image 1.5:
- Корректный текст на изображениях — надписи генерируются без ошибок и артефактов, включая кириллицу. Заявленная точность превышает 99%.
- Естественная цветопередача — исчез характерный желтоватый «пластиковый» оттенок, картинки выглядят реалистичнее.
- Узнавание брендов и интерфейсов — модель корректно воспроизводит логотипы и UI известных сервисов: YouTube, Ozon, Apple и других.
- Консистентность персонажей — один и тот же герой сохраняется между разными изображениями, что идеально подходит для создания серий иллюстраций и маскотов.
- Скорость × 2 — генерация работает примерно вдвое быстрее предшественника.
Как пользоваться из России?
Получить прямой доступ к модели через OpenAI из России — задача не из простых: потребуется VPN или другие инструменты для обхода региональных ограничений, иностранная банковская карта и подписка ChatGPT Plus или Pro. Технически реализуемо, но процесс утомительный. Да и минимальный платеж в 20$ в месяц по подписке удовольствие не из дешевых.
Хорошо что мы в asix.space уже добавили эту модель и вы можете воспользоваться ей абсолютно бесплатно из России без всяких ВПН. По промокоду НЕЙРОКРЕАТОР при регистрации начислим 50 поинтов, хватит на 5 генераций. Стоимость одной генерации всего 10 рублей!
Ну а теперь к примерам!
В первую очередь пробуем работу с текстом.
Винтажный советский плакат с жирными красными и кремовыми цветами. Героический рабочий поднимает ноутбук над головой. Крупный текст сверху: "ДЕДЛАЙН НЕ ЖДЁТ!" и мелкий текст снизу: "Сдавай проект вовремя". Стиль пропагандистского искусства с полутоновой текстурой. Generate as horizontal landscape image, 1536x1024 pixels.
Рукописная карточка рецепта на состаренной бумаге с кофейными пятнами. Красивая каллиграфия: "Бабушкины сырники" как заголовок, ниже список ингредиентов: "Творог — 500г, Яйца — 2 шт, Мука — 3 ложки, Сахар — по вкусу". Тёплый кухонный фон слегка размыт. Generate as horizontal landscape image, 1536x1024 pixels.
Неоновая вывеска, светящаяся в темноте на кирпичной стене уютного ночного кафе. Вывеска показывает текст: "Кофе и Wi-Fi" тёплыми розовыми и голубыми неоновыми трубками. Капли дождя на объективе камеры, огни боке на заднем плане. Фотореалистичный стиль. Generate as horizontal landscape image, 1536x1024 pixels.
Дальше попробуем как он справится с генерацией скриншотов известных платформ
Скриншот страницы товара на Ozon, показывающий забавный товар: подушку в форме гигантского пельменя. Название товара: "Подушка Пельмень гигант 60см". Цена: "1 499 ₽", рейтинг 4.8 звезды с "2 847 отзывов". Значок "Хит продаж". Реалистичный интерфейс маркетплейса Ozon. Generate as horizontal landscape image, 1536x1024 pixels.
Скриншот интерфейса чата Telegram на горизонтальном экране планшета. Чат называется "Рабочий чат 💼" с сообщениями: первое сообщение от "Босс" гласит "Срочно нужен отчёт", второе сообщение от "Я" гласит "Уже отправляю!", третье сообщение показывает "Босс печатает...". Синие галочки, реалистичный UI Telegram с тёмной темой. Generate as horizontal landscape image, 1536x1024 pixels.
Скриншот страницы видео на YouTube. Превью видео показывает шокированного мужчину, указывающего на золотистого ретривера в очках. Название видео: "Моя собака сдала ЕГЭ лучше меня". Название канала: "Лютый Контент", просмотры: "2,4 млн просмотров", опубликовано "3 дня назад". Кнопка лайка показывает "185 тыс." Реалистичный интерфейс YouTube 2024. Generate as horizontal landscape image, 1536x1024 pixels.
Теперь попробуем как он справится с реальными местами и брендами
Фотореалистичное изображение Красной площади в Москве зимними сумерками. Собор Василия Блаженного подсвечен разноцветными огнями, падает лёгкий снег. На переднем плане тележка уличного торговца с горячими напитками и вывеской "Глинтвейн 200₽". Туристы фотографируются, волшебная рождественская атмосфера. Generate as horizontal landscape image, 1536x1024 pixels.
Фото MacBook Pro на минималистичном белом столе с открытым сайтом Apple на русском языке. Рядом: iPhone 15 Pro, чехол AirPods и чашка матча-латте. Мягкий естественный свет из окна слева, чистая эстетика. На экране виден текст: "Добро пожаловать". Generate as horizontal landscape image, 1536x1024 pixels.
Витрина кафе Starbucks дождливым вечером в Санкт-Петербурге. Классическая европейская архитектура окружает современную кофейню. Зелёный логотип Starbucks светится, в окне видна русская доска меню с надписями "Тыквенный латте" и "Капучино". Мокрая брусчатка отражает огни. Generate as horizontal landscape image, 1536x1024 pixels.
Попробуем смешные анархизмы
Ренессансная картина маслом в стиле Рафаэля, изображающая знатную даму за богато украшенным столом. Она раздражена, смотрит на MacBook с надписью "Ошибка 404". Драматичное освещение, богатые ткани, херувимы в облаках выглядят растерянными. Музейная табличка гласит: "Дама с ноутбуком, 1512". Generate as horizontal landscape image, 1536x1024 pixels.
Древнеегипетская настенная роспись в стиле гробницы, изображающая фараона на троне, вокруг иероглифы. Он держит смартфон и делает селфи. Современный текстовый пузырь на кириллице: "Щас сторис выложу". Традиционные охра, синий и золотой цвета на текстуре песчаника. Generate as horizontal landscape image, 1536x1024 pixels.
Советская чёрно-белая фотография 1960-х годов, показывающая космонавтов в скафандрах, собравшихся вокруг стола. Они увлечённо играют в PlayStation 5. Консоль и телевизор выглядят анахронично современными. Подпись внизу шрифтом пишущей машинки: "Гагарин и команда на тренировке, 1961". Аутентичная зернистость плёнки. Generate as horizontal landscape image, 1536x1024 pixels.
Теперь попробуем применение для работы
Профессиональный слайд презентации с чистым корпоративным дизайном. Заголовок: "Итоги Q3 2024". Инфографика с восходящим графиком, три блока с иконками и подписями: "Рост выручки +45%", "Новые клиенты: 12 500", "NPS: 78 баллов". Современная сине-белая цветовая схема, минималистичный стиль. Generate as horizontal landscape image, 1536x1024
Первый слайд карусели Instagram для маркетингового агентства. Жирная современная типографика на градиентном фиолетово-оранжевом фоне. Основной текст: "5 ошибок в таргете, которые сливают бюджет". Мелкий текст: "Листай →". Чистые геометрические формы, профессиональный дизайн для соцсетей. Горизонтальная композиция для ленты. Generate as horizontal landscape image, 1536x1024 pixels.
Дизайн обложки книги для бизнес-бестселлера. Горизонтальный формат для рекламного баннера. Заголовок жирным шрифтом: "Хватит мечтать — начни делать" с подзаголовком "Практическое руководство для предпринимателей". Имя автора: "Алексей Петров". Минималистичный дизайн с иконкой ракеты, взлетающей из открытой книги. Профессиональное издательское качество. Generate as horizontal landscape image, 1536x1024 pixels.
Теперь попробуем игровые и эпохальные стилизации
Сцена в визуальном стиле загрузочного экрана GTA 5. Бородатый мужчина в спортивном костюме Adidas сидит на корточках на лавочке, держит пакет семечек. Советские многоэтажки (хрущёвки) на заднем плане. Жирный стилизованный текст внизу: "ГТА: Челябинск". Стиль иллюстраций Rockstar Games. Generate as horizontal landscape image, 1536x1024 pixels.
Страница средневековой иллюминированной рукописи, изображающая рыцаря в доспехах, сражающегося с трёхглавым драконом. Витиеватые золотые бордюры с цветочными узорами. Текст в древнерусском стиле сверху: "Сказание о храбром программисте" и снизу: "Битва с багами". Текстура состаренного пергамента, насыщенные красные и синие тона. Горизонтальная композиция свитка. Generate as horizontal landscape image, 1536x1024 pixels.
Скриншот из вымышленной RPG-видеоигры в стиле Ведьмака 3. Славянский воин с заплетённой бородой стоит в туманном болоте. Диалоговое окно квеста внизу показывает имя NPC "Баба Яга" и текст: "Принеси мне три мухомора, добрый молодец". Видны полоска здоровья и мини-карта. Generate as horizontal landscape image, 1536x1024 pixels.
Ну и на последок попробуем фотореализм
Спонтанное фото с iPhone на пикнике в золотой час в московском парке. Молодая пара смеётся, делится клубникой на клетчатом пледе. Сталинская высотка видна на размытом заднем плане. Естественные блики, слегка пересвеченные светлые участки, аутентичный вид смартфонной фотографии. Generate as horizontal landscape image, 1536x1024 pixels.
Селфи с iPhone улыбающейся девушки в уютном кафе, держащей латте с пенкой. Она в оверсайз-свитере, натуральный макияж. Тёплое освещение интерьера, малая глубина резкости, лёгкая зернистость, характерная для камер смартфонов. Момент выглядит искренним и непостановочным. Горизонтальная композиция с видом интерьера кафе. Generate as horizontal landscape image, 1536x1024 pixels.
Случайное фото с iPhone из окна машины во время путешествия. Бескрайние российские просторы, бесконечные поля подсолнухов до горизонта. Приборная панель слегка видна внизу, размытие движения на ближайших цветах, драматичные облака. Аутентичная эстетика тревел-фотографии. Generate as horizontal landscape image, 1536x1024 pixels.
Итог
Если следить за развитием генеративных моделей, то GPT Image 2 — пожалуй, главное событие последнего полугодия. Текст на изображениях? Работает отлично: афиши, обложки, баннеры, схемы — всё читается. Нужно воссоздать интерфейс приложения или сайта? Получается узнаваемо. Хотите реалистичное фото без того самого «нейросетевого лоска»? Модель справляется. Плюс персонаж остаётся похожим на себя в разных сценах. По всем этим пунктам она обгоняет как свою предшественницу, так и Nano Banana.
Но если задача — выстроить сложную геометрию в кадре или получить картинку для печати в 4K, возможно, стоит посмотреть в сторону других инструментов.
Попробовать эту и другие модели бесплатно и без ВПН и танцев с бубнами можно прямо сейчас по ссылке asix.space
По промокоду НЕЙРОКРЕАТОР при регистрации начислим 50 поинтов, хватит на 5 генераций. Стоимость одной генерации всего 10 рублей!