124 подписчика

OpenAI выпустила GPT-5.4. Я потестил — и вот что реально изменилось 👇

9 марта9 мар

3 мин

(больше контента про ии, it, технологии и автоматизацию с бесплатными гайдами в моём канале) Каждый релиз OpenAI сопровождается одним и тем же: хайп, скептики, мемы. Но GPT-5.4 — случай немного другой. Здесь есть несколько вещей, которые реально меняют то, как ты работаешь с ИИ каждый день. Не "улучшили бенчмарки", а именно — меняют процесс. Давай по порядку. Что вышло

5 марта 2026 года OpenAI представила GPT-5.4 🚀 — сразу в двух версиях: Thinking и Pro. Обновление затронуло ChatGPT, API и модель Codex. Главный фокус — не просто "стал умнее", а конкретные улучшения: глубокий веб-поиск, управление компьютером через скриншоты и меньше выдуманных фактов. Как было раньше — и почему это важно

GPT-5.2 была неплохой, но с характерной проблемой: на сложных многоэтапных задачах она работала как чёрный ящик 😬. Ты давал запрос, получал ответ — и никогда не знал заранее, в какую сторону модель пойдёт. Часто приходилось начинать заново. Веб-поиск — 65,8% на BrowseComp. Управление десктопом — 47,

(больше контента про ии, it, технологии и автоматизацию с бесплатными гайдами в моём канале)

Каждый релиз OpenAI сопровождается одним и тем же: хайп, скептики, мемы. Но GPT-5.4 — случай немного другой. Здесь есть несколько вещей, которые реально меняют то, как ты работаешь с ИИ каждый день. Не "улучшили бенчмарки", а именно — меняют процесс. Давай по порядку.

Что вышло
5 марта 2026 года OpenAI представила GPT-5.4 🚀 — сразу в двух версиях: Thinking и Pro. Обновление затронуло ChatGPT, API и модель Codex. Главный фокус — не просто "стал умнее", а конкретные улучшения: глубокий веб-поиск, управление компьютером через скриншоты и меньше выдуманных фактов.

Как было раньше — и почему это важно
GPT-5.2 была неплохой, но с характерной проблемой: на сложных многоэтапных задачах она работала как чёрный ящик 😬. Ты давал запрос, получал ответ — и никогда не знал заранее, в какую сторону модель пойдёт. Часто приходилось начинать заново. Веб-поиск — 65,8% на BrowseComp. Управление десктопом — 47,3% на OSWorld. Таблицы — 68,4%. И да, фактические ошибки встречались буквально в каждом ответе.

Три вещи, которые реально изменились 🔧

"Upfront plan" — теперь перед тем как начать работу, модель показывает тебе план: "сначала сделаю вот это, потом вот это". Ты можешь поправить прямо на старте. Это как архитектор, который показывает чертёж до того, как начать стройку 🏗 — вместо того чтобы сносить стены уже в готовом доме.

Computer use — ИИ научился управлять приложениями через скриншоты 🖱. Буквально: видит экран, двигает курсором, заполняет формы. На бенчмарке OSWorld — 75%, что выше заявленного человеческого уровня в 72,4% 🤯. Пока больше для разработчиков, но направление очевидно.

Меньше галлюцинаций — фактические ошибки снизились на 33% в отдельных утверждениях и на 18% в полных ответах ✅. Это не "стало идеально", но стало заметно честнее.

Плюс — работа с таблицами выросла до 87,3% 📊, веб-поиск до 82,7%, а скорость ответов увеличилась на 20–30% ⚡.

Минусы — и тут я скажу честно ⚠️

Галлюцинации никуда не делись — их стало меньше, но они есть. На узких и специфических темах модель всё ещё может уверенно врать 🤔.

Цена выросла 💸. API: с $1.75 до $2.50 за миллион токенов в базовой версии, Pro — ещё дороже. Для личных экспериментов терпимо, для продакшена — считай ROI внимательно.

Computer use пока сырой для обычного пользователя. Это инструмент для разработчиков и тех, кто строит агентные системы — не для "просто попробовать".

И неожиданный факт: в задачах терминала GPT-5.3-Codex (77,3%) всё ещё обходит GPT-5.4 (75,1%). Новое — не всегда лучшее во всём.

Как попробовать
Если ты обычный пользователь — зайди в режим Thinking и дай модели по-настоящему сложный многоэтапный запрос 🧠. Посмотри на план, поправь его. Почувствуй разницу.

Если разработчик — смотри на computer use и контекстное окно в 1 миллион токенов. Это уже другой уровень для агентов.

Если работаешь с данными — протестируй ChatGPT for Excel. Разница с предыдущей версией там ощутима.

Моё мнение
GPT-5.4 — это не революция, но честный шаг вперёд 🔮. Upfront plan — реально удобная штука, я уже использую. Computer use — смотрю с интересом, но пока жду, пока дозреет для нормального use case. Главное: OpenAI явно движется к ИИ, который не отвечает, а делает. И это уже интереснее, чем очередной прирост в бенчмарках.

📌 Итоги: главное за 1 минуту

🗓 5 марта 2026 — релиз GPT-5.4
🧠 Две версии — Thinking и Pro
📝 Upfront plan — видишь план до старта, правишь на ходу
🖱 Computer use — управление приложениями через скриншоты, 75% успеха
📊 Таблицы — 87.3%, веб-поиск — 82.7%
📉 Ошибок меньше — на 33% в утверждениях, на 18% в ответах
⚡ Быстрее на 20–30%
💰 Цена выросла — особенно для Pro

Публикую только важные новинки в своём канале. Рассказываю как бесплатно пользоваться нейросетями и автоматизировать жизнь, экономя сотни часов. Контент рассортирован по хэштегам и каждый найдёт полезное для себя.