Найти в Дзене
Vibecode Wiki

OpenAI выпустила GPT-5.4 — модель для профессиональной работы с 1 млн токенов, native computer-use и рекордными бенчмарками

Сегодня, 5 марта 2026 года, OpenAI официально представила GPT-5.4 — самую мощную и эффективную frontier-модель на сегодняшний день. Она сразу доступна в ChatGPT (как GPT-5.4 Thinking и Pro), API и Codex. Главный акцент — на реальном профессиональном использовании: сложный код, агентные workflow, работа с документами, таблицами и полноценное управление компьютером. Кратко: это уже не просто «большая модель», а готовый инструмент для разработчиков, который реально ускоряет работу и снижает количество ошибок. Есть две версии: OpenAI опубликовала официальную таблицу сравнения GPT-5.4 с GPT-5.3-Codex и GPT-5.2. Цифры говорят сами за себя — особенно в агентных задачах, компьютер-use и профессиональной работе. Бенчмарк GPT-5.4 GPT-5.3-Codex GPT-5.2 GDPval (wins or ties) 83.0% 70.9% 70.9% SWE-Bench Pro (Public) 57.7% 56.8% 55.6% OSWorld-Verified 75.0% 74.0%* 47.3% Toolathlon 54.6% 51.9% 46.3% BrowseComp 82.7% 77.3% 65.8% *Примечание: для GPT-5.3-Codex использовался новый параметр с
Оглавление

Сегодня, 5 марта 2026 года, OpenAI официально представила GPT-5.4 — самую мощную и эффективную frontier-модель на сегодняшний день. Она сразу доступна в ChatGPT (как GPT-5.4 Thinking и Pro), API и Codex. Главный акцент — на реальном профессиональном использовании: сложный код, агентные workflow, работа с документами, таблицами и полноценное управление компьютером.

Кратко: это уже не просто «большая модель», а готовый инструмент для разработчиков, который реально ускоряет работу и снижает количество ошибок.

Что нового в GPT-5.4

  • Контекст до 1 млн токенов — идеально для длинных проектов, анализа больших кодовых баз и долгосрочных агентных задач.
  • Native computer-use — модель может сама управлять браузером, кликать по координатам, заполнять формы, отправлять письма и выполнять сложные workflow (демо с Playwright Interactive впечатляет).
  • Upfront planning + steerability — теперь ChatGPT сначала строит план ответа и может корректировать его по ходу. Плюс преамбулы и mid-response инструкции работают намного лучше.
  • Улучшенная мультимодальность — лучшее распознавание документов, таблиц, презентаций и визуалов. Появился специальный ChatGPT for Excel add-in.
  • Tool search и token efficiency — модель сама выбирает нужные инструменты и тратит меньше токенов (быстрее и дешевле в использовании).

Есть две версии:

  • GPT-5.4 Thinking — для обычных задач (заменяет GPT-5.2 Thinking).
  • GPT-5.4 Pro — максимальная производительность для самых сложных кейсов (только Pro/Enterprise).

Бенчмарки: прямое сравнение с предыдущими моделями

OpenAI опубликовала официальную таблицу сравнения GPT-5.4 с GPT-5.3-Codex и GPT-5.2. Цифры говорят сами за себя — особенно в агентных задачах, компьютер-use и профессиональной работе.

Бенчмарк GPT-5.4 GPT-5.3-Codex GPT-5.2 GDPval (wins or ties) 83.0% 70.9% 70.9% SWE-Bench Pro (Public) 57.7% 56.8% 55.6% OSWorld-Verified 75.0% 74.0%* 47.3% Toolathlon 54.6% 51.9% 46.3% BrowseComp 82.7% 77.3% 65.8%

*Примечание: для GPT-5.3-Codex использовался новый параметр сохранения разрешения изображений.

Дополнительные рекордные результаты GPT-5.4:

  • Spreadsheet modeling: 87.3% (было 68.4%)
  • Presentations (по оценке людей): предпочтение 68.0% против GPT-5.2
  • WebArena-Verified: 67.3%
  • MMMU-Pro: 81.2%
  • ARC-AGI-1: 93.7% (было 86.2%)

Особенно сильно выросли показатели в работе с таблицами, презентациями и агентными задачами. Для разработчиков это значит: меньше багов в коде, быстрее прототипирование и надёжные автономные агенты.

Доступность и цены

Сейчас (постепенный rollout с 5 марта):

  • ChatGPT Plus / Team / Pro — GPT-5.4 Thinking (GPT-5.2 Thinking останется ещё на 3 месяца).
  • Pro и Enterprise — GPT-5.4 Pro.
  • API: gpt-5.4 и gpt-5.4-pro (Codex поддерживает 1M контекст экспериментально).

Цены выросли (как и ожидалось):

Модель Input (за 1M токенов) Output (за 1M токенов) gpt-5.2 $1.75 $14 gpt-5.4 $2.50 $15 gpt-5.2-pro $21 $168 gpt-5.4-pro $30 $180

Batch/Flex — в два раза дешевле, Priority — в два раза дороже.

Что это значит для вайбкодеров и разработчиков

GPT-5.4 — это уже не просто чат. Это полноценный коллега, который:

  • сам запускает браузер и делает рутинные действия,
  • анализирует огромные репозитории,
  • строит сложные модели в Excel и презентации,
  • создаёт надёжных агентов без постоянного контроля.

Для тех, кто строит продукты на OpenAI API и Codex, это прямой апгрейд производительности и новый уровень автоматизации.