12 подписчиков

GPT‑5 кратко: главные новинки, отличия и сравнение с конкурентами

8 августа 20258 авг 2025

3 мин

GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины. Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%. Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде. Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro. Больше информации о релизе Chat GPT 5 у нас на сайте

Оглавление

Главные новшества GPT‑5
Где прирост заметен на практике
GPT‑5 vs GPT‑4o и o3

Главные новшества GPT‑5

Единая система с роутером: модель сама решает, когда отвечать быстро, а когда «думать дольше» (можно принудить фразой «подумай тщательно над этим»).
Меньше ошибок: ~45% меньше фактических промахов vs GPT‑4o; при рассуждении ~80% меньше, чем у o3; на LongFact/FActScore — до 6× меньше галлюцинаций.
Больше честности: лучше распознаёт невозможные/недоопределённые задачи и сообщает о лимитах; «обманчивость» на прод‑трафике снижена до ~2,1% (vs 4,8% у o3).
Меньше угодничества: доля «поддакиваний» сокращена с ~14,5% до <6%; стиль — сдержанней, по делу.
«Safe completions»: вместо голых отказов — максимально полезные, но безопасные ответы (особенно в dual‑use темах).
Эффективное рассуждение: результаты как у o3 при 50–80% меньшем объёме токенов на сложных задачах.

Где прирост заметен на практике

Кодинг: лучший результат OpenAI на реальных задачах SWE‑bench Verified (74,9%) и Aider Polyglot (88%). Сильная фронтенд‑генерация «с одного промпта», грамотная отладка крупных репо.
Письмо и креатив: глубже держит форму и ритм, меньше клише; помогает от «сырой идеи» до «готового текста» (репорты, письма, тосты, статьи).
Медицина: лучший у OpenAI на HealthBench/Hard (до 46,2%); ведёт себя как «мыслящий партнёр». Важно: не заменяет врача.
Мультимодальность: новый пик на MMMU (84,2%), VideoMMMU и CharXiv — точнее читает графики, фото слайдов, диаграммы.
Инструкции и «агентность»: лучше в multi‑turn сценариях, броузинге/поиске, function calling; точнее следует кастом‑инструкциям.

Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%.

GPT‑5 vs GPT‑4o и o3

Унификация: встроенный роутер между «быстрее» и «глубже» (у 4o/o3 этого нет в таком виде).
Фактичность и честность: ощутимо меньше галлюцинаций и «уверенных небылиц», лучше сигнализирует невозможность задачи.
Кодинг и мультимодальность: рост в реальном инжиниринге (SWE‑bench) и визуально‑видео‑логике (MMMU/VideoMMMU).
Стиль и послушность: меньше sycophancy, лучше держит инструкции и тон.
Эффективность: глубина рассуждения при меньшем количестве токенов.

Сравнение с конкурентами

Claude 3.x/3.5: силён в редактуре и деликатном диалоге. GPT‑5 выигрывает в мультимодальной логике, агентном поиске/браузинге, честности на открытых бенчах и кодинге (SWE‑bench).
Google Gemini 1.5: козыри — длинный контекст и интеграция с экосистемой Google. GPT‑5 — сильнее в тяжёлых науко‑математических вопросах, агентности и «умной» маршрутизации глубины.
Open‑weights (Llama, Mistral): приватность и контроль на своей инфраструктуре. GPT‑5 — сильнее «из коробки» на широкой корзине задач без тонкой инженерии вокруг.

GPT‑5 Pro

Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде.

Доступ и планы

GPT‑5 — новый дефолт в ChatGPT (заменяет GPT‑4o/o3/о4‑mini/4.1/4.5).
Роллаут: Plus, Pro, Team и Free — уже; Enterprise/Edu — через неделю.
Pro — безлимитный GPT‑5 и доступ к GPT‑5 Pro; Plus/Team — щедрые лимиты; Free — при превышении лимитов авто‑переход на GPT‑5 mini.
Разработчикам: кодинг с GPT‑5 через Codex CLI.

Кому особенно зайдёт

Продукт/инжиниринг: быстрые фронты, фиксы в репозиториях, планирование релизов.
Аналитика/консалтинг: разборы графиков/слайдов, отчёты с источниками.
Контент/маркетинг: тексты «под голос», локализация со смыслом.
Образование: объяснения разными стилями, проверка понимания.
Здоровье: подготовка к визиту, разбор терминов (не медицинский совет).

Как выжать максимум ✨

Явно просите рассуждение: «подумай тщательно», «шаги 1–2–3», «альтернативы и риски».
Форматируйте ответ: «сначала план, затем код и тесты», «запроси уточнения при нехватке контекста».
Включайте веб‑поиск с ограничениями по источникам/датам; для кода — давайте структуру проекта и тесты.
Используйте пресеты‑личности (Cynic/Robot/Listener/Nerd) вместо длинных промптов‑«характеров».

Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro.

Больше информации о релизе Chat GPT 5 у нас на сайте