Добавить в корзинуПозвонить
Найти в Дзене
Разум Будущего

GPT‑5 кратко: главные новинки, отличия и сравнение с конкурентами

GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины. Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%. Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде. Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro. Больше информации о релизе Chat GPT 5 у нас на сайте
Оглавление
GPT‑5 кратко: главные новинки, отличия и сравнение с конкурентами
GPT‑5 кратко: главные новинки, отличия и сравнение с конкурентами

GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины.

Главные новшества GPT‑5

  • Единая система с роутером: модель сама решает, когда отвечать быстро, а когда «думать дольше» (можно принудить фразой «подумай тщательно над этим»).
  • Меньше ошибок: ~45% меньше фактических промахов vs GPT‑4o; при рассуждении ~80% меньше, чем у o3; на LongFact/FActScore — до 6× меньше галлюцинаций.
  • Больше честности: лучше распознаёт невозможные/недоопределённые задачи и сообщает о лимитах; «обманчивость» на прод‑трафике снижена до ~2,1% (vs 4,8% у o3).
  • Меньше угодничества: доля «поддакиваний» сокращена с ~14,5% до <6%; стиль — сдержанней, по делу.
  • «Safe completions»: вместо голых отказов — максимально полезные, но безопасные ответы (особенно в dual‑use темах).
  • Эффективное рассуждение: результаты как у o3 при 50–80% меньшем объёме токенов на сложных задачах.

Где прирост заметен на практике

  • Кодинг: лучший результат OpenAI на реальных задачах SWE‑bench Verified (74,9%) и Aider Polyglot (88%). Сильная фронтенд‑генерация «с одного промпта», грамотная отладка крупных репо.
  • Письмо и креатив: глубже держит форму и ритм, меньше клише; помогает от «сырой идеи» до «готового текста» (репорты, письма, тосты, статьи).
  • Медицина: лучший у OpenAI на HealthBench/Hard (до 46,2%); ведёт себя как «мыслящий партнёр». Важно: не заменяет врача.
  • Мультимодальность: новый пик на MMMU (84,2%), VideoMMMU и CharXiv — точнее читает графики, фото слайдов, диаграммы.
  • Инструкции и «агентность»: лучше в multi‑turn сценариях, броузинге/поиске, function calling; точнее следует кастом‑инструкциям.

Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%.

GPT‑5 vs GPT‑4o и o3

  • Унификация: встроенный роутер между «быстрее» и «глубже» (у 4o/o3 этого нет в таком виде).
  • Фактичность и честность: ощутимо меньше галлюцинаций и «уверенных небылиц», лучше сигнализирует невозможность задачи.
  • Кодинг и мультимодальность: рост в реальном инжиниринге (SWE‑bench) и визуально‑видео‑логике (MMMU/VideoMMMU).
  • Стиль и послушность: меньше sycophancy, лучше держит инструкции и тон.
  • Эффективность: глубина рассуждения при меньшем количестве токенов.

Сравнение с конкурентами

  • Claude 3.x/3.5: силён в редактуре и деликатном диалоге. GPT‑5 выигрывает в мультимодальной логике, агентном поиске/браузинге, честности на открытых бенчах и кодинге (SWE‑bench).
  • Google Gemini 1.5: козыри — длинный контекст и интеграция с экосистемой Google. GPT‑5 — сильнее в тяжёлых науко‑математических вопросах, агентности и «умной» маршрутизации глубины.
  • Open‑weights (Llama, Mistral): приватность и контроль на своей инфраструктуре. GPT‑5 — сильнее «из коробки» на широкой корзине задач без тонкой инженерии вокруг.

GPT‑5 Pro

Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде.

Доступ и планы

  • GPT‑5 — новый дефолт в ChatGPT (заменяет GPT‑4o/o3/о4‑mini/4.1/4.5).
  • Роллаут: Plus, Pro, Team и Free — уже; Enterprise/Edu — через неделю.
  • Pro — безлимитный GPT‑5 и доступ к GPT‑5 Pro; Plus/Team — щедрые лимиты; Free — при превышении лимитов авто‑переход на GPT‑5 mini.
  • Разработчикам: кодинг с GPT‑5 через Codex CLI.

Кому особенно зайдёт

  • Продукт/инжиниринг: быстрые фронты, фиксы в репозиториях, планирование релизов.
  • Аналитика/консалтинг: разборы графиков/слайдов, отчёты с источниками.
  • Контент/маркетинг: тексты «под голос», локализация со смыслом.
  • Образование: объяснения разными стилями, проверка понимания.
  • Здоровье: подготовка к визиту, разбор терминов (не медицинский совет).

Как выжать максимум ✨

  • Явно просите рассуждение: «подумай тщательно», «шаги 1–2–3», «альтернативы и риски».
  • Форматируйте ответ: «сначала план, затем код и тесты», «запроси уточнения при нехватке контекста».
  • Включайте веб‑поиск с ограничениями по источникам/датам; для кода — давайте структуру проекта и тесты.
  • Используйте пресеты‑личности (Cynic/Robot/Listener/Nerd) вместо длинных промптов‑«характеров».

Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro.

Больше информации о релизе Chat GPT 5 у нас на сайте