GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины. Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%. Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде. Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro. Больше информации о релизе Chat GPT 5 у нас на сайте
GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины. Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%. Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде. Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro. Больше информации о релизе Chat GPT 5 у нас на сайте
...Читать далее
GPT‑5 кратко: главные новинки, отличия и сравнение с конкурентами
GPT‑5 — новый дефолт в ChatGPT и самый «прикладной» релиз OpenAI: умная маршрутизация между быстрым ответом и глубоким рассуждением, меньше галлюцинаций, сильнее кодинг и мультимодальная логика, аккуратная безопасность и честная коммуникация ограничений. Доступен всем, а у Plus/Pro — выше лимиты; у Pro есть GPT‑5 Pro для максимальной глубины.
Главные новшества GPT‑5
- Единая система с роутером: модель сама решает, когда отвечать быстро, а когда «думать дольше» (можно принудить фразой «подумай тщательно над этим»).
- Меньше ошибок: ~45% меньше фактических промахов vs GPT‑4o; при рассуждении ~80% меньше, чем у o3; на LongFact/FActScore — до 6× меньше галлюцинаций.
- Больше честности: лучше распознаёт невозможные/недоопределённые задачи и сообщает о лимитах; «обманчивость» на прод‑трафике снижена до ~2,1% (vs 4,8% у o3).
- Меньше угодничества: доля «поддакиваний» сокращена с ~14,5% до <6%; стиль — сдержанней, по делу.
- «Safe completions»: вместо голых отказов — максимально полезные, но безопасные ответы (особенно в dual‑use темах).
- Эффективное рассуждение: результаты как у o3 при 50–80% меньшем объёме токенов на сложных задачах.
Где прирост заметен на практике
- Кодинг: лучший результат OpenAI на реальных задачах SWE‑bench Verified (74,9%) и Aider Polyglot (88%). Сильная фронтенд‑генерация «с одного промпта», грамотная отладка крупных репо.
- Письмо и креатив: глубже держит форму и ритм, меньше клише; помогает от «сырой идеи» до «готового текста» (репорты, письма, тосты, статьи).
- Медицина: лучший у OpenAI на HealthBench/Hard (до 46,2%); ведёт себя как «мыслящий партнёр». Важно: не заменяет врача.
- Мультимодальность: новый пик на MMMU (84,2%), VideoMMMU и CharXiv — точнее читает графики, фото слайдов, диаграммы.
- Инструкции и «агентность»: лучше в multi‑turn сценариях, броузинге/поиске, function calling; точнее следует кастом‑инструкциям.
Бенчмарки: AIME 2025 (без инструментов) — 94,6%; GPQA без инструментов (у GPT‑5 Pro) — 88,4%.
GPT‑5 vs GPT‑4o и o3
- Унификация: встроенный роутер между «быстрее» и «глубже» (у 4o/o3 этого нет в таком виде).
- Фактичность и честность: ощутимо меньше галлюцинаций и «уверенных небылиц», лучше сигнализирует невозможность задачи.
- Кодинг и мультимодальность: рост в реальном инжиниринге (SWE‑bench) и визуально‑видео‑логике (MMMU/VideoMMMU).
- Стиль и послушность: меньше sycophancy, лучше держит инструкции и тон.
- Эффективность: глубина рассуждения при меньшем количестве токенов.
Сравнение с конкурентами
- Claude 3.x/3.5: силён в редактуре и деликатном диалоге. GPT‑5 выигрывает в мультимодальной логике, агентном поиске/браузинге, честности на открытых бенчах и кодинге (SWE‑bench).
- Google Gemini 1.5: козыри — длинный контекст и интеграция с экосистемой Google. GPT‑5 — сильнее в тяжёлых науко‑математических вопросах, агентности и «умной» маршрутизации глубины.
- Open‑weights (Llama, Mistral): приватность и контроль на своей инфраструктуре. GPT‑5 — сильнее «из коробки» на широкой корзине задач без тонкой инженерии вокруг.
GPT‑5 Pro
Вариант для самых сложных кейсов: ещё дольше и эффективнее «думает», даёт более полные и точные ответы; SOTA на GPQA, меньше крупных ошибок — особенно в медицине, науке, математике и коде.
Доступ и планы
- GPT‑5 — новый дефолт в ChatGPT (заменяет GPT‑4o/o3/о4‑mini/4.1/4.5).
- Роллаут: Plus, Pro, Team и Free — уже; Enterprise/Edu — через неделю.
- Pro — безлимитный GPT‑5 и доступ к GPT‑5 Pro; Plus/Team — щедрые лимиты; Free — при превышении лимитов авто‑переход на GPT‑5 mini.
- Разработчикам: кодинг с GPT‑5 через Codex CLI.
Кому особенно зайдёт
- Продукт/инжиниринг: быстрые фронты, фиксы в репозиториях, планирование релизов.
- Аналитика/консалтинг: разборы графиков/слайдов, отчёты с источниками.
- Контент/маркетинг: тексты «под голос», локализация со смыслом.
- Образование: объяснения разными стилями, проверка понимания.
- Здоровье: подготовка к визиту, разбор терминов (не медицинский совет).
Как выжать максимум ✨
- Явно просите рассуждение: «подумай тщательно», «шаги 1–2–3», «альтернативы и риски».
- Форматируйте ответ: «сначала план, затем код и тесты», «запроси уточнения при нехватке контекста».
- Включайте веб‑поиск с ограничениями по источникам/датам; для кода — давайте структуру проекта и тесты.
- Используйте пресеты‑личности (Cynic/Robot/Listener/Nerd) вместо длинных промптов‑«характеров».
Итог: GPT‑5 задаёт новую норму полезности — меньше «поговорили», больше «сделали». Для ультрасложных задач есть GPT‑5 Pro.