Найти в Дзене

GPT-5: прорыв или красивая вывеска? Что на самом деле показала презентация OpenAI

Мнение автора. Короткие абзацы, конкретика и вопросы к вам в конце. Раньше была линейка разных моделей — теперь одна система GPT-5. Внутри неё несколько «уровней мощности», а роутер решает, кого звать на ваш запрос: «быструю» для простого вопроса или «думающую» для сложного. Звучит удобно: не нужно разбираться, какую модель включать. Но тех, кто делает продукты, это задело: выбора больше нет. Если вы привыкли, что одна версия лучше пишет тексты, а другая — общается, теперь остаётся только «довериться системе». Есть и сомнение: когда самая продвинутая модель доступна всем, не происходит ли внутри скрытая «экономия» — подмена более дешёвой моделью под видом «так решил роутер»? OpenAI почти весь час показывала графики и убеждала, что модель всё ближе к AGI. Только вот именно графики запомнились странностями: местами «50%» оказалось «в два раза меньше, чем 47%» — мем, который мгновенно разлетелся по соцсетям. Вдохновлённые заявлениями, пользователи побежали тестировать GPT-5 — и охладели:
Оглавление

Мнение автора. Короткие абзацы, конкретика и вопросы к вам в конце.

Коротко о главном

  • OpenAI представила GPT-5 как «единую систему» с роутером, который сам выбирает нужную «мощность» модели под задачу.
  • В презентации было много бенчмарков — и много вопросов к их корректности.
  • Пользователи быстро заметили странности: от неверных ответов на базовые вопросы до сбоев роутера в день запуска.
  • «Личности» чата меняют стиль, но не точность; интерфейс слегка обновили; кодинг стал быстрее — но не обязательно качественнее.
  • Главный вопрос: это реальная польза или иллюзия прогресса?

Как OpenAI «упростила» выбор модели

Раньше была линейка разных моделей — теперь одна система GPT-5. Внутри неё несколько «уровней мощности», а роутер решает, кого звать на ваш запрос: «быструю» для простого вопроса или «думающую» для сложного.

Звучит удобно: не нужно разбираться, какую модель включать. Но тех, кто делает продукты, это задело: выбора больше нет. Если вы привыкли, что одна версия лучше пишет тексты, а другая — общается, теперь остаётся только «довериться системе».

Есть и сомнение: когда самая продвинутая модель доступна всем, не происходит ли внутри скрытая «экономия» — подмена более дешёвой моделью под видом «так решил роутер»?

Презентация и бенчмарки: где «поплыл» нарратив

OpenAI почти весь час показывала графики и убеждала, что модель всё ближе к AGI. Только вот именно графики запомнились странностями: местами «50%» оказалось «в два раза меньше, чем 47%» — мем, который мгновенно разлетелся по соцсетям.

Вдохновлённые заявлениями, пользователи побежали тестировать GPT-5 — и охладели: на вопрос «сколько пальцев у человека?» модель уверенно ошибалась. В сетях прокатилось разочарование, а часть фанатов OpenAI «переобулась на лету».

Роутер не выдержал старта

В первый день роутер дал сбой: местами GPT-5 отвечал хуже GPT-4.0. Сам Сэм Альтман на Reddit признал серьёзную неполадку. «Починили», но осадочек остался — особенно у тех, кому инструмент нужен для работы здесь и сейчас.

«Скажи шёпотом: подумай вдумчиво»

OpenAI убрала переключатели моделей — зато предложила «магические фразы». Нужно глубже — напишите в промпте «подумай вдумчиво». Нужно быстрее — так и скажите. Удобно ли это вместо одного тумблера в интерфейсе? Вопрос открытый.

Личности чата: стиль меняется, точность — нет

Появились «личности» — они влияют на тон и подачу, но не на качество фактов:

  • Циник — честная критика и жёсткие оценки.
  • Робот — инструкции, код, отладка.
  • Слушатель — структурирование мыслей и помощь в решениях.
  • Фанат своего дела — объясняет сложное простыми словами.

Минус: нельзя переключать личность на лету — нужно каждый раз лазить в настройки.

Кодинг: быстрее — да, лучше — не всегда

GPT-5 заметно улучшили в фронтенде: можно сверстать сайт, интерфейс, даже простую игру «по описанию». В сети полно примеров — чаще всего с простыми играми.

Но на реальных задачах разработчики отмечают: кода стало больше и быстрее, а переписывать всё равно приходится. То есть «скорость» выросла, а вот «качество под задачу» — не всегда.

Иллюзия прогресса против практической пользы

За 10 месяцев база знаний так и не обновлена до 2025 года. Мы получили универсальную систему, личности, ускоренный код — но не специализированные инструменты под конкретные задачи.

Чего действительно не хватает:

  • Отдельной модели для анализа документов, обученной на реальных кейсах.
  • Писателя по нишам, который блестяще держит тональность и отраслевую специфику.
  • Глубоких интеграций «под ключ» (вплоть до нативной работы с биржами предсказаний и корпоративными сервисами).
  • Честной настройки «качество/стоимость» с правом пользователя выбирать, а не «просить вежливо в промпте».

Рынок тоже «голосует»

Эффект презентации был мгновенным: ожидания рыночных игроков резко развернуло — фаворит может смениться. Это прямой сигнал: маркетингом рынок не удержать, ему нужны стабильность и практические улучшения.

Итог

Прогресс есть — GPT-5 стал аккуратнее и быстрее, интерфейс полирнули, код пишется бодрее. Но глобального скачка, о котором говорили, многие не почувствовали. И пока что ощущение такое, что нас больше уговаривают «поверить в графики», чем дают вещи, решающие задачи на 100%.

Главный вопрос к вам: нужно ли нам «универсальное всё-в-одном», или пора требовать пакет специализированных моделей, каждая из которых безоговорочно закрывает свою задачу?

Напишите в комментариях, что вы уже пробовали в GPT-5 и где он реально помог (или подвёл). Ваши кейсы — лучшая проверка любых бенчмарков.