Добавить в корзинуПозвонить
Найти в Дзене
Три кольца в ночи

Провал GPT-5: Почему новая модель OpenAI разочаровала пользователей?

7 августа 2025 года OpenAI с помпой представила GPT-5, назвав её «самой умной и точной» языковой моделью в истории. Глава компании Сэм Альтман сравнил её с «экспертом с докторской степенью», обещая прорыв в точности, скорости и логическом мышлении. Однако спустя всего сутки интернет заполонили жалобы пользователей, называющих GPT-5 «мусором» и требующих вернуть старые модели. Что пошло не так? Разбираемся в причинах провала и сравниваем с конкурентами. На Reddit пользователи активно обсуждают провал GPT-5, готовясь к AMA (Ask Me Anything) с топ-менеджерами OpenAI. Вопросы сыплются один за другим: почему убрали старые модели? Когда пофиксят маршрутизатор? Вернётся ли режим глубокого размышления? Сообщество требует от Альтмана объяснений и возврата к проверенным моделям, которые, по их мнению, работали лучше. Илон Маск не преминул указать на слабости конкурента. По его словам, Grok 4 Heavy, выпущенный xAI две недели назад, превосходит GPT-5 в тестах на логическое мышление и знания. Бенч
Оглавление

7 августа 2025 года OpenAI с помпой представила GPT-5, назвав её «самой умной и точной» языковой моделью в истории. Глава компании Сэм Альтман сравнил её с «экспертом с докторской степенью», обещая прорыв в точности, скорости и логическом мышлении. Однако спустя всего сутки интернет заполонили жалобы пользователей, называющих GPT-5 «мусором» и требующих вернуть старые модели. Что пошло не так? Разбираемся в причинах провала и сравниваем с конкурентами.

-2
-3
-4
-5

Основные претензии пользователей

  1. Глючный выбор модели: Вместо мощной GPT-5 пользователи часто получают ответы от урезанной версии GPT-5-mini, которая выдаёт слабые и поверхностные результаты. Автоматический маршрутизатор, который должен выбирать подходящую модель, работает ненадёжно, из-за чего качество ответов сильно варьируется.
  2. Срезанный режим «размышлений»: GPT-5 значительно быстрее, но это обернулось катастрофой. Задачи, которые модель o3 решала за несколько минут, анализируя проблему, теперь обрабатываются за 15 секунд — и часто с ошибками. Лимиты на глубокое размышление урезаны почти до нуля, что делает модель менее точной, чем её предшественники.
  3. Исчезновение старых моделей: Подписчики тарифов Plus и Pro лишились доступа к предыдущим моделям (GPT-4o, GPT-4.5, o3). OpenAI оставила только GPT-5, что вызвало бурю негодования, так как многие считают её хуже. Пользователи буквально умоляют вернуть старые версии, особенно o3, которая славилась глубокими аналитическими ответами.
  4. Снижение качества общения: GPT-5 критикуют за отсутствие «личности». Если GPT-4o был «приятным в общении», а GPT-4.5 блистал креативностью, то новая модель кажется «уставшим секретарём», выдающим короткие и сухие ответы. Пользователи отмечают, что она уступает по интеллекту o3 и даже допускает больше «галлюцинаций» (ошибочных выдумок).
  5. Ошибки в презентации: Довершил провал слайд с бенчмарками, где OpenAI некорректно отобразила данные. Например, на графике «Deception evals» столбик GPT-5 оказался короче, чем у o3, хотя по данным модель ошибалась чаще (50% против 47,4%). На другом слайде GPT-5 с 52,8% точности выглядел выше, чем o3 с 69,1%. Сэм Альтман был вынужден извиниться за путаницу, пообещав исправить графики в блоге.

-6
-7
-8

Реакция сообщества и готовящийся AMA

На Reddit пользователи активно обсуждают провал GPT-5, готовясь к AMA (Ask Me Anything) с топ-менеджерами OpenAI. Вопросы сыплются один за другим: почему убрали старые модели? Когда пофиксят маршрутизатор? Вернётся ли режим глубокого размышления? Сообщество требует от Альтмана объяснений и возврата к проверенным моделям, которые, по их мнению, работали лучше.

Сравнение с Grok 4 Heavy от xAI

Илон Маск не преминул указать на слабости конкурента. По его словам, Grok 4 Heavy, выпущенный xAI две недели назад, превосходит GPT-5 в тестах на логическое мышление и знания. Бенчмарки подтверждают: в AIME 2025 GPT-5 набрала 94,6%, но Grok 4 Heavy показала лучшие результаты в ряде логических задач. Кроме того, пользователи отмечают, что Grok сохраняет доступ к предыдущим версиям, чего так не хватает в OpenAI.

Что говорят бенчмарки?

OpenAI утверждала, что GPT-5 на 45% реже ошибается по сравнению с GPT-4o и демонстрирует меньше «галлюцинаций». Однако пользователи этого не подтверждают: модель часто выдаёт ошибочные или неполные ответы, особенно в программировании и сложных аналитических задачах. Например, при редактировании кода GPT-5 допускает «галлюцинации», выдумывая несуществующие методы, в отличие от o3, которая справлялась лучше.

Что дальше?

Провал GPT-5 стал ударом по репутации OpenAI, особенно на фоне растущей конкуренции с xAI, Google Gemini и Anthropic Claude. Пользователи надеются, что AMA с руководством компании прольёт свет на планы по исправлению ошибок. Среди требований: вернуть доступ к старым моделям, доработать маршрутизатор и восстановить полноценный режим размышлений.

А что вы думаете о GPT-5? Пробовали новую модель? Делитесь впечатлениями в комментариях!