26 подписчиков

OpenAI под огнём: «прорыв» GPT-5 в математике оказался ошибкой. Что на самом деле произошло.

21 октября21 окт

5 мин

Резонанс и откат заявления

20 октября 2025 года вокруг OpenAI разгорелся скандал: ряд исследователей компании объявили о «прорыве» GPT-5 — якобы модель нашла решения для 10 «проблем Эрдёша» (Erdős problems). Сообщение моментально разошлось по соцсетям, его ретвитнули топ-менеджеры OpenAI, а в ленте появилась уверенная формулировка: «GPT-5 решила 10 ранее нерешённых задач и продвинулась ещё в 11».

Однако уже через сутки всё было отыграно назад. Математик Томас Блум, поддерживающий сайт с каталогом проблем Эрдёша, публично опроверг формулировки: GPT-5 не строила новых доказательств, а лишь указала на уже существующие публикации, которые он ранее не видел. Статус «open» на сайте означал лишь незнание автором страницы о соответствующей работе, а не реальную «неразрешённость» в математическом смысле.

После критики посты сотрудников OpenAI были удалены, а риторика смягчена: речь действительно шла о литературном поиске, а не о создании новых доказательств. Ситуацию раскритиковали ведущие фигуры индустрии — от Демиса Хассабиса (Google DeepMind) до Янна Лекуна (Meta). Последний не без ехидства заметил, что OpenAI «сама споткнулась о собственный GPT».

Что такое «проблемы Эрдёша» и почему все так возбудились

Поль Эрдёш оставил огромное наследие открытых вопросов в комбинаторике, теории чисел, геометрии. Часть задач действительно была закрыта в последние десятилетия, часть остается открытой, на некоторые назначены вознаграждения. Любые заявления о массовых решениях таких задач воспринимаются как событие чрезвычайной важности — и требуют безупречной проверки: от формальной верификации до рецензирования.

Фраза «нашли решения 10 открытых задач» в буквальном смысле означает крупный научный прорыв. Но в данном случае GPT-5 выступала не как автоматический «доказатель», а как инструмент поиска релевантных публикаций — и сделала это местами удачно, указывая на известные решения для задач, ошибочно помеченных на сайте как «открытые».

Репутационные и рыночные последствия

В соцсетях вспыхнули теги вроде #OpenAIFail; за считаные дни набралось свыше 10 тысяч постов с критикой и разочарованием.
По сообщениям медиа, рыночные индикаторы, связанные с оценкой OpenAI на вторичных площадках, просели в премаркете.
По данным СМИ, Федеральная торговая комиссия США (FTC) начала проверку на предмет вводящей в заблуждение рекламы; возможны штрафы и меры надзора.
Отдельно усилилось внимание к прозрачности бенчмаркинга: пресса сообщала о «непубличном доступе» OpenAI к данным FrontierMath через связи с Epoch AI, что подлило масла в дискуссию о справедливой конкуренции и корректности испытаний.

Даже если часть этих сюжетов касается более широкого контекста вокруг OpenAI, они резонируют на фоне громкой (и оказавшейся некорректной) коммуникации о «математическом прорыве».

Источники: The Decoder

Где в этой истории реальная ценность

При всей токсичности инфошума, в эпизоде есть важное рациональное зерно: GPT-5 проявила силу как инструмент научного поиска и литературного обзора. Для областей, где терминология разнородна, а решения «распылены» по нишевым журналам и докладам, умная навигация по корпусу знаний — значимый вклад.

Эту мысль чётко формулирует Терренс Тао (UCLA), один из ведущих математиков современности. По его словам, наиболее продуктивные применения ИИ в математике — не в «героическом штурме» самых трудных задач, а в ускорении рутины: систематизации библиографии, проверке следствий, генерации примеров, организации экспериментов и компьютерной валидации фрагментов рассуждений. Здесь ИИ экономит часы и недели, повышает охват и снижает «слепые зоны» поиска.

Тао подчёркивает важные аспекты:

ИИ-выводы в части литературы верифицируемы человеком — это безопасная и уместная зона применения (при наличии квалификации у пользователя).
В массовых обзорах ценны не только «положительные» находки, но и «отрицательные» результаты (где релевантной литературы не найдено): публикация таких сводок уменьшает дублирование усилий и ложные представления о «незакрытости» вопросов.
«Индустриализация» математики с помощью ИИ — это про масштабирование процессов, а не замещение строгого доказательства: человеческая экспертиза по-прежнему критична для проверки, классификации и интеграции результатов.

Позиция Тао: ИИ «имеет силу», но максимальная польза — в правильно выбранных задачах и процессах. Источник: Mastodon Терренса Тао

Коммуникация против науки: где прошла красная линия

Ошибка OpenAI — не в самом факте использования GPT-5 для поиска литературы, а в формулировках и темпе публичных заявлений. Когда корпоративные соцсети громко объявляют «решение» без формальной верификации, наука и общественное доверие проигрывают. Для индустрии, где стоимость обещаний измеряется миллиардами, это недопустимый риск.

Уроки:

Разделять «нашли ссылку на существующее решение» и «получили новое доказательство».
Вводить внутренние «красные команды» по верификации научных заявлений перед публичным анонсом.
Сопровождать публикации протоколом проверки: ссылки, статус задач в авторитетных реестрах, независимые отзывы экспертов.
В отчётах об ИИ-инструментах в науке фиксировать и «минусы» (ложноположительные и ложноотрицательные находки), чтобы не искажать картину эффективности.

Что дальше для ИИ в математике

Короткий горизонт: усиление инструментов научного поиска, построение «графов знаний» по узким темам, полуавтоматическая нормализация терминологии и синонимии между подполями.
Средний горизонт: интеграция ИИ в потоки «formal math» (Lean/Isabelle/Coq) — генерация набросков доказательств с формальной проверкой по частям.
Длинный горизонт: появление гибридных рабочих мест «математик + ИИ-оркестратор», где человек ведёт программу исследований, а ИИ закрывает поиск, перебор, эксперимент и начальную верификацию.

Вывод

Скандал вокруг GPT-5 — не «конец ИИ в математике», а напоминание: коммуникация должна быть столь же строгой, как и доказательство. Инструментальная сила моделей уже полезна — прежде всего в литературных обзорах и масштабируемой поддержке исследований. Но переход от «умного поиска» к «новому знанию» требует дисциплины, прозрачности и формальной валидации. Иначе даже реальные успехи будут тонуть в шуме, а доверие — в том числе со стороны регуляторов — продолжит таять.

Материалы:

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/