Резонанс и откат заявления
20 октября 2025 года вокруг OpenAI разгорелся скандал: ряд исследователей компании объявили о «прорыве» GPT-5 — якобы модель нашла решения для 10 «проблем Эрдёша» (Erdős problems). Сообщение моментально разошлось по соцсетям, его ретвитнули топ-менеджеры OpenAI, а в ленте появилась уверенная формулировка: «GPT-5 решила 10 ранее нерешённых задач и продвинулась ещё в 11».
Однако уже через сутки всё было отыграно назад. Математик Томас Блум, поддерживающий сайт с каталогом проблем Эрдёша, публично опроверг формулировки: GPT-5 не строила новых доказательств, а лишь указала на уже существующие публикации, которые он ранее не видел. Статус «open» на сайте означал лишь незнание автором страницы о соответствующей работе, а не реальную «неразрешённость» в математическом смысле.
После критики посты сотрудников OpenAI были удалены, а риторика смягчена: речь действительно шла о литературном поиске, а не о создании новых доказательств. Ситуацию раскритиковали ведущие фигуры индустрии — от Демиса Хассабиса (Google DeepMind) до Янна Лекуна (Meta). Последний не без ехидства заметил, что OpenAI «сама споткнулась о собственный GPT».
Что такое «проблемы Эрдёша» и почему все так возбудились
Поль Эрдёш оставил огромное наследие открытых вопросов в комбинаторике, теории чисел, геометрии. Часть задач действительно была закрыта в последние десятилетия, часть остается открытой, на некоторые назначены вознаграждения. Любые заявления о массовых решениях таких задач воспринимаются как событие чрезвычайной важности — и требуют безупречной проверки: от формальной верификации до рецензирования.
Фраза «нашли решения 10 открытых задач» в буквальном смысле означает крупный научный прорыв. Но в данном случае GPT-5 выступала не как автоматический «доказатель», а как инструмент поиска релевантных публикаций — и сделала это местами удачно, указывая на известные решения для задач, ошибочно помеченных на сайте как «открытые».
Репутационные и рыночные последствия
- В соцсетях вспыхнули теги вроде #OpenAIFail; за считаные дни набралось свыше 10 тысяч постов с критикой и разочарованием.
- По сообщениям медиа, рыночные индикаторы, связанные с оценкой OpenAI на вторичных площадках, просели в премаркете.
- По данным СМИ, Федеральная торговая комиссия США (FTC) начала проверку на предмет вводящей в заблуждение рекламы; возможны штрафы и меры надзора.
- Отдельно усилилось внимание к прозрачности бенчмаркинга: пресса сообщала о «непубличном доступе» OpenAI к данным FrontierMath через связи с Epoch AI, что подлило масла в дискуссию о справедливой конкуренции и корректности испытаний.
Даже если часть этих сюжетов касается более широкого контекста вокруг OpenAI, они резонируют на фоне громкой (и оказавшейся некорректной) коммуникации о «математическом прорыве».
Источники: The Decoder
Где в этой истории реальная ценность
При всей токсичности инфошума, в эпизоде есть важное рациональное зерно: GPT-5 проявила силу как инструмент научного поиска и литературного обзора. Для областей, где терминология разнородна, а решения «распылены» по нишевым журналам и докладам, умная навигация по корпусу знаний — значимый вклад.
Эту мысль чётко формулирует Терренс Тао (UCLA), один из ведущих математиков современности. По его словам, наиболее продуктивные применения ИИ в математике — не в «героическом штурме» самых трудных задач, а в ускорении рутины: систематизации библиографии, проверке следствий, генерации примеров, организации экспериментов и компьютерной валидации фрагментов рассуждений. Здесь ИИ экономит часы и недели, повышает охват и снижает «слепые зоны» поиска.
Тао подчёркивает важные аспекты:
- ИИ-выводы в части литературы верифицируемы человеком — это безопасная и уместная зона применения (при наличии квалификации у пользователя).
- В массовых обзорах ценны не только «положительные» находки, но и «отрицательные» результаты (где релевантной литературы не найдено): публикация таких сводок уменьшает дублирование усилий и ложные представления о «незакрытости» вопросов.
- «Индустриализация» математики с помощью ИИ — это про масштабирование процессов, а не замещение строгого доказательства: человеческая экспертиза по-прежнему критична для проверки, классификации и интеграции результатов.
Позиция Тао: ИИ «имеет силу», но максимальная польза — в правильно выбранных задачах и процессах. Источник: Mastodon Терренса Тао
Коммуникация против науки: где прошла красная линия
Ошибка OpenAI — не в самом факте использования GPT-5 для поиска литературы, а в формулировках и темпе публичных заявлений. Когда корпоративные соцсети громко объявляют «решение» без формальной верификации, наука и общественное доверие проигрывают. Для индустрии, где стоимость обещаний измеряется миллиардами, это недопустимый риск.
Уроки:
- Разделять «нашли ссылку на существующее решение» и «получили новое доказательство».
- Вводить внутренние «красные команды» по верификации научных заявлений перед публичным анонсом.
- Сопровождать публикации протоколом проверки: ссылки, статус задач в авторитетных реестрах, независимые отзывы экспертов.
- В отчётах об ИИ-инструментах в науке фиксировать и «минусы» (ложноположительные и ложноотрицательные находки), чтобы не искажать картину эффективности.
Что дальше для ИИ в математике
- Короткий горизонт: усиление инструментов научного поиска, построение «графов знаний» по узким темам, полуавтоматическая нормализация терминологии и синонимии между подполями.
- Средний горизонт: интеграция ИИ в потоки «formal math» (Lean/Isabelle/Coq) — генерация набросков доказательств с формальной проверкой по частям.
- Длинный горизонт: появление гибридных рабочих мест «математик + ИИ-оркестратор», где человек ведёт программу исследований, а ИИ закрывает поиск, перебор, эксперимент и начальную верификацию.
Вывод
Скандал вокруг GPT-5 — не «конец ИИ в математике», а напоминание: коммуникация должна быть столь же строгой, как и доказательство. Инструментальная сила моделей уже полезна — прежде всего в литературных обзорах и масштабируемой поддержке исследований. Но переход от «умного поиска» к «новому знанию» требует дисциплины, прозрачности и формальной валидации. Иначе даже реальные успехи будут тонуть в шуме, а доверие — в том числе со стороны регуляторов — продолжит таять.
Материалы:
Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru