На недавно прошедшем форуме IPAM (Institute for Pure and Applied Mathematics) лауреат Филдсовской премии Терренс Тао и ведущий исследователь OpenAI Марк Чен провели беседу у камина, в которой обсудили впечатляющий прогресс больших моделей в математике за последний год и то, как это меняет научную работу, образование и организацию исследований.
Из разговора вытекает, что большие модели перестали быть «математическими двоечниками» и начинают претендовать на реальные исследовательские роли — но с важными оговорками.
Еще год назад Тао охарактеризовал GPT в математике как «очень неэффективного аспиранта»: модели часто допускали грубые ошибки, быстро «уставали» и генерировали бессмысленные ходы. Сегодня ситуация иная: большие модели начали показывать уровень, сопоставимый с золотыми результатами на олимпиадах (IMO) и «прочёсывать» стандартные тесты — создаётся впечатление, что многие бенчмарки уже «пробиты».
По словам Марка Чена, ключевая разница — снижение частоты ошибок и увеличение «времени автономной работы» модели: теперь ей можно доверить более длительные и сложные задачи без постоянного вмешательства человека.
Особенно показательны успехи на «длиннохвостых» задачах Эрдёша: множество малоисследованных, но относительно локальных задач, которые долгое время оставались без внимания, оказались доступными для машинной атаки. Модели в условиях минимального надзора решали десятки таких задач, а решения нередко можно было формально проверить с помощью вспомогательных инструментов.
Тао отмечает: это важно не потому, что все крупные нерешённые проблемы размотаны, а потому что изменилась практическая организация работы — теперь можно целенаправленно публиковать наборы задач и массово их «прогонять» через AI, ожидая статистического выхода новых результатов.
Но крупный прогресс сопровождается важным ограничением: верификация. Генерация множества гипотез и доказательств — это только полдела; их нужно тщательно проверять. Сейчас это остаётся главным «бутылочным горлышком»: модели могут порождать сотни кандидатов, но человеческая экспертиза и формальные верификаторы не всегда успевают оценить их качество и новизну. Комбинация AI‑генерации и формальной проверки — один из ключевых технологических вызовов.
Тао и Чен обсуждали, что AI открывает возможность для настоящей индустриализации математического труда: разделение этапов (генерация идей, подбор стратегий, верификация, оформление результатов) и выделение специалистов для каждой стадии.
Некоторые роли можно отдать моделям, другие оставить людям. Появляется модель «человек‑дирижёр», который управляет большим числом автономных агентов и обрабатывает итоги.
Такая трансформация может изменить и структуру коллабораций: вместо одиночных авторов — более крупные, сетевые проекты, где сотни участников формируют и решают наборы задач.
В университете и школьной практике это уже видно: домашние задания становятся выполнимы с помощью AI, поэтому Тао переориентирует оценку на проектную и устную работу, где важна верификация понимания и умение проверять результаты модели. Кроме того, одним из ключевых навыков станет способность корректно формулировать запросы, проверять и валидировать машинные ответы.
Оба собеседника предупреждают: чрезмерная автоматизация может лишить исследователей случайных инсайтов, которые возникают в ходе «медленного» человеческого труда — тех самых побочных открытий, которые ценны сами по себе.
Кроме того, неправильная постановка целей (слишком узкие награды) приведёт к тому, что AI будет оптимизировать смещённые метрики и «читерить» верификаторы.
Марка Чена и Тао сходятся: нужны и алгоритмы, и вычислительные ресурсы. Улучшение архитектур и методов обучения позволит эффективнее использовать растущий объем вычислений; одновременно большие модели и масштабные вычисления дают новые возможности для генерации идей и длинного «временного горизонта» задач.
Математика — удачная площадка для развития AI: здесь верификация формализуема, ошибки «дешёвы», и результаты однозначны. Но механика комбинирования генерации и проверки может быть перенесена и в другие области (физика, биология), хотя там верификаторы сложнее, и риски выше. Чен указывает на примеры успехов в биологических приложениях и материаловедении, где AI уже ускоряет эксперименты.
Тао и Чен видят будущее, в котором математика и другие науки станут продуктом гибридного сотрудничества человека и множества специализированных AI‑агентов. Это не «конец человечества» в научной работе, а переформатирование ролей: задачи, которые были рутинными и трудозатратными, станут автоматизированы, а люди сосредоточатся на формулировке глубоких вопросов, контроле качества и креативных синтезах.
Пока что мы на ранней стадии этого перехода: улучшения в генерации очевидны, но прогресс в проверке и организации усилий определит, насколько быстро и глубоко изменится ландшафт исследований.
В ближайшие годы можно ожидать появления экспериментальных «рынков задач» и платформ, где ученые будут публиковать наборы задач для коллективного решения с помощью AI — то, что Терренс Тао называет возможной «рыночной» формой математики будущего.
Хотите создать уникальный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.
ИИ сегодня — ваше конкурентное преимущество завтра!
Тел. +7 (985) 982-70-55
E-mail sms_systems@inbox.ru
Сайт https://www.smssystems.ru/razrabotka-ai/