31 подписчик

Что меняет большие модели в математике

12 марта12 мар

4 мин

На недавно прошедшем форуме IPAM (Institute for Pure and Applied Mathematics) лауреат Филдсовской премии Терренс Тао и ведущий исследователь OpenAI Марк Чен провели беседу у камина, в которой обсудили впечатляющий прогресс больших моделей в математике за последний год и то, как это меняет научную работу, образование и организацию исследований. Из разговора вытекает, что большие модели перестали быть «математическими двоечниками» и начинают претендовать на реальные исследовательские роли — но с важными оговорками. Еще год назад Тао охарактеризовал GPT в математике как «очень неэффективного аспиранта»: модели часто допускали грубые ошибки, быстро «уставали» и генерировали бессмысленные ходы. Сегодня ситуация иная: большие модели начали показывать уровень, сопоставимый с золотыми результатами на олимпиадах (IMO) и «прочёсывать» стандартные тесты — создаётся впечатление, что многие бенчмарки уже «пробиты». По словам Марка Чена, ключевая разница — снижение частоты ошибок и увеличение «време

Из разговора вытекает, что большие модели перестали быть «математическими двоечниками» и начинают претендовать на реальные исследовательские роли — но с важными оговорками.

Еще год назад Тао охарактеризовал GPT в математике как «очень неэффективного аспиранта»: модели часто допускали грубые ошибки, быстро «уставали» и генерировали бессмысленные ходы. Сегодня ситуация иная: большие модели начали показывать уровень, сопоставимый с золотыми результатами на олимпиадах (IMO) и «прочёсывать» стандартные тесты — создаётся впечатление, что многие бенчмарки уже «пробиты».

По словам Марка Чена, ключевая разница — снижение частоты ошибок и увеличение «времени автономной работы» модели: теперь ей можно доверить более длительные и сложные задачи без постоянного вмешательства человека.

Особенно показательны успехи на «длиннохвостых» задачах Эрдёша: множество малоисследованных, но относительно локальных задач, которые долгое время оставались без внимания, оказались доступными для машинной атаки. Модели в условиях минимального надзора решали десятки таких задач, а решения нередко можно было формально проверить с помощью вспомогательных инструментов.

Тао отмечает: это важно не потому, что все крупные нерешённые проблемы размотаны, а потому что изменилась практическая организация работы — теперь можно целенаправленно публиковать наборы задач и массово их «прогонять» через AI, ожидая статистического выхода новых результатов.

Но крупный прогресс сопровождается важным ограничением: верификация. Генерация множества гипотез и доказательств — это только полдела; их нужно тщательно проверять. Сейчас это остаётся главным «бутылочным горлышком»: модели могут порождать сотни кандидатов, но человеческая экспертиза и формальные верификаторы не всегда успевают оценить их качество и новизну. Комбинация AI‑генерации и формальной проверки — один из ключевых технологических вызовов.

Тао и Чен обсуждали, что AI открывает возможность для настоящей индустриализации математического труда: разделение этапов (генерация идей, подбор стратегий, верификация, оформление результатов) и выделение специалистов для каждой стадии.

Некоторые роли можно отдать моделям, другие оставить людям. Появляется модель «человек‑дирижёр», который управляет большим числом автономных агентов и обрабатывает итоги.

Такая трансформация может изменить и структуру коллабораций: вместо одиночных авторов — более крупные, сетевые проекты, где сотни участников формируют и решают наборы задач.

В университете и школьной практике это уже видно: домашние задания становятся выполнимы с помощью AI, поэтому Тао переориентирует оценку на проектную и устную работу, где важна верификация понимания и умение проверять результаты модели. Кроме того, одним из ключевых навыков станет способность корректно формулировать запросы, проверять и валидировать машинные ответы.

Оба собеседника предупреждают: чрезмерная автоматизация может лишить исследователей случайных инсайтов, которые возникают в ходе «медленного» человеческого труда — тех самых побочных открытий, которые ценны сами по себе.

Кроме того, неправильная постановка целей (слишком узкие награды) приведёт к тому, что AI будет оптимизировать смещённые метрики и «читерить» верификаторы.

Марка Чена и Тао сходятся: нужны и алгоритмы, и вычислительные ресурсы. Улучшение архитектур и методов обучения позволит эффективнее использовать растущий объем вычислений; одновременно большие модели и масштабные вычисления дают новые возможности для генерации идей и длинного «временного горизонта» задач.

Математика — удачная площадка для развития AI: здесь верификация формализуема, ошибки «дешёвы», и результаты однозначны. Но механика комбинирования генерации и проверки может быть перенесена и в другие области (физика, биология), хотя там верификаторы сложнее, и риски выше. Чен указывает на примеры успехов в биологических приложениях и материаловедении, где AI уже ускоряет эксперименты.

Тао и Чен видят будущее, в котором математика и другие науки станут продуктом гибридного сотрудничества человека и множества специализированных AI‑агентов. Это не «конец человечества» в научной работе, а переформатирование ролей: задачи, которые были рутинными и трудозатратными, станут автоматизированы, а люди сосредоточатся на формулировке глубоких вопросов, контроле качества и креативных синтезах.

Пока что мы на ранней стадии этого перехода: улучшения в генерации очевидны, но прогресс в проверке и организации усилий определит, насколько быстро и глубоко изменится ландшафт исследований.

В ближайшие годы можно ожидать появления экспериментальных «рынков задач» и платформ, где ученые будут публиковать наборы задач для коллективного решения с помощью AI — то, что Терренс Тао называет возможной «рыночной» формой математики будущего.

Хотите создать уникальный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/