📰 DeepMind взломал математику: ИИ решил задачи Эрдёша, пока ты страдал на геометрии

СегодняСегодня

2 мин

! DeepMind снова в деле, и на этот раз они замахнулись на святое – математику! По данным iXBT, их новая система AlphaProof Nexus смогла решить девять открытых задач из знаменитого списка Пола Эрдёша. Да-да, того самого Эрдёша, чьи задачи заставляли математиков потеть на протяжении полувека. AlphaProof Nexus не остановилась на достигнутом. Она также доказала 44 открытые гипотезы из Online Encyclopedia of Integer Sequences (той самой, что Нил Слоун создал еще в 1964 году), решила 15-летнюю проблему, связанную с функциями Гильберта в алгебраической геометрии, и даже улучшила известную оценку в задачах выпуклой оптимизации. Звучит как магия, правда? Главная фишка AlphaProof Nexus – это не просто языковая модель, которая умеет болтать про математику, а система, которая реально может доказывать теоремы. Она сочетает в себе языковую модель Gemini 3.1 Pro с системой формальной математической проверки Lean. Что это значит? Вместо того, чтобы генерировать доказательства на естественном языке

📰 DeepMind взломал математику: ИИ решил задачи Эрдёша, пока ты страдал на геометрии!

DeepMind снова в деле, и на этот раз они замахнулись на святое – математику! По данным iXBT, их новая система AlphaProof Nexus смогла решить девять открытых задач из знаменитого списка Пола Эрдёша. Да-да, того самого Эрдёша, чьи задачи заставляли математиков потеть на протяжении полувека.

AlphaProof Nexus не остановилась на достигнутом. Она также доказала 44 открытые гипотезы из Online Encyclopedia of Integer Sequences (той самой, что Нил Слоун создал еще в 1964 году), решила 15-летнюю проблему, связанную с функциями Гильберта в алгебраической геометрии, и даже улучшила известную оценку в задачах выпуклой оптимизации. Звучит как магия, правда?

Главная фишка AlphaProof Nexus – это не просто языковая модель, которая умеет болтать про математику, а система, которая реально может доказывать теоремы. Она сочетает в себе языковую модель Gemini 3.1 Pro с системой формальной математической проверки Lean. Что это значит? Вместо того, чтобы генерировать доказательства на естественном языке (как это делают обычные LLM), модель выдает отдельные шаги доказательства на формальном языке Lean, а компилятор автоматически проверяет их корректность.

Если система вдруг накосячит, Lean тут же выдаст точное сообщение об ошибке, которое используется для следующей попытки. Получается этакий "страховочный контур": модель не может бесконтрольно галлюцинировать, потому что каждый шаг проходит строгую верификацию.

По словам исследователей, стоимость вычислений для решения одной задачи составляла всего несколько сотен долларов. Чувствуете, как дешевеет математический гений?

Система оказалась наиболее успешной в тех областях, где уже хорошо развита библиотека формализованной математики Mathlib: в комбинаторике, теории чисел и выпуклой оптимизации. Но не стоит думать, что ИИ уже готов заменить математиков. Из 353 открытых задач Эрдёша система смогла решить лишь девять. Так что работы еще непочатый край.

Авторы подчеркивают, что AlphaProof Nexus – это не замена математикам, а новый исследовательский инструмент. Ученые, работавшие с системой, отмечают, что даже неудачные попытки доказательства помогали лучше понять структуру задачи и выявлять слабые места в существующих теориях.

Кроме того, система уже используется в исследованиях по квантовой оптике и теории графов. Все формальные доказательства на Lean можно найти на GitHub. Так что, если вам вдруг захочется проверить, как ИИ доказывает теоремы, – милости просим.

Как AlphaProof Nexus решает задачу Эрдёша №125: агент получает файл Lean, в котором настоящее доказательство заменено на «пробел» (a), затем анализирует предыдущие попытки с оценками Elo и текущий план решения, встроенный в запрос (b). После этого система пошагово разбивает доказательство на подзадачи, вызывает AlphaProof для решения отдельных подцелей и итеративно уточняет неудачные шаги, декомпозируя их до уровня лемм, пока все цели доказательства не будут формально подтверждены.

Разработка DeepMind появляется на фоне растущей конкуренции между крупнейшими ИИ-лабораториями в области математики. Ранее OpenAI при помощи своей reasoning-модели смогла опровергнуть гипотезу Эрдёша о единичных расстояниях, а математик Терренс Тао называл подобные результаты одним из первых действительно убедительных примеров решения открытых математических задач с помощью LLM....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут