Добавить в корзинуПозвонить
Найти в Дзене
Новостник

Gemini Deep Think: как ИИ ускоряет открытия в математике, физике и информатике

Под руководством профессиональных математиков и ученых режим Gemini Deep Think применяется для решения исследовательских задач в математике, физике и информатике. Летом 2025 года усовершенствованная версия Gemini Deep Think достигла уровня золотой медали на Международной математической олимпиаде, а позднее обновленная версия показала сопоставимый результат на Международной студенческой олимпиаде по программированию. Эти итоги показали, что модель способна рассуждать на уровне самых сложных задач по математике и программированию, которые обычно даются сильнейшим студентам. После этого режим Deep Think начали применять в научных, инженерных и корпоративных сценариях с более открытыми и сложными постановками задач. В течение последней недели команды DeepMind опубликовали две научные статьи с результатами междисциплинарной работы по профессиональным исследовательским задачам с использованием Gemini Deep Think. Авторы подчеркивают, что полученные результаты стали возможны благодаря плотному
Оглавление

Под руководством профессиональных математиков и ученых режим Gemini Deep Think применяется для решения исследовательских задач в математике, физике и информатике.

Летом 2025 года усовершенствованная версия Gemini Deep Think достигла уровня золотой медали на Международной математической олимпиаде, а позднее обновленная версия показала сопоставимый результат на Международной студенческой олимпиаде по программированию. Эти итоги показали, что модель способна рассуждать на уровне самых сложных задач по математике и программированию, которые обычно даются сильнейшим студентам. После этого режим Deep Think начали применять в научных, инженерных и корпоративных сценариях с более открытыми и сложными постановками задач.

В течение последней недели команды DeepMind опубликовали две научные статьи с результатами междисциплинарной работы по профессиональным исследовательским задачам с использованием Gemini Deep Think. Авторы подчеркивают, что полученные результаты стали возможны благодаря плотному взаимодействию математиков, физиков и специалистов по информатике.

Передний край чистой математики

В отличие от олимпиадных задач, исследовательская математика требует владения большим числом продвинутых методов из обширной литературы. Несмотря на большие базы знаний, у базовых моделей в этой области часто возникают поверхностное понимание и ошибочные выводы.

Для решения этой проблемы в DeepMind создали исследовательского математического агента под внутренним названием Aletheia, работающего на основе Gemini Deep Think. В систему добавлен проверяющий модуль на естественном языке, который ищет слабые места в кандидатных решениях и поддерживает итеративный цикл: генерация, проверка и доработка решения. Важной особенностью стала способность агента признавать, что задачу решить не удалось: по оценке авторов, это существенно повышает эффективность реальной работы исследователей.

Дополнительно агент использует веб-поиск и просмотр источников, чтобы ориентироваться в сложной литературе, снижать риск фиктивных ссылок и вычислительных неточностей при синтезе опубликованных результатов.

   Схема Aletheia: цикл генерации, проверки и пересмотра решений в исследовательской математике.
Схема Aletheia: цикл генерации, проверки и пересмотра решений в исследовательской математике.

После результата уровня золотой медали IMO в июле 2025 года возможности Gemini Deep Think, по данным DeepMind, быстро выросли. На тесте IMO-ProofBench Advanced система достигала значений до 90% по мере увеличения вычислений на этапе вывода. Авторы также показывают, что этот эффект сохраняется и при переходе от олимпиадных задач к упражнениям уровня докторантуры на внутреннем тесте FutureMath Basic.

Отмечается, что Aletheia показывает более высокое качество рассуждений при меньших вычислительных затратах на этапе вывода.

Для исследовательской математики DeepMind приводит ряд примеров результатов, полученных при разной степени самостоятельности системы:

  • Полностью автономная работа: научная статья, сформированная без участия человека, с вычислением ряда структурных констант в арифметической геометрии.
  • Совместная работа человека и ИИ: статья о доказательстве оценок для систем взаимодействующих частиц.
  • Полуавтономная массовая проверка: анализ 700 открытых задач из базы гипотез Эрдёша, включая автономные решения четырех задач из списка.

Также сообщается о промежуточном вкладе системы в еще две исследовательские работы и о более ранних проектах меньшего масштаба, где Gemini уже применялась в математических исследованиях.

После обсуждений с математическим сообществом авторы предлагают классификацию исследований с участием ИИ по двум осям: значимость результата и степень вклада ИИ. Работы уровня «публикационного качества» уже поданы в авторитетные журналы. При этом авторы отдельно оговаривают, что на момент публикации не заявляют результатов уровней «крупный прорыв» и «знаковый прорыв».

Расширение на физику и информатику

По данным DeepMind, режим Gemini Deep Think также показал перспективные результаты в теоретической информатике и физике. Во второй статье описаны практические «рецепты» совместной работы человека и системы, в том числе модель «советника», где эксперт итеративно направляет ход доказательства и проверку гипотез.

Среди тактических приемов выделены «сбалансированные запросы» (одновременная просьба доказать или опровергнуть утверждение, чтобы снизить риск подтверждающего уклона) и проверка с поддержкой программного кода. В совокупности с возможностью связывать идеи из разных областей это, по оценке авторов, меняет подход к теоретическим исследованиям.

   Схема конвейера рассуждений: от широкого поиска в пространстве решений к структурированному выводу и многоуровневой проверке.
Схема конвейера рассуждений: от широкого поиска в пространстве решений к структурированному выводу и многоуровневой проверке.

В совместной работе с экспертами по 18 исследовательским задачам система помогла продвинуться в алгоритмах, машинном обучении и комбинаторной оптимизации, теории информации и экономической теории. Среди примеров в статье:

  1. Продвижение по классическим задачам Max-Cut и Steiner Tree за счет методов из других разделов математики.
  2. Контрпример к интуитивному правилу в подмодулярной оптимизации, которое более 10 лет не удавалось строго подтвердить или опровергнуть.
  3. Объяснение механизма работы нового метода оптимизации в машинном обучении через вывод адаптивного внутреннего штрафа.
  4. Расширение теоремы в аукционных моделях с рациональных чисел на непрерывный случай действительных значений.
  5. Новый аналитический подход к интегралам в задачах о космических струнах с получением конечной замкнутой формы.

Авторы отмечают, что полученные результаты охватывают широкий круг направлений — от теории информации до криптографии и теории механизмов — и демонстрируют, что ИИ фундаментально меняет сам характер научных исследований.

Учитывая гибкую, ориентированную на конференции систему публикаций в информатике, результаты представлены не в виде строгой классификации, а с точки зрения их академической траектории: примерно половина работ нацелена на ведущие конференции, тогда как остальные станут основой будущих журнальных публикаций. Даже в случаях, когда ИИ способствовал корректировке направления исследований — через выявление ошибок или опровержение гипотез — это подчёркивает его роль как полноценного научного соавтора высокого уровня.

Будущее сотрудничества человека и ИИ

Опираясь на предыдущие достижения Google в математике и алгоритмах, авторы делают вывод, что универсальные базовые модели в сочетании с агентными рабочими схемами уже могут выступать сильным научным помощником.

Под управлением экспертов в математике, физике и информатике Gemini Deep Think, по оценке команды, показывает практическую полезность в областях, где критически важны сложные математические рассуждения и логическая проверка.

В материале говорится, что научный рабочий процесс начинает меняться: система все больше берет на себя поиск релевантных знаний и строгую проверку промежуточных построений, а исследователь концентрируется на содержательной глубине и творческом выборе направления. В таких задачах, как уточнение доказательств, поиск контрпримеров и связывание разрозненных областей, ИИ становится полноценным инструментом научного сотрудничества.

Авторы благодарят математическое, физическое и компьютерное научные сообщества за консультации и обсуждения, а также исследовательские команды Google и DeepMind, участвовавшие в создании режима Deep Think, его проверке и подготовке научных публикаций. В оригинальном материале приведены полные списки участников и соавторов двух статей.