75 подписчиков

Gemini Deep Think: как ИИ ускоряет открытия в математике, физике и информатике

26 февраля26 фев

5 мин

Под руководством профессиональных математиков и ученых режим Gemini Deep Think применяется для решения исследовательских задач в математике, физике и информатике. Летом 2025 года усовершенствованная версия Gemini Deep Think достигла уровня золотой медали на Международной математической олимпиаде, а позднее обновленная версия показала сопоставимый результат на Международной студенческой олимпиаде по программированию. Эти итоги показали, что модель способна рассуждать на уровне самых сложных задач по математике и программированию, которые обычно даются сильнейшим студентам. После этого режим Deep Think начали применять в научных, инженерных и корпоративных сценариях с более открытыми и сложными постановками задач. В течение последней недели команды DeepMind опубликовали две научные статьи с результатами междисциплинарной работы по профессиональным исследовательским задачам с использованием Gemini Deep Think. Авторы подчеркивают, что полученные результаты стали возможны благодаря плотному

Оглавление

Передний край чистой математики
Расширение на физику и информатику
Будущее сотрудничества человека и ИИ

Под руководством профессиональных математиков и ученых режим Gemini Deep Think применяется для решения исследовательских задач в математике, физике и информатике.

Летом 2025 года усовершенствованная версия Gemini Deep Think достигла уровня золотой медали на Международной математической олимпиаде, а позднее обновленная версия показала сопоставимый результат на Международной студенческой олимпиаде по программированию. Эти итоги показали, что модель способна рассуждать на уровне самых сложных задач по математике и программированию, которые обычно даются сильнейшим студентам. После этого режим Deep Think начали применять в научных, инженерных и корпоративных сценариях с более открытыми и сложными постановками задач.

В течение последней недели команды DeepMind опубликовали две научные статьи с результатами междисциплинарной работы по профессиональным исследовательским задачам с использованием Gemini Deep Think. Авторы подчеркивают, что полученные результаты стали возможны благодаря плотному взаимодействию математиков, физиков и специалистов по информатике.

Передний край чистой математики

В отличие от олимпиадных задач, исследовательская математика требует владения большим числом продвинутых методов из обширной литературы. Несмотря на большие базы знаний, у базовых моделей в этой области часто возникают поверхностное понимание и ошибочные выводы.

Для решения этой проблемы в DeepMind создали исследовательского математического агента под внутренним названием Aletheia, работающего на основе Gemini Deep Think. В систему добавлен проверяющий модуль на естественном языке, который ищет слабые места в кандидатных решениях и поддерживает итеративный цикл: генерация, проверка и доработка решения. Важной особенностью стала способность агента признавать, что задачу решить не удалось: по оценке авторов, это существенно повышает эффективность реальной работы исследователей.

Дополнительно агент использует веб-поиск и просмотр источников, чтобы ориентироваться в сложной литературе, снижать риск фиктивных ссылок и вычислительных неточностей при синтезе опубликованных результатов.

После результата уровня золотой медали IMO в июле 2025 года возможности Gemini Deep Think, по данным DeepMind, быстро выросли. На тесте IMO-ProofBench Advanced система достигала значений до 90% по мере увеличения вычислений на этапе вывода. Авторы также показывают, что этот эффект сохраняется и при переходе от олимпиадных задач к упражнениям уровня докторантуры на внутреннем тесте FutureMath Basic.

Закон масштабирования во время инференса также переносится на упражнения уровня PhD.

Последняя продвинутая версия Deep Think по состоянию на январь 2026 года значительно превзошла версию IMO-Gold (июль 2025 года) при решении задач олимпиадного уровня.Aletheia делает ещё более существенный шаг вперёд с точки зрения качества рассуждений при меньших вычислительных затратах на этапе инференса. Все результаты были оценены экспертами-людьми.

Отмечается, что Aletheia показывает более высокое качество рассуждений при меньших вычислительных затратах на этапе вывода.

Для исследовательской математики DeepMind приводит ряд примеров результатов, полученных при разной степени самостоятельности системы:

Полностью автономная работа: научная статья, сформированная без участия человека, с вычислением ряда структурных констант в арифметической геометрии.
Совместная работа человека и ИИ: статья о доказательстве оценок для систем взаимодействующих частиц.
Полуавтономная массовая проверка: анализ 700 открытых задач из базы гипотез Эрдёша, включая автономные решения четырех задач из списка.

Также сообщается о промежуточном вкладе системы в еще две исследовательские работы и о более ранних проектах меньшего масштаба, где Gemini уже применялась в математических исследованиях.

После обсуждений с математическим сообществом авторы предлагают классификацию исследований с участием ИИ по двум осям: значимость результата и степень вклада ИИ. Работы уровня «публикационного качества» уже поданы в авторитетные журналы. При этом авторы отдельно оговаривают, что на момент публикации не заявляют результатов уровней «крупный прорыв» и «знаковый прорыв».

Расширение на физику и информатику

По данным DeepMind, режим Gemini Deep Think также показал перспективные результаты в теоретической информатике и физике. Во второй статье описаны практические «рецепты» совместной работы человека и системы, в том числе модель «советника», где эксперт итеративно направляет ход доказательства и проверку гипотез.

Среди тактических приемов выделены «сбалансированные запросы» (одновременная просьба доказать или опровергнуть утверждение, чтобы снизить риск подтверждающего уклона) и проверка с поддержкой программного кода. В совокупности с возможностью связывать идеи из разных областей это, по оценке авторов, меняет подход к теоретическим исследованиям.

Схема конвейера рассуждений: от широкого поиска в пространстве решений к структурированному выводу и многоуровневой проверке.

В совместной работе с экспертами по 18 исследовательским задачам система помогла продвинуться в алгоритмах, машинном обучении и комбинаторной оптимизации, теории информации и экономической теории. Среди примеров в статье:

Продвижение по классическим задачам Max-Cut и Steiner Tree за счет методов из других разделов математики.
Контрпример к интуитивному правилу в подмодулярной оптимизации, которое более 10 лет не удавалось строго подтвердить или опровергнуть.
Объяснение механизма работы нового метода оптимизации в машинном обучении через вывод адаптивного внутреннего штрафа.
Расширение теоремы в аукционных моделях с рациональных чисел на непрерывный случай действительных значений.
Новый аналитический подход к интегралам в задачах о космических струнах с получением конечной замкнутой формы.

Авторы отмечают, что полученные результаты охватывают широкий круг направлений — от теории информации до криптографии и теории механизмов — и демонстрируют, что ИИ фундаментально меняет сам характер научных исследований.

Учитывая гибкую, ориентированную на конференции систему публикаций в информатике, результаты представлены не в виде строгой классификации, а с точки зрения их академической траектории: примерно половина работ нацелена на ведущие конференции, тогда как остальные станут основой будущих журнальных публикаций. Даже в случаях, когда ИИ способствовал корректировке направления исследований — через выявление ошибок или опровержение гипотез — это подчёркивает его роль как полноценного научного соавтора высокого уровня.

Будущее сотрудничества человека и ИИ

Опираясь на предыдущие достижения Google в математике и алгоритмах, авторы делают вывод, что универсальные базовые модели в сочетании с агентными рабочими схемами уже могут выступать сильным научным помощником.

Под управлением экспертов в математике, физике и информатике Gemini Deep Think, по оценке команды, показывает практическую полезность в областях, где критически важны сложные математические рассуждения и логическая проверка.

В материале говорится, что научный рабочий процесс начинает меняться: система все больше берет на себя поиск релевантных знаний и строгую проверку промежуточных построений, а исследователь концентрируется на содержательной глубине и творческом выборе направления. В таких задачах, как уточнение доказательств, поиск контрпримеров и связывание разрозненных областей, ИИ становится полноценным инструментом научного сотрудничества.

Авторы благодарят математическое, физическое и компьютерное научные сообщества за консультации и обсуждения, а также исследовательские команды Google и DeepMind, участвовавшие в создании режима Deep Think, его проверке и подготовке научных публикаций. В оригинальном материале приведены полные списки участников и соавторов двух статей.