Профессор физики публично признался, что регулярно использует Google Gemini для проверки своих научных работ перед отправкой в журналы. Заявление от 9 мая на Hacker News вызвало бурную дискуссию о роли искусственного интеллекта в академической валидации — практике, которая ещё три года назад казалась фантастикой. Этот случай стал катализатором широкого обсуждения границ применения ИИ в научной работе и вызвал неоднозначную реакцию академического сообщества. Ситуация выглядит парадоксально: языковые модели, которые 3-4 года назад не могли надёжно решать задачи школьного уровня, сегодня анализируют исследовательские работы. Прогресс действительно впечатляет — на специализированном бенчмарке CritPt, построенном на неопубликованных задачах исследовательского уровня по физике, модель o3 полтора года назад показывала результат 1,4 процента, а GPT 5.4 в режиме xhigh достигла 23,4 процента. Frontier-модели пока далеки от полного решения, но траектория развития очевидна. Более того, последняя