Тест Тьюринга — GPT-4.5 (март 2025) Исследователи Кэмерон Джонс и Бенджамин Берген из Калифорнийского университета Сан-Диего провели строгий трёхсторонний тест Тьюринга. GPT-4.5 был принят за человека в 73% случаев — значительно чаще, чем реальный человек-собеседник (которого принимали за человека примерно в 50–60% случаев). LLaMa-3.1-405B также прошла тест с результатом 56%. Это первое эмпирически подтверждённое прохождение классического теста Тьюринга ИИ-системой. Базовые модели GPT-4o и ELIZA провалились, набрав лишь 21–23%. Источник: arXiv.org 2. Международная математическая олимпиада — Gemini Deep Think и GPT-5 (июль 2025) Gemini Deep Think от Google DeepMind решила 5 из 6 задач IMO 2025, набрав 35 баллов из 42 в течение отведённых 4,5 часов — это результат уровня золотой медали. Решения были получены официальной сертификацией IMO, что делает Gemini первой ИИ-системой, получившей официальное золото олимпиады. OpenAI также заявила о результате уровня золота с GPT-5 и Grok-4 — 5 п