1 неделю назад
Вот 10 наиболее резонансных случаев 2025–2026 годов, когда нейросети превзошли человеческие показатели на конкретных тестах — строго с
источниками. 1. Тест Тьюринга — GPT-4.5 (март 2025) Исследователи Кэмерон Джонс и Бенджамин Берген из Калифорнийского университета Сан-Диего провели строгий трёхсторонний тест Тьюринга. GPT-4.5 был принят за человека в 73% случаев — значительно чаще, чем реальный человек-собеседник (которого принимали за человека примерно в 50–60% случаев). LLaMa-3.1-405B также прошла тест с результатом 56%. Это первое эмпирически подтверждённое прохождение классического теста Тьюринга ИИ-системой. Базовые модели GPT-4o и ELIZA провалились, набрав лишь 21–23%.hi-tech.mail+3 Источник: arXiv.org — arxiv.org/abs/2503...
1 неделю назад
1
Тест Тьюринга — GPT-4.5 (март 2025) Исследователи Кэмерон Джонс и Бенджамин Берген из Калифорнийского университета Сан-Диего провели строгий трёхсторонний тест Тьюринга. GPT-4.5 был принят за человека в 73% случаев — значительно чаще, чем реальный человек-собеседник (которого принимали за человека примерно в 50–60% случаев). LLaMa-3.1-405B также прошла тест с результатом 56%. Это первое эмпирически подтверждённое прохождение классического теста Тьюринга ИИ-системой. Базовые модели GPT-4o и ELIZA провалились, набрав лишь 21–23%. Источник: arXiv.org   2. Международная математическая олимпиада — Gemini...