Найти в Дзене

Люди опережают LLM на базовых заданиях ARC-AGI-3

Люди опережают LLM на базовых заданиях ARC-AGI-3

Исследователь ИИ Франсуа Шоле и его команда выпустили ARC-AGI-3 — новую версию теста для оценки способности искусственного интеллекта справляться с неизвестными задачами. По словам Шоле, этот бенчмарк помогает понять, может ли ИИ самостоятельно обучаться в непривычных ситуациях, не используя предварительные знания или подсказки. В заданиях используются только базовые когнитивные умения, такие как постоянство объектов и причинно-следственные связи, без…

Подробнее