Тест ARC-AGI-2, разработанный фондом Arc Prize Foundation, представляет собой новый стандарт для оценки общего интеллекта искусственного интеллекта. Он был создан с целью выявления способности ИИ адаптироваться к задачам, которые не встречались в обучающих данных. В отличие от предыдущих тестов, ARC-AGI-2 исключает возможность решения задач методом грубой силы, что делает его особенно сложным для современных нейросетей. ARC-AGI-2 состоит из серии головоломок, в которых ИИ должен идентифицировать визуальные закономерности, анализируя разноцветные квадраты. Задачи требуют от моделей не только решения, но и способности к адаптации и пониманию новых концепций, что является значительным вызовом для существующих технологий. В ходе тестирования, проведенного с участием более 400 человек, средний результат людей составил около 60%, в то время как лучшие модели ИИ показали результаты не более 1,3%. Это подчеркивает огромный разрыв между возможностями современных ИИ и человеческим интеллектом,
Этот тест не может решить ни одна нейросеть, а люди могут
27 марта 202527 мар 2025
388
2 мин