2 подписчика
Искусственный интеллект не справился с новым тестом 🤖
Согласно последним данным, даже самые продвинутые модели OpenAI не смогли справиться с тестом ARC-AGI-2, который оценивает способность искусственного интеллекта мыслить как человек.
Модели o3-mini и GPT 4.5 показали нулевой результат, в то время как лучшая из доступных моделей o1-pro набрала всего 1%, а закрытая версия o3 — 4%.
Для сравнения, средний результат человека без подготовки составляет около 60%. Проблема заключается в нехватке абстрактного мышления, которое пока остается сложной задачей для нейросетей.
Около минуты
27 марта 2025