2 подписчика

Искусственный интеллект не справился с новым тестом 🤖

Согласно последним данным, даже самые продвинутые модели OpenAI не смогли справиться с тестом ARC-AGI-2, который оценивает способность искусственного интеллекта мыслить как человек.

Модели o3-mini и GPT 4.5 показали нулевой результат, в то время как лучшая из доступных моделей o1-pro набрала всего 1%, а закрытая версия o3 — 4%.

Для сравнения, средний результат человека без подготовки составляет около 60%. Проблема заключается в нехватке абстрактного мышления, которое пока остается сложной задачей для нейросетей.

🧠 AI Grid

Искусственный интеллект не справился с новым тестом 🤖 Согласно последним данным, даже самые продвинутые модели OpenAI не смогли справиться с тестом ARC-AGI-2, который оценивает способность...

Около минуты

27 марта 2025