Найти в Дзене

Искусственный интеллект не справился с новым тестом 🤖


Согласно последним данным, даже самые продвинутые модели OpenAI не смогли справиться с тестом ARC-AGI-2, который оценивает способность искусственного интеллекта мыслить как человек.

Модели o3-mini и GPT 4.5 показали нулевой результат, в то время как лучшая из доступных моделей o1-pro набрала всего 1%, а закрытая версия o3 — 4%.

Для сравнения, средний результат человека без подготовки составляет около 60%. Проблема заключается в нехватке абстрактного мышления, которое пока остается сложной задачей для нейросетей.

Искусственный интеллект не справился с новым тестом 🤖  Согласно последним данным, даже самые продвинутые модели OpenAI не смогли справиться с тестом ARC-AGI-2, который оценивает способность...
Около минуты