3376 подписчиков
O3 установила новый рекорд в ARC-бенчмарке, превзойдя показатели человека
В индустрии ИИ произошло важное событие: система o3 показала рекордные результаты в ARC-бенчмарке — одном из самых авторитетных тестов, оценивающих шаги к созданию искусственного общего интеллекта (AGI).
ARC-бенчмарк — это комплексный тест, включающий задачи уровня IQ-тестов, загадки и проверку навыков решения задач на разные типы логики и абстракции.
Прежний рекорд в этом бенчмарке держался пять лет — значительный срок для стремительно развивающейся сферы ИИ.
Новый результат o3 — 87,5%, что выше среднего уровня человека (~85%).
Хотя такой успех нельзя назвать полноценным достижением AGI, это подтверждает, что мы приближаемся к созданию систем с общими интеллектуальными способностями. Эксперты предполагают, что появление AGI может стать реальностью уже в ближайшем будущем.
Около минуты
20 декабря 2024