Найти в Дзене
3376 подписчиков

O3 установила новый рекорд в ARC-бенчмарке, превзойдя показатели человека


В индустрии ИИ произошло важное событие: система o3 показала рекордные результаты в ARC-бенчмарке — одном из самых авторитетных тестов, оценивающих шаги к созданию искусственного общего интеллекта (AGI).

ARC-бенчмарк — это комплексный тест, включающий задачи уровня IQ-тестов, загадки и проверку навыков решения задач на разные типы логики и абстракции.
Прежний рекорд в этом бенчмарке держался пять лет — значительный срок для стремительно развивающейся сферы ИИ.
Новый результат o3 — 87,5%, что выше среднего уровня человека (~85%).

Хотя такой успех нельзя назвать полноценным достижением AGI, это подтверждает, что мы приближаемся к созданию систем с общими интеллектуальными способностями. Эксперты предполагают, что появление AGI может стать реальностью уже в ближайшем будущем.



O3 установила новый рекорд в ARC-бенчмарке, превзойдя показатели человека  В индустрии ИИ произошло важное событие: система o3 показала рекордные результаты в ARC-бенчмарке — одном из самых...
Около минуты