94 подписчика

GPT-5 на 58% приблизилась к человеческому разуму: учёные создали первый тест на AGI

19 октября19 окт

2 мин

Оглавление

Что такое AGI
Десять критериев интеллекта
Неровный профиль GPT-5

Группа ведущих учёных во главе с Дэном Хендриксом впервые дала чёткое определение общему искусственному интеллекту (AGI) и создала тест для измерения прогресса на пути к нему. И результаты потрясающие: GPT-5 уже на 58% приблизилась к человеческому разуму.

58% это много или мало? Давайте разберёмся, что стоит за этими процентами и почему это исследование может стать историческим.

Что такое AGI

До сих пор термин AGI был расплывчатым, постоянно смещающейся целью. Как только ИИ осваивал какую-то задачу, считавшуюся признаком интеллекта, планка поднималась выше.

Исследователи предложили конкретное определение: "AGI это ИИ, который может соответствовать или превосходить когнитивную универсальность и мастерство хорошо образованного взрослого человека". Просто, понятно, измеримо.

"AGI это ИИ, который может соответствовать или превосходить когнитивную универсальность и мастерство хорошо образованного взрослого человека"

Десять критериев интеллекта

Для оценки исследователи использовали теорию Кеттелла-Хорна-Кэрролла (CHC), самую проверенную модель человеческого познания. Её адаптировали для тестирования ИИ по десяти ключевым когнитивным доменам:

Приобретённые знания (математика, чтение, письмо). Восприятие (визуальная и слуховая обработка). Центральный исполнитель (рассуждение, обработка информации). Память (рабочая и долгосрочная). Скорость обработки и вывода информации.

Каждый домен весит 10%, чтобы подчеркнуть широту и охватить основные области познания.

Неровный профиль GPT-5

Применение теста выявило то, что исследователи назвали "зазубренным когнитивным профилем". Модели сильны в одних областях и критически слабы в других.

GPT-5 показывает отличные результаты в знаниеёмких доменах: математика, чтение, письмо получают почти 10 из 10 баллов. Это означает, что в этих областях ИИ уже достиг или превысил уровень образованного взрослого.

Но есть критический пробел: долгосрочная память хранения получает почти 0%. Это самый значительный дефицит, выявленный исследованием.

"Отсутствие долгосрочной памяти хранения приводит к форме амнезии, заставляя ИИ заново учить контекст в каждом взаимодействии"

Когда ждать AGI

Если следовать линейному прогнозу: от 27% до 58% за два года означает прирост примерно 15-16% в год. При таком темпе 100% можно достичь примерно через 3-4 года.

Но прогресс в ИИ редко бывает линейным. Могут быть прорывы, которые резко ускорят движение к AGI, или плато, где прогресс замедлится.

Авторы пишут: "Начнём переживать о восстании машин примерно после 75%". Полушутя-полусерьёзно, но это напоминание: AGI не за горами.

Заключение

Это исследование важно по нескольким причинам. Во-первых, оно даёт конкретное определение AGI вместо расплывчатых формулировок. Во-вторых, позволяет измерять прогресс и сравнивать модели. В-третьих, выявляет конкретные слабости современных систем.

58% это одновременно много и мало. Много, потому что всего два года назад мы были на 27%. Мало, потому что оставшиеся 42% могут быть самыми сложными.

Одно ясно точно: мы живём в историческое время, когда искусственный интеллект стремительно приближается к человеческому уровню. И теперь у нас есть линейка, чтобы измерить этот путь!

Подписывайтесь на наш Telegram