Найти в Дзене
ITtech

GPT-5 на 58% приблизилась к человеческому разуму: учёные создали первый тест на AGI

Оглавление

Группа ведущих учёных во главе с Дэном Хендриксом впервые дала чёткое определение общему искусственному интеллекту (AGI) и создала тест для измерения прогресса на пути к нему. И результаты потрясающие: GPT-5 уже на 58% приблизилась к человеческому разуму.​

58% это много или мало? Давайте разберёмся, что стоит за этими процентами и почему это исследование может стать историческим.​

Прогресс моделей OpenAI на пути к общему искусственному интеллекту
Прогресс моделей OpenAI на пути к общему искусственному интеллекту

Что такое AGI

До сих пор термин AGI был расплывчатым, постоянно смещающейся целью. Как только ИИ осваивал какую-то задачу, считавшуюся признаком интеллекта, планка поднималась выше.​

Исследователи предложили конкретное определение: "AGI это ИИ, который может соответствовать или превосходить когнитивную универсальность и мастерство хорошо образованного взрослого человека". Просто, понятно, измеримо.​

"AGI это ИИ, который может соответствовать или превосходить когнитивную универсальность и мастерство хорошо образованного взрослого человека"

Десять критериев интеллекта

Для оценки исследователи использовали теорию Кеттелла-Хорна-Кэрролла (CHC), самую проверенную модель человеческого познания. Её адаптировали для тестирования ИИ по десяти ключевым когнитивным доменам:​

Приобретённые знания (математика, чтение, письмо). Восприятие (визуальная и слуховая обработка). Центральный исполнитель (рассуждение, обработка информации). Память (рабочая и долгосрочная). Скорость обработки и вывода информации.​

Десять когнитивных доменов для оценки общего ИИ
Десять когнитивных доменов для оценки общего ИИ

Каждый домен весит 10%, чтобы подчеркнуть широту и охватить основные области познания.​

Неровный профиль GPT-5

Применение теста выявило то, что исследователи назвали "зазубренным когнитивным профилем". Модели сильны в одних областях и критически слабы в других.​

GPT-5 показывает отличные результаты в знаниеёмких доменах: математика, чтение, письмо получают почти 10 из 10 баллов. Это означает, что в этих областях ИИ уже достиг или превысил уровень образованного взрослого.​

Но есть критический пробел: долгосрочная память хранения получает почти 0%. Это самый значительный дефицит, выявленный исследованием.​

"Отсутствие долгосрочной памяти хранения приводит к форме амнезии, заставляя ИИ заново учить контекст в каждом взаимодействии"

Когда ждать AGI

Если следовать линейному прогнозу: от 27% до 58% за два года означает прирост примерно 15-16% в год. При таком темпе 100% можно достичь примерно через 3-4 года.​

Но прогресс в ИИ редко бывает линейным. Могут быть прорывы, которые резко ускорят движение к AGI, или плато, где прогресс замедлится.​

Авторы пишут: "Начнём переживать о восстании машин примерно после 75%". Полушутя-полусерьёзно, но это напоминание: AGI не за горами.​

Заключение

Это исследование важно по нескольким причинам. Во-первых, оно даёт конкретное определение AGI вместо расплывчатых формулировок. Во-вторых, позволяет измерять прогресс и сравнивать модели. В-третьих, выявляет конкретные слабости современных систем.​

58% это одновременно много и мало. Много, потому что всего два года назад мы были на 27%. Мало, потому что оставшиеся 42% могут быть самыми сложными.​

Одно ясно точно: мы живём в историческое время, когда искусственный интеллект стремительно приближается к человеческому уровню. И теперь у нас есть линейка, чтобы измерить этот путь!​

Подписывайтесь на наш Telegram