120 подписчиков

OpenAI представила GPT-5.2, и вот что в этом особенно интересно

2 дня назад2 дня назад

~1 мин

OpenAI представила GPT-5.2, и вот что в этом особенно интересно.

На первый взгляд может показаться, что это просто еще одна модель, немного лучше предыдущей, но GPT-5.2 стала самой «человечной» нейросетью на сегодняшний день.

Существует бенчмарк ARC-AGI-2, который оценивает абстрактное мышление. Он не проверяет знания, а измеряет способность самостоятельно формулировать правила и комбинировать их для решения новых задач. Этот тест называют тестом на искусственный разум. Средний человек с хорошими умственными способностями набирает 60%, в то время как GPT-5.2 показала результат 53-54%. Впервые разрыв между человеком и ИИ стал таким малым.

Еще один момент: сложный математический экзамен AIME 2025. Он включает алгебру, геометрию и комбинаторику на уровне олимпиад. GPT-5.2 впервые решила все задачи на 100%, не допустив ни одной ошибки.

Третий тест, GDPval, проверяет, может ли ИИ выполнять реальные задачи из различных профессий. Результат 70-74% соответствует уровню хорошего специалиста и превышает показатели большинства работников.

NeuroFlux

#OpenAI #GPT52 #нейросети #искусственныйинтеллект #тесты #абстрактноемышление #математика #рыноктруда #инновации #технологии