OpenAI представила GPT-5.2, и вот что в этом особенно интересно.
На первый взгляд может показаться, что это просто еще одна модель, немного лучше предыдущей, но GPT-5.2 стала самой «человечной» нейросетью на сегодняшний день.
Существует бенчмарк ARC-AGI-2, который оценивает абстрактное мышление. Он не проверяет знания, а измеряет способность самостоятельно формулировать правила и комбинировать их для решения новых задач. Этот тест называют тестом на искусственный разум. Средний человек с хорошими умственными способностями набирает 60%, в то время как GPT-5.2 показала результат 53-54%. Впервые разрыв между человеком и ИИ стал таким малым.
Еще один момент: сложный математический экзамен AIME 2025. Он включает алгебру, геометрию и комбинаторику на уровне олимпиад. GPT-5.2 впервые решила все задачи на 100%, не допустив ни одной ошибки.
Третий тест, GDPval, проверяет, может ли ИИ выполнять реальные задачи из различных профессий. Результат 70-74% соответствует уровню хорошего специалиста и превышает показатели большинства работников.
#OpenAI #GPT52 #нейросети #искусственныйинтеллект #тесты #абстрактноемышление #математика #рыноктруда #инновации #технологии