Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

GPT-5.2: Новый лидер в мире ИИ

OpenAI представила GPT-5.2 — новую флагманскую модель, которая вскоре заменит GPT-5.1 в API и ChatGPT. Организация ARC Prize опубликовала результаты бенчмарков ARC-AGI-1 и ARC-AGI-2, считающихся сложным тестом на абстрактное мышление, часто называемым "экзаменом на AGI". Модель лидирует в обоих бенчмарках, особенно в ARC-AGI-2, задачи которого еще не встречались в обучающих данных ИИ. GPT-5.2 Pro решает 54,2% задач, что немного выше, чем у предыдущего рекордсмена (54%). Ранее первое место принадлежало Poetiq — системе, использующей несколько копий Gemini 3 Pro, оптимизированной для бенчмарков типа ARC-AGI. Теперь лучший результат демонстрирует модель, доступная широкой публике. Важно отметить, что GPT-5.2 Thinking в режиме X-High решает 52,9% задач по цене $1,90 за задачу, в то время как GPT-5.2 Pro стоит $15,27, а Poetiq — $30,75. Это означает, что более доступные версии модели теперь справляются с более сложными задачами. ARC-AGI проверяет способность ИИ применять навыки к похожим за

OpenAI представила GPT-5.2 — новую флагманскую модель, которая вскоре заменит GPT-5.1 в API и ChatGPT. Организация ARC Prize опубликовала результаты бенчмарков ARC-AGI-1 и ARC-AGI-2, считающихся сложным тестом на абстрактное мышление, часто называемым "экзаменом на AGI". Модель лидирует в обоих бенчмарках, особенно в ARC-AGI-2, задачи которого еще не встречались в обучающих данных ИИ.

GPT-5.2 Pro решает 54,2% задач, что немного выше, чем у предыдущего рекордсмена (54%). Ранее первое место принадлежало Poetiq — системе, использующей несколько копий Gemini 3 Pro, оптимизированной для бенчмарков типа ARC-AGI. Теперь лучший результат демонстрирует модель, доступная широкой публике. Важно отметить, что GPT-5.2 Thinking в режиме X-High решает 52,9% задач по цене $1,90 за задачу, в то время как GPT-5.2 Pro стоит $15,27, а Poetiq — $30,75. Это означает, что более доступные версии модели теперь справляются с более сложными задачами.

ARC-AGI проверяет способность ИИ применять навыки к похожим задачам. Модели показывают две визуальные головоломки ("условие — решение"). ИИ должен вывести правило решения и применить его к третьей головоломке. Люди справляются с этим легко, но ИИ долго не мог. GPT-5.2 приблизилась к человеческому уровню (66% для ARC-AGI-2).

В бенчмарке GDPval GPT-5.2 Thinking показывает 70,9% против 38,8% у GPT-5.1 Thinking. GDPval — новый бенчмарк OpenAI, измеряющий способность ИИ выполнять реальные рабочие задачи: создавать презентации, таблицы Excel, документы Word и рендерить видео. Эти задачи важны для внедрения ИИ в работу и влияния на ВВП. Также у модели вдвое сократилось количество ошибок при распознавании изображений, особенно графических интерфейсов, где сильна Gemini 3 Pro.

GPT-5.2 уже доступна подписчикам ChatGPT Plus, Pro, Business и Enterprise, но полная активация может занять несколько дней. Цена в API: $1.75 за миллион входящих токенов и $14 за миллион исходящих токенов (с 90% скидкой за кэшированные токены).