Найти в Дзене
Neurogen

GPT-5.2

GPT-5.2 GPT-5.2 Thinking стала первой моделью, которая достигла экспертного уровня на бенчмарке GDPval, охватывающем 44 профессии. Модель превосходит или сравнивается с ведущими отраслевыми специалистами в 70,9% случаев, работая при этом в 11 раз быстрее и с затратами менее 1% от стоимости работы экспертов Работа с таблицами и презентациями На 9,3% выше результаты в финансовом моделировании по сравнению с GPT-5.1. Улучшенное форматирование и профессиональный дизайн. Доступно в ChatGPT на платных тарифах Программирование - 55,6% на SWE-Bench Pro (новый рекорд) - 80% на SWE-bench Verified - Стал сильнее во frontend-разработке, особенно с 3D-элементами - Более надежная отладка, рефакторинг и внедрение функций Точность и надежность - На 30% меньше ошибок по сравнению с GPT-5.1 Thinking - Почти 100% точность при работе с контекстом до 256K токенов - Лучшее понимание длинных документов, контрактов, исследований Компьютерное зрение - Вдвое меньше ошибок при анализе графиков и интерфейсов

GPT-5.2

GPT-5.2 Thinking стала первой моделью, которая достигла экспертного уровня на бенчмарке GDPval, охватывающем 44 профессии. Модель превосходит или сравнивается с ведущими отраслевыми специалистами в 70,9% случаев, работая при этом в 11 раз быстрее и с затратами менее 1% от стоимости работы экспертов

Работа с таблицами и презентациями

На 9,3% выше результаты в финансовом моделировании по сравнению с GPT-5.1. Улучшенное форматирование и профессиональный дизайн. Доступно в ChatGPT на платных тарифах

Программирование

- 55,6% на SWE-Bench Pro (новый рекорд)

- 80% на SWE-bench Verified

- Стал сильнее во frontend-разработке, особенно с 3D-элементами

- Более надежная отладка, рефакторинг и внедрение функций

Точность и надежность

- На 30% меньше ошибок по сравнению с GPT-5.1 Thinking

- Почти 100% точность при работе с контекстом до 256K токенов

- Лучшее понимание длинных документов, контрактов, исследований

Компьютерное зрение

- Вдвое меньше ошибок при анализе графиков и интерфейсов

- Улучшенное понимание пространственного расположения объектов

- Точная интерпретация дашбордов, диаграмм, технических схем

Работа с инструментами

- 98,7% на Tau2-bench Telecom

- Надежное выполнение многоэтапных задач с инструментами

- Эффективная координация сложных рабочих процессов

🔘Научные достижения

93,2% на GPQA Diamond (GPT-5.2 Pro) - лучший результат для научных исследований

40,3% на FrontierMath - новый рекорд в математике

90%+ на ARC-AGI-1 - первая модель, преодолевшая этот порог

54,2% на ARC-AGI-2 (GPT-5.2 Pro)

🔘Три версии

GPT-5.2 Instant - повседневка

GPT-5.2 Thinking - для сложных задач с кодом, документами и тп

GPT-5.2 Pro - самая умная версия для задач, где нужно критичное качество ответа

Начинается развертывание для платных тарифов Plus, Pro, Business, Enterprise

Цены API: $1.75/1M входных токенов, $14/1M выходных токенов (со скидкой 90% на кэшированные запросы)

https://openai.com/index/introducing-gpt-5-2/

-2
-3
-4
-5
-6
-7
-8