Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

GPT-5.2: Новый уровень AI для разработчиков

OpenAI представила новое поколение своих флагманских моделей. GPT-5.2 позиционируется как мощный инструмент для решения сложных профессиональных задач, включая создание агентских пайплайнов, обработку больших объемов данных и мультимодальные приложения. В тестах на реальную разработку, SWE-Bench Pro, GPT-5.2 Thinking демонстрирует впечатляющие результаты, решая 55.6% задач против 50.8% у GPT-5.1. На более простой версии теста, SWE-Bench Verified, показатель достигает 80%. Это говорит о значительном снижении необходимости ручной доработки кода, повышении стабильности работы с крупными проектами и возможности GPT-5.2 автономно реализовывать новые функции и исправлять ошибки. Ранние пользователи особенно отмечают улучшения во фронтенд-разработке: создание сложных интерфейсов, работа с 3D-элементами и генерация UI по одному запросу. GPT-5.2 впервые выглядит как полноценный инструмент для full-stack разработки, а не просто генератор кода. GPT-5.2 Thinking значительно улучшила работу с длинн

OpenAI представила новое поколение своих флагманских моделей. GPT-5.2 позиционируется как мощный инструмент для решения сложных профессиональных задач, включая создание агентских пайплайнов, обработку больших объемов данных и мультимодальные приложения.

В тестах на реальную разработку, SWE-Bench Pro, GPT-5.2 Thinking демонстрирует впечатляющие результаты, решая 55.6% задач против 50.8% у GPT-5.1. На более простой версии теста, SWE-Bench Verified, показатель достигает 80%. Это говорит о значительном снижении необходимости ручной доработки кода, повышении стабильности работы с крупными проектами и возможности GPT-5.2 автономно реализовывать новые функции и исправлять ошибки.

Ранние пользователи особенно отмечают улучшения во фронтенд-разработке: создание сложных интерфейсов, работа с 3D-элементами и генерация UI по одному запросу. GPT-5.2 впервые выглядит как полноценный инструмент для full-stack разработки, а не просто генератор кода.

GPT-5.2 Thinking значительно улучшила работу с длинными контекстами, достигая 256k токенов. В тесте MRCRv2 модель показывает почти идеальную точность извлечения информации даже из огромных объемов текста.

Это позволяет загружать в модель длинные документы, многофайловые проекты, большие отчеты и переписки, сохраняя при этом последовательность и точность ответов. Кроме того, новый компактный режим позволяет GPT-5.2 эффективно работать за пределами стандартного окна контекста, что особенно важно для длительных агентских сценариев.

Точность использования инструментов в GPT-5.2 на тесте Tau2-bench Telecom достигла 98.7%, даже в быстром режиме. Несколько компаний уже смогли заменить множество небольших агентов одним, более мощным, с использованием более чем 20 инструментов.

Модель стала лучше понимать изображения, включая графики, дашборды, интерфейсы и технические схемы. Ошибки при интерпретации графического интерфейса уменьшились почти вдвое, а при анализе диаграмм GPT-5.2 демонстрирует более аккуратную и точную работу.

Количество фактических ошибок (галлюцинаций) снизилось примерно на треть, что критически важно для задач аналитики, составления резюме и деловой переписки.

GPT-5.2 уже доступна подписчикам ChatGPT Plus, Pro, Business и Enterprise. В API модель представлена под именами gpt-5.2 и gpt-5.2-chat-latest, а самая мощная версия – gpt-5.2-pro.

Стоимость использования API была увеличена по сравнению с GPT-5.1:

• Input: 1.75 $ за миллион токенов
• Output: 14 $ за миллион токенов
• Cached input: скидка 90%

OpenAI утверждает, что общие расходы часто снижаются благодаря более эффективной работе GPT-5.2, которая выполняет задачи быстрее и с меньшим количеством токенов.