Добавить в корзинуПозвонить
Найти в Дзене

OpenAI выпустили GPT-5.5: фокус на системное планирование и агентную работу

OpenAI анонсировала GPT-5.5. Модель перешла от простого предсказания текста к архитектуре глубоких рассуждений, что позволяет ей решать задачи как автономный агент. Во всех тестах обошла Claude Opus 4.7. Детали: — Окно в 256 тысяч токенов позволяет анализировать длинные видео и тяжелые репозитории кода. — На SWE-bench Verified модель решает 48.7% задач с GitHub, обходя предыдущие версии. — Точность на научном тесте GPQA достигла 84.2%, на математическом MATH — 92.4%. — Модель умеет самостоятельно работать в браузере и терминале, устанавливать софт и проверять свои действия. — Внутренняя проверка шагов снизила галлюцинации на 40%. В API можно выбирать между быстрым ответом и глубоким размышлением для сложных архитектурных задач. @bykorolev

OpenAI выпустили GPT-5.5: фокус на системное планирование и агентную работу

OpenAI анонсировала GPT-5.5. Модель перешла от простого предсказания текста к архитектуре глубоких рассуждений, что позволяет ей решать задачи как автономный агент. Во всех тестах обошла Claude Opus 4.7.

Детали:

— Окно в 256 тысяч токенов позволяет анализировать длинные видео и тяжелые репозитории кода.

— На SWE-bench Verified модель решает 48.7% задач с GitHub, обходя предыдущие версии.

— Точность на научном тесте GPQA достигла 84.2%, на математическом MATH — 92.4%.

— Модель умеет самостоятельно работать в браузере и терминале, устанавливать софт и проверять свои действия.

— Внутренняя проверка шагов снизила галлюцинации на 40%.

В API можно выбирать между быстрым ответом и глубоким размышлением для сложных архитектурных задач.

@bykorolev

-2