OpenAI анонсировала GPT-5.5. Модель перешла от простого предсказания текста к архитектуре глубоких рассуждений, что позволяет ей решать задачи как автономный агент. Во всех тестах обошла Claude Opus 4.7. Детали: — Окно в 256 тысяч токенов позволяет анализировать длинные видео и тяжелые репозитории кода. — На SWE-bench Verified модель решает 48.7% задач с GitHub, обходя предыдущие версии. — Точность на научном тесте GPQA достигла 84.2%, на математическом MATH — 92.4%. — Модель умеет самостоятельно работать в браузере и терминале, устанавливать софт и проверять свои действия. — Внутренняя проверка шагов снизила галлюцинации на 40%. В API можно выбирать между быстрым ответом и глубоким размышлением для сложных архитектурных задач. @bykorolev
OpenAI выпустили GPT-5.5: фокус на системное планирование и агентную работу
2 дня назад2 дня назад
19
~1 мин