Компания OpenAI объявила о выпуске GPT-5.3-Codex — новой версии флагманской модели для кодинг-агента Codex. В OpenAI сообщили, что модель получила улучшения в программировании, работе с агентными сценариями и эффективности, а также применялась внутри компании в процессе собственной разработки. По сухим цифрам прирост в чистом программировании выглядит спокойным. На SWE-Bench Pro результат поднялся с 56,4% до 56,8% по сравнению с предыдущей генерацией. Зато в задачах вокруг кода картина уже иная. На Terminal-Bench 2.0 модель шагнула с 64% до 77,3%. На OSWorld-Verified, где агент управляет полноценным десктопом через визуальный интерфейс, показатель вырос с 38,2% до 64,7%. Для ориентира люди на этом же тесте держатся примерно на уровне 72%. Параллельно GPT-5.3-Codex стала экономнее по токенам и быстрее примерно на 25%. Самое любопытное начинается за пределами привычного программирования. В OpenAI описывают модель как универсального цифрового исполнителя для всего, что специалисты делают