11,5 тыс подписчиков

GPT‑5.3‑Codex: офисный напарник и кодер

2 дня назад2 дня назад

1 мин

Компания OpenAI объявила о выпуске GPT-5.3-Codex — новой версии флагманской модели для кодинг-агента Codex. В OpenAI сообщили, что модель получила улучшения в программировании, работе с агентными сценариями и эффективности, а также применялась внутри компании в процессе собственной разработки. По сухим цифрам прирост в чистом программировании выглядит спокойным. На SWE-Bench Pro результат поднялся с 56,4% до 56,8% по сравнению с предыдущей генерацией. Зато в задачах вокруг кода картина уже иная. На Terminal-Bench 2.0 модель шагнула с 64% до 77,3%. На OSWorld-Verified, где агент управляет полноценным десктопом через визуальный интерфейс, показатель вырос с 38,2% до 64,7%. Для ориентира люди на этом же тесте держатся примерно на уровне 72%. Параллельно GPT-5.3-Codex стала экономнее по токенам и быстрее примерно на 25%. Самое любопытное начинается за пределами привычного программирования. В OpenAI описывают модель как универсального цифрового исполнителя для всего, что специалисты делают

По сухим цифрам прирост в чистом программировании выглядит спокойным. На SWE-Bench Pro результат поднялся с 56,4% до 56,8% по сравнению с предыдущей генерацией. Зато в задачах вокруг кода картина уже иная.

На Terminal-Bench 2.0 модель шагнула с 64% до 77,3%. На OSWorld-Verified, где агент управляет полноценным десктопом через визуальный интерфейс, показатель вырос с 38,2% до 64,7%. Для ориентира люди на этом же тесте держатся примерно на уровне 72%. Параллельно GPT-5.3-Codex стала экономнее по токенам и быстрее примерно на 25%.

Самое любопытное начинается за пределами привычного программирования. В OpenAI описывают модель как универсального цифрового исполнителя для всего, что специалисты делают за компьютером.

Презентации, таблицы, документация, работа с настольными приложениями — агент постепенно превращается в полноценного офисного напарника. На бенчмарке GDPval, где проверяют выполнение рабочих задач сразу в 44 профессиях, результат составил 70,9%. Это тот же уровень, что и у GPT-5.2. Появился и интерактивный режим, при котором агент регулярно сообщает о ходе работы и даёт возможность вмешаться в процесс без перезапуска задачи.

Отдельного внимания заслуживает блок, связанный с кибербезопасностью. GPT-5.3-Codex стала первой моделью компании с рейтингом High по кибербезопасности во внутреннем Preparedness Framework. Её специально обучали поиску уязвимостей в коде, а параллельно запускается пилот Trusted Access for Cyber для исследователей.

На поддержку открытого программного обеспечения и критической инфраструктуры выделено $10 млн в виде API-кредитов. Сейчас модель доступна платным подписчикам ChatGPT, а выход через API заявлен на более поздний срок.

Оригинал публикации на сайте CISOCLUB: "OpenAI выпустила GPT-5.3-Codex — модель, которая была частично создана самим ChatGPT".

Гаджеты и электроника

5,73 млн интересуются