19 подписчиков

Новая модель OpenAI GPT-5.3-Codex сама помогала создавать себя

6 февраля6 фев

1 мин

OpenAI выпустила GPT-5.3-Codex, свою последнюю модель кодирования. Компания заявляет, что она сочетает возможности кодирования GPT-5.2-Codex с логикой и знаниями GPT-5.2, при этом работает на 25 процентов быстрее. Изображение выше: создано в сервисе для генерации фотографий от KolerskyAI Наиболее примечательно, что в Terminal-Bench 2.0 она превосходит только что выпущенный Opus 4.6 на 12 процентных пунктов — значительный разрыв по текущим стандартам искусственного интеллекта - при использовании меньшего количества токенов, чем ее предшественники. В OSWorld, агентском тесте по использованию компьютеров, она набрала 64,7% баллов по сравнению с 38,2% у GPT-5.2-Codex. По GDPval, эталону OpenAI для умственных задач по 44 профессиям, он соответствует GPT-5.2. OpenAI также утверждает, что модель сыграла определенную роль в ее собственной разработке: команда использовала ранние версии для поиска ошибок во время обучения, управления развертыванием и оценки результатов. Компания говорит, что

OpenAI выпустила GPT-5.3-Codex, свою последнюю модель кодирования. Компания заявляет, что она сочетает возможности кодирования GPT-5.2-Codex с логикой и знаниями GPT-5.2, при этом работает на 25 процентов быстрее.

Изображение выше: создано в сервисе для генерации фотографий от KolerskyAI

Наиболее примечательно, что в Terminal-Bench 2.0 она превосходит только что выпущенный Opus 4.6 на 12 процентных пунктов — значительный разрыв по текущим стандартам искусственного интеллекта - при использовании меньшего количества токенов, чем ее предшественники. В OSWorld, агентском тесте по использованию компьютеров, она набрала 64,7% баллов по сравнению с 38,2% у GPT-5.2-Codex. По GDPval, эталону OpenAI для умственных задач по 44 профессиям, он соответствует GPT-5.2.

OpenAI также утверждает, что модель сыграла определенную роль в ее собственной разработке: команда использовала ранние версии для поиска ошибок во время обучения, управления развертыванием и оценки результатов. Компания говорит, что команда была "поражена тем, насколько Codex удалось ускорить собственную разработку".

GPT-5.3-Codex теперь доступен платным пользователям ChatGPT в приложении Codex, командной строке, расширении IDE и в Интернете. Доступ к API последует. OpenAI классифицировала модель как первую с "Высоким" рейтингом риска кибербезопасности, хотя компания заявляет, что это мера предосторожности, поскольку нет окончательных доказательств необходимости такой классификации.

Гаджеты и электроника

5,73 млн интересуются