Найти в Дзене
4 подписчика

GPT-5.5 уже выкатили и она вам понравится.

OpenAI выкатила GPT-5.5 и описывает её как модель для длинной компьютерной работы. Она лучше держит многоходовые задачи, сама пользуется инструментами, перепроверяет результат и дожимает задачу без постоянного ручного контроля.
Самый важный сдвиг модели в её поведении. OpenAI отдельно выделяет кодинг, ресёрч, работу с цифрами, документы, таблицы и действия по компьютеру. Модель берёт на себя кусок реального процесса, а не останавливается на ответе в чате.
Прирост на бенчмарках тоже заметен.

Terminal-Bench 2.0 показал 82.7% против 75.1% у GPT-5.4.
OSWorld-Verified: 78.7% против 75.0%.
BrowseComp: 84.4%, а у версии Pro и того 90.1%.
На SWE-Bench Pro модель тоже прибавила и дошла до 58.6%. Но это всё ещё не та точка, где можно говорить о полном разрыве всех конкурентов.
Судя по первым живым тестам модель стала тяжелее, лучше пишет текст и заметно увереннее во фронтенде. Для многих это будет важнее сухих бенчмарков, потому что именно фронт и продуктовый UI у предыдущих версий часто были слабым местом.
Конечно, цены тоже не низкие, особенно Pro. В API модель уже появилась на прайсинге. Просят $5 за 1 млн входных токенов и $30 за 1 млн выходных. У GPT-5.5 Pro цены $30 и $180 соответственно. То есть токен стал дороже, и квота в Codex теоретически будет сгорать быстрее. Но если модель правда решает простые задачи меньшим числом токенов, итоговая экономика может оказаться не такой уж плохой.
Есть и забавная мета-деталь из свежего релиза. GPT-5.5 и Codex помогали OpenAI оптимизировать собственный inference stack. В одном из кейсов это дало больше 20% прироста скорости генерации токенов.
Доступны GPT-5.5, GPT-5.5 Thinking и GPT-5.5 Pro. Сегодня модель раскатывают всем платным пользователям, а API OpenAI обещает открыть немного позже.
Если всё это подтвердится в реальной работе, то GPT-5.5 станет первым шагом к тому, что Codex моделью уже можно будет закрывать последнее, что оставалось уделом Claude Opus: ДИЗАЙН.
1 минута