Новая система имён: поколение отдельно, класс отдельно
GPT-5.6 - это сразу три модели. В новой схеме число обозначает поколение, а Sol, Terra и Luna задают устойчивые классы по соотношению «интеллект / скорость / цена», которые дальше могут развиваться своим темпом.
МодельКлассЦена за 1 млн токенов (вход / выход)SolФлагман, максимум интеллекта$5 / $30TerraБаланс для повседневных задач$2,5 / $15LunaСкорость и минимальная цена$1 / $6
По заявлению OpenAI, Terra сравнима с прошлогодней GPT-5.5, но вдвое дешевле, а Luna даёт сильные возможности при самой низкой стоимости.
Заодно переделали кеширование запросов: появились явные точки кеша и минимальный срок его жизни в 30 минут. Запись в кеш теперь обходится в 1,25× от обычной цены входа, чтение по-прежнему идёт со скидкой 90%.
Схема призвана убрать путаницу с версиями. Но к и без того длинному каталогу OpenAI добавляются ещё три имени, которые читателю придётся запоминать.
Почему старт открыли не для всех
Обычно новую модель выкатывают в ChatGPT и API сразу. Здесь иначе: на старте GPT-5.6 доступна только через API и среду разработки Codex узкому списку партнёров и организаций, и этот список согласован с правительством США. Компания заранее показала Администрации планы и возможности моделей, и релиз начали с ограниченного превью именно по запросу властей.
OpenAI открыто пишет, что не считает такой порядок нормой. По её формулировке, государственный фильтр на доступ «держит лучшие инструменты вдали» от пользователей, разработчиков и тех, кто занимается защитой систем. Шаг называют вынужденным и краткосрочным - пока вместе с Администрацией разрабатывается рамка кибер-указа (cyber Executive Order) и повторяемая процедура для будущих релизов.
Ситуация редкая: компания публично выпускает продукт через процесс, который сама же критикует.
Кибербезопасность: сильнее, но без перехода критического порога
Главная причина осторожности - именно кибервозможности. GPT-5.6 Sol в OpenAI называют самой сильной своей моделью для задач безопасности, то есть для поиска и эксплуатации уязвимостей на длинной дистанции. На бенчмарке ExploitBench, по данным компании, Sol не уступает конкурентной модели Mythos Preview, тратя при этом примерно треть выходных токенов.
При всём этом Sol, по собственной оценке OpenAI, не переходит порог «Cyber Critical» из её Preparedness Framework - внутренней методики оценки рисков. В тестах на браузерных движках Chromium и Firefox модель находила баги и заготовки для эксплойтов, но не собирала рабочую цепочку атаки целиком в заданных условиях. Тут компания делает важную оговорку:
Sol пока лучше помогает находить и закрывать дыры, чем проводить атаку от начала до конца. Полезнее она защитникам, а не нападающим.
Семь слоёв защиты и 700 тысяч GPU-часов на взлом самих себя
Вокруг моделей выстроена многослойная защита:
- отказ вшит в саму модель - она обучена не помогать с запрещёнными запросами, даже когда намерение маскируют;
- классификаторы в реальном времени - отдельно ловят кибер- и биоугрозы прямо по ходу генерации;
- проверка на уровне аккаунта - система смотрит не на один диалог, а на поведение в целом;
- дифференцированный доступ и мониторинг - самые чувствительные возможности не раздаются всем по умолчанию.
Если классификатор замечает подозрительный вывод, генерацию могут поставить на паузу: более крупная модель перечитывает диалог и решает, выдавать ответ или придержать.
Чтобы защита держала не только известные атаки, OpenAI пустила на автоматический «ред-тиминг» (поиск уязвимостей силами своих же моделей) больше 700 тысяч GPU-часов в пересчёте на чипы A100. Цель - универсальные джейлбрейки, приёмы, которые ломают модель разом во многих контекстах, а не в одном узком сценарии. Параллельно модель атаковали приглашённые живые эксперты.
Побочный эффект честно прописан:
в превью защита будет иногда срабатывать и на легитимных задачах вроде ревью кода или анализа уязвимостей.
OpenAI заранее предупреждает о ложных блокировках и замедлениях и просит присылать фидбэк.
max, ultra и остальные цифры
Вместе с GPT-5.6 завезли два новых режима. Первый, max, даёт Sol максимум времени «на размышление». Второй, ultra, подключает субагентов, которые ускоряют сложную работу, выходя за рамки одного агента.
По бенчмаркам компания показала прирост в трёх областях: код (новый рекорд на Terminal-Bench 2.1), биология (на GeneBench v1 результат выше GPT-5.5 при меньшем расходе токенов) и та же кибербезопасность.
В июле Sol обещают запустить на чипах Cerebras со скоростью до 750 токенов в секунду - пока тоже для избранных клиентов.
Проверочная точка - «ближайшие недели»
Общий доступ к Sol, Terra и Luna OpenAI обещает «в ближайшие недели». Это и есть главная точка проверки. Если превью затянется, станет ясно, что согласование с государством на практике тормозит выпуск сильнее, чем признаёт компания. Отдельный вопрос на перспективу - останется ли правительственный фильтр разовым исключением или превратится в стандартную процедуру для каждой пограничной модели. От ответа зависит, как быстро мощные ИИ-инструменты будут доходить до обычных разработчиков.