442 подписчика

Новости ИИ: Анонс GPT‑5.6 - Sol, Terra и Luna

26 июня26 июн

2 мин

Если судить только по официальному посту OpenAI, это выглядит не как обычный “ещё +7% к умности, хлопайте, кожаные”, а как попытка перестроить линейку вокруг агентности, цены и контроля рисков. GPT-5.6 теперь делится на Sol, Terra и Luna: Sol как флагман, Terra как сбалансированная модель, Luna как быстрая и дешёвая. OpenAI пишет, что Terra примерно конкурентна GPT-5.5, но в 2 раза дешевле, а Luna даёт “strong capability” по самой низкой цене в линейке. Самое интересное тут не “модель умнее”, а режимы max и ultra. Max даёт больше времени на глубокое рассуждение, а ultra использует субагентов для сложной работы. Вот это уже похоже на реальный сдвиг: не один чат-бот, который героически притворяется целым отделом, а модельная система, которая распараллеливает работу. OpenAI прямо выделяет улучшения в coding, biology и cybersecurity. Для кода они заявляют новый state of the art на Terminal-Bench 2.1, то есть на задачах с командной строкой, планированием, итерациями и координацией инструмен

Оглавление

Главное
1. Новая линейка стала понятнее
2. Sol явно двигают в сторону сложных агентных задач

Если судить только по официальному посту OpenAI, это выглядит не как обычный “ещё +7% к умности, хлопайте, кожаные”, а как попытка перестроить линейку вокруг агентности, цены и контроля рисков.

Главное

1. Новая линейка стала понятнее

GPT-5.6 теперь делится на Sol, Terra и Luna: Sol как флагман, Terra как сбалансированная модель, Luna как быстрая и дешёвая. OpenAI пишет, что Terra примерно конкурентна GPT-5.5, но в 2 раза дешевле, а Luna даёт “strong capability” по самой низкой цене в линейке.

2. Sol явно двигают в сторону сложных агентных задач

Самое интересное тут не “модель умнее”, а режимы max и ultra. Max даёт больше времени на глубокое рассуждение, а ultra использует субагентов для сложной работы. Вот это уже похоже на реальный сдвиг: не один чат-бот, который героически притворяется целым отделом, а модельная система, которая распараллеливает работу.

3. Самые важные применения: код, биология, кибербезопасность

OpenAI прямо выделяет улучшения в coding, biology и cybersecurity. Для кода они заявляют новый state of the art на Terminal-Bench 2.1, то есть на задачах с командной строкой, планированием, итерациями и координацией инструментов. Это ближе к реальной работе разработчика, чем очередной стерильный тест, где модель решает задачку в вакууме и все делают вид, что это продакшн.

4. Киберчасть одновременно впечатляет и нервирует

OpenAI говорит, что Sol стал их самой сильной моделью для cybersecurity, включая vulnerability research и exploitation-задачи, но при этом подчёркивает, что модель лучше помогает находить и чинить уязвимости, чем стабильно проводить полноценные end-to-end атаки. Они также пишут, что Sol не пересёк Cyber Critical threshold по их Preparedness Framework, но признают, что бенчмарки не покрывают все реальные способы использования. Это разумная оговорка, редкий случай, когда маркетинг хотя бы делает вид, что помнит о реальности.

5. Ограниченный preview через “trusted partners” выглядит политически значимо

OpenAI пишет, что стартует с ограниченного preview для небольшой группы доверенных партнёров, чьё участие было передано правительству США, и что такой процесс не должен стать долгосрочной нормой. Это важный сигнал: frontier-модели всё сильнее становятся не просто продуктами, а объектами регулирования, особенно из-за киберрисков.

6. Цены выглядят агрессивно, но не революционно

Заявленные цены за 1 млн токенов:

Sol $5 input / $30 output
Terra $2.50 / $15
Luna $1 / $6

Ещё интереснее кэширование: cache writes стоят 1.25x от обычного input, а cache reads сохраняют 90% скидку. Для длинных агентных workflows это может быть важнее, чем кажется, потому что стоимость контекста быстро превращается в маленький финансовый пожар.

В итоге

Sol выглядит как модель не для “поговорить умнее”, а для тяжёлой работы: код, ресёрч, аудит, многошаговые задачи, автономные пайплайны. Если ultra с субагентами реально работает стабильно, это может быть важнее, чем обычный прирост на бенчмарках.

Но я бы не покупался на всё сразу. Пока это preview и в основном self-reported оценки OpenAI. Настоящая проверка будет в трёх вещах:

насколько Sol держит длинные проекты без деградации
насколько ultra не превращается в “много агентов, много шума, один счёт за токены”
насколько safeguards не будут душить легитимную работу по безопасности и коду

В сухом остатке: это выглядит как сильный релиз, но важен не Sol сам по себе, а сдвиг к модели как к системе агентов. Именно там, похоже, будет следующая большая битва: не “кто умнее отвечает”, а “кто надёжнее делает работу”.

Гаджеты и электроника

5,73 млн интересуются