426 подписчиков

GPT-5.3-Codex-Spark

12 февраля12 фев

~1 мин

Первая модель, специально разработанная для риал тайм кодинга, результат партнерства с Cerebras, о котором объявляли в январе Генерирует более 1000 токенов в секунду, практически мгновенный отклик Получилось это благодаря спец оборудованию Cerebras Wafer Scale Engine 3 от новых партнеров, это такой ускоритель, созданный именно для сверхбыстрого инференса Производительность: - Контекстное окно 128K токенов - Оптимизация под интерактивную работу - Возможность прерывать и перенаправлять модель на ходу - Минимальные, точечные правки кода по умолчанию Показал сильные результаты на SWE-Bench Pro и Terminal-Bench 2.0, сильно обогнал обычный кодекс 5.3 Улучшили инфраструктуру Опен Аи провели масштабную оптимизацию всего пайплайна: ⬇️80% снижение накладных расходов на roundtrip клиент-сервер ⬇️30% снижение накладных расходов на токен ⬇️50% сокращение времени до первого токена - Постоянное WebSocket-соединение для всех моделей Пока доступен для Pro подписчиков в приложении кодекса, кли и в

GPT-5.3-Codex-Spark

Первая модель, специально разработанная для риал тайм кодинга, результат партнерства с Cerebras, о котором объявляли в январе

Генерирует более 1000 токенов в секунду, практически мгновенный отклик

Получилось это благодаря спец оборудованию Cerebras Wafer Scale Engine 3 от новых партнеров, это такой ускоритель, созданный именно для сверхбыстрого инференса

Производительность:

- Контекстное окно 128K токенов

- Оптимизация под интерактивную работу

- Возможность прерывать и перенаправлять модель на ходу

- Минимальные, точечные правки кода по умолчанию

Показал сильные результаты на SWE-Bench Pro и Terminal-Bench 2.0, сильно обогнал обычный кодекс 5.3

Улучшили инфраструктуру

Опен Аи провели масштабную оптимизацию всего пайплайна:

⬇️80% снижение накладных расходов на roundtrip клиент-сервер

⬇️30% снижение накладных расходов на токен

⬇️50% сокращение времени до первого токена

- Постоянное WebSocket-соединение для всех моделей

Пока доступен для Pro подписчиков в приложении кодекса, кли и в расширении vs code

В ближайшие недели доступ будет расширяться по мере оптимизации инфраструктуры

https://openai.com/index/introducing-gpt-5-3-codex-spark/