Первая модель, специально разработанная для риал тайм кодинга, результат партнерства с Cerebras, о котором объявляли в январе Генерирует более 1000 токенов в секунду, практически мгновенный отклик Получилось это благодаря спец оборудованию Cerebras Wafer Scale Engine 3 от новых партнеров, это такой ускоритель, созданный именно для сверхбыстрого инференса Производительность: - Контекстное окно 128K токенов - Оптимизация под интерактивную работу - Возможность прерывать и перенаправлять модель на ходу - Минимальные, точечные правки кода по умолчанию Показал сильные результаты на SWE-Bench Pro и Terminal-Bench 2.0, сильно обогнал обычный кодекс 5.3 Улучшили инфраструктуру Опен Аи провели масштабную оптимизацию всего пайплайна: ⬇️80% снижение накладных расходов на roundtrip клиент-сервер ⬇️30% снижение накладных расходов на токен ⬇️50% сокращение времени до первого токена - Постоянное WebSocket-соединение для всех моделей Пока доступен для Pro подписчиков в приложении кодекса, кли и в