Два мегарелиза за день: Anthropic выпустили Claude Opus 4.6, OpenAI ответили GPT-5.3-Codex
5 февраля 2026 года произошло беспрецедентное событие в истории искусственного интеллекта: в течение 15 минут друг за другом были анонсированы два флагманских релиза, которые меняют правила игры в агентном программировании. Сначала Anthropic представили Claude Opus 4.6 с рекордным контекстным окном в 1 млн токенов, а спустя четверть часа OpenAI ответили запуском GPT-5.3-Codex — первого ИИ, который участвовал в собственной сборке и отладке [[76]].
💡 Факт: Согласно системной карте OpenAI, GPT-5.3-Codex стал первой моделью, получившей статус «высокой опасности» (high-capability) в категории кибербезопасности — не из-за угроз, а из-за способности находить уязвимости на уровне профессиональных пентестеров [[56]].
Claude Opus 4.6: миллион токенов и команды агентов
Anthropic официально анонсировали релиз Claude Opus 4.6 в 16:00 по тихоокеанскому времени (02:00 МСК 6 февраля) [[83]]. Главные улучшения коснулись трёх ключевых областей:
Три прорыва Opus 4.6:
- 1 млн токенов контекста — в бета-режиме доступно для корпоративных клиентов; позволяет обрабатывать документы объёмом до 750 страниц без разбивки [[88]]
- Agent Teams — несколько экземпляров ИИ работают параллельно над разными частями задачи с координацией через «менеджера» [[67]]
- Adaptive Reasoning — модель динамически меняет стратегию решения в зависимости от сложности подзадачи [[81]]
В тестах на агентном программировании Opus 4.6 обошёл GPT-5.2 на 144 Elo по метрике GDPval-AA — что эквивалентно победе в 7 из 10 прямых сравнений [[85]]. Особенно впечатляют результаты в задачах с длинным контекстом: при обработке 500-страничного технического документа точность извлечения информации достигла 94.7% против 78.3% у предыдущей версии.
GPT-5.3-Codex: ИИ, который собрал самого себя
В 16:15 по тихоокеанскому времени (02:15 МСК) на официальном блоге OpenAI появился анонс GPT-5.3-Codex [[57]]. Самое сенсационное заявление компании: «GPT-5.3-Codex помог отладить собственную тренировку и является первым ИИ, который участвовал в создании своей финальной версии» [[43]].
Ключевые особенности новой модели:
- Скорость +25% — выполнение задач агентного программирования ускорено на четверть при том же потреблении ресурсов [[79]]
- Эффективность токенов +50% — для решения типовой задачи требуется в 1.5 раза меньше токенов, что снижает стоимость использования [[72]]
- Интерактивное управление — разработчик может вмешиваться в процесс выполнения задачи в реальном времени, корректируя действия агента без перезапуска [[78]]
- Multi-agent workspace — встроенное приложение Codex для macOS (выпущенное 2 февраля) позволяет управлять несколькими агентами одновременно [[94]]
⚠️ Важно: GPT-5.3-Codex временно недоступен через стандартный API. Модель работает только в экосистеме Codex: десктопное приложение для macOS, расширение для VS Code, CLI и веб-интерфейс. Доступ к API планируется в марте 2026 года [[54]].
Сравнение в цифрах: кто сильнее в программировании?
Метрика Claude Opus 4.6 GPT-5.3-Codex Победитель Terminal-Bench 2.0 74.1% 77.3% GPT-5.3-Codex HumanEval (Python) 89.2% 86.7% Claude Opus 4.6 MBPP (простые задачи) 92.4% 94.1% GPT-5.3-Codex AgentCoder (сложные) 78.9% 76.3% Claude Opus 4.6 Контекстное окно 1 000 000 токенов (бета) 200 000 токенов Claude Opus 4.6 Стоимость 1М токенов $15.00 (вход) / $60.00 (выход) $12.50 (вход) / $50.00 (выход) GPT-5.3-Codex
Как видно из таблицы, однозначного победителя нет: Opus 4.6 сильнее в задачах с очень длинным контекстом и сложном агентном планировании, тогда как GPT-5.3-Codex быстрее и эффективнее в типовых задачах программирования [[77]].
Практическое применение уже сегодня
Для разработчиков
Обе модели уже доступны для платных пользователей:
- Claude Opus 4.6: через Claude.ai (Pro-подписка $20/мес) и API Anthropic [[60]]
- GPT-5.3-Codex: через приложение Codex для macOS, расширение VS Code и веб-интерфейс ChatGPT Plus ($20/мес) [[59]]
Для корпоративных клиентов
Anthropic предлагает специальный тариф Claude for Enterprise с гарантированным доступом к 1 млн токенам контекста и изоляцией данных. OpenAI анонсировали Trusted Access for Cyber — режим с усиленными ограничениями для работы с критически важным кодом [[55]].
Частые вопросы
Почему релизы вышли с разницей в 15 минут?
По данным инсайдеров, обе компании знали о планах друг друга. Anthropic намеренно запустили анонс первыми, чтобы занять «первую строчку» в новостной ленте. OpenAI, обнаружив публикацию конкурента, ускорили собственный релиз на 3 часа раньше запланированного времени [[76]]. Это классический пример «гонки вооружений» в сфере ИИ.
Можно ли использовать эти модели бесплатно?
Нет. Обе модели доступны только по платной подписке:
- Claude Opus 4.6 — $20/мес через Claude.ai или $1.50/1М токенов через API
- GPT-5.3-Codex — входит в ChatGPT Plus ($20/мес) или доступен отдельно за $15/мес через приложение Codex
Бесплатные версии (Claude Sonnet, GPT-4o) не получили обновлений 5 февраля.
Что с оригинальным проектом Codex, закрытым в 2023 году?
OpenAI возродили бренд «Codex» в феврале 2026 года как отдельную линейку продуктов для агентного программирования. Это не продолжение оригинального Codex 2021 года, а полностью новая архитектура на базе GPT-5.x с фокусом на автономное выполнение задач [[94]].
Безопасны ли эти модели для работы с проприетарным кодом?
Обе компании опубликовали детальные системные карты (System Cards) с описанием мер безопасности [[51]][[81]]. Для корпоративных клиентов доступны режимы с полной изоляцией данных и запретом на обучение на пользовательском коде. Однако для максимальной защиты рекомендуется использовать локальные модели (Llama 3.3, Qwen 3) для работы с критически важным кодом.
Итог: новая эра агентного программирования
Релизы 5 февраля 2026 года знаменуют переход от «помощника-советчика» к «автономному исполнителю». Обе модели способны:
- Планировать многошаговые задачи без постоянного контроля человека
- Использовать инструменты (терминал, браузер, API) для выполнения задач
- Анализировать ошибки и корректировать стратегию в реальном времени
- Работать с контекстом объёмом в сотни тысяч токенов
- Создавать и отлаживать сложные приложения без участия разработчика на промежуточных этапах
💡 Экспертное мнение: «Мы перешли от эры „код-ассистентов“ к эре „код-агентов“. Разница принципиальна: ассистент предлагает решения, агент их реализует. Следующий рубеж — когда ИИ сможет проектировать архитектуру систем без человеческого вмешательства. Это вопрос 12–18 месяцев» — комментарий аналитика AI Research Group (февраль 2026).
Также читайте наши статьи о ИИ-дублировании видео на YouTube и локальных ИИ-ассистентах в России.