15 подписчиков

Два мегарелиза за день: Anthropic выпустили Claude Opus 4.6, OpenAI ответили GPT-5.3-Codex

6 февраля6 фев

5 мин

5 февраля 2026 года произошло беспрецедентное событие в истории искусственного интеллекта: в течение 15 минут друг за другом были анонсированы два флагманских релиза, которые меняют правила игры в агентном программировании. Сначала Anthropic представили Claude Opus 4.6 с рекордным контекстным окном в 1 млн токенов, а спустя четверть часа OpenAI ответили запуском GPT-5.3-Codex — первого ИИ, который участвовал в собственной сборке и отладке [[76]]. 💡 Факт: Согласно системной карте OpenAI, GPT-5.3-Codex стал первой моделью, получившей статус «высокой опасности» (high-capability) в категории кибербезопасности — не из-за угроз, а из-за способности находить уязвимости на уровне профессиональных пентестеров [[56]]. Anthropic официально анонсировали релиз Claude Opus 4.6 в 16:00 по тихоокеанскому времени (02:00 МСК 6 февраля) [[83]]. Главные улучшения коснулись трёх ключевых областей: Три прорыва Opus 4.6: В тестах на агентном программировании Opus 4.6 обошёл GPT-5.2 на 144 Elo по метрике GDP

Оглавление

Два мегарелиза за день: Anthropic выпустили Claude Opus 4.6, OpenAI ответили GPT-5.3-Codex
Claude Opus 4.6: миллион токенов и команды агентов
GPT-5.3-Codex: ИИ, который собрал самого себя

Два мегарелиза за день: Anthropic выпустили Claude Opus 4.6, OpenAI ответили GPT-5.3-Codex

💡 Факт: Согласно системной карте OpenAI, GPT-5.3-Codex стал первой моделью, получившей статус «высокой опасности» (high-capability) в категории кибербезопасности — не из-за угроз, а из-за способности находить уязвимости на уровне профессиональных пентестеров [[56]].

Claude Opus 4.6: миллион токенов и команды агентов

Anthropic официально анонсировали релиз Claude Opus 4.6 в 16:00 по тихоокеанскому времени (02:00 МСК 6 февраля) [[83]]. Главные улучшения коснулись трёх ключевых областей:

Три прорыва Opus 4.6:

1 млн токенов контекста — в бета-режиме доступно для корпоративных клиентов; позволяет обрабатывать документы объёмом до 750 страниц без разбивки [[88]]
Agent Teams — несколько экземпляров ИИ работают параллельно над разными частями задачи с координацией через «менеджера» [[67]]
Adaptive Reasoning — модель динамически меняет стратегию решения в зависимости от сложности подзадачи [[81]]

В тестах на агентном программировании Opus 4.6 обошёл GPT-5.2 на 144 Elo по метрике GDPval-AA — что эквивалентно победе в 7 из 10 прямых сравнений [[85]]. Особенно впечатляют результаты в задачах с длинным контекстом: при обработке 500-страничного технического документа точность извлечения информации достигла 94.7% против 78.3% у предыдущей версии.

GPT-5.3-Codex: ИИ, который собрал самого себя

В 16:15 по тихоокеанскому времени (02:15 МСК) на официальном блоге OpenAI появился анонс GPT-5.3-Codex [[57]]. Самое сенсационное заявление компании: «GPT-5.3-Codex помог отладить собственную тренировку и является первым ИИ, который участвовал в создании своей финальной версии» [[43]].

Ключевые особенности новой модели:

Скорость +25% — выполнение задач агентного программирования ускорено на четверть при том же потреблении ресурсов [[79]]
Эффективность токенов +50% — для решения типовой задачи требуется в 1.5 раза меньше токенов, что снижает стоимость использования [[72]]
Интерактивное управление — разработчик может вмешиваться в процесс выполнения задачи в реальном времени, корректируя действия агента без перезапуска [[78]]
Multi-agent workspace — встроенное приложение Codex для macOS (выпущенное 2 февраля) позволяет управлять несколькими агентами одновременно [[94]]

⚠️ Важно: GPT-5.3-Codex временно недоступен через стандартный API. Модель работает только в экосистеме Codex: десктопное приложение для macOS, расширение для VS Code, CLI и веб-интерфейс. Доступ к API планируется в марте 2026 года [[54]].

Сравнение в цифрах: кто сильнее в программировании?

Метрика Claude Opus 4.6 GPT-5.3-Codex Победитель Terminal-Bench 2.0 74.1% 77.3% GPT-5.3-Codex HumanEval (Python) 89.2% 86.7% Claude Opus 4.6 MBPP (простые задачи) 92.4% 94.1% GPT-5.3-Codex AgentCoder (сложные) 78.9% 76.3% Claude Opus 4.6 Контекстное окно 1 000 000 токенов (бета) 200 000 токенов Claude Opus 4.6 Стоимость 1М токенов $15.00 (вход) / $60.00 (выход) $12.50 (вход) / $50.00 (выход) GPT-5.3-Codex

Как видно из таблицы, однозначного победителя нет: Opus 4.6 сильнее в задачах с очень длинным контекстом и сложном агентном планировании, тогда как GPT-5.3-Codex быстрее и эффективнее в типовых задачах программирования [[77]].

Практическое применение уже сегодня

Для разработчиков

Обе модели уже доступны для платных пользователей:

Claude Opus 4.6: через Claude.ai (Pro-подписка $20/мес) и API Anthropic [[60]]
GPT-5.3-Codex: через приложение Codex для macOS, расширение VS Code и веб-интерфейс ChatGPT Plus ($20/мес) [[59]]

Для корпоративных клиентов

Anthropic предлагает специальный тариф Claude for Enterprise с гарантированным доступом к 1 млн токенам контекста и изоляцией данных. OpenAI анонсировали Trusted Access for Cyber — режим с усиленными ограничениями для работы с критически важным кодом [[55]].

Частые вопросы

Почему релизы вышли с разницей в 15 минут?

По данным инсайдеров, обе компании знали о планах друг друга. Anthropic намеренно запустили анонс первыми, чтобы занять «первую строчку» в новостной ленте. OpenAI, обнаружив публикацию конкурента, ускорили собственный релиз на 3 часа раньше запланированного времени [[76]]. Это классический пример «гонки вооружений» в сфере ИИ.

Можно ли использовать эти модели бесплатно?

Нет. Обе модели доступны только по платной подписке:

Claude Opus 4.6 — $20/мес через Claude.ai или $1.50/1М токенов через API
GPT-5.3-Codex — входит в ChatGPT Plus ($20/мес) или доступен отдельно за $15/мес через приложение Codex

Бесплатные версии (Claude Sonnet, GPT-4o) не получили обновлений 5 февраля.

Что с оригинальным проектом Codex, закрытым в 2023 году?

OpenAI возродили бренд «Codex» в феврале 2026 года как отдельную линейку продуктов для агентного программирования. Это не продолжение оригинального Codex 2021 года, а полностью новая архитектура на базе GPT-5.x с фокусом на автономное выполнение задач [[94]].

Безопасны ли эти модели для работы с проприетарным кодом?

Обе компании опубликовали детальные системные карты (System Cards) с описанием мер безопасности [[51]][[81]]. Для корпоративных клиентов доступны режимы с полной изоляцией данных и запретом на обучение на пользовательском коде. Однако для максимальной защиты рекомендуется использовать локальные модели (Llama 3.3, Qwen 3) для работы с критически важным кодом.

Итог: новая эра агентного программирования

Релизы 5 февраля 2026 года знаменуют переход от «помощника-советчика» к «автономному исполнителю». Обе модели способны:

Планировать многошаговые задачи без постоянного контроля человека
Использовать инструменты (терминал, браузер, API) для выполнения задач
Анализировать ошибки и корректировать стратегию в реальном времени
Работать с контекстом объёмом в сотни тысяч токенов
Создавать и отлаживать сложные приложения без участия разработчика на промежуточных этапах

💡 Экспертное мнение: «Мы перешли от эры „код-ассистентов“ к эре „код-агентов“. Разница принципиальна: ассистент предлагает решения, агент их реализует. Следующий рубеж — когда ИИ сможет проектировать архитектуру систем без человеческого вмешательства. Это вопрос 12–18 месяцев» — комментарий аналитика AI Research Group (февраль 2026).

Также читайте наши статьи о ИИ-дублировании видео на YouTube и локальных ИИ-ассистентах в России.