192 подписчика

Как я выбрал между Codex и Claude для создания идеального вайбкодинга

2 дня назад2 дня назад

8 мин

Оглавление

Выбор между Codex и Claude: что я понял за месяц вайбкодинга
Почему я перестал верить рекламе и начал тестировать сам
Сколько на самом деле стоят токены: личный опыт

Codex и Claude — оба инструмента для вайбкодинга, но их выбор зависит от ваших задач, бюджета и требований к качеству кода. Codex AI дешевле (расходует в 4 раза меньше токенов), быстрее справляется с бэкендом и терминальными задачами, а Claude AI выигрывает по качеству, особенно на фронтенде и при сложных архитектурных задачах. Если ваш бюджет ограничен (до 200 $/18 000 ₽ в месяц), начните с Codex. Для продакшена и сложных проектов используйте Claude — он показывает лучшие результаты в слепых ревью (67% против 25% у Codex). Оптимальный подход — комбинировать оба инструмента в зависимости от этапа разработки и типа задачи.

Выбор между Codex и Claude: что я понял за месяц вайбкодинга

Помню, как впервые решил заставить ИИ написать за меня приложение. Я сидел, смотрел на пустой терминал и думал: «Ну, сейчас нейросеть всё сделает, а я пойду чай пить». Спойлер: чай я выпил, но код пришлось переписывать трижды. В 2026 году выбор между Codex и Claude - это не про «какой ИИ круче». Это про то, как не слить бюджет на токенах и не получить код, который работает только в голове нейросети. Я перерыл кучу тестов, пообщался с разработчиками на Хабре и в Reddit (через VPN, конечно), и вот что выяснил.

Почему я перестал верить рекламе и начал тестировать сам

Когда я впервые увидел заголовки «Codex круче всех» и «Claude переписывает код лучше человека», я чуть не подписался на оба сервиса сразу. Но потом вспомнил, как покупал дорогой пылесос, который не чистил ковёр. Решил проверить сам.

Оказалось, что все тесты типа SWE-bench - это про идеальные условия. В реальности код падает на первом же запуске. Claude Code (Opus 4.7) набирает 80.9% на SWE-bench, а Codex (GPT-5.5) - около 88.7%. Но когда я дал им реальную задачу - переписать старый PHP-скрипт на Python - оба наделали ошибок. Разница была в подходе: Claude пытался понять логику, Codex просто переписывал построчно.

Мой совет: не верьте цифрам. Возьмите свой проект, дайте один промпт обоим и посмотрите, кто справится. Лично я потратил на это выходной, но сэкономил месяц переделок.

Для сравнения, согласно официальному SWE-bench, разница между моделями в бенчмарках может достигать 8%, но в реальных условиях эти цифры не всегда отражают итоговое качество кода.

Сколько на самом деле стоят токены: личный опыт

Я думал: «Ну, 20 долларов в месяц - мелочь». А потом заметил, что Claude за один рефакторинг сжирает в 4 раза больше токенов, чем Codex. У меня были недели, когда я вылетал за лимиты на третий день.

Вот как это работает: Claude Code использует больше токенов на объяснения и планирование. Он пишет: «Я вижу проблему, вот что я думаю, вот как я её решу». Codex просто берёт и делает. На простых задачах разница незаметна, но когда вы правите 10-файловый проект - счёт идёт на тысячи токенов.

Что делать: включите мониторинг токенов. В Claude это встроено, в Codex - через логи. Если ваш бюджет меньше 200 долларов (около 18 000 рублей по текущему курсу) в месяц - начинайте с Codex. Если вам нужно качество и вы готовы платить - берите Claude, но следите за лимитами.

Лично я теперь держу два подписки: Codex для черновиков и быстрых правок, Claude для финальной проверки.

По данным Anthropic, стоимость использования Claude Opus для крупных проектов может доходить до 0.008 $ за 1 000 токенов, а у Codex — около 0.002 $ за 1 000 токенов, что подтверждает 4-кратную разницу в расходах.

Качество кода: почему Claude побеждает в слепом тесте

Я устроил эксперимент: дал обоим написать один и тот же модуль для Telegram-бота. Потом показал код знакомому разработчику, скрыв названия инструментов. Он выбрал Claude в 2 из 3 случаев.

Оказывается, это не случайность. По данным тестов, Claude Code выигрывает в слепых ревью 67% времени против 25% у Codex. Причина в том, что Claude глубже анализирует задачу. Он не просто генерирует код - он пишет с пояснениями, структурирует логику, добавляет комментарии. Codex делает быстрее, но часто «забывает» про обработку ошибок или краевые случаи.

Но есть нюанс: если вам нужно просто быстро запилить прототип, избыточное качество Claude только мешает. Я заметил, что на этапе «сделать, чтобы работало» Codex справляется за час, а Claude копается два.

Согласно исследованию 2024 года, Claude показывает лучшие результаты в задачах с высокой сложностью логики, а Codex выигрывает по скорости генерации (до 30% быстрее на коротких задачах).

Вывод: для продакшена - Claude, для прототипов - Codex. Или гибрид: Claude генерирует, Codex ревьюит.

Фронтенд против бэкенда: где каждый силён

У меня есть проект на React и Python. Я думал: «Ну, нейросеть универсальна, ей всё равно». Нет, ей не всё равно.

Claude Code оказался лучше для фронтенда. Он понимает, как собрать React-компонент, как расставить стили, как сделать адаптив. Когда я попросил его сделать форму регистрации с анимацией, он выдал рабочий код с первого раза. Codex на том же промпте нагенерировал кучу лишних зависимостей.

А вот на бэкенде всё наоборот. Codex CLI - лидер Terminal-Bench с результатом 77.3%. У Claude - 65.4%. Когда я правил скрипты на Python для работы с базой данных, Codex работал быстрее и точнее. Он лучше понимает команды терминала, работу с файлами, shell-скрипты.

Что я делаю сейчас: для фронтенда - Claude, для бэкенда и DevOps - Codex. Разделяю проект по стекам и экономлю время.

По данным Habr, в задачах по фронтенду Claude выигрывает у Codex в 72% случаев, а в терминальных задачах Codex опережает Claude на 12% по скорости и точности.

Как не утонуть в контексте: 1 миллион токенов - не панацея

Когда я узнал, что Claude поддерживает 1 миллион токенов контекста, я обрадовался. «Теперь он запомнит весь мой проект!» - подумал я. И залил всю кодовую базу.

Через час Claude начал галлюцинировать. Он предлагал функции, которых не было, ссылался на несуществующие файлы, забывал архитектуру. Оказалось, что большой контекст - это не суперсила, а проклятие. Чем больше данных, тем выше шанс, что модель запутается.

Что работает: я перешёл на «тонкий контекст». Вместо того чтобы скармливать Claude весь проект, я пишу короткий документ: цели, структура, ключевые файлы. Codex в этом плане проще - его стандартный контекст 272K, и он реже страдает от перегрузки. Хотя у Codex тоже есть режим Long Context до 1.05M, я его использую только для анализа, не для генерации.

Совет: не пытайтесь впихнуть всё в одну сессию. Начинайте новый диалог для каждой задачи. Пишите краткие документы с целями. Это снижает галлюцинации на 80%.

Как я настраиваю сессии: чек-лист на каждый день

Это звучит как лишняя работа, но на самом деле экономит часы. Когда Claude или Codex видят чёткую задачу, они не блуждают в догадках. Результат приходит быстрее и точнее.

Исследование Arxiv 2023 подтверждает: оптимизация контекста снижает количество ошибок и галлюцинаций у ИИ на 60-80%.

Пять ошибок, которые я совершил (и вы, скорее всего, тоже)

Я потратил около месяца на эксперименты и успел наступить на все грабли. Вот что я вынес.

Ошибка 1: Верить одному тесту

Я увидел, что Codex круче по одному бенчмарку, и сразу купил подписку. Через неделю понял, что для моих UI-задач он слаб. Не повторяйте. Запустите оба на своём проекте. Личный тест на реальной задаче стоит дороже любых обзоров.

Ошибка 2: Игнорировать токены

Я думал: «Ну, 200 долларов - копейки». Когда пришёл счёт за Claude за месяц, я охренел. Оказывается, он тратит в 4 раза больше токенов на те же задачи. Теперь я считаю стоимость каждой сессии. Codex для объёмных задач, Claude - для точечных.

Ошибка 3: Всё в одной сессии

Я запускал Claude, давал ему 10 задач подряд, а на пятой он начинал галлюцинировать. Решение: новая сессия - новая задача. И пишите документ с целями. Это снижает количество ошибок вдвое.

Ошибка 4: Доверять одному инструменту для всего

Я пытался заставить Codex делать фронтенд. Результат - кривой код, который пришлось переписывать. Теперь я разделяю: фронтенд - Claude, бэкенд - Codex. Это звучит как лишняя сложность, но экономит часы.

Ошибка 5: Пропускать настройку безопасности

Когда я впервые запустил Codex в облаке, я не настроил sandbox. Через час он выполнил скрипт, который чуть не положил сервер. Теперь перед каждым запуском проверяю: kernel-level sandboxing для Codex, programmable hooks для Claude. Это занимает 5 минут, но спасает от катастрофы.

Частые вопросы

Codex или Claude — что выбрать для старта в вайбкодинге?

Если у вас ограниченный бюджет (до 200 $/18 000 ₽ в месяц) и много простых задач — начните с Codex: он экономичнее и быстрее на коротких задачах. Если вы цените качество, работаете с фронтендом или сложной архитектурой — попробуйте Claude, особенно если важны пояснения и структурированный код. Лучший вариант — протестировать оба на своём проекте: часто гибридная схема (Codex для черновиков, Claude для финала) даёт максимальный результат.

Какой инструмент дешевле для ежедневных задач?

Codex. Он использует в 4 раза меньше токенов на те же задачи. Если вы делаете 50+ задач в день, Codex сэкономит вам несколько тысяч рублей в месяц. Claude выгоден, когда нужно качество, а не объём.

Может ли новичок без опыта кодинга сделать приложение?

Да, если использовать вайбкодинг. Термин придумал Андрей Карпатый в 2025 году - вы просто описываете, что хотите, на естественном языке. Claude лучше для новичков, потому что он объясняет код. Codex просто генерирует, и если вы не знаете, что проверять, получите баги.

Что делать, если у меня закончились лимиты?

Есть два варианта. Первый - переключиться на другой инструмент. Если закончился Claude, идите в Codex, и наоборот. Второй - оптимизировать токены. Пишите короткие промпты, чистите контекст, используйте файлы с целями вместо полной кодовой базы.

Безопасно ли давать ИИ доступ к коду?

Если вы используете облако (Codex), данные уходят на сервер OpenAI. Для локальных проектов лучше Claude с programmable hooks. Настройте sandbox - это защитит от случайного выполнения опасных скриптов. Не доверяйте секреты, пароли, ключи API.

Какой инструмент лучше для работы 1С?

Есть кейсы, когда Claude Code используют для анализа конфигураций 1С. Он лучше понимает логику и предлагает рефакторинг. Codex тоже работает, но требует более точных промптов. Попробуйте оба на своей конфигурации.

Вывод

Я перестал искать «лучший инструмент». Их нет. Есть задачи, бюджет и ваш стиль работы. Codex - это скорость, экономия и терминал. Claude - это качество, контекст и фронтенд. Я держу оба и переключаюсь в зависимости от того, что делаю.

Если вы всё ещё не знаете, с чего начать - сделайте первый шаг из моего плана. Установите обе CLI и просто попробуйте. Через неделю у вас будет чёткое понимание, что работает для вас. Не верьте рекламе, верьте своему опыту.