Пока все обсуждают, кто круче — Claude Code или Codex от OpenAI — Alibaba тихо выкатила своего агента, который бьёт обоих по цене и по некоторым тестам не уступает. Называется Qwen Code, и если ты платишь за Claude Code или Cursor, тебе стоит дочитать до конца.
Что вообще такое Qwen Code
Это не просто модель с автодополнением кода. Qwen Code — полноценный ИИ-агент для терминала, примерно как Claude Code: читает весь репозиторий, сам запускает команды, правит файлы, гоняет тесты, чинит ошибки и коммитит результат.
В апреле 2026 года вышел Qwen 3.6 Plus — флагманская версия, с которой собственно и началась вся история. На её основе работает и CLI-агент Qwen Code, и плагины для VS Code и JetBrains.
Технически под капотом — гибрид двух подходов к обработке длинных текстов и архитектура «смесь экспертов»: модель огромная по параметрам, но на каждый запрос активирует лишь небольшую их часть. Из-за этого она работает быстрее, чем должна была бы при своём размере. Но это детали — важнее то, что она умеет на практике.
Как Qwen сравнивается с Claude Code и Codex
Есть стандартные тесты, по которым индустрия меряется силой. Главный называется SWE-bench — агент получает реальный баг из GitHub-репозитория и должен его починить: найти причину, написать исправление, пройти тесты. Это максимально близко к тому, что делаешь ты каждый день.
На базовой версии теста расклад такой: GPT-5.3 Codex — 85%, Claude 4.6 Opus — 80.8%, Qwen 3.6 Plus — 78.8%. Qwen третий, отставание небольшое.
Но есть усложнённая версия — SWE-bench Pro, где нужна глубокая интеграция с инструментами, параллельная работа с файлами и серьёзное планирование. Вот тут уже интереснее: Qwen 3.6 Plus — 56.6%, GPT-5.2 Codex — 56.4%, Claude 4.6 Opus — 52.9%.
Qwen первый. Буквально.
Ещё есть Terminal-Bench — тест на реальную работу в терминале: процессы, файловая система, сборочные скрипты. Здесь Qwen тоже обогнал Claude. Что логично — агент изначально заточен под терминальную работу и дообучался на реальных DevOps-сценариях.
Если совсем коротко: Qwen чуть хуже в «классическом» смысле, но агрессивнее и настойчивее на сложных задачах. Claude Code — более отточен и стабилен. Пользователи описывают Qwen как «модель с высоким потолком, но иногда нестабильную». Это честная характеристика.
Про деньги — и вот тут начинается интересное
Claude Code через API на базе Opus стоит $15 за миллион входящих токенов и $75 за миллион исходящих. Qwen 3.6 Plus — $0.40 и $1.20 соответственно.
Чтобы это не осталось абстракцией: возьмём реальный рабочий месяц — 50 миллионов входящих токенов и 10 миллионов исходящих. Это нормальная нагрузка, если агент активно работает с большим репозиторием.
На Claude Opus такой месяц обойдётся в $1 500. На GPT-5.2 Codex — в $227. На Qwen 3.6 Plus — в $32.
Тридцать два доллара.
Это не опечатка. Разница с Claude Opus — в 47 раз. С Codex — в 7 раз.
Cursor, кстати, в этом разговоре стоит отдельно: это IDE, которая берёт те же модели под капотом (Claude, GPT) и продаёт тебе удобный интерфейс за $20–40 в месяц. Если ты платишь за Cursor Pro и активно его используешь — ты платишь за удобство плюс накрутку сверху. Qwen Code CLI не такой красивый, но работает в терминале бесплатно или за копейки.
Бесплатного тира больше нет
Когда Qwen Code только вышел, можно было авторизоваться через аккаунт qwen.ai и получить 1 000 бесплатных запросов в день. Потом стало 100. А 15 апреля бесплатный OAuth-тир закрыли полностью — Alibaba решила, что промо-период закончился.
Теперь вариантов два.
Первый — зарегистрироваться на Alibaba Cloud International в сингапурском регионе. Там по-прежнему дают разовую квоту в миллион токенов на каждую модель на 90 дней. Это уже серьёзная возможность протестировать в реальном проекте, а не просто пощупать — и всё ещё бесплатно.
Второй — подключиться через OpenRouter или Fireworks AI. Qwen 3.6 Plus там доступен, и при любом раскладе это будет на порядок дешевле, чем Claude Opus.
Чем Qwen реально отличается от Claude Code — не по цифрам, а по логике
У Claude Code и Qwen Code разная философия параллельной работы.
Claude Code, когда задача сложная, уходит вглубь: запускает субагентов, которые детально прорабатывают одну задачу. Это хорошо для глубокого рефакторинга или архитектурных решений.
Qwen Code идёт вширь: можно запустить два независимых экземпляра агента в разных окнах терминала — один работает с бэкендом, второй параллельно пилит фронтенд. Каждый держит свой контекст и не мешает другому. Для больших проектов с чёткими границами между частями кода — это реально удобно.
Ещё одна штука, которую сложно переоценить при агентной работе: Qwen умеет сохранять цепочку рассуждений через длинные сессии. Когда агент делает 15–20 шагов — читает файлы, запускает тесты, правит код — он часто «забывает», почему на третьем шаге принял какое-то решение. Qwen 3.6 Plus умеет держать эту историю в памяти и на восьмом шаге может вернуться к выводам первого. Звучит как мелочь, но на практике именно это отличает агента, который доводит задачу до конца, от агента, который запутывается и начинает ходить по кругу.
Контекстное окно у Qwen — миллион токенов. У Claude Opus — 200 тысяч, у GPT-5.2 Codex — 400 тысяч. Если репозиторий большой, это уже не абстрактное преимущество.
И последнее: Qwen крайне редко оставляет заглушки в коде — те самые // остальная логика здесь, которыми грешат модели OpenAI. Это мелкая, но раздражающая привычка, которой у Qwen практически нет.
Где Qwen проигрывает — честно
Стабильность. Claude Code — более предсказуемый и отполированный продукт. Если ты работаешь в команде или на продакшн-проекте с жёсткими требованиями, случайная нестабильность Qwen может стоить дороже, чем разница в цене.
Экосистема. Claude Code глубоко интегрирован с Anthropic — MCP, субагенты, постоянные обновления. Qwen — открытый и гибкий, но менее «вылизанный» в деталях.
Работа в Windows. Пользователи отмечают, что GPT-5.2 Codex лучше справляется в Windows-среде. Qwen заточен под Unix-окружение.
И да — это всё-таки продукт Alibaba. Для кода с конфиденциальными данными часть моделей можно запускать локально (открытые веса есть), но флагманский Qwen 3.6 Plus работает через облако. Этот вопрос каждый решает для себя.
Кому реально стоит попробовать
Если ты платишь за Cursor или используешь Claude Code через API и тебя начинает беспокоить счёт — Qwen Code стоит поставить и потратить день на тесты. Бесплатная квота позволяет это сделать без риска.
Если ты работаешь с большими репозиториями и постоянно упираешься в ограничения контекста — миллион токенов это аргумент сам по себе.
Если Claude Code или Codex работают у тебя идеально и ты не думаешь о цене — менять ничего не нужно. Qwen чуть уступает по стабильности, и это реально ощутимо в ежедневной работе.
Ситуация сейчас примерно такая: на рынке агентов идёт настоящая ценовая война. Claude Code полирует качество, OpenAI давит производительностью флагмана, а Alibaba режет цену до такого уровня, что конкурировать стандартными методами уже сложно. В этой войне ты — единственный, кто точно выигрывает.
Вопрос только в том, сколько тебе нужно стабильности и насколько ты готов мириться с шероховатостями ради 47-кратной разницы в цене — или это звучит как очевидный выбор?
Занимаюсь внедрением ИИ для бизнеса. Детали — в телеграме.