88,4 тыс подписчиков

Новая версия нейросети Qwen обошла Gemini и DeepSeek

27 января27 янв

1 мин

Компания Alibaba представила большую языковую модель Qwen3-Max Thinking. Она примечательна необычным методом «мышления», благодаря которому в тестах производительности уже опередила Gemini и DeepSeek. Главная особенность Qwen3-Max Thinking — отход от стандартных методов логического вывода. Вместо линейной генерации токенов Qwen3 использует «тяжёлый режим» — то есть не просто генерирует множество ответов и выбирает лучший, а использует накопительную многоэтапную стратегию. Такой метод имитирует процесс решения задач человеком. Например, модель проводит итеративный самоанализ: учитывает свой опыт, чтобы извлекать информацию из предыдущих этапов рассуждений. Благодаря этому Qwen3-Max Thinking может выходить из тупиковых ситуаций и направлять ресурсы на решение «неразрешённых неопределённостей», а не на повторное получение уже известных выводов. Другое преимущество модели — она объединяет режим размышления с обычным, причём умеет работать с ними одновременно. В бенчмарке GPQA нейросеть наб

Главная особенность Qwen3-Max Thinking — отход от стандартных методов логического вывода. Вместо линейной генерации токенов Qwen3 использует «тяжёлый режим» — то есть не просто генерирует множество ответов и выбирает лучший, а использует накопительную многоэтапную стратегию.

Такой метод имитирует процесс решения задач человеком. Например, модель проводит итеративный самоанализ: учитывает свой опыт, чтобы извлекать информацию из предыдущих этапов рассуждений. Благодаря этому Qwen3-Max Thinking может выходить из тупиковых ситуаций и направлять ресурсы на решение «неразрешённых неопределённостей», а не на повторное получение уже известных выводов. Другое преимущество модели — она объединяет режим размышления с обычным, причём умеет работать с ними одновременно.

В бенчмарке GPQA нейросеть набрала 92,8 балла, а в LiveCodeBench v6 — 91,4 балла. При тестировании на логическое мышление (HMMT) её результат составит 98 баллов, против 97,5 у Gemini 3 Pro и 92,5 у DeepSeek V3.2. Заодно Qwen3-Max Thinking проверили в тесте Humanity’s Last Exam (HLE), где ИИ получил оценку в 49,8 балла (45,8 у Gemini 3 Pro и 45,5 у GPT-5.2-Thinking). В Arena-Hard v2 результат составил 90,2 балла против 76,7 у Claude-Opus-4.5.

По стоимости токенов Qwen3-Max Thinking находится между Claude Haiku 4.5 и Gemini 3 Pro: 1 млн токенов на входные данные стоит $1,2, на выходные — $6. Опробовать возможности нейросети можно в чат-боте Qwen Chat или по API.

Deep Seek

20,9 тыс интересуются