Китайская команда разработчиков нейросетей Qwen на этой неделе выпустила сразу две новые версии своей флагманской большой языковой модели Qwen 3. Речь идёт о наиболее крупной модификации Qwen 3 с 235 миллиардами параметров. Напомним, Qwen 3 была представлена в апреле и теперь получает первое обновление. Ещё в начале недели разработчики обновили «недумающий», так называемый Instruct-режим работы системы. В этом случае модель сразу же генерирует свой ответ и выдаёт его пользователю очень быстро. После апдейта «недумающая» версия Qwen 3 показала сильный прогресс во всевозможных бенчмарках. К примеру, в тесте GPQA, проверяющим научные знания, результат составил 77,5%. Для Instruct-моделей, которые сходу выдают свой ответ пользователю, это рекорд. Сегодня же команда Qwen представила модель «Qwen 3 235B A22B Thinking 2507» – лучшее, что на данный момент есть у компании. Модель по-прежнему содержит 235 миллиардов параметров, из них 22 миллиарда активы. «Thinking» означает, что перед нами имен
Нейросеть Qwen 3 получила значительное обновление и сравнялась с DeepSeek R1
25 июля 202525 июл 2025
25
2 мин