Китайский разработчик Qwen выпустил небольшую, но мощную нейронку QwQ-32B с открытой лицензией. Новинка принадлежит к категории рассуждающих. При столь скромном числе параметров в ряде задач заметно превосходство над крупной DeepSeek R1 671B. Рассказываем, для каких сценариев это может быть полезно. Локальный запуск языковых моделей даёт немало премуществ технически подкованным пользователям. Среди них — работа офлайн, приватность за счёт отсутствия сообщения с облаком, точечная настройка под свои нужды. Однако здесь всё упирается в характеристики домашнего ПК. С приличной скоростью на передовых компьютерах нетрудно запускать решения на 7–32 млрд параметров. Тогда как с гигантскими вариантами, включая 671-миллиардную DeepSeek R1, не обойтись без серверного оборудования. Qwen QwQ 32B — свежее пополнение семейства моделей Alibaba, где упор сделан на обдумывание сложных задач, требующих дополнительного времени и контекста. Окно расширили до 32 тысяч токенов, что позволяет принимать длинны
Компактный убийца DeepSeek и o1 mini. Что умеет модель Qwen 32B от Alibaba?
10 марта 202510 мар 2025
334
1 мин