Найти в Дзене
4pda.to

Новая «думающая» ИИ-модель Alibaba превосходит конкурентов при меньшем размере

Qwen Team, подразделение китайской корпорации Alibaba, представило новую «рассуждающую» ИИ-модель QwQ-32B с 32 миллиардами параметров. Она предназначена для повышения производительности в решении сложных задач с помощью обучения с подкреплением. По словам разработчиков, в ряде сценариев она превосходит DeepSeek R1. При своих 32 миллиардах параметров QwQ-32B превосходит DeepSeek R1 с 671 миллиардом параметров в сфере математических вычислений, написании программного кода и решении общих вопросов. Этому способствует использование многоступенчатого подхода обучения с подкреплением. Также заявлено о превосходстве новой ИИ-модели над OpenAI o1-mini с 100 миллиардами параметров. Разработчики отмечают, что меньшее количество параметров снижает требования к вычислительным ресурсам и способствует более широкому применению. Модель находится в открытом доступе на платформах Hugging Face и ModelScope по лицензии Apache 2.0. Это означает, что она доступна для свободного коммерческого и исследовате
   Новая «думающая» ИИ-модель Alibaba превосходит конкурентов при меньшем размере
Новая «думающая» ИИ-модель Alibaba превосходит конкурентов при меньшем размере

Qwen Team, подразделение китайской корпорации Alibaba, представило новую «рассуждающую» ИИ-модель QwQ-32B с 32 миллиардами параметров. Она предназначена для повышения производительности в решении сложных задач с помощью обучения с подкреплением. По словам разработчиков, в ряде сценариев она превосходит DeepSeek R1.

-2

При своих 32 миллиардах параметров QwQ-32B превосходит DeepSeek R1 с 671 миллиардом параметров в сфере математических вычислений, написании программного кода и решении общих вопросов. Этому способствует использование многоступенчатого подхода обучения с подкреплением. Также заявлено о превосходстве новой ИИ-модели над OpenAI o1-mini с 100 миллиардами параметров. Разработчики отмечают, что меньшее количество параметров снижает требования к вычислительным ресурсам и способствует более широкому применению.

Модель находится в открытом доступе на платформах Hugging Face и ModelScope по лицензии Apache 2.0. Это означает, что она доступна для свободного коммерческого и исследовательского использования. Компании могут использовать её для своих продуктов и приложений, в том числе платных.