Добавить в корзинуПозвонить
Найти в Дзене
Машинное обучение

🔥 Релиз Qwen 3 от Alibaba

🔥 Релиз Qwen 3 от Alibaba В релиз вошли 2 MoE-модели и 6 Dense models (плотные модели), размером от 0.6B до 235B параметров. 🏆 Флагманская модель Qwen3-235B-A22B демонстрирует конкурентные результаты в задачах Кодина, математики и общих способностей, уверенно соперничая с передовыми моделями, такими как DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro. ⚡ Небольшая MoE-модель Qwen3-30B-A3B превосходит QwQ-32B, испрльзуя в 10 раз больше параметров. 🔥 Компактная модель Qwen3-4B сопоставима по производительности с Qwen2.5-72B-Instruct. 🔜Blog: https://qwenlm.github.io/blog/qwen3/ 🔜GitHub: https://github.com/QwenLM/Qwen3 🔜Hugging Face: https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f 🔜 ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48 @machinelearning #Qwen

🔥 Релиз Qwen 3 от Alibaba

В релиз вошли 2 MoE-модели и 6 Dense models (плотные модели), размером от 0.6B до 235B параметров.

🏆 Флагманская модель Qwen3-235B-A22B демонстрирует конкурентные результаты в задачах Кодина, математики и общих способностей, уверенно соперничая с передовыми моделями, такими как DeepSeek-R1, o1, o3-mini, Grok-3 и Gemini-2.5-Pro.

⚡ Небольшая MoE-модель Qwen3-30B-A3B превосходит QwQ-32B, испрльзуя в 10 раз больше параметров.

🔥 Компактная модель Qwen3-4B сопоставима по производительности с Qwen2.5-72B-Instruct.

🔜Blog: https://qwenlm.github.io/blog/qwen3/

🔜GitHub: https://github.com/QwenLM/Qwen3

🔜Hugging Face: https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f

🔜 ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48

@machinelearning

#Qwen

-2