Qwen 3, созданная командой Qwen от Alibaba Cloud, представляет собой семейство больших языковых моделей (LLM), которое устанавливает новые стандарты в производительности, универсальности и визуальной генерации. Эта серия моделей предлагает передовые решения для разработчиков, исследователей и бизнеса, включая возможности создания высококачественных изображений. 🌐 Подписывайтесь на мой телеграмм канал - НейроФакт, там я делюсь эксклюзивным контентом про ИИ! Архитектура и масштабы Qwen 3 🛠️ Qwen 3 охватывает модели с параметрами от 0,6 до 235 миллиардов, представленные в двух архитектурах: плотные (dense) и Mixture-of-Experts (MoE). Флагманская модель Qwen3-235B-A22B с 235 миллиардами параметров (22 миллиарда активных) конкурирует с лидерами, такими как DeepSeek-R1 и Gemini 2.5 Pro. Компактная MoE-модель Qwen3-30B-A3B (30 миллиардов параметров, 3 миллиарда активных) превосходит QwQ-32B, используя лишь 10% активных параметров, что снижает затраты на обучение и инференс. Плотные модели
Qwen 3: Прорыв в искусственном интеллекте и генерации изображений🚀
6 июня 20256 июн 2025
7
2 мин