Найти в Дзене

🔥 Новая неделя — новые модели от Qwen

🔥 Новая неделя — новые модели от Qwen!

Мы продолжаем использовать Gemini 2.5 Flash Lite — быструю и надёжную модель для продакшн-задач.

Но теперь у нас появился вариант для локального запуска — и он впечатляет 👇

🚀 Qwen3 VL — свежие модели в размерах 4B и 8B.

Идеально подходят для офлайн-инференса, дообучения и тестов без подключения к облаку.

Каждая доступна в версиях Instruct и Thinking.

Несмотря на размер, эти «малышки» кое-где даже обгоняют Gemini 2.5 Flash Lite и GPT-5 Nano 😎

📊 По бенчмаркам видно, что Qwen3 VL почти дотянулась до уровня Qwen2.5-VL-72B,

которая всего полгода назад считалась флагманом серии.

💡 Вдобавок инженеры оптимизировали потребление VRAM и выпустили FP8-версии,

так что запустить модель теперь можно даже на 24 GB GPU.