🔥 Новая неделя — новые модели от Qwen!
Мы продолжаем использовать Gemini 2.5 Flash Lite — быструю и надёжную модель для продакшн-задач.
Но теперь у нас появился вариант для локального запуска — и он впечатляет 👇
🚀 Qwen3 VL — свежие модели в размерах 4B и 8B.
Идеально подходят для офлайн-инференса, дообучения и тестов без подключения к облаку.
Каждая доступна в версиях Instruct и Thinking.
Несмотря на размер, эти «малышки» кое-где даже обгоняют Gemini 2.5 Flash Lite и GPT-5 Nano 😎
📊 По бенчмаркам видно, что Qwen3 VL почти дотянулась до уровня Qwen2.5-VL-72B,
которая всего полгода назад считалась флагманом серии.
💡 Вдобавок инженеры оптимизировали потребление VRAM и выпустили FP8-версии,
так что запустить модель теперь можно даже на 24 GB GPU.