Компания Google представила Gemma 4 12B — открытую мультимодальную модель, которую можно запускать прямо на ноутбуках. Она работает не только с текстом, но и с изображениями и аудио, что делает её универсальным инструментом для самых разных задач. Главная особенность Gemma 4 12B — единая архитектура без отдельных мультимодальных энкодеров. Это позволяет экономить память и ускоряет обработку данных: модель справляется с задачами с низкой задержкой, не требуя мощных серверов. Для запуска потребуется 16 ГБ VRAM или объединённой памяти, что делает модель доступной для пользователей с современными ноутбуками и рабочими станциями. Gemma 4 12B содержит 12 миллиардов параметров и распространяется по лицензии Apache 2.0. Модель поддерживается такими популярными платформами, как Ollama, LM Studio, llama.cpp, MLX, vLLM, SGLang и Unsloth. Это значит, что интеграция в существующие рабочие процессы не вызовет сложностей. Готовые сборки Gemma 4 12B доступны на Hugging Face по адресу: huggingface.co/u