27 подписчиков

Открытые модели мая 2026: Gemma 4 и Kimi K2.6 — какую качать на свой комп

2 дня назад2 дня назад

3 мин

Открытые модели в 2026-м догнали GPT-4 на большинстве типовых задач — суммаризация, код, перевод, анализ текста. Вопрос сместился: не «какая модель лучше», а «на какой платформе запускать и под какую задачу». Я потестировал два свежих релиза апреля — Gemma 4 от Google DeepMind и Kimi K2.6 от Moonshot AI. Что понравилось, что нет, кому какая подойдёт — всё ниже. Окей, тут важно не путать. Open-weight — это когда компания выкладывает веса модели (то есть «мозг» нейросети, файл на несколько гигабайт), и вы можете скачать его себе на комп и запустить. Без интернета, без подписки, без ограничений на количество запросов. Обе модели из этой статьи идут под лицензией Apache 2.0 — можно использовать даже в коммерческих проектах. Хочешь — встраивай в свой продукт, хочешь — крути локально для личных задач. Главное отличие от ChatGPT или Claude: всё работает на вашем железе. Данные никуда не уходят. Для тех, кто параноит насчёт приватности — это аргумент. Четвёртое поколение открытой линейки Go

Оглавление

Open-weight — это вообще про что
🔥 Gemma 4 от Google DeepMind
Kimi K2.6 — зачем я вообще полез это пробовать

Open-weight — это вообще про что

Окей, тут важно не путать. Open-weight — это когда компания выкладывает веса модели (то есть «мозг» нейросети, файл на несколько гигабайт), и вы можете скачать его себе на комп и запустить. Без интернета, без подписки, без ограничений на количество запросов.

Обе модели из этой статьи идут под лицензией Apache 2.0 — можно использовать даже в коммерческих проектах. Хочешь — встраивай в свой продукт, хочешь — крути локально для личных задач.

Главное отличие от ChatGPT или Claude: всё работает на вашем железе. Данные никуда не уходят. Для тех, кто параноит насчёт приватности — это аргумент.

🔥 Gemma 4 от Google DeepMind

Четвёртое поколение открытой линейки Google. Не буду врать — впечатлило.

Главная цифра: ~85 токенов в секунду на консьюмерском железе (токен — это примерно ¾ слова, то есть модель выдаёт около 60 слов в секунду). Это быстро. Для сравнения — многие закрытые API-модели работают медленнее.

Gemma 4 выходит в нескольких размерах — от компактных версий для ноутбуков до тяжёлых для серверов. Компактные варианты влезают в 8-16 ГБ видеопамяти, что реально для обычной игровой видеокарты.

Для чего хороша: тексты, суммаризация, код, перевод. Общие задачи — её конёк. Я прогнал через неё пару рабочих текстов — пишет чисто, не «водит», структура логичная.

Где пока слабее: сложные цепочки рассуждений и мультимодальность (работа с картинками). Тут платные модели всё ещё впереди.

Kimi K2.6 — зачем я вообще полез это пробовать

А вот это совсем другой зверь. Kimi K2.6 — модель от китайской Moonshot AI, заточенная под агентные задачи.

Что это значит? Обычная модель отвечает на один вопрос и забывает контекст. Kimi K2.6 умеет вести длинные цепочки действий — long-horizon agentic execution (буквально: «выполнение длинных горизонтов задач»). Ты даёшь ей план из 15 шагов, и она последовательно их выполняет, помня, что было на шаге 3, когда дошла до шага 12.

И зачем это обычному человеку? Ну, например: «проанализируй эти 5 документов, найди противоречия, составь сводку, потом напиши письмо клиенту на основе сводки». Одним промтом. Без перезапуска.

K2.6 уже есть в Ollama — можно поставить одной командой. Я, правда, с первого раза полчаса провозился — забыл обновить сам Ollama до свежей версии. Сижу, смотрю в ошибку, гуглю, а там всё просто. Классика.

⚡ Запуск локально — 3 команды

Обе модели доступны через Ollama (это менеджер локальных моделей, как App Store, только для нейросетей):

Установить Ollama: curl -fsSL https://ollama.com/install.sh | sh
Скачать модель: ollama pull gemma4 или ollama pull kimi-k2.6
Запустить: ollama run gemma4

Всё. Три строчки в терминале — и у вас локальная нейросеть. Без регистрации, без API-ключей.

Так что выбрать-то

Короче, расклад такой:

Gemma 4 — если нужен быстрый универсал. Тексты, код, ответы на вопросы, суммаризация. Работает шустро, жрёт немного ресурсов
Kimi K2.6 — если задачи длинные и многошаговые. Агенты, анализ документов, сложные цепочки. Медленнее, но умнее в длинном контексте

Можно поставить обе. Серьёзно. Ollama позволяет переключаться между моделями одной командой.

Где открытые догнали платные, а где — нет

Смотрите, на задачах вроде «перепиши текст», «напиши функцию на Python», «переведи статью» — разницу между Gemma 4 и, скажем, GPT-4 я уже почти не вижу. Догнали.

Где ещё уступают: глубокие рассуждения (математика, логические головоломки), работа с изображениями, генерация длинного связного текста на 5+ страниц. Тут платные модели пока выигрывают — но разрыв сокращается каждый квартал. Это не ощущение, это видно по бенчмаркам.

А по-простому это значит: для 80% бытовых задач с текстом открытые модели уже достаточно хороши. Платить $20/месяц за подписку стоит, только если вы упираетесь в эти оставшиеся 20%.

—

📱 Больше промтов, экспериментов и смешных фейлов нейросетей —

в моём Телеграме: @skazhi_ai