182 подписчика

🖼️ Картинки из терминала: Ollama тихо меняет правила игры

3 дня назад3 дня назад

3 мин

Пока большие компании спорят о будущем ИИ и «социальном разрешении» на сжигание мегаватт, Ollama делает очень практичный ход: добавляет генерацию изображений прямо в локальный CLI. Без облаков, без подписок, без веб-интерфейсов. Просто терминал, модель и картинка у тебя на диске. И, на мой взгляд, это как раз тот случай, когда ИИ становится не абстрактным «ассистентом», а нормальным инструментом. Ollama запустила экспериментальную поддержку формирование картинок (image generation) на macOS (Windows и Linux — «вот-вот»).

Одна команда: ollama run x/z-image-turbo "your prompt" И результат: Это выглядит мелочью, но на самом деле меняет UX радикально: генерация изображений становится частью девелоперского пайплайна, а не отдельным «походом в веб». Ollama не стала изобретать велосипед, а аккуратно встроила уже сильные open-weight модели. 🎨 Z-Image Turbo

Модель на 6 млрд параметров от Tongyi Lab (Alibaba). Что в ней интересно: И это важный момент: речь не про «поиграться», а про модель, кото

Оглавление

Что вообще произошло подчёркнуто просто
Какие модели доступны и почему это важно
Почему формат «через терминал» — это не странно, а гениально

Пока большие компании спорят о будущем ИИ и «социальном разрешении» на сжигание мегаватт, Ollama делает очень практичный ход: добавляет генерацию изображений прямо в локальный CLI. Без облаков, без подписок, без веб-интерфейсов. Просто терминал, модель и картинка у тебя на диске. И, на мой взгляд, это как раз тот случай, когда ИИ становится не абстрактным «ассистентом», а нормальным инструментом.

Что вообще произошло подчёркнуто просто

Ollama запустила экспериментальную поддержку формирование картинок (image generation) на macOS (Windows и Linux — «вот-вот»).
Одна команда:

ollama run x/z-image-turbo "your prompt"

И результат:

PNG-файл сохраняется в текущую директорию
в терминалах вроде Ghostty или iTerm2 изображение можно увидеть прямо inline
никакого браузера, аккаунта или API-ключей

Это выглядит мелочью, но на самом деле меняет UX радикально: генерация изображений становится частью девелоперского пайплайна, а не отдельным «походом в веб».

Какие модели доступны и почему это важно

Ollama не стала изобретать велосипед, а аккуратно встроила уже сильные open-weight модели.

🎨 Z-Image Turbo
Модель на 6 млрд параметров от Tongyi Lab (Alibaba).

Что в ней интересно:

фоторалистичные сцены и портреты
редкий кейс: нормальная генерация текста внутри изображения
поддержка английского и китайского
лицензия Apache 2.0 — можно использовать в коммерческих продуктах

И это важный момент: речь не про «поиграться», а про модель, которую можно легально встраивать в сервисы, ботов, CI-процессы и генераторы контента.

🌲 FLUX.2 Klein
Модель от Black Forest Labs, доступная в версиях 4B и 9B.

Чем она выделяется:

очень хорошо рисует читабельный текст
подходит для UI-макетов, баннеров, продуктовых изображений
4B-версия полностью open-source (Apache 2.0)
9B — мощнее, но уже с non-commercial лицензией

Если коротко: Z-Image — про реализм и эстетику, FLUX — про дизайн и типографику.

Почему формат «через терминал» — это не странно, а гениально

На первый взгляд идея рисовать картинки из CLI кажется гиковской. Но если копнуть глубже, всё очень логично.

⚙️ Что даёт терминальный подход

генерация легко автоматизируется
можно версионировать промпты
удобно встраивать в скрипты и пайплайны
изображения сразу лежат рядом с кодом или артефактами сборки

📦 Представь:

CI-джоб, который генерирует превью для README
скрипт, который делает продуктовые изображения для каталога
локальный генератор иллюстраций для статей или блогов

Без SaaS, без лимитов, без «ваша подписка закончилась».

Технические детали, которые приятно удивляют

Ollama даёт контроль, который обычно прячут за «расширенными настройками».

настройка ширины и высоты
количество шагов генерации (speed vs detail)
seed для воспроизводимых результатов
negative prompt — чтобы отсеивать мусор

Это выглядит мелочью, но именно такие вещи превращают ИИ из игрушки в инженерный инструмент.

Личное мнение: вот так и выглядит «полезный ИИ»

На фоне разговоров о том, что ИИ должен «доказывать пользу», Ollama делает всё правильно:

не обещает AGI
не продаёт «революцию»
просто добавляет функцию, которая реально экономит время

Мне особенно нравится, что:

всё работает локально
модели открытые
UX ориентирован на разработчиков, а не маркетинг

Если ИИ и должен прижиться в повседневной работе, то именно так — тихо, утилитарно, без фанфар.

Что дальше и почему это интересно

🔮 В планах:

поддержка Windows и Linux
новые модели
редактирование изображений (image editing)

Если Ollama пойдёт дальше — маски, inpainting, контрольные карты — мы вполне можем получить локальную альтернативу облачным генераторам, но в формате Unix-инструмента. А это уже серьёзная заявка.

Источники

Оригинальный блог Ollama: https://ollama.com/blog/image-generation
Документация Ollama: https://ollama.com/docs
GitHub Ollama: https://github.com/ollama
Discord Ollama: https://discord.gg/ollama