Найти в Дзене

🖼️ Картинки из терминала: Ollama тихо меняет правила игры

Пока большие компании спорят о будущем ИИ и «социальном разрешении» на сжигание мегаватт, Ollama делает очень практичный ход: добавляет генерацию изображений прямо в локальный CLI. Без облаков, без подписок, без веб-интерфейсов. Просто терминал, модель и картинка у тебя на диске. И, на мой взгляд, это как раз тот случай, когда ИИ становится не абстрактным «ассистентом», а нормальным инструментом. Ollama запустила экспериментальную поддержку формирование картинок (image generation) на macOS (Windows и Linux — «вот-вот»).
Одна команда: ollama run x/z-image-turbo "your prompt" И результат: Это выглядит мелочью, но на самом деле меняет UX радикально: генерация изображений становится частью девелоперского пайплайна, а не отдельным «походом в веб». Ollama не стала изобретать велосипед, а аккуратно встроила уже сильные open-weight модели. 🎨 Z-Image Turbo
Модель на 6 млрд параметров от Tongyi Lab (Alibaba). Что в ней интересно: И это важный момент: речь не про «поиграться», а про модель, кото
Оглавление

Пока большие компании спорят о будущем ИИ и «социальном разрешении» на сжигание мегаватт, Ollama делает очень практичный ход: добавляет генерацию изображений прямо в локальный CLI. Без облаков, без подписок, без веб-интерфейсов. Просто терминал, модель и картинка у тебя на диске. И, на мой взгляд, это как раз тот случай, когда ИИ становится не абстрактным «ассистентом», а нормальным инструментом.

Что вообще произошло подчёркнуто просто

Ollama запустила экспериментальную поддержку формирование картинок (image generation) на macOS (Windows и Linux — «вот-вот»).
Одна команда:

ollama run x/z-image-turbo "your prompt"

И результат:

  • PNG-файл сохраняется в текущую директорию
  • в терминалах вроде Ghostty или iTerm2 изображение можно увидеть прямо inline
  • никакого браузера, аккаунта или API-ключей

Это выглядит мелочью, но на самом деле меняет UX радикально: генерация изображений становится частью девелоперского пайплайна, а не отдельным «походом в веб».

Какие модели доступны и почему это важно

Ollama не стала изобретать велосипед, а аккуратно встроила уже сильные open-weight модели.

🎨 Z-Image Turbo
Модель на 6 млрд параметров от
Tongyi Lab (Alibaba).

Что в ней интересно:

  • фоторалистичные сцены и портреты
  • редкий кейс: нормальная генерация текста внутри изображения
  • поддержка английского и китайского
  • лицензия Apache 2.0 — можно использовать в коммерческих продуктах

И это важный момент: речь не про «поиграться», а про модель, которую можно легально встраивать в сервисы, ботов, CI-процессы и генераторы контента.

🌲 FLUX.2 Klein
Модель от
Black Forest Labs, доступная в версиях 4B и 9B.

Чем она выделяется:

  • очень хорошо рисует читабельный текст
  • подходит для UI-макетов, баннеров, продуктовых изображений
  • 4B-версия полностью open-source (Apache 2.0)
  • 9B — мощнее, но уже с non-commercial лицензией

Если коротко: Z-Image — про реализм и эстетику, FLUX — про дизайн и типографику.

Почему формат «через терминал» — это не странно, а гениально

На первый взгляд идея рисовать картинки из CLI кажется гиковской. Но если копнуть глубже, всё очень логично.

⚙️ Что даёт терминальный подход

  • генерация легко автоматизируется
  • можно версионировать промпты
  • удобно встраивать в скрипты и пайплайны
  • изображения сразу лежат рядом с кодом или артефактами сборки

📦 Представь:

  • CI-джоб, который генерирует превью для README
  • скрипт, который делает продуктовые изображения для каталога
  • локальный генератор иллюстраций для статей или блогов

Без SaaS, без лимитов, без «ваша подписка закончилась».

Технические детали, которые приятно удивляют

Ollama даёт контроль, который обычно прячут за «расширенными настройками».

  • настройка ширины и высоты
  • количество шагов генерации (speed vs detail)
  • seed для воспроизводимых результатов
  • negative prompt — чтобы отсеивать мусор

Это выглядит мелочью, но именно такие вещи превращают ИИ из игрушки в инженерный инструмент.

Личное мнение: вот так и выглядит «полезный ИИ»

На фоне разговоров о том, что ИИ должен «доказывать пользу», Ollama делает всё правильно:

  • не обещает AGI
  • не продаёт «революцию»
  • просто добавляет функцию, которая реально экономит время

Мне особенно нравится, что:

  • всё работает локально
  • модели открытые
  • UX ориентирован на разработчиков, а не маркетинг

Если ИИ и должен прижиться в повседневной работе, то именно так — тихо, утилитарно, без фанфар.

Что дальше и почему это интересно

🔮 В планах:

  • поддержка Windows и Linux
  • новые модели
  • редактирование изображений (image editing)

Если Ollama пойдёт дальше — маски, inpainting, контрольные карты — мы вполне можем получить локальную альтернативу облачным генераторам, но в формате Unix-инструмента. А это уже серьёзная заявка.

Источники