Найти в Дзене
«НейроКафе»

Товарищ, кажется, генерация изображений переходит на новый уровень — Alibaba показала Z-Image

Alibaba выпустила новую открытую модель генерации изображений Z-Image, и она уже вызывает активные обсуждения.
Компактная Turbo-версия на 6 млрд параметров по качеству работает на уровне гораздо более крупных моделей, включая Flux 2. Источник: источник Что делает Z-Image особенной Модель уверенно справляется с фотореалистичными пейзажами, городскими сценами и сложными композициями. Умеет работать с текстом на изображениях — что остаётся трудной задачей для большинства нейросетей. На английском и китайском показывает почти безошибочную генерацию надписей. Русский, немецкий и французский понимает частично: иногда путает буквы или стилистику, но динамика у модели очень хорошая. Варианты модели Сейчас доступна версия Turbo — быстрая, лёгкая и предназначенная для массового использования.
В ближайшее время выйдут: Base — максимальное качество и возможности; Edit — редактирование существующих изображений. Вес Turbo уже доступен для скачивания на GitHub и HuggingFace.
Для локального запус
Оглавление

Alibaba выпустила новую открытую модель генерации изображений Z-Image, и она уже вызывает активные обсуждения.

Компактная Turbo-версия на
6 млрд параметров по качеству работает на уровне гораздо более крупных моделей, включая Flux 2.

Источник: источник

Что делает Z-Image особенной

  • Модель уверенно справляется с фотореалистичными пейзажами, городскими сценами и сложными композициями.
  • Умеет работать с текстом на изображениях — что остаётся трудной задачей для большинства нейросетей.
  • На английском и китайском показывает почти безошибочную генерацию надписей.
  • Русский, немецкий и французский понимает частично: иногда путает буквы или стилистику, но динамика у модели очень хорошая.

Варианты модели

Сейчас доступна версия Turbo — быстрая, лёгкая и предназначенная для массового использования.

В ближайшее время выйдут:

  • Base — максимальное качество и возможности;
  • Edit — редактирование существующих изображений.

Вес Turbo уже доступен для скачивания на GitHub и HuggingFace.

Для локального запуска понадобится видеокарта от
16 ГБ.

Что говорят пользователи

В сети активно делятся примерами:

фотореалистичные ландшафты, достопримечательности, архитектура.

Многие сравнивают результаты Z-Image с топовыми SOTA-моделями — и разница порой минимальна.

Вывод

Гонка генеративных нейросетей выходит на новый этап.

Компактные модели становятся достаточно сильными, чтобы конкурировать с тяжеловесами.

Будущее генерации изображений ускоряется — товарищи, держитесь, дальше будет ещё интереснее