Найти в Дзене
Postium

Alibaba представила Z-Image — бесплатную нейросеть для фотореалистичной генерации

Команда Tongyi Lab (подразделение Alibaba) анонсировала Z-Image — ИИ-модель для генерации изображений размером 6 миллиардов параметров. Разработчики заявляют, что по качеству она не уступает крупным коммерческим нейросетям, но при этом остаётся открытой. Модели уже доступны: их можно запускать на видеокартах с памятью меньше 16 ГБ, то есть фактически на домашнем компьютере. Подробности в материале Postium. Читайте также: 25 нейросетей для генерации картинок В основе Z-Image лежит архитектура Single-Stream Diffusion Transformer (DiT). В отличие от классических подходов, где текст и визуальные данные обрабатываются раздельно, здесь процесс унифицирован. Модель объединяет текстовые условия и «зашумленные» латенты (сжатые представления изображения) в единый поток данных. Это позволяет нейросети лучше понимать связь между словами в запросе и пикселями на картинке, повышая точность генерации при меньших вычислительных затратах. Во внутреннем рейтинге Elo Z-Image показывает результаты, сопост
Оглавление

Команда Tongyi Lab (подразделение Alibaba) анонсировала Z-Image — ИИ-модель для генерации изображений размером 6 миллиардов параметров. Разработчики заявляют, что по качеству она не уступает крупным коммерческим нейросетям, но при этом остаётся открытой.

Модели уже доступны: их можно запускать на видеокартах с памятью меньше 16 ГБ, то есть фактически на домашнем компьютере. Подробности в материале Postium.

Читайте также: 25 нейросетей для генерации картинок

Нейросеть Z-Image — что это и как работает

В основе Z-Image лежит архитектура Single-Stream Diffusion Transformer (DiT). В отличие от классических подходов, где текст и визуальные данные обрабатываются раздельно, здесь процесс унифицирован.

Модель объединяет текстовые условия и «зашумленные» латенты (сжатые представления изображения) в единый поток данных. Это позволяет нейросети лучше понимать связь между словами в запросе и пикселями на картинке, повышая точность генерации при меньших вычислительных затратах.

Во внутреннем рейтинге Elo Z-Image показывает результаты, сопоставимые с закрытыми системами, и становится лидером среди открытых моделей.

Ключевое отличие Z-Image от большинства open-source решений — это наличие «интеллекта» и знаний о реальном мире. Модель оснащена модулем Prompt Enhancer, который выстраивает цепочку рассуждений перед рисованием. Нейросеть не просто ищет визуальные соответствия, а использует логику.

-2

Кроме того, в модель заложены глубокие знания о мировой культуре и объектах. Она корректно генерирует известные достопримечательности, конкретных персонажей и реальные предметы, не искажая их детали, чем часто грешат другие открытые модели.

-3

Линейка состоит из трёх моделей — каждая под свою задачу. Доступные версии:

  • Z-Image-Turbo — для пользователей. Самая быстрая версия, которой достаточно 8 шагов вычислений, чтобы выдать готовый кадр. Работает на бытовых GPU и делает фотореалистичные изображения.
  • Z-Image-Base — для разработчиков. Базовая «чистая» модель без ускорений. Предназначена для дообучения, кастомных стилей, экспериментов и построения собственных моделей на её основе.
  • Z-Image-Edit — для дизайнеров. Версия для редактирования готовых изображений. Работает как ИИ-фотошоп: можно загрузить картинку и попросить изменить конкретный элемент, сохранив стиль и композицию.

Как пользоваться Z-Image бесплатно

Протестировать Z-Image проще всего прямо в браузере — на официальной странице в Hugging Face, где генерация работает без установки и настройки.

-4

Для локального запуска достаточно скачать веса нужной версии и открыть их в любом стандартном инструменте, который поддерживает open-source модели: Diffusers, WebUI или ComfyUI.

Модель запускается так же, как обычные diffusion-модели, запускается на видеокартах до 16 ГБ и генерирует изображение по текстовому запросу без дополнительных параметров.

Почему это важно? Рынок генерации картинок за последние месяцы резко обновился. Flux вывел открытую ветку FLUX.1 и запустил Pro-версии, которые считаются эталоном фотореализма, но работают только в облаке. Google выпустил Nano Banana: базовая версия даёт бесплатную генерацию и простое редактирование, а Nano Banana Pro — продвинутый инструмент, но с привязкой к сервисам Gemini.

На этом фоне Z-Image — это ИИ-генератор, который одновременно открыт, компактен, работает локально и позволяет получить качество, близкое к флагманам.

Итог: Пользователи получили бесплатный аналог топовых нейросетей, который «думает» перед рисованием и запускается на обычном домашнем компьютере.

Запись Alibaba представила Z-Image — бесплатную нейросеть для фотореалистичной генерации впервые появилась Postium.