Alibaba выпустила новую открытую модель генерации изображений Z-Image, и она уже вызывает активные обсуждения.
Компактная Turbo-версия на 6 млрд параметров по качеству работает на уровне гораздо более крупных моделей, включая Flux 2. Источник: источник Что делает Z-Image особенной Модель уверенно справляется с фотореалистичными пейзажами, городскими сценами и сложными композициями. Умеет работать с текстом на изображениях — что остаётся трудной задачей для большинства нейросетей. На английском и китайском показывает почти безошибочную генерацию надписей. Русский, немецкий и французский понимает частично: иногда путает буквы или стилистику, но динамика у модели очень хорошая. Варианты модели Сейчас доступна версия Turbo — быстрая, лёгкая и предназначенная для массового использования.
В ближайшее время выйдут: Base — максимальное качество и возможности; Edit — редактирование существующих изображений. Вес Turbo уже доступен для скачивания на GitHub и HuggingFace.
Для локального запус