Z-Anime — специализированная текст-в-картинку модель под аниме-стиль, сделанная на базе Z-Image от Alibaba. Ключевой контраст: это не набор LoRA (параметры-надстройки поверх базовой модели), а полный финетюнинг основной модели на аниме-данных. В основе — S3-DiT (Single-Stream Diffusion Transformer) с ~6B параметров. Обучение всего проекта заняло 314 000 GPU-часов на H800 (~$630K) — цифры пока не убеждают в «дешевизне для всех», но масштаб точно ниже, чем у многих релизов «с нуля». Доступны три варианта: Base (28–50 шагов), Distill-8-Step и Distill-4-Step. Для ускоренных версий применили distillation с reward post-training, чтобы удержать качество при 4–8 шагах. Заявлена полная поддержка negative prompts и natural language prompting. По железу — 8GB VRAM (BF16 ~12GB, FP8 ~6GB), плюс варианты форматов: GGUF, и AIO для интеграции в ComfyUI. Попробовать можно на Hugging Face: SeeSee21/Z-Anime. Команда также держит репозиторий базовой Z-Image — детали обучения и артефактов обычно сводят
🚀 Z-Anime — полноформатный финетюнинг Z-Image под аниме-стиль, который запускается даже на 8GB VRAM
21 мая21 мая
~1 мин