Отличие от предшественника в наличии KV-кэша для ускорения мульти-референс редактирования. Он кэширует данные из рефов во время первого этапа денойза, и хранит их у себя вместо того, чтобы получать их каждый раз заново, тем самым устраняя избыточные вычисления в последующих шагах, что даёт ускорение в ~2,5 раза. При этом KV модель заточена генерить в 4 шага. На 4090 выдаёт картинку 832х1248 за 1 сек (3,28 ит/сек), хотя на первый запуск будет больше времени ибо идёт кэширование. При этом промта и рефа придерживается отлично. Детали текстур несколько пожеванные, но тут можно поиграться с апскейлером. Официально потребление 29 ГБ VRAM, где то что не влезло в видюху оффлоадится в оперативку. Так что, если у вас 12-16 ГБ VRAM и 32-64 ГБ RAM тоже должно быть неплохо. В Comfy уже завезли шаблон. Демо Хаггинг
Black Forest Labs: выпустили Flux Klein 9B KV, обновлённую версию своего генератора картинок вышедшего в январе
13 марта13 мар
3
~1 мин
