Если вы хоть раз пытались повторить удачную генерацию, вы знаете боль: промпт тот же, а поза уехала, перспектива поплыла, руки стали "другими", а композиция развалилась. У Qwen-Image наконец появился нормальный "руль" - ControlNet-подобное управление, где картинка держится не только за текст, но и за структуру: контуры, глубину, позу, маску для дорисовки. ControlNet - это способ зафиксировать "скелет" изображения, чтобы модель не импровизировала там, где вам нужна точность. Суть простая: к промпту добавляется контрольная картинка (control image). Ее можно получить из референса через карты типа canny (границы), depth (глубина), pose (скелет), или даже набросать от руки. Дальше модель генерирует новое изображение, но старается сохранить заданную структуру. Почему это важно именно для Qwen-Image: Практический тумблер, который решает половину проблем - сила контроля (часто это control_context_scale). Логика такая: Я бы начинал с 0.70 - 0.80 почти в любых задачах, а если нужно прям приби
Qwen Image + ControlNet: как «прикрутить руль» к генерации
13 января13 янв
3
3 мин