Добавить в корзинуПозвонить
Найти в Дзене
Neurogen

LTX-2.3 22B IC-LoRA Ingredients

Контроль персонажей, реквизита и локаций через reference sheet, решает проблему визуальной консистентности повторяющихся персонажей и всего выше перечисленного Reference sheet подаётся не как изображение, а как статичное видео - тот же кадр, зацикленный до длины выходного клипа. Минимум 121 кадр, иначе ломается reference-encoding bucket, под который модель обучалась Промпт разбивается на две помеченные части Reference sheet: <описание панелей: персонажи, реквизит, локация> Generated video: <описание действия и шота> 🔘Рекомендуемые настройки инференса - LoRA strength: 1.4 (заметно выше дефолтной единицы — модель обучалась под высокий вес) - Steps: 30 - Guidance scale: 4.0 - Разрешение/длина: 768×448, 121 кадр, 24 fps — единственный тренировочный bucket; другие резолюции и длительности официально OOD - STG: stg_v, block 29, scale 1.0 — помогает стабильности движения - Negative prompt: worst quality, inconsistent motion, blurry, jittery, distorted 🔘Траблшутинг 1. «Bigger panels c

LTX-2.3 22B IC-LoRA Ingredients

Контроль персонажей, реквизита и локаций через reference sheet, решает проблему визуальной консистентности повторяющихся персонажей и всего выше перечисленного

Reference sheet подаётся не как изображение, а как статичное видео - тот же кадр, зацикленный до длины выходного клипа. Минимум 121 кадр, иначе ломается reference-encoding bucket, под который модель обучалась

Промпт разбивается на две помеченные части

Reference sheet: <описание панелей: персонажи, реквизит, локация>

Generated video: <описание действия и шота>

🔘Рекомендуемые настройки инференса

- LoRA strength: 1.4 (заметно выше дефолтной единицы — модель обучалась под высокий вес)

- Steps: 30

- Guidance scale: 4.0

- Разрешение/длина: 768×448, 121 кадр, 24 fps — единственный тренировочный bucket; другие резолюции и длительности официально OOD

- STG: stg_v, block 29, scale 1.0 — помогает стабильности движения

- Negative prompt: worst quality, inconsistent motion, blurry, jittery, distorted

🔘Траблшутинг

1. «Bigger panels carry over better» — чем больше места элемент занимает на референс-листе, тем точнее он переносится. Микроскопические панели с важными персонажами — путь к identity drift

2. Модель воспроизводит только то, что есть на листе. Если нужен какой-то prop в кадре — для него обязана быть отдельная панель плюс упоминание в Reference sheet: части промпта

3. Это не general T2V — без reference sheet модель работает плохо, она специализирована

4. Лица плывут? → проверьте, что есть чистый фронтальный close-up и turnaround, и что панель не загромождена

🔘Запуск в ComfyUI

Workflow поддерживается в ComfyUI-LTXVideo нужен именно IC-LoRA / reference workflow, потому что generic LoRA-loader игнорирует control-path и кондиционирование просто не применяется. Веса (ltx-2.3-22b-ic-lora-ingredients-0.9.safetensors) кладутся в models/loras, базой грузится LTX-2.3-22B, статичное видео из reference sheet подаётся в control input

https://huggingface.co/Lightricks/LTX-2.3-22b-IC-LoRA-Ingredients

В этом посте есть большое видео, которое не загрузилось в Дзен. Откройте оригинал поста в телеграме, чтобы его посмотреть