В LTX Trainer добавили поддержку тренировки лор и файнтюна на основе видеогенератора LTXV. Теперь этот фреймворк позволяет работать сразу с десятком режимов, охватывающих видео и аудио: от t2v и i2v до расширения длительности, инпейнтинга, аутпейнтинга, преобразования аудио в видео и наоборот, генерации Foley, text-to-audio и IC-лоров. Базовые лоры уже доступны на Hugging Face. В комплекте есть подробная документация: инструкции по созданию датасетов, оптимизации пайплайна для экономии памяти и примеры конфигов. Для автоматизации задач предусмотрен скилл для агентов — например, Hermes или Claude Code, которым можно описать задачу на естественном языке, а дальше они сами разберутся с пайплайном. Важный момент: в рекомендациях по тренировке отмечается, что для полноценной работы желательно иметь видеокарту с 80+ ГБ VRAM (например, RTX 6000 PRO). Тем не менее, INT8-кванты запускаются и на более доступных 4090 или 5090. Также поддерживается распределённый файнтюн на кластере GPU. Документа
LTX Trainer теперь поддерживает тренировки лор и файнтюна на базе LTXV
18 июня18 июн
~1 мин