Израильская компания Lightricks выложила в открытый доступ модель LTX-2 с 19 миллиардами параметров. Она создает синхронизированный аудио-видео контент по текстовому описанию и работает быстрее конкурентов. По техотчету система генерирует до 20 секунд видео со стереозвуком из одного текстового запроса. Это включает синхронизированную речь, фоновый звук, шумы и музыку, подобранные к каждой сцене. Полная версия LTX-2 поддерживает 4K до 50 кадров в секунду, утверждают в Lightricks. Разработчики считают, что существующие подходы не решают задачу полностью. Во многих моделях сначала создается видео, потом добавляется звук, или наоборот. Такие раздельные схемы не учитывают взаимосвязь аудио и видео. «Синхронизация… Подробнее
Lightricks выпустил LTX-2 — конкурента Sora и Veo
11 января11 янв
1
~1 мин