Китайский проект StepFun выпустил новую ИИ-модель под названием Step-Video-T2V. С её помощью можно генерировать видеоролики по текстовому описанию — при этом, в отличие от большинства конкурентов, в ней нет ограничений на создание материалов с изображением известных личностей. Step-Video-T2V способна создавать ролики длительностью до 10 секунд, в которых можно задействовать, например, Илона Маска или Стива Джобса. На генерацию одного видео у ИИ-модели уходит около 6 минут. Нейросеть понимает запросы только на китайском и английском языках, но воспользоваться ей можно и в РФ: код подтверждения при регистрации на российский номер телефона приходит в Telegram. В тексте запроса можно подробно описать персонажа, включая его эмоции, одежду, указать тип съёмки, и даже добавить надписи на поддерживаемых языках (например, на табличке или плакате). Демоверсия Step-Video-T2V доступна на сайте проекта, исходники для локальной установки Step-Video-T2V можно найти на GitHub.
Нейросеть Step-Video получила «безлимит» на генерацию видео со знаменитостями
18 февраля 202518 фев 2025
15
~1 мин