Сегодня компания Kling совершила большой шаг в мире image-to-video, сделав свою технологию доступной для всего мира. Ранее, доступная исключительно в Китае, компания открывает новые возможности для пользователей, позволяя создавать видеоролики из изображений за считанные секунды.
Система позволяет генерировать видеоролики длительностью 5 и 10 секунд. (при этом возможность продлевать ролики до 3 минут пока остается доступной только для пользователей Китая). Пользователи могут выбирать между скоростью генерации и качеством видео в зависимости от своих потребностей.
Для создания видео достаточно загрузить изображение размером до 10 МБ и разрешением до 300 dpi. При желании можно добавить описание, и картинка оживет, превращаясь в динамичный видеоролик.
Ключевым преимуществом модели Kling является встроенный механизм совместного внимания, который позволяет моделировать сложные пространственно-временные движения и генерировать видео, соответствующее законам физики. Модель обучена имитировать физические характеристики реального мира, что позволяет создавать видеоролики с естественными движениями и плавной динамикой.
Кроме того, Kling использует собственную разработку 3D VAE, которая обеспечивает высококачественные видеоролики от крупных планов до панорамных съемок. Технология 3D реконструкции лица и всего тела вместе со стабилизацией фона позволяет создавать реалистичные и стабильные видеоклипы.
Изначально созданная как часть Kuaishou — популярного китайского приложения для коротких видео, аналогичного TikTok, технология Kling впечатляет своим качеством и возможностями. Теперь это инновационное решение доступно и для международной аудитории, предлагая новый уровень творчества и профессионализма в создании видео.