6 подписчиков

ByteDance нож в спину Kling 3.0

2 дня назад2 дня назад

2 мин

Kling 3.0 не успел даже толком погреться в лучах славы, а создатели TikTok уже выкатили своего кайдзю. И он реально впечатляет. Главная фишка — можно скормить модели до 12 референсов разом: 9 картинок + 3 видео. Закидываешь фото актёра, фото локации, видео с нужными движениями и она собирает из этого готовую сцену. Больше контроля, меньше промптинга, почти идеально! Что умеет: Понимает текст, картинки, видео и аудио одновременно Генерит ролики 4–15 секунд Сама добавляет звук и музыку в тему. Перерисовывает готовое видео в новом стиле, сохраняя движения Модель омни, понимает не только контекст но и выстраивает свою картину мира из референсов. Причём делает это интересно не 1 в 1 а очень приближенно, как будто понимает ага вот тут я не смогу такое движение сделать попробую немного иначе и выходит очень хорошо! Уникальные преимущества которые на мой взгляд отрывают от конкурентов: Динамика — лучшая на рынке. Драки, танцы, акробатика — тела двигаются как настоящие, а не как пластили

Kling 3.0 не успел даже толком погреться в лучах славы, а создатели TikTok уже выкатили своего кайдзю. И он реально впечатляет.

Главная фишка — можно скормить модели до 12 референсов разом: 9 картинок + 3 видео. Закидываешь фото актёра, фото локации, видео с нужными движениями и она собирает из этого готовую сцену. Больше контроля, меньше промптинга, почти идеально!

Что умеет:

Понимает текст, картинки, видео и аудио одновременно

Генерит ролики 4–15 секунд

Сама добавляет звук и музыку в тему.

Перерисовывает готовое видео в новом стиле, сохраняя движения

Модель омни, понимает не только контекст но и выстраивает свою картину мира из референсов. Причём делает это интересно не 1 в 1 а очень приближенно, как будто понимает ага вот тут я не смогу такое движение сделать попробую немного иначе и выходит очень хорошо!

Уникальные преимущества которые на мой взгляд отрывают от конкурентов:

Динамика — лучшая на рынке. Драки, танцы, акробатика — тела двигаются как настоящие, а не как пластилиновые

Камера — облёты на 360°, сложный трекинг. Раньше такое убивало качество у любой модели

Персонажи "почти" не ломаются — поворот головы, резкое движение — лицо остаётся тем же. Звучит как базовое требование, но до сих пор это была проблема, В супер сложных сценах да бывает что что то морфится, но это настолько незаметно что и пофиг)

Сборка из референсов — вот это прям киллер-фича. Ты буквально показываешь модели «хочу вот этого человека, в этом месте, с такими движениями в такой графике. » И она это делает. МАГИЯ

Не без проблем давай расскажу

Контекст иногда заставляет модель «глючить». Персонажи, которых не было в кадре, но которые должны, например, взять ружьё со стойки, порой появляются уже с этим оружием в руках — при этом предметы как будто «сливаются» в одну сущность. Формально логика соблюдается, но возникает дублирование контекста.

Иногда персонажи могут исчезнуть, если дверь закрывается и тут же снова открывается — буквально в ту же секунду.

Физика тоже временами переходит в режим гонконгского боевика: движения персонажей выглядят красиво, но слишком «воздушно», будто они парят на тросах, как в фильмах про кунг-фу.

Kling 3.0 берёт фотореализмом и проработкой деталей. SeeDance 2.0 — экшеном, движением и контролем над сценой. На мой взгляд Это две самых жирных модели на данный момент времени и не использовать в работе будет ошибкой.

Постарался собрать для тебя уникальную партию примеров.

💢 Ждём полноценного выхода SeeDance 2 по API, а пока ставь реакции и подписывайся!

🤖Saramudvlad | забустить 🤖

Мой Max 💜