Кадр из генерации Dream Machine.
Напомним, сервис Dream Machine был запущен ещё в начале лета и наделал немало шума в сети благодаря относительно высокому качеству картинки, но при этом порой довольно непредсказуемым генерациям. Вдобавок система имеет функцию «оживления» загруженных в неё изображений. Длина роликов составляет всего 5 секунд, но их можно продлевать. Бесплатно сервис позволяет создавать до 30 роликов в месяц с одного аккаунта.
На этой неделе в Dream Machine добавили сразу две новые функции. Первая из них активируется опцией «Loop», которая появилась под текстовым полем с описанием содержимого видео. Эта функция позволяет бесшовно зациклить сгенерированные видео так, чтобы на нём был незаметен момент склейки. Таким образом, этот видеофрагмент может повторяться бесконечно.
В примерах разработчики показывают бесконечно летящий сквозь звёздное пространство космический корабль, безостановочную юлу, едущего по бесконечной дороге велосипедиста и так далее. Особо эффектно выглядят различные логотипы с горящим текстом или с залпами салюта вокруг придуманного пользователем названия.
Кадр из зацикленного видео с горящими буквами, созданного нейросетью.
Вторая функция – развитие уже имевшейся в Dream Machine возможности с двумя ключевыми кадрами. В этом случае пользователь загружает сразу две собственных картинки (реальные или сгенерированные каким-нибудь генератором изображений), после чего нейросеть пытается создать между ними красивый и логичный переход.
Теперь же авторы сервиса пошли чуть дальше и разрешили загружать только финальный кадр, если начального у вас нет или по каким-то причинам он вам не нужен. В итоге Dream Machine предоставляет пользователю выбор:
- Использовать только начальный кадр, позволив системе самой «додумать» окончание видео;
- Использовать только конечный кадр, позволив нейросети самостоятельно визуализировать то, что было до него;
- Использовать первую и последнюю картинку одновременно, после чего Dream Machine будет работать над переходом между ними;
- Не использовать опорных кадров вообще, создавая видео исключительно по текстовому описанию.
У немногочисленных конкурентов такой функциональности на данный момент нет. Из всех аналогов функцию ключевых кадров пока обещает только китайский Kling, но в глобальной версии нейросети она ещё недоступна.
Две новые функции. В свою очередь, опцию «Enhance prompt» иногда лучше отключать.
Также заметим, что в первых трёх случаях пользователь может одновременно использовать и ключевые кадры, и своё текстовое описание того, что должно происходить в видео.
Напомним, что прежде авторы Dream Machine – команда Luma AI также занималась нейросетями, но была известна прежде всего в сфере 3D и, среди прочего, специализировались на конвертации различного 2D-контента в трёхмерное пространство.
За полтора месяца, прошедшие с момента релиза, Dream Machine получила ряд важных обновлений. Это упомянутые выше ключевые кадры, а также возможность продлевать уже созданное видео так, что изначальные 5 секунд можно расширить вплоть до 60. Причём каждое продление можно сопроводить новым текстовым описанием.
Дополнительно команда объявила об использовании нового оборудования, которое увеличивает скорость генерации вдвое.
Примеры сгенерированного видео на сайте проекта.
Что касается будущих планов, то разработчики обещают продвинутые возможности редактирования генерации на лету. В этом случае пользователь, к примеру, одним кликом сможет заменять отдельные объекты, персонажей и целые локации в видео на другие. Таким образом открывается широкий простор для экспериментов и создания необычных сюжетов.
Такую особенность разработчики анонсировали ещё в июне и, очевидно, увидим мы её уже достаточно скоро.
Сильнейшим конкурентом Luma на данный момент является упомянутый выше Kling. Качество видео там весьма высокое, нейросеть многое позволяет бесплатно и недавно стала доступна глобально. Сильное качество генераций также предлагает Gen-3 от Runway, но исключительно платно и цены там пока неприятно удивляют.
Наконец, самым ожидаемым видеогенератором является Sora от создателей ChatGPT, её впечатляющие ролики удивили пользователей ещё в начале года, однако с тех пор широкой публике система всё ещё недоступна.