Мы рассмотрим пять самых популярных бесплатных нейросетей, пробежимся по их функционалу и интерфейсам, а также проведем сравнение результатов их работы на примере одного запроса.
Все нейросети, указанные в статье, бесплатные для ознакомления. Достаточно регистрации через Google-аккаунт.
Эксперимент
Для наглядности всем нейросетям был предложен один и тот же запрос, который сгенерировал ChatGPT-4. Вкратце он описывает кинематографичный ролик о ночной жизни в Токио.
Полный текст запроса:
“Create a cinematic video capturing the vibrant nightlife of Tokyo. The video should begin with sweeping aerial views of the city at dusk, transitioning into neon-lit streets bustling with activity. Feature close-up shots of iconic landmarks like Shibuya Crossing and Tokyo Tower, illuminated at night. Include scenes of people dining in izakayas, shopping in brightly lit stores, and enjoying the nightlife in Roppongi. Add sequences of traditional festivals with lanterns and modern dance clubs pulsating with energy. Use a mix of slow-motion and time-lapse techniques to convey the dynamic atmosphere. Incorporate ambient city sounds blended with a lively soundtrack to enhance the urban experience.”
Kandinsky Video
Kandinsky Video — нейросеть, созданная Сбером, может генерировать не только картинки, но и видео. Интерфейс максимально простой и понятный. На выбор предложены две генеративные модели: «Анимация» и «Видео», а также три варианта размера видео: 16:9, 9:16, 1:1.
Внизу находится поле для запроса. Туда необходимо ввести описание на русском или английском языке. Далее нажимаем «создать видео», и через несколько минут получаем на выходе ролик длиной несколько секунд. Когда все готово, есть возможность скачать получившийся результат или изменить запрос и попробовать еще раз.
Результат работы Kandinsky Video по нашему запросу можно увидеть ниже.
Runway
RunwayML-2 — это простой в использовании, но в то же время очень мощный инструмент для создания видео по текстовому запросу. Здесь есть возможность загрузить референсную картинку для улучшения результата и лучшего понимания нейросетью того, что вы от нее хотите.
В натройках можно указать множество параметров:
- Стиль
- Жанр
- Объект
- Действие
- Окружение
- Кадр
- Освещение
Но чтобы начать, достаточно просто ввести описание длиной до 320 символов в плашку запросов.
Вот что Runway выдал на тему ночного Токио:
Genmo
Genmo — это еще один генератор видео по тексту. Имеет стандартный функционал: окно запроса, возможность загрузить изображение в качестве исходника. Положительно выделяется наличием рандомайзера и количеством предварительных настроек.
Заранее можно выбрать движение камеры, пресет визуальных эффектов и еще несколько параметров в отдельном окне.
Давайте посмотрим, как ночной город видит Genmo.
Pika
Pika — это сервис, который лучше всего использовать для создания художественной анимации. Он предоставляет возможность творить в свободном стиле или выбрать один из предложенных.
На главной странице нас встречают уже созданные видео, которые можно взять за основу.
Внизу можно увидеть поле запроса с возможностью загрузить изображение, выбрать стиль и настроить необходимые параметры.
А вот что Pika выдает по нашему запросу:
Invideo
Invideo заметно отличается от всех, описанных ранее нейросетей. Она не генерирует видео, но монтирует его из стоковых исходников. По запросу мы получаем смонтированный ролик длиной несколько минут с закадровым голосом, музыкой, субтитрами. Также присутствует автоматическое деление на смысловые части.
В начале работы нам дают поле для запросов и несколько форматов на выбор.
Затем необходимо уточнить аудиторию, стиль видео и платформу публикации.
В итоге мы получаем готовое видео. Если необходимо, на этом этапе можно отредактировать каждую отдельную сцену или дополнить запрос.
Стоит отметить, что при экспорте есть функции, которые требуют платную подписку. Например, убрать вотермарки и логотип сервиса.
Получившийся результат:
Итоги
На момент написания этой статьи все нейросети для генерации видео представляют из себя не более, чем способ занятно провести вечер и создать забавный контент для соцсетей (что не плохо). Во всех случаях заметны ошибки, которые раньше были свойственны нейросетям, генерирующим изображения:
- Образы, которые возникают из ниоткуда и исчезают в никуда.
- "Проблема пяти пальцев".
- Абсолютно нелогичное расположение некоторых вещей на изображении.
- Низкое качество.
Будем надеяться, что в ближайшее время сгенерированные видео догонят по качеству сгенерированные картинки.