1K подписчиков

15 нейросетей для создания видео и анимации по тексту и изображению

Генерация видео и анимации с помощью ИИ облегчает жизнь рекламщикам, SMM-специалистам и всем, кто работает с контентом. Редакция Pressfeed.Журнала протестировала популярные нейросети и выяснила, чем они отличаются и как написать промт, чтобы получить хороший результат.

Нейросети с функцией создания видео — отличный инструмент для диджитал-специалистов. Они могут сгенерировать атмосферную анимацию для постов, видео для продвижения продукта, сделать обучающие, презентационные и рекламные ролики с озвучкой, аватаром и субтитрами. Это не просто хайп на волне популярности нейросетей, а реальная экономия времени и денег, если у вас нет штатного видеографа или аниматора.

Одни ИИ создают видео и анимацию с нуля по текстовому запросу, а в некоторые сервисы можно загрузить фото продукта и его описание. Нейросеть генерирует на их основе рекламный ролик или презентацию для маркетплейсов — иногда даже с логотипом и цветами из фирменного стиля компании.

Как создать промт в нейросети для видео и анимации

Чтобы получить нужный результат по текстовому промту, важно правильно написать запрос. Промты должны быть максимально простыми и прямыми — без витиеватых сравнений и сложных действий. Фразу «На фоне красивого заката выныривает голубой дельфин, а за ним плещутся волны» нейросеть, скорее всего, не поймет. Расскажите нейросети как можно подробнее, какое видео вам нужно. В каждом звене указываем по одному слову или фразе, например:

стиль: cinematic action (сцена из фильма), black and white film (черно-белая пленка), animation (анимация);
параметры кадра: long shot (общий план), wide angle (широкий угол), close up (крупный план);
объект: young man (молодой человек), black dog (черная собака), vase with flowers (ваза с цветами), lonely tree (одинокое дерево);
действие: standing (стоит), running (бежит), smiling (улыбается), walking (идет);
окружение: road (дорога), night city (ночной город), beach (пляж), forest (лес);
освещение: studio lighting (студийный свет), sunset (закат), sunrise (рассвет), warm lighting (теплый свет), nightfall (сумерки), moonlight (лунный свет).

Например, можно взять за основу схему, которую придумал автор YouTube-канала Theoretically Media. Он предложил формулировать запросы как цепочки из следующих пунктов: стиль, камера, объект, действие, окружение, освещение. По мнению автора и отзывам подписчиков, такие параметры позволяют получить самый точный результат.

Мы написали несколько промтов по этой схеме — на них и будем тестировать разные нейросети в этой статье:

сцена из фильма, общий план, небоскребы, ночной мегаполис, лунный свет / cinematic action, long shot, skyscrapers, night metropolis, moonlight;
анимация, широкий угол, черный кот бежит за летящей стрекозой по траве, теплый свет / animation, wide angle, black cat running after a flying dragonfly on the grass, warm lighting;
сцена из фильма, черноволосая девушка печатает на ноутбуке в светлой комнате, студийный свет / cinematic action, black hair girl typing on laptop, light room, studio lighting;
сцена из фильма, широкий угол, автомобиль движется по дороге в горах на закате / cinematic action, wide angle, car driving on the road, mountains, sunset;
черно-белая пленка, общий план, молодой мужчина стоит на берегу моря, рассвет / black and white film, long shot, young man standing on the seashore, sunrise.

Во многих нейросетях есть функция настройки движения камеры внутри редактора, но можно учесть это сразу в запросе — например добавить фразу: «приближение камеры» (camera zoom in). Если же у вас нет четких требований к результату, напишите краткий промт, допустим, ограничьтесь объектом и освещением или объектом и стилем: «море на закате», «кот в стиле аниме».

Большинство зарубежных сервисов с ИИ, даже если и работают с запросами на русском языке, все равно лучше воспринимают английский — так что в тестах мы будем использовать именно его.

При работе с нейросетями учитывайте, что генерация видео — более сложный процесс и пока не так развит, как создание изображений. Поэтому будьте готовы экспериментировать. Делайте несколько попыток с одним и тем же промтом или немного изменяйте запрос.

Поскольку ни одна статья не выдержит веса всех видео, которые мы создали во время тестов нейросетей, в текст добавили скриншоты и описания результатов. Полноценные ролики загрузили в облако, там вы можете просмотреть их все.

Нейросети для генерации видео и анимации с нуля

1. Kandinsky Video

Русскоязычная нейросеть Kandinsky Video от «Сбера» генерирует 5-секундные видео и 4-секундные анимации в веб-версии и в Телеграм-боте.

Что умеет: создает видео и анимацию по текстовому запросу.

Стоимость: бесплатно.

Для начала работы в веб-версии нужно зарегистрироваться. Сначала протестируем модель «Видео». Выбираем один из форматов соотношения сторон: 1:1, 16:9 или 9:1, и пишем промт на русском. Генерация занимает около 4 минут. Можно создать несколько видео подряд по одному и тому же запросу, чтобы найти более подходящий вариант.

Вот такой результат получился с промтом «сцена из фильма, общий план, небоскребы, ночной мегаполис, лунный свет». Видео неплохое, но скорее «мультяшное», чем реалистичное.

С изображением движущегося животного по запросу «анимация, широкий угол, черный кот бежит за летящей стрекозой по траве, теплый свет» нейросеть справилась хуже. У кота получилось три лапы, и они то и дело сливаются в одно пятно.

Девушка за ноутбуком тоже получилось не очень реалистичной, а с руками выходит совсем что-то непонятное.

А вот с неподвижной фигурой человека удается сгенерировать красивую картину. Например, вот результат по запросу «черно-белая пленка, общий план, молодой мужчина стоит на берегу моря, рассвет».

Также по запросу «сцена из фильма, широкий угол, автомобиль движется по дороге в горах на закате» Kandinsky Video выдал вполне живописную сцену с ретро-автомобилем.

В модели «Анимация» генерация более примитивная, и сцены не такие четкие. Здесь тоже можно выбрать одно из разрешений видео — 1:1, 16:9 или 9:16. Программа генерирует одну сцену длительностью 4 секунды или сразу несколько эпизодов, которые будут склеены в одно видео. Для каждой части напишите свой запрос и настройте движение камеры. Генерация занимает от 1,5 минут.

Опробуем снова наш первый промт с небоскребами и добавим к нему две сцены с более короткими запросами: «ночные облака» и «окно дома ночью». Получилась мерцающая анимация с плавными переходами и мрачной атмосферой.

Плюсы: бесплатный доступ и неограниченное число роликов, можно писать запросы на русском, есть встроенный редактор для склейки видео.Минусы: невысокое качество видео, нормально генерирует только обстановку и движущиеся предметы, животные и люди хорошо получаются только без движений.

2. «Шедеврум»

Нейросеть «Шедеврум» от «Яндекса» доступна только в мобильном приложении на iOs и Android. Для создания анимации нужно ввести запрос, а затем выбрать одну из четырех картинок-превью и эффект: например, приближение (зум), отдаление, панораму.

Что умеет: генерирует анимацию по текстовому запросу.

Стоимость: бесплатно.

Предложенные варианты дизайна. Слева промт: «анимация, широкий угол, черный кот бежит за летящей стрекозой по траве, теплый свет». Справа промт: «сцена из фильма, общий план, небоскребы, ночной мегаполис, лунный свет» 📷

В «Шедевруме» мы протестировали те же промты на русском языке, что и в Kandinsky Video. Однако эта нейросеть позволяет создавать только квадратные анимации длиной 4 секунды с постоянной сменой кадров, а не полноценные видео с непрерывным плавным движением объектов. Возможности «Шедеврума» схожи с режимом «Анимация» в Kandinsky.

Наименее удачными получились результаты с изображением людей: их положение и внешность изменяются слишком хаотично.

Промт: «сцена из фильма, черноволосая девушка печатает на ноутбуке в светлой комнате, студийный свет» 📷

Промт: «черно-белая пленка, общий план, молодой мужчина стоит на берегу моря, рассвет» 📷

Анимация с автомобилем на закате получилась атмосферной, но машина в процессе постоянно меняет внешний вид.

Промт: «сцена из фильма, широкий угол, автомобиль движется по дороге в горах на закате» 📷

Кот получился пропорциональным, но неподвижным — фактически это изображение с эффектом мерцания. Его можно использовать как акцентную картинку, но не полноценное видео.

Промт: «анимация, широкий угол, черный кот бежит за летящей стрекозой по траве, теплый свет» 📷

Зато сервис отлично подойдет для создания пейзажей — городских или природных. В «Шедевруме» более качественная анимационная рисовка, больше деталей и мягче переход — с тем же промтом.

Промт: «сцена из фильма, общий план, небоскребы, ночной мегаполис, лунный свет» 📷

Для подобных пейзажных видео можно не писать длинный запрос, а просто обозначить тему. Например, заказываем «море на закате», чтобы получить живописную сцену.

Плюсы: неограниченный бесплатный доступ, более живые и «мягкие» пейзажи.

Минусы: нейросеть пока не умеет создавать видео с движущимися объектами, качество анимации невысокое, есть только «квадратный» формат и нет десктоп-версии.

3. Runway ML Gen-2

Runway ML Gen-2 считается одной из самых продвинутых нейросетей для создания видео. Она делает очень реалистичные детализированные сцены с плавными переходами между кадрами. Также ИИ может сгенерировать несколько роликов с похожим оформлением — они отлично подойдут для склейки большого видео.

Что умеет: создает видео по текстовому описанию, картинке или по тому и другому одновременно.

Стоимость: бесплатно можно сгенерировать 105 секунд видео в качестве 720p на один аккаунт. Платная подписка от $12 в месяц дает больше попыток генерации в более высоком качестве и без водяного знака. Оплатить российской картой нельзя — нужна зарубежная карта или кошелек AliPay, CashApp Pay либо AmazonPay. Видео получаются действительно качественными, так что сервис стоит мороки с оплатой.

С текстовыми промтами Runway ML Gen-2 работает только на английском. Зарегистрируйтесь и введите запрос в диалоговое окно.

В дополнительных настройках можно отрегулировать движение камеры — например, по горизонтали, приближение или поворот.

В сервисе есть ручная настройка света, теней и графике. Но проще всего выбрать один из готовых фильтров: по умолчанию стоит Cinematic, но можно поставить, например, стиль аниме или пластилиновой анимации.

Если хотите создать несколько роликов в похожем оформлении, перед генерацией поставьте галочку в настройках в пункте Fixed seed. Также по умолчанию уже стоит параметр Interpolate для плавности перехода между кадрами — здесь галочку убирать не стоит.

Еще одна интересная настройка — параметр Prompt weight for preview images, который отвечает за соответствие результата промту. Можно выбрать значение от 1 до 30: чем больше число, тем ближе у запросу будет видео.

Например, такой результат выдала нейросеть по запросу «cinematic action, wide angle, car driving on the road, mountains, sunset» с фильтром Cinematic. Получилось довольно реалистично — чем не заставка к рекламе новой модели машины.

А видео ниже — по тому же промту, но с использованием фильтра Anime. Вышла очень атмосферная сцена с мягкими цветами и красивым изменением света и тени.

Протестируем и другие запросы, которые составили ранее. Так, по описанию «cinematic action, long shot, skyscrapers, night metropolis, moonlight» получилась очень реалистичная и детализированная сцена ночного города. Кстати, это первая нейросеть, которая сделала «живую» картинку города, а не рисованную анимацию.

Протестируем генерацию по картинке и запросу. Здесь нейросеть больше опирается не на описание, а на изображение: она добавляет движение элементам картинки. Какие детали будут двигаться, можно настроить вручную. А вот поставить готовый фильтр здесь не получится.

Реалистичные руки оказались слишком сложной задачей для нейросети. Зато ИИ добавил естественное движение волос, будто от легкого ветерка.

Увы, с бегом кошки на основе фото нейросеть тоже справилась плохо — лапы и голова движутся хаотично и принимают странные формы.

Еще один вариант генерации по картинке с котенком, на котором он должен был поворачивать голову, тоже оказался не самым удачным: нейросеть вместе с движением сильно изменяет внешний вид объекта.

Также попробуем создать анимацию со стоящим человеком по запросу «black and white film, long shot, young man standing on the seashore, sunrise»: в целом, получилось классно и довольно реалистично.

В Gen-2 стандартная длина видео — 4 секунды, но его можно автоматически продлевать, пока не закончатся доступные секунды на вашем тарифе. Также есть возможность сохранять удачные промты и использовать в качестве пресетов.

Плюсы: можно генерировать вполне реалистичные видео с обстановкой и предметами, увеличивать длительность записи, создавать серию роликов в едином стиле, есть набор готовых фильтров. Справляется с анимацией людей лучше, чем другие сервисы.

Минусы: бесплатные возможности ограничены — по истечении лимита генераций придется создать новый аккаунт.

4. Genmo

В Genmo текстовые промты можно писать как на английском, так и на русском. Можно не придумывать полноценный запрос самостоятельно, а ввести короткую фразу — нейросеть сама предложит несколько вариантов, как расширить описание.

Можно настроить направление камеры, формат, длительность видео: 2, 4 или 6 секунд, интенсивность движения, зациклить анимацию и сгенерировать до 3 вариантов за раз. Также есть набор визуальных эффектов — например, Wheel, Tunnel, Spiral.

Что умеет: генерирует видео по текстовому запросу или картинке.

Стоимость: бесплатно дается 100 секунд видео в день — этого вполне достаточно для создания небольших роликов. По подписке за $10 можно создавать записи общей длительностью до 1 тыс. секунд в день и скачивать их без водяного знака. Оплатить можно зарубежной картой или кошельком Cash App Pay.

Так выглядит результат по нашему промту с небоскребами без эффектов:

Промт: cinematic action, long shot, skyscrapers, night metropolis, moonlight 📷

А так — с применением пресета Tunnel. Откровенно говоря, эффект странный, но может хорошо подойти для какой-нибудь рекламы в стиле ретро с другим объемтом в главной роли.

Теперь опробуем генерацию видео с животными. По запросу «animation, black cat runs after a flying dragonfly on the grass, warm lighting» кот получился симпатичным, но он сидит на месте, а не бежит. Другие попытки тоже не увенчались успехом — при беге у животного лапы движутся хаотично и «отрываются», появляются лишние хвосты.

Также опробовали промт с машиной на закате. Получилась сцена будто из фантастического фильма или компьютерной игры — вполне симпатично.

Промт: cinematic action, wide angle, car driving on the road, mountains, sunset 📷

Анимация с человеком у моря тоже подходящая: у парня руки в карманах и нет странных движений.

Теперь протестируем создание видео по картинке на основе фото девушки с ноутбуком. Загружаем изображение, и нейросеть автоматически пишет по нему текстовый промт, который можно отредактировать перед генерацией.

В результате ИИ немного изменил лицо, прическу и одежду девушки, добавил движение рук — правда, они получилось немного размытыми. Побочный эффект — нейросеть «оживила» предметы на столе, но это пишем на полтергейста.

Плюсы: бесплатный доступ возобновляется каждый день — лимита хватает на несколько коротких или один большой ролик. А еще можно создавать атмосферные видео по картинкам и добавлять к ним готовые пресеты.

Минусы: при генерации людей и животных придется перебрать много вариантов, чтобы получить более удачный.

5. Stable Video Diffusion

Сервис создан на основе популярной нейросети для создания картинок Stable Diffusion. Пользователи отмечают, что Stable Video Diffusion хорошо справляется с передачей объемных объектов.

Что умеет: генерирует видео по картинке и текстовому промту.

Стоимость: бесплатно дается 40 кредитов в день — на них можно сгенерировать три–четыре 4-секундных видео. Есть возможность докупить от 500 кредитов (примерно 50 генераций) за $10, оплата только зарубежной картой.

Сначала создадим видео по описанию: пишем промт на английском, выбираем формат и при желании — один из 17 предложенных стилей.

По запросу нейросеть сначала выдает четыре картинки-превью. Выбираем понравившийся вариант и настраиваем дополнительные параметры положения камеры: приближение или отдаление, тряска, прокрутка или поворот. В настройках Advanced также можно указать амплитуду движений (раздел Motion Strength) и количество шагов (раздел Steps) — чем больше значение, тем лучше качество видео, но медленнее генерация.

Получился вид на город с движущейся водой. Правда, примененный эффект прокрутки камеры по кругу не очень заметен, зато картинка объемная.

С бегущим котом по составленному промту снова не удалось получить хороший результат: сначала картинка отличная, а потом лапы и хвост деформируются.

Промт с машиной на закате протестировали с фильтром Analog film и эффектом поворота камеры: получилась красивая сцена, как из старого фильма. Но при движении камеры автомобиль и разметка на дороге «поплыли».

Промт со стоящим человеком, увы, не дал хорошего результата: хотя парень не двигается, его голова постепенно деформируется в Голлума.

При генерации видео по своему изображению аналогично можно настроить параметры съемки. Но результат получается не самым удачным: например, людям нейросеть добавляет смазанные хаотичные видео.

Плюсы: можно выбирать превью и стили при создании видео по описанию, есть отличные инструменты для работы с динамикой и киноэффекты. Получаются красивые объемные анимации с окружением и предметами. Есть функция генерации роликов по своей картинке.

Минусы: плохо справляется с анимацией людей и животных, количество бесплатных генераций в день ограничено.

6. Pixverse

На Pixverse вы выбираете один из трех вариантов генерации: по тексту, картинке и персонажу. Второй и третий варианты фактически одинаковы, просто в последнем делается акцент на создание видео по фото человека или рисунку героя, изображение получается более натуральным.

Что умеет: генерирует видео по описанию и картинке.

Стоимость: бесплатно дают 10 генераций при регистрации плюс 5 генераций ежедневно, видео загружаются с водяным знаком. 100 роликов в месяц без лого доступно по подписке стоимостью от $4. Оплатить можно с кошельков AliPay и Stripe.

Для начала протестируем генерацию видео по описанию. В редакторе вводим свой запрос, добавляем негативный промт — например, исключаем лишние конечности (extra limb), а также выбираем один из четырех стилей: Realistic, Anime, 3D Animation, CG.

Например, такую девушку сгенерировала нейросеть по запросу «cinematic action, black hair girl typing on laptop, light room, studio lighting» с выбранным стилем anime. В видео периодически теряется четкость кадра, но нет искажений анатомии.

С промтом «black and white film, long shot, young man standing on the seashore, sunrise» получилась реалистичная анимация с неподвижным человеком:

А вот по запросу с бегущим котором и стилем 3D-анимации нейросеть добавила интересный мультяшный лес, но кот снова вышел пугающим.

Промт: animation, wide angle, black cat running after a flying dragonfly on the grass, warm lighting 📷

Зато анимация с ночными небоскребами вполне удачная, хоть здесь и движется только камера:

При создании видео по картинке Pixverse предлагает настроить вручную, какие объекты и в каком направлении будут двигаться, а также изменение положения камеры.

Результат соответствует настройкам, но объект немного деформируется:

При генерации по персонажу в нейросеть можно добавить фото человека и написать к нему промт. Такой результат с минимальным движением получился при совмещении изображения и промта «black and white film, long shot, young man standing on the seashore, sunrise».

Также в нейросети есть функция Upscale: с помощью нее можно добавить детализации сгенерированным видео.

Плюсы: анимация с минимальным движением по фото и текстовому запросу вполне реалистичная, есть набор стилей-шаблонов, можно добавить негативный промт.

Минусы: при интенсивных движениях объекты деформируются.

7. Pika

Сервис Pika Labs, ранее доступный внутри Discord, получил полноценную веб-версию, которая позволяет генерировать короткие анимации с минимальными движениями на основе описания и фото.

Что умеет: создает анимацию по текстовому запросу и изображению.

Стоимость: при регистрации дарят 25 генераций, далее бесплатно можно генерировать 3 ролика по 3 секунды в день. Подписка от $8 дает больше генераций и загрузку видео без водяного знака. Оплатить можно иностранной картой, кошельком Cash App Pay или Amazon Pay.

При генерации видео по текстовому промту вы выбираете один из шаблонов стилей, например, Natural или 3D — и нейросеть сама добавит к запросу нужные фразы.

Также в сервисе можно настроить ракурс кадра, формат, интенсивность движения, количество кадров в секунду, степень соответствия запросу, добавить негативный промт и скорость. Параметры можно сохранить и скопировать из предыдущей генерации, чтобы получить результат в похожем стиле.

По запросу с автомобилем на закате в горах сцена получилась в целом подходящей, но не очень четкой.

Небоскребы вышли менее детализированными, чем в других нейросетях, и мерцание огней незаметное.

Люди по текстовому запросу получаются скорее мультяшными, чем реалистичными, например, девушка с ноутбуком по нашему промту. Зато благодаря ракурсу не видно рук — нет их деформации.

Черно-белая сцена с парнем на берегу моря получилась удачной, но нейросеть сделала более крупный план, чем мы заказывали.

Более реалистичного человека можно получить в генерации по фото, но движения будут минимальные — например, моргание глаз и небольшое приближение камеры.

По подписке также доступны продление ролика на 4 секунды, озвучка текста с созданием аватара по фото и улучшение качества видео.

Плюсы: есть шаблоны стилей и возможность ввести негативный промт.

Минусы: хорошо справляется с минимальными движениями объектов, а реалистичные люди генерируются только по фото.

Нейросети для создания рекламных, обучающих роликов и презентаций

8. Visper

AI-сервис Visper интерфейс работает на русском языке. Здесь можно выбрать женский или мужской аватар либо персонажа из представленных шаблонов, подобрать цвет фона, добавить музыку, вставить текст для озвучки либо загрузить свое аудио. На бесплатном тарифе длительность одного ролика не превышает 20 секунд, скачать его тоже нельзя (предприимчивые пользователи на форумах рекомендуют использовать захват экрана). С платным доступом появляется возможность загрузить фото своего лица.

Что умеет: создает видео с говорящими аватарами.

Стоимость: бесплатно — 2 минуты генерации в месяц. Поминутный тариф от 90 рублей за минуту дает загружать видео без водяного знака, есть и подписка — от 1490 рублей за 20 минут генерации в месяц.

Настраиваем аватар, добавляем речь. В результате текст озвучен без ошибок, но голосу и позе девушки не хватает естественности — сразу видно, что это робот.

Также на фон можно вставить свою презентацию:

Плюсы: простой интерфейс на русском.

Минусы: небольшой набор шаблонов, возможности бесплатного тарифа очень ограничены.

9. Veed.io

Нейросеть Veed.io работает на английском, но поддерживает русский язык. Для создания видео с персонажем нужно использовать функцию Create Avatar Video. В редакторе выбираем аватар из списка, голос и цвет фона, вставляем текст для озвучки.

Что умеет: генерирует говорящие аватары.

Стоимость: бесплатно можно создавать до 1,5 минут видео и загружать их с водяным знаком в качестве 720p. Подписка от $12 дает возможность скачивать ролики без логотипа в более высоком качестве и создавать аватары на основе своих фото. Оплатить можно зарубежной картой, через PayPal или Google Pay.

Настраиваем героя и пишем текст для озвучки. Результат вполне качественный: артикуляция соответствует речи, движения головы и мимика естественные — аватар больше похож на реального человека, чем на робота.

Также внутри сервиса есть видеоредактор, в котором можно создавать ролики со стоковыми видео.

Плюсы: большой выбор шаблонов, реалистичная речь и движения аватара.

Минусы: практически нет шаблонов со славянской внешностью, а загрузить свое фото можно только на платном тарифе.

10. Designs.ai

Сервис Designs.ai предоставляет целвый набор инструментов для работы с изображениями и видео: от генерации картинок по описанию и замены лица на фото до создания логотипов и брендированных роликов.

Что умеет: создает ролики на основе шаблонов и стоковых видео.

Стоимость: все функции, кроме загрузки без водяного знака, доступны бесплатно в течение 7 дней. Платная подписка предоставляет лицензию на стоковые ролики и убирает водяной знак. Стоит от $19 в месяц, оплатить можно зарубежной картой.

Протестируем функцию Video Maker: здесь можно создавать рекламные и обучающие ролики на основе описания и стоковых видео.

В каталоге есть и готовые шаблоны, разделенные по темам — от недвижимости до искусства.

В выбранном шаблоне можно заменить видео, текст, дизайн, переходы и добавить музыку или озвучку текста. Вот пример получившегося ролика.

Также есть функция видео на основе текстового описания — нейросеть подберет видеослайды, отредактировать их можно вручную. А еще для создания брендированного ролика можно загрузить свои файлы и добавить логотип.

Плюсы: можно быстро создавать короткие ролики и презентации на основе шаблонов, если вам не нужна оригинальность.

Минусы: короткий бесплатный период — после окончания придется создавать новый аккаунт.

11. Lumen5

Lumen 5 создает видео на основе текста или уже опубликованной статьи или поста, а также позволяет сделать озвучку и создать «говорящую голову».

Что умеет: генерирует ролики на основе текста и стоковых видео.

Стоимость: 5 роликов в месяц длительностью до 2 минут каждый можно создавать бесплатно. Генерировать видео безлимитно без логотипа сервиса дает подписка за $29 в месяц, оплата картами иностранных банков.

Протестируем функцию генерации видео по тексту: нейросеть делает краткую выжимку, на основе которой создадут ролик. При желании синопсис можно отредактировать.

Затем Lumen5 делает ролик на основе одного из дизайн-шаблонов и стоковых видео. В редакторе можно изменить ролики из внутренней библиотеки, переместить текст, поменять оформление, настроить длительность слайдов и фоновую музыку.

Вот пример простого видео, которое у нас получилось. Кстати, брендированную вставку нейросети в конце после скачивания можно обрезать самостоятельно в любом видеоредакторе.

Плюсы: удобный редактор, есть бесплатная генерация коротких роликов.

Минусы: на бесплатном тарифе не так много шаблонов оформления.

12. Pictory

Pictory — многофункциональный видеоредактор, который помогает создавать ролики для бизнеса.

Что умеет: генерирует ролики на основе текста и стоковых видео.

Стоимость: бесплатный доступ ко всем функциям дается на две недели, можно создать 3 ролика без ограничения по длительности. Подписка от $19 позволяет генерировать от 30 видео в месяц. Оплатить можно зарубежной картой или через PayPal.

В Pictory есть несколько функций:

Script to video — генерация роликов по описанию с помощью стоковых видео;
Article to video — создание видео на основе текста и картинок из статьи или поста в блоге;
Edit Video using Text — генерация субтитров к видео, добавление логотипа;
Visuals to Video — обычный редактор для склейки нескольких фото и видео в один ролик.

Протестируем функцию Script to video и введем в диалоговое окно рекламный текст.

Нейросеть сама разбивает текст на части и поставляет видео по теме. Вы можете отредактировать субтитры, настроить их стиль, заменить видео на другие, добавить корпоративные цвета и логотип, фоновую музыку и озвучку текста от AI-ассистента. Озвучка на русском доступна только премиум-голосами и с ограничением в 5 минут — зато она получается довольно естественной.

Такое рекламное видео о надувных матрасах у нас получилось. Нейросеть сама создала и синхронизировала субтитры, а стоковые ролики выглядят вполне естественно.

Плюсы: много инструментов для создания брендированных роликов.

Минусы: бесплатный тариф ограничен по времени — чтобы продолжить работу с сервисом, придется создать новый аккаунт.

13. Elai.io

С Elai.io вы можете сгенерировать видео с озвучкой от реалистичного аватара, а также создать ролик на основе текста, статьи, презентации или общей темы.

Что умеет: создает видео с аватарами, генерирует ролики на основе текста и стоковых видео.

Стоимость: бесплатно можно сгенерировать одно или несколько видео общей длительностью до 1 минуты в 1080HD. Подписка стоит от $23 и позволяет создать 15 минут видео в месяц без водяного знака, оплата зарубежными картами.

После регистрации выбираем одну из функций — генерация видео на основе готового шаблона, по тексту или презентации либо создание аватара.

В библиотеке аватаров выбираем подходящего реалистичного персонажа.

Далее в редакторе добавляете текст для озвучки, выбираете голос, настраиваете фон, при необходимости добавляете шаблон дизайна, стикеры, фоновую музыку, стоковые видео. На платных тарифах также можно создать собственный аватар на основе фото или сделать маскота.

Аватар получается с довольно естественными движениями и мимикой, но по голосу заметно, что это робот.

Плюсы: много инструментов для генерации роликов для бизнеса: от создания аватаров до генерации по тексту.

Минусы: бесплатный лимит ограничен — для продолжения работы придется создать новый аккаунт.

14. Colossyan

Colossyan позволяет создавать видеопрезентации с нуля прямо внутри сервиса и добавлять озвучку реалистичных аватаров.

Что умеет: генерирует «говорящие головы», создает ролики с озвучкой на основе текста с добавлением стоковых картинок и видео.

Стоимость: после регистрации дается бесплатный двухнедельный доступ, можно сгенерировать 5 минут видео. Платная подписка от $19 долларов позволяет создавать от 10 минут видео в месяц без водяного знака. Оплата иностранными картами.

В начале работы над роликом выбираете аватар из внутренней библиотеки и настраиваете его размер.

Далее создаете слайды с подписями, в каждом вводите текст для озвучки в окно Script, выбираете язык и голос, настраиваете скорость речи.

Можно отредактировать цвет фона и стиль текста вручную или воспользоваться одним из шаблонов, а еще добавить стоковые картинки и видео.

Также внутри сервиса есть функция создания диалога между двумя персонажами и загрузки своего голоса из аудиофайла для генерации озвучки.

Результат — видео с довольно реалистичной речью и мимикой.

Плюсы: полноценный редактор для видеопрезентаций с озвучкой аватара.

Минусы: бесплатная генерация ограничена, для продолжения работы после окончания стартового периода понадобится новый аккаунт.

15. FlexClip

Внутри ИИ-сервиса FlexClip есть множество инструментов для создания видео на основе текста со стоковыми видео и изображениями, а также озвучка текста и генерация субтитров.

Что умеет: создает ролики по тексту, описанию, шаблону, статье на основе стоковых и загруженных вами фото и видео.

Стоимость: бесплатно можно сгенерировать видео в качестве 720p длительностью до 10 минут. Создавать ролики без водяного знака и без ограничений по длительности можно по платной подписке от $9,99, оплата зарубежными картами либо через PayPal.

Протестируем функцию AI Video Script. В диалоговое окно вводим нужный текст, и на его основе нейросеть создает ролик из нескольких сцен и субтитрами. Также можно изначально взять один из готовых шаблонов и изменить его под себя.

В каждом слайде предлагают отредактировать текст, заменить контент на другое стоковое видео или фото либо загрузить свой файл, настроить длительность.

Далее накладываете музыку, добавляете стикеры и визуальные эффекты.

Функция Ai Video Generator позволяет создавать ролики по короткому описанию — нейросеть сама подберет фото и видео и текстовое сопровождение. А если прикрепить ссылку на статью, видео будет сгенерировано на основе выжимки из нее. После этого тоже можно настроить все параметры, как мы рассказали выше.

Плюсы: длительность бесплатной генерации дольше, чем у других сервисов. Есть большой выбор стоковых медиа и возможность загрузить свои файлы.

Минусы: по окончании бесплатного лимита нужно создавать новый аккаунт.

Что в итоге

Пока что нейросети способны создавать с нуля красивые реалистичные анимации только с пейзажами и предметами. Движение животных и людей они передают гораздо хуже и нормально генерируют только минимальные движения. Для хорошего результата порой нужно сделать несколько попыток по одному и тому же промту. Однако ИИ-инструменты постоянно совершенствуются, так что, возможно, уже скоро эта проблема будет решена.

При этом создание реалистичных аватаров и роликов на основе автоподбора стоковых видео уже сейчас работает отлично. Нейросети вполне способны создать рекламное или обучающее видео на основе текста.