161,7 тыс подписчиков

Вышла нейросеть Gen-2, способная создавать видеоролики по текстовому описанию

1 минута

21 прочтение

22 марта 2023

Нейросеть также может генерировать видео из заданных ей изображений.

Стартап Runway представил нейросеть Gen-2, генерирующую видео по текстовому описанию. Ее авторы участвовали в разработке Stable Diffusion — сервиса, который, так же как и Midjourney, создает картинки по текстовому запросу.

На сайте проекта говорится, что сервис способен создавать короткие ролики на основе заданного текста либо изображения. Запрос также может включать в себя как картинку, так и уточняющий текст.

Runway обещает предоставить доступ к Gen-2 широкому кругу пользователей в ближайшие недели. Сейчас компания предлагает записаться в лист ожидания.

Пока оценить работу нейросети можно по опубликованному Runway демонстрационному ролику. На сайте также можно увидеть ряд видео длительностью несколько секунд, которые сгенерировала предыдущая версия технологии, Gen-1.

На прошлой неделе создатели ChatGPT представили новую языковую модель GPT-4, способную обрабатывать не только текст, но и изображения. К примеру, она может рассказать о содержимом холодильника по его фотографии и предложить рецепты из продемонстрированных ей продуктов.

При этом картинки GPT-4 не генерирует. Но у нее есть другие достоинства: языковая модель успешно сдает профессиональные экзамены для людей и даже может обмануть человека, чтобы пройти «капчу».