Нейросеть также может генерировать видео из заданных ей изображений.
Стартап Runway представил нейросеть Gen-2, генерирующую видео по текстовому описанию. Ее авторы участвовали в разработке Stable Diffusion — сервиса, который, так же как и Midjourney, создает картинки по текстовому запросу.
На сайте проекта говорится, что сервис способен создавать короткие ролики на основе заданного текста либо изображения. Запрос также может включать в себя как картинку, так и уточняющий текст.
Runway обещает предоставить доступ к Gen-2 широкому кругу пользователей в ближайшие недели. Сейчас компания предлагает записаться в лист ожидания.
Пока оценить работу нейросети можно по опубликованному Runway демонстрационному ролику. На сайте также можно увидеть ряд видео длительностью несколько секунд, которые сгенерировала предыдущая версия технологии, Gen-1.
На прошлой неделе создатели ChatGPT представили новую языковую модель GPT-4, способную обрабатывать не только текст, но и изображения. К примеру, она может рассказать о содержимом холодильника по его фотографии и предложить рецепты из продемонстрированных ей продуктов.
При этом картинки GPT-4 не генерирует. Но у нее есть другие достоинства: языковая модель успешно сдает профессиональные экзамены для людей и даже может обмануть человека, чтобы пройти «капчу».