135,5 тыс подписчиков

ИИ научился превращать текст в видео

30 сентября 202230 сен 2022

1 мин

Представлена новая система под названием Make-A-Video, которую разработали инженеры Meta* (признана экстремистской организацией на территории России). Как и следует из названия, пользователь может ввести текстовое описание того, что он хочет увидеть, а система с помощью искусственного интеллекта (ИИ) генерирует короткий ролик, соответствующий тексту. Видео пока что не слишком качественные, с размытыми объектами и искаженной анимацией, но все же система представляет значительный шаг вперед в области создания контента с помощью ИИ.

Make-A-Video сейчас генерирует 16 кадровые ролики с разрешением 64 на 64 пикселя, которые затем увеличиваются в размере с помощью отдельной модели ИИ до 768 на 768.

Создатели системы отмечают, что Make-A-Video обучается на парах изображений и подписей, а также на немаркированных видеоматериалах. Учебный контент получается из двух наборов данных (WebVid-10M и HD-VILA-100M), которые вместе содержат миллионы видеороликов, охватывающих сотни тысяч часов отснятого материала. Сюда входят стоковые видеоматериалы, размещенные на таких сайтах, как Shutterstock, и извлеченные из других сайтов в Сети.

Сейчас не известно, как и/или когда Make-A-Video станет общедоступным средством создания контента.