141 подписчик
Nvidia представила нейросеть, которая создает видео из текста
Американская компания Nvidia на конференции IEEE по компьютерному зрению и распознаванию образов представила новую версию нейросети, генерирующей видео по текстовому описанию. Видео создается в разрешении либо 512x1024, либо 1280x2048 и состоит из 113 кадров длиной около пяти секунд. Нейросеть учитывает около 4,1 млрд параметров, из которых 2,7 млрд обучаются на видео.
Около минуты
20 апреля 2023