Компания Google объявила о разработке Imagen Video - нейросети, способной создавать видео 1280×768 с частотой 24 кадра в секунду на основе письменной подсказки. В настоящее время проект находится на стадии исследования, но его появление через пять месяцев после появления Google Imagen указывает на быстрое развитие моделей генерации видео. На сайте официального релиза Imagen Video можно посмотреть примеры представленные командой. Спустя всего шесть месяцев после запуска генератора текста в изображение DALLE-2 от OpenAI, прогресс в области моделей распространения ИИ стремительно набирает обороты. Анонс Imagen Video от Google произошел менее чем через неделю после того, как компания Meta* представила свой инструмент ИИ для преобразования текста в видео - Make-A-Video. (*Meta - признана экстремистской и запрещена в России) Ключом к возможностям Imagen Video является "каскад" из семи диффузионных моделей, которые преобразуют исходный текст. Например, "медведь моет посуду" в видео
Imagen Video: Google представила нейросеть для создания HD-видеороликов по текстовому запросу
10 октября 202210 окт 2022
54
2 мин