Google LLC представила Lumiere, систему искусственного интеллекта для создания видео, которая, по словам компании, превосходит предыдущие модели в этой области. Компания Alphabet Inc. описала технологию в исследовательском документе, опубликованном во вторник. По словам Google, Lumiere может создавать пятисекундные ролики с разрешением 1024 на 1024 пикселя. Он может генерировать ролики на основе текстовой подсказки или картинки, предоставленной пользователем, а также изменять существующие кадры.
Lumiere построен на основе двух различных моделей искусственного интеллекта. Первая, названная исследователями Google Space-Time U-Net, создает исходный кадр с низким разрешением в ответ на команду пользователя. Второй ИИ увеличивает разрешение ролика, в результате чего Lumiere выдает на выходе окончательный вид 1024 на 1024 пикселя.
По словам Google, модель Space-Time U-Net, которая генерирует первое видео низкого разрешения, основана на диффузионной архитектуре. Эта конструкция лежит в основ