Найти тему
3025 подписчиков

#odd_facts #generative #video


Google выпустил Imagen Video, собственную версию системы, генерирующую видеоролики по текстовому описанию (в работе с генеративными нейросетями эта текст-команда называется промпт). Анонс состоялся всего через неделю после того, как Meta AI первой из технологических гигантов показала подобную нейросеть под названием Make-A-Video. Как и у Meta, гугловская система способна создавать пятисекундные ролики, фактически гифки, но чтобы как-то превзойти фэйсбуковскую модель, гугловцы делают эти ролики в высоком разрешении. Это не всегда очевидно, потому что изначально нейросеть генерирует всего 16 кадров, причем ужасного качества — 24 на 48 пикселей. Потом эту картинки последовательно прогоняют еще через две нейросети, которые улучшают разрешение отдельных картинок и улучшают анимацию, генерируя «промежуточные» кадры. В результате их становится 128 в формате 720p, что в общем немало, но некоторые ролики при этом выглядят странновато. На пейзажах артефакты практически незаметны. В кадрах с водой или сложными фактурами нейросеть уже «мылит» картинку, а вот искусственно созданные и анимированные лица или морды животных внимательного зрителя могут и напугать. Впрочем, видео все равно получается получше, чем у Facebook и чтобы подчеркнуть это гугловцы даже сгенерировали ролики с плюшевым мишкой, как и в анонсе Meta AI.

(Meta признана в РФ экстремистской организацией)

༼つ◕_◕༽つ @geekorama
1 минута
403 читали