Google представила ИИ-модель VideoPoet, способную генерировать аудио и видео на основе текстового описания. Она, как утверждают разработчики, заметно отличается от других подобных решений, и способна создавать даже длинные сюжетные ролики, а также редактировать готовые материалы. По заявлению Google, в отличие от других подобных нейросетей, использующих метод на базе диффузии с открытым исходным кодом, её решение основано на большой языковой модели (LLM) — такие обычно используются для генерации текста и кода (например, ChatGPT или Llama 2). Для обучения ИИ разработчики использовали 270 миллионов видео и более миллиарда пар текст/изображение, взятых из интернета и других источников. Google утверждает, что фирменная языковая модель позволяет создавать более длинные, чем у конкурентов, и при этом качественные видеоролики с минимумом артефактов и ограничений, особенно в случае с подвижными объектами. В арсенале VideoPoet — имитация различных движений камеры, множество визуальных стилей, с
Google запустила нейросеть VideoPoet для создания видеороликов
22 декабря 202322 дек 2023
43
1 мин