139,9 тыс подписчиков

Модель искусственного интеллекта Google создает реалистичные видеоролики

4 марта 20244 мар 2024

1 мин

Несколько недель назад Google признала, что схитрила при представлении своей новой ИИ-модели Gemini. Части демонстрационного видео потенциального конкурента ChatGPT были отредактированы специалистами.

Новые видеоролики ИИ-генератора Lumiere, которые в конце января опубликовала Google, следует оценивать с осторожностью.

Изображение из открытых источников

Lumiere не только создает визуально потрясающие и реалистичные фрагменты видео по подсказкам, то есть с помощью текстовых команд. Lumiere также может анимировать изображения и редактировать существующие видео.

Благодаря последней функции одежду человека на видео можно будет изменить позже с помощью соответствующей подсказки. Стиль видео также можно корректировать – его можно трансформировать в комикс или стиль Лего. Анимацию можно адаптировать к стилю, заданному изображением. Это, например, даже может быть детский рисунок.

По данным Google, разработана новая технология специально для модели Lumiere. В отличие от существующих генераторов преобразования текста в видео, создание видео Lumiere не включает в себя серию последовательных ключевых кадров, которые в конечном итоге преобразуются в видео более высокого разрешения.

Google заявляет, что с помощью Lumiere видео создается целостно, за один раз. За это отвечает новая «пространственно-временная архитектура». В результате видео должно меньше дергаться и не иметь неприглядных элементов.

ИИ был обучен на 30 миллионах видеороликов. Каждое видео имеет длину 80 кадров. При скорости 16 кадров в секунду каждое видео длится пять секунд.

У Lumiere есть свои ограничения. Пока можно создавать только пятисекундные фрагменты видео с максимальным разрешением 1024 на 1024 пикселей. Даже исследователи Google описывают это как «низкое разрешение».