Найти в Дзене
2 подписчика

Sora - ИИ от OpenAI


OpenAI представила миру модель text-to-video - Sora. Эта "малышка" способна генерить, согласно промпту, видео длиной до минуты без потери качества.

Модель пока еще "сырая", но производит хорошее впечатление. На текущий момент открыт доступ только ряду тестировщиков, специалистов по информационной безопасности, а также профессионалов в сфере творчества. Они будут давать свои рекомендации по доработке и совершенствованию ИИ.

Sora способна генерировать сложные сцены с несколькими персонажами, определенными типами движения и точной детализацией объекта и фона. Модель понимает не только то, что запрашивает пользователь, но и то, как эти вещи существуют в физическом мире.

Sora довольно точно интепретирует эмоции, характер и визуальный стиль.

ИИ способна генерировать целые видео за один раз или удлинять сгенерированные видео. Также модель способна взять существующее неподвижное изображение и сгенерировать из него видео, анимируя содержимое изображения с точностью и вниманием к мелким деталям. Она также может взять существующее видео и расширить его или заполнить недостающие кадры.

Куда без недостатков. Она не всегда справляется с точным моделированием сложных сцен и испытывает проблемы с причинно-следственными связями. Например, человек может откусить кусочек от печенья, но после этого печенье может остаться целым или не будет следа от укуса. Также может путать направление указанного движения, а еще право и лево.

Все, созданные видео, будут помечены, как ИИ-контент, а также Sora будет проверять и отклонять текстовые запросы, которые нарушают правила использования, например, запросы, содержащие насилие, сексуальный контент, нецензурные изображения, изображения знаменитостей.

То, что представило OpenAI очень впечатляет. И как говорят разработчики у Sora огромный потенциал.

1 минута