Найти в Дзене

Что такое Sora? Объяснение текстово-видеоприложения от OpenAI.

Оглавление

Что такое Sora?

Sora — это генеративная модель искусственного интеллекта, превращающая текст в видео, разработанная компанией OpenAI, создателем ChatGPT и DALL·E 3. OpenAI утверждает, что она «может создавать реалистичные и imaginative сцены». Тем не менее, можно утверждать, что «реалистичные» может немного преувеличивать возможности модели, а также нельзя забывать, что у видео отсутствует звук; тем не менее, видеоролики, генерируемые из текстовых подсказок, выглядят впечатляюще.

Помимо текстовых подсказок, Sora также может брать изображение и превращать его в видео или использовать видеофрагмент для продления его во времени. Это имеет потенциал быть еще более полезным, хотя может выявить спорное понимание физики моделью.

Как работает Sora?

Sora основана на идеях других моделей OpenAI, а также включает множество новаторских подходов. Модель была обучена на неопределенном объеме видеоматериалов, включая как личные видео, так и фильмы, телешоу, реальные кадры, записи видеоигр и многое другое. Все эти обучающие материалы были аннотированы, в основном при помощи ИИ, что позволило Sora глубоко понять естественный язык и его связь с физическим миром.

Какой уровень качества у Sora?

Sora демонстрирует впечатляющие результаты. Хотя создаваемые ею видео не всегда выглядят реалистично, многие из них выглядят достаточно хорошо для поверхностного восприятия. Особенно хорошо получаются ландшафты, абстрактные узоры и мультфильмы или анимация в стиле стоп-кадров. Видео с людьми и животными может выглядеть хорошо, если они не слишком движутся, но как только появляется много движения, результаты обычно ухудшаются.

Насколько безопасна Sora?

Существует потенциал для создания дипфейков. Хотя существующие инструменты редактирования видео и ИИ уже облегчают их создание, текстово-видеомодели ИИ могут значительно увеличить способность недобросовестных людей генерировать такие видео с минимальными усилиями. В текущий момент OpenAI делает все возможное, чтобы Sora получала положительные отзывы, поэтому они внедрили основные защитные механизмы, чтобы предотвратить создание любых типов дипфейков.

Как попробовать Sora?

Sora в настоящее время доступна пользователям ChatGPT Plus и ChatGPT Pro. Пользователи ChatGPT Plus могут создавать ограниченное количество водяных знаков видео длиной до 720p и пяти секунд. Пользователи ChatGPT Pro могут создавать неограниченное количество невинетированных видео длиной до 1080p и 20 секунд.

На момент написания статьи Sora уже не принимает новых пользователей, даже среди подписчиков ChatGPT Plus. Однако это, вероятно, изменится по мере того, как OpenAI будет развивать Sora в коммерческий продукт.

Заключение

С учетом вышеизложенного, Sora представляет собой интересную комбинацию технологий и креативных возможностей в области генерации видео из текста, и ее значение будет только расти в будущем.

==> Хотите узнать про автоматизации на n8n? — Здесь основные курсы n8n, вы научитесь автоматизировать бизнес-процессы! <==

-2

OpenAI
60,9 тыс интересуются