Найти тему
HTN

Нейросеть Sora — генератор сверхреалистичных видео станет общедоступной

В феврале компания Open AI представила нейросеть Sora, способную по текстовому описанию генерировать сверхреалистичные видео в разрешении FullHD. Возможности нейросети потрясли общественность — ролики получались практически не отличимы от реальных съемок. Однако несмотря на ажиотаж ее инструментарий пока доступен лишь ряду создателей контента: художникам, дизайнерам и кинематографистам. Сейчас технический директор OpenAI Мира Мурати сообщила, что нейросеть Sora станет доступна широкой публике позже в текущем году.

Нейросеть Sora, заявила техдиректор Open AI, сможет генерировать звуковое сопровождение к роликам. Финальный результат станет еще более качественным. Однако уже сейчас функционал продвинутой нейросети может содержать некоторые риски.

  Скриншот из видео, сгенерированного нейросетью Sora
Скриншот из видео, сгенерированного нейросетью Sora

Компания HarrisX проводила опрос с участием более 1000 американцев. Им предложили отличить сгенерированное ИИ видео от настоящего. Оказалось, что большая часть опрошенных ошиблась в 5 из 8 предлагаемых роликов.

Исследование указывает на то, что создаваемый с помощью генеративных нейросетей контент становится все более реалистичным. Отличить его от реальных съемок становится все сложнее.

  Скриншот из видео, сгенерированного нейросетью Sora
Скриншот из видео, сгенерированного нейросетью Sora

Китай стал первой страной, в которой ввели регулирование генеративных нейросетей. Общедоступные ИИ-генераторы должны будут получать специальную лицензию. К слову, Илон Маск и Стив Возняк (основатель Apple) еще год назад подписали открытое письмо, в котором содержались потенциальные риски развития ИИ для человечества.

  Соучредитель Apple — Стив Возняк
Соучредитель Apple — Стив Возняк

По словам технического директора Open AI Миры Мурати, нейросеть Sora не сможет создавать изображения общественных деятелей, как и нейросеть DALL-E. Видео от Sora также будут включать водяные знаки, но они не являются идеальной защитой и могут быть удалены из видео при помощи других ИИ или традиционных технологий.

Сейчас OpenAI работает над возможностью редактирования контента в видеороликах Sora, поскольку инструменты искусственного интеллекта не всегда создают точные изображения. «Мы пытаемся выяснить, как использовать эту технологию в качестве инструмента, с помощью которого люди смогут редактировать медиаконтент», — заявили в Open AI.

  Скриншот из видео, сгенерированного нейросетью Sora
Скриншот из видео, сгенерированного нейросетью Sora

Мурати уклонилась от ответа на вопрос, какие данные OpenAI использовала для обучения Sora.

«Я не собираюсь вдаваться в подробности использованных данных, но это были общедоступные или лицензированные данные», — заявила она изданию The Wall Street Journal. Мурати не подтвердила и не опровергла использование видео с крупных видеохостингов: YouTube и ряда запрещенных в России социальных сетей.

Видео с примерами работ, сделанных нейросетью Sora:

Технический директор отметила, что Sora использует контент фотохостинга Shutterstock, с которым у OpenAI заключено партнерское соглашение.

Мурати рассказала, что на сегодняшний день нейросеть Sora отличается от других моделей ИИ повышенными требованиями к вычислительным ресурсам. Стоимость доступа к нейросети пока не уточняется, но, по всей видимости, она будет сопоставима с платой за использование DALL-E (10 долларов в месяц).