Найти в Дзене
Герман Геншин

Я попробовал Sora от OpenAI, и, честно говоря, это довольно интересно

После месяцев ожидания технология генерации видео от OpenAI под названием Sora стала доступна для широкой публики. Я провел некоторое время, экспериментируя с этой ожидаемой технологией, и, честно говоря, остался немного разочарован. Как и все остальные подписчики ChatGPT Plus, когда Sora стала доступна для широкой публики, я получил возможность создавать свои собственные видео. Однако это скорее проба, чем полноценный продукт. Люди, которые платят за Sora, могут создавать клипы длиной до 20 секунд и получать разрешение 1080p. Для подписчиков Plus доступны клипы длительностью 5 секунд и качество до 720p. Вам просто нужно ввести свой запрос в текстовое поле, и через несколько секунд вы получите видеоклип, примерно так же, как это работает в Midjourney или других генераторах изображений. Одной из основных причин, почему «полный» опыт Sora ограничен 20 секундами, является наличие значительных проблем с этой технологией в плане связности. Чем дольше идет видео, тем больше ошибок и странны
Оглавление

Резюме

После месяцев ожидания технология генерации видео от OpenAI под названием Sora стала доступна для широкой публики. Я провел некоторое время, экспериментируя с этой ожидаемой технологией, и, честно говоря, остался немного разочарован.

Подписчики ChatGPT Plus получают 5-секундный тест Sora

Как и все остальные подписчики ChatGPT Plus, когда Sora стала доступна для широкой публики, я получил возможность создавать свои собственные видео. Однако это скорее проба, чем полноценный продукт. Люди, которые платят за Sora, могут создавать клипы длиной до 20 секунд и получать разрешение 1080p. Для подписчиков Plus доступны клипы длительностью 5 секунд и качество до 720p.

Вам просто нужно ввести свой запрос в текстовое поле, и через несколько секунд вы получите видеоклип, примерно так же, как это работает в Midjourney или других генераторах изображений.

Даже короткие клипы бывают очень разными по качеству

Одной из основных причин, почему «полный» опыт Sora ограничен 20 секундами, является наличие значительных проблем с этой технологией в плане связности. Чем дольше идет видео, тем больше ошибок и странных отклонений оно содержит.

Кроме того, Sora испытывает трудности с визуализацией моих запросов. Например, я попросил сделать клип со звездолетом, входящим в режим варпа, что является довольно распространенным мотивом в научной фантастике.

Ну, это отчасти то, что я имел в виду, но я бы не стал использовать это в своем полусыром видео на YouTube с говорящей головой.

В других случаях результат довольно точный, как, например, когда я спросил о вращающемся логотипе HTG из хрома.

Последней проблемой, с которой в настоящее время сталкивается Sora, является хоть какая-то физика. Я видел множество видео с животными, которые просто не двигаются правдоподобно, и когда я попросил показать что-то простое — шарик, катящийся по рельсу, она выдала мне это странное видео.

Даже когда видео визуально прекрасно, обычно именно движение и выдает, что это сгенерированный ИИ клип.

Sora ощущается гораздо менее зрелой по сравнению с генерацией изображений

Я не хочу создать впечатление, что Sora не впечатляет. Это значительное достижение, но на практике его использование напоминает ранние дни генерации изображений. Это было бы не так заметно, если бы не четко выверенный анонс Veo 2 от Google.

Видео из этой системы выглядят значительно лучше, чем у Sora, особенно когда речь идет о физике движущихся объектов.

Просто взгляните на этот официальный компиляцию от Google.

Хотя можно утверждать, что это выборочные примеры, несколько YouTube-блогеров уже получили доступ к Veo 2, и мнение, похоже, заключается в том, что Veo 2 существенно превосходит Sora.

Пока это просто интересная игрушка

Поиграть с Sora на некоторое время благодаря подписке, которую я уже имею, было весело, но я определенно не хочу платить 200 долларов в месяц за этот продукт в его нынешнем состоянии. Вам было бы намного выгоднее просто подписаться на сервис стоковых видео.

Учитывая, что Google предложил свои разработки, и принимая во внимание других конкурентов в этой сфере, таких как HeyGen и Runway ML, я ожидаю, что обновления и улучшения будут быстрыми и частыми. Если не по другой причине, так как OpenAI не устает в совершенствовании ChatGPT.

Я все еще вижу среднесрочную перспективу, где генерация видео при помощи ИИ будет способна на гораздо большее, и даже позволит создавать длинное содержание с точным соблюдением запросов и возможностью редактировать элементы внутри сцены. Однако этот день, скорее всего, все еще в нескольких годах, и пока это интересная, хоть и непрактичная, диковинка.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Новинка! На нашем канале в Яндекс Дзен появилась премиум подписка, которая позволяет читать статьи без рекламы и получать доступ к эксклюзивным материалам, недоступным обычным пользователям. Будем рады, видеть вас в числе премиум пользователей!
🏕️ Любите активный отдых на природе? Подписывайтесь на канал Поход лайфхак в Яндекс Дзен — кладезь полезных советов для любителей активного отдыха!

Вы также можете читать наши материалы в: