Добавить в корзинуПозвонить
Найти в Дзене

OpenAI только что выпустила приложение для обмена гиперреалистичными нейросетями

Ключевые заметки На этой неделе компания OpenAI анонсировала два новых продукта на основе ИИ: Sora 2 — новую видеомодель на основе ИИ, и Sora — приложение для создания такого контента и обмена им. В Sora 2 реализована более реалистичная физика и улучшена связность между кадрами, а также синхронизирован звук. Приложение Sora позволяет создавать такие видео и делиться ими, а также добавлять друзей прямо в ролики с помощью функции Cameo. На мой взгляд, риски, связанные с дезинформацией, намного превышают возможные преимущества. В прошлом году я написал, что нам всем стоит бояться Соры, видеогенератора с искусственным интеллектом от OpenAI. Сора изначально обещала создавать гиперреалистичные видео, которые, хотя и впечатляли некоторых, меня пугали. В то время как поклонники ИИ видят будущее за фильмами и сериалами, созданными искусственным интеллектом, я вижу будущее, в котором никто не сможет отличить реальность от подделки. На мой взгляд, единственная цель этой технологии — массовая дези

Ключевые заметки

На этой неделе компания OpenAI анонсировала два новых продукта на основе ИИ: Sora 2 — новую видеомодель на основе ИИ, и Sora — приложение для создания такого контента и обмена им.
В Sora 2 реализована более реалистичная физика и улучшена связность между кадрами, а также синхронизирован звук.
Приложение Sora позволяет создавать такие видео и делиться ими, а также добавлять друзей прямо в ролики с помощью функции Cameo.
На мой взгляд, риски, связанные с дезинформацией, намного превышают возможные преимущества.

В прошлом году я написал, что нам всем стоит бояться Соры, видеогенератора с искусственным интеллектом от OpenAI. Сора изначально обещала создавать гиперреалистичные видео, которые, хотя и впечатляли некоторых, меня пугали. В то время как поклонники ИИ видят будущее за фильмами и сериалами, созданными искусственным интеллектом, я вижу будущее, в котором никто не сможет отличить реальность от подделки. На мой взгляд, единственная цель этой технологии — массовая дезинформация.

За прошедшие полтора года эти видео, созданные искусственным интеллектом, не только стали более реалистичными, но и более доступными, поскольку такие компании, как Google делают свои инструменты доступными для всех, кто готов платить. Именно в такой ситуации мы оказались после последних анонсов OpenAI: Sora 2, новая модель искусственного интеллекта для создания видео со звуком, а также новое приложение Sora для создания продуктов с помощью искусственного интеллекта и обмена ими.

Сора 2

OpenAI позиционирует Sora 2 как значительно улучшенную версию Sora, сравнивая их с GPT-3.5 и GPT-1 соответственно. Компания заявляет, что новая модель может генерировать сложные видеоролики, которые не могли создавать предыдущие модели. В частности, это касается олимпийской гимнастической программы, мужчины, выполняющего сальто назад на доске с веслом, которое «точно» моделирует физику воды, а также фигуриста, выполняющего тройной аксель с кошкой на плече.

Одним из распространённых недостатков видеомоделей с искусственным интеллектом является их неспособность понимать физику реального мира. Изображение может выглядеть реалистично, но элементы могут хаотично сливаться друг с другом, а другие могут исчезать и появляться без всякой логики. OpenAI утверждает, что Sora 2 не так часто допускает подобные ошибки. Промахнувшийся баскетбольный мяч не появится в кольце волшебным образом, а отскочит от щита, как и следовало ожидать. Компания предупреждает, что модель всё ещё несовершенна, но она постоянно совершенствуется. Исходя из этого, можно сказать, что модель лучше справляется с непрерывностью между разными кадрами. Если верить OpenAI, ваши видео должны быть последовательными, и вы должны иметь возможность задавать различные стили, в том числе «реалистичный», «кинематографичный» и «анимешный».

Пожалуй, самым большим достижением Sora 2 является возможность добавлять в модель элементы реального мира. OpenAI называет эту функцию Cameo. Вы можете добавить в модель Sora 2 реальных людей и попросить ИИ сгенерировать из них любое видео по вашему желанию. OpenAI приводит несколько примеров того, как их сотрудники добавляли себя в различные видео, и хотя качество не всегда было на высоте, это огромный шаг вперёд по сравнению с временами JibJab.

Как и модель Veo 3 от Google, Sora 2 может генерировать видео с реалистичным звуком. Видео с анонсом демонстрирует это: слон рычит, фигурист скользит по льду, вода плещется о землю. Но что ещё более впечатляюще (и тревожно), люди говорят. Сэм Альтман, созданный искусственным интеллектом, в этом видео рассказывает о новой модели и приложении. И хотя для тех из нас, кто в теме, очевидно, что это искусственный интеллект, я могу представить, что многие люди даже не догадаются, что в ролике не настоящий Альтман.

Приложение Sora

OpenAI утверждает, что приложение Sora появилось как «естественная эволюция коммуникации.» Компания рассматривает его как способ, с помощью которого люди могут создавать и переделывать ИИ-модели других пользователей, особенно с учётом возможности загрузить в модель собственное лицо и черты.

На данный момент приложение доступно только по приглашению, хотя сегодня вы можете бесплатно скачать его в App Store. Однако вы можете получить представление о возможностях приложения из демонстрационного видео, опубликованного OpenAI во вторник, а также из постов людей, у которых уже есть доступ.

Первый пример демонстрации OpenAI — это двойная камео-сцена с участием научного сотрудника OpenAI Билла Пиблса и Сэма Альтмана. Видео начинается с общего плана, на котором двое мужчин разговаривают, затем крупным планом показывают, как Пиблс быстро рассказывает о доходах приложения, затем крупным планом показывают, как Альтман слушает его тираду, после чего снова показывают общий план. На первый взгляд это видео похоже на те, что вы обычно пролистываете в TikTok или Reels, но оно полностью создано искусственным интеллектом.

Сотрудники OpenAI демонстрируют ряд других предварительно сгенерированных примеров, в том числе Cameo, который превращается в мультфильм, другой Cameo, который переключается в режим аниме, и ещё один, который генерирует «новостной» отчёт о пристрастии одного из сотрудников к кетчупу. (Должен сказать, что последний пример довольно отвратительный.) Они также демонстрируют ремиксы на видео, которые вы находите в ленте, поскольку вы можете попросить Сору изменить видео по своему усмотрению. На одном видео Пиблз снимается в «рекламе» одеколона Sora 2, но на других видео его заменяют зубной пастой или снимают полностью на корейском языке.

Эти видео довольно реалистичны: в одном из них вы думаете, что просто смотрите запись теннисного матча, но оказывается, что это камео Рохана Сахаи из OpenAI. После того как «Сахаи» выигрывает матч, видео переходит к его «интервью», в котором он благодарит хейтеров. Другие видео явно созданы искусственным интеллектом, но, опять же, не настолько, чтобы это заметили большинство пользователей.

Безопасность и охрана, по мнению OpenAI

Cameo может показаться кошмаром с точки зрения конфиденциальности и безопасности, хотя у OpenAI есть некоторые средства защиты. Вы не можете просто использовать чьё-то лицо для любых видео, и вы можете загрузить на платформу только своё собственное лицо. Настройка функции Cameo в приложении проста, хотя и крайне неприятна. Приложение отсканирует ваше лицо, как при настройке Face ID на iPhone, а затем отправит данные в «системы» OpenAI для «многократной проверки», чтобы заблокировать самозванцев или пользователей, которые могут захотеть создать ваши Cameo без вашего согласия. После подтверждения вы сможете выбрать, кто сможет создавать ваши Cameo: все пользователи, друзья, пользователи, которых вы специально одобрили, или только вы.

Что касается самих видео, то приложение Sora накладывает видимый водяной знак на любой клип, экспортированный из приложения. Если вы уже видели какое-либо из этих видео в интернете, то заметили на каждом из них небольшую маркировку «Sora», похожую на водяной знак, который вы видите на клипах TikTok, экспортированных на другие платформы. Кроме того, используются модели логического вывода, которые блокируют создание пользователями «вредного» контента, особенно в отношении Cameos.

Если вы подросток и пользуетесь приложением Sora, вы не сможете прокручивать ленту бесконечно. После некоторого времени прокрутки будет действовать период ожидания, чтобы вы не тратили часы на просмотр этих видео с искусственным интеллектом. Хотя для взрослых аккаунтов такого ограничения нет, приложение будет «подталкивать» вас к тому, чтобы вы сделали перерыв.

Кто просил об этом?

При всём уважении к OpenAI и её команде по обеспечению безопасности, это приложение, похоже, обернётся катастрофой по многим причинам.

Во-первых, OpenAI упростила создание гиперреалистичных коротких видеороликов до уровня запроса Siri о погоде. Я понимаю, что на всех этих видео есть водяные знаки, но не нужно быть особо умелым, чтобы их убрать — по крайней мере, так, чтобы большинство людей этого не заметили. Как только эта технология станет широко доступной, все наши ленты в социальных сетях будут переполнены подобным контентом. И, учитывая, что большая часть контента сопровождается видео и аудио, которые выглядят вполне реалистично, многие люди будут обмануты большим количеством контента.

Плохо уже то, что это глупые видео, например, с кроликами, прыгающими на батуте. Но что происходит, когда «политики» говорят что-то возмутительное или «знаменитость» крадёт что-то из магазина? В одном из вирусных видео Sora Сэм Альтман пытается сбежать с видеокартой из Target, но его останавливает охранник. Сколько ещё видео с Сорой будут показывать Сэма Альтмана и всех, кто одобряет ремиксы на их камеи, совершающих преступления или просто делающих что-то постыдное? Те, у кого достаточно власти или известности, могут опровергнуть эти видео, но к тому времени будет уже слишком поздно: большинство людей, которые их видели, примут это за правду.

С этой точки зрения здорово, что существуют меры безопасности, которые не позволяют людям без разрешения использовать Cameo других пользователей, но риск злоупотреблений здесь возвышен: что произойдёт, если кто-то придумает, как «отсканировать» чьё-то лицо на видео или взломает настройки, которые не позволяют другим использовать исходное сканирование лица? Если они смогут обойти меры безопасности OpenAI, то смогут использовать лицо этого человека в любом видео, одобренном платформой. В этот момент кошка уже вылезла из мешка.

Послушайте, я постоянно в сети. Я не буду притворяться, что мне не нравится хороший мем, созданный искусственным интеллектом, когда он появляется в моей ленте. Но я не собираюсь тратить своё свободное время на просмотр ничего, кроме бреда, созданного искусственным интеллектом. Я уверен, что люди найдут креативные способы снимать забавные видео с помощью Sora или весело проводить время, создавая Cameo со своими друзьями, но суть в следующем: кроме новизны технологии, в этом нет ничего хорошего.

Пора перестать верить в всё, что угодно, что вы видите в интернете: возможно, кто-то просто сфабриковал это в приложении.