OpenAI оказалась в центре скандала из-за использования огромного объема видеоконтента с YouTube для обучения своего последнего продукта - нейросети Sora.
По данным СМИ, OpenAI применила более миллиона часов видео с YouTube в процессе обучения Sora, вызвав возмущение из-за использования защищенного авторским правом контента.
Sora - новая нейросеть от OpenAI, позволяющая создавать качественные видеоролики на основе простых текстовых запросов. Однако с момента ее выпуска возникли вопросы о том, какие источники данных использовала OpenAI для обучения модели.
В интервью техническому директору OpenAI был задан вопрос о том, использовали ли они контент с YouTube в процессе обучения. Мира Мурати ответила: «Я не могу подтвердить это». Впоследствии операционный директор также отказался давать ответ на вопрос о том, использовался ли контент YouTube для обучения модели, как утверждают источники.
Генеральный директор Google, Сундар Пичаи, прокомментировал обвинения, заявив, что будет расследовать ситуацию, если они подтвердятся. «Я считаю, что это вопрос, на который они должны ответить. Мне нечего добавить. У нас есть четкие условия обслуживания», - отметил Сундар Пичаи, комментируя, являются ли эти обвинения нарушением условий использования Google. «Обычно мы сотрудничаем с компаниями и гарантируем, что они соблюдают наши условия обслуживания. И мы разберемся в этом».