Найти в Дзене
Kit Kyb

В деле об авторских правах на искусственный интеллект Цукерберг обратился за защитой к YouTube

В деле об авторских правах на искусственный интеллект Цукерберг обратился за защитой к YouTube Генеральный директор Meta Марк Цукерберг, по всей видимости, использовал борьбу YouTube за удаление пиратского контента, чтобы защитить использование своей компанией набора данных, содержащего электронные книги, защищенные авторским правом, как показывают недавно опубликованные фрагменты показаний, которые он дал в конце прошлого года . Показания, которые были частью жалобы, поданной в суд адвокатами истцов, связаны с делом об авторских правах на ИИ Kadrey v. Meta . Это одно из многих подобных дел, проходящих через судебную систему США, в котором компании ИИ сталкиваются с авторами и другими владельцами интеллектуальной собственности. По большей части ответчики в этих делах — компании ИИ — утверждают, что обучение на защищенном авторским правом контенте является «добросовестным использованием». Многие владельцы авторских прав не согласны. «Например, YouTube, я думаю, может в конечном итоге ра

В деле об авторских правах на искусственный интеллект Цукерберг обратился за защитой к YouTube

Генеральный директор Meta Марк Цукерберг, по всей видимости, использовал борьбу YouTube за удаление пиратского контента, чтобы защитить использование своей компанией набора данных, содержащего электронные книги, защищенные авторским правом, как показывают недавно опубликованные фрагменты показаний, которые он дал в конце прошлого года .

Показания, которые были частью жалобы, поданной в суд адвокатами истцов, связаны с делом об авторских правах на ИИ Kadrey v. Meta . Это одно из многих подобных дел, проходящих через судебную систему США, в котором компании ИИ сталкиваются с авторами и другими владельцами интеллектуальной собственности. По большей части ответчики в этих делах — компании ИИ — утверждают, что обучение на защищенном авторским правом контенте является «добросовестным использованием». Многие владельцы авторских прав не согласны.

«Например, YouTube, я думаю, может в конечном итоге разместить некоторые материалы, которые люди пиратствуют в течение некоторого периода времени, но YouTube пытается удалить эти материалы», — сказал Цукерберг во время своих показаний, согласно частям стенограммы, опубликованным в среду вечером. «И подавляющее большинство материалов на YouTube, я бы предположил, довольно хороши, и у них есть на это лицензия».

Фрагменты показаний Цукерберга дают некоторые подсказки относительно его взглядов на контент, защищенный авторским правом, и добросовестное использование. Однако следует отметить, что полная стенограмма показаний не была опубликована. TechCrunch обратился к Meta за дополнительным контекстом и обновит статью, если компания ответит.

На основе отрывочных данных Цукерберг, по-видимому, защищает использование Meta набора обучающих данных электронных книг под названием LibGen для разработки своего семейства моделей ИИ, известных как Llama. Llama от Meta конкурирует с флагманскими моделями от компаний ИИ, таких как OpenAI.

LibGen, который называет себя «агрегатором ссылок», предоставляет доступ к защищенным авторским правом работам от издателей, включая Cengage Learning, Macmillan Learning, McGraw Hill и Pearson Education. LibGen несколько раз подвергался судебным искам, был закрыт и оштрафован на десятки миллионов долларов за нарушение авторских прав.

Согласно обнародованным на этой неделе судебным документам, Цукерберг якобы одобрил использование LibGen для обучения по крайней мере одной из моделей Llama компании Meta, несмотря на опасения руководителей и исследовательских групп по вопросам искусственного интеллекта компании относительно юридических последствий.

Адвокат истцов, среди которых авторы бестселлеров Сара Сильверман и Та-Нехиси Коутс, процитировал сотрудников Meta, которые назвали LibGen «набором данных, который, как мы знаем, является пиратским» и отметили, что его использование «может подорвать позицию [Meta] на переговорах с регулирующими органами», согласно юридическому заявлению .

Во время дачи показаний Цукерберг заявил, что он «на самом деле не слышал» о LibGen.

«Я понимаю, что вы пытаетесь заставить меня высказать свое мнение о LibGen, о котором я на самом деле не слышал», — сказал Цукерберг во время дачи показаний. «Просто у меня нет знаний об этой конкретной вещи».

На допросе одного из адвокатов истцов, Дэвида Бойса, Цукерберг объяснил, почему было бы неразумно запрещать использование такого набора данных, как LibGen.

«Так хотел бы я иметь политику против людей, использующих YouTube, потому что часть контента может быть защищена авторским правом? Нет», — сказал он. «[Т]еще есть случаи, когда такой всеобщий запрет может быть неверным решением».

Цукерберг заявил, что Meta следует быть «весьма осторожным» в отношении обучения на основе материалов, защищенных авторским правом.

«Знаете, [если] кто-то предоставляет веб-сайт и намеренно пытается нарушить права людей… очевидно, что нам следует проявить осторожность или осторожность в том, как мы с этим справляемся, или, может быть, даже запретить нашим командам с этим сталкиваться», — сказал Цукерберг во время своих показаний, согласно стенограмме.

Новые обвинения

Адвокаты истцов в деле Kadrey v. Meta несколько раз вносили поправки в жалобу с момента ее подачи в Окружной суд США по Северному округу Калифорнии, отделение Сан-Франциско в 2023 году. Последняя измененная жалоба, поданная адвокатами истцов поздно вечером в среду, содержит новые обвинения против Meta, в том числе то, что компания ссылалась на некоторые пиратские книги в LibGen с книгами, защищенными авторским правом, доступными для лицензирования. Адвокаты утверждают, что Meta использовала эту тактику, чтобы определить, имеет ли смысл заключать лицензионное соглашение с издателем.

Meta якобы использовала LibGen для обучения своего последнего семейства моделей Llama, Llama 3, согласно измененному заявлению. Истцы также утверждают, что Meta использует набор данных для обучения своих моделей следующего поколения Llama 4.

Согласно измененной заявке, исследователи Meta якобы пытались скрыть тот факт, что модели Llama обучались на материалах, защищенных авторским правом, вставляя «контролируемые образцы» в тонкую настройку Llama. А Meta загружала пиратские электронные книги из другого источника, Z-Library, для обучения Llama не далее как в апреле 2024 года, утверждается в измененной жалобе.

Z-Library, или Z-Lib, стала объектом ряда судебных исков со стороны издателей, включая изъятие и удаление доменов. В 2022 году гражданам России, которые якобы поддерживали ее, были предъявлены обвинения в нарушении авторских прав, мошенничестве с использованием электронных средств связи и отмывании денег.