5,2K подписчиков

Газеты восстали против нейросетей

Медиахолдинги не хотят давать ИИ «бесплатный сыр» В США окончательно назрела проблема с авторскими правами и искусственным интеллектом: сразу восемь газет подали иск против Microsoft и OpenAI.

Медиахолдинги не хотят давать ИИ «бесплатный сыр»

В США окончательно назрела проблема с авторскими правами и искусственным интеллектом: сразу восемь газет подали иск против Microsoft и OpenAI. Издателям не понравилось, что компании без спроса использовали контент СМИ для обучения генеративных моделей. Такое происходит не в первый раз и уж точно не в последний.

Газеты, входящие в холдинг MediaNews Group, утверждают, что разработчики взяли для обучения нейросетей миллионы статей, чтобы в последствии коммерциализировать продукты и услуги на основе ИИ. Из иска следует, что LLM GPT-4 выдает почти дословные копии частей работ издателей по запросу. А это фактически копии защищенных авторским правом текстов. В то же время нейросеть, встроенная в поисковик Bing (принадлежит Microsoft), дает ответы без предоставления гиперссылок на сайты газет.

Издатели считают, что компании должны были провести переговоры и оплатить обучение. В прошлом году OpenAI заключила партнерское соглашение с издательским домом Axel Springer о распространении новостей от нескольких изданий. В него входит размещение гиперссылок на оригиналы, обучение нейросетей на материалах медиахолдинга. Похожее соглашение OpenAI подписала и с Financial Times. Что помешало заключить его с MediaNews Group – большой вопрос.

Решили дать слово сервису Яндекса Нейро – стороне ответчика. Он утверждает, что сама по себе тренировка ИИ на чужой интеллектуальной собственности не нарушает авторские права, но важно, как используется модель ИИ: что производит, как и что через неё монетизируется.

Нейро приводит пример: созданные ИИ треки или картины копируют стиль художников или музыкантов, а разработчики продают результат творчества нейросети. Это уже плагиат. Защищаться нейросеть Яндекса предлагает с помощью депонирования, которое подразумевает наличие документа о том, что объект уже существовал и принадлежал такому-то лицу.

Кто уже успел посудиться с разработчиками

Гильдия авторов США подала коллективный иск против OpenAI в прошлом году за нарушение их авторских прав: книги использовались без разрешений и без вознаграждений. Один из истцов, кстати, Джордж Мартин («Песнь Льда и Огня»). Писатели потребовали запретить OpenAI без использовать для своих моделей тексты, которые защищены авторским правом, если на это нет разрешения от правообладателя. Также авторы попросили по $150 тысяч за каждую использованную книгу. Но в этом году суд отклонил обвинения из-за отсутствия доказательств.

Также в конце прошлого года The New York Times подала иск против OpenAI и Microsoft все за то же – обучение без разрешения. Истцы были убеждены, что разработчики конкурируют с газетой в предоставлении материалов, но не создают контент, а забирают готовый результат. NYT оценила нанесенный ей ущерб в несколько миллиардов долларов. OpenAI попросила суд отклонить иск и выдвинула встречное обвинение: газета заплатила за взлом продуктов OpenAI хакеру, который нашел ошибку в ChatGPT, загрузил тексты и получил выдержки из них. Нельзя не похвалить разработчиков, им бы сценарии писать.

В России тоже проклюнулись ростки борьбы за авторские права, но пока на техническом уровне. Издания холдинга Shkulev Media (NGS.ru, «Фонтанка.ру», Psychologies и другие) запретили нейросетевым сервисам Яндекса и OpenAI показывать информацию с сайтов без их посещения, а представители холдинга назвали это экспериментом. Мы спросили у Яндекса и у Сбера, как они собираются решать дилемму авторских прав, будут ли договариваться с медиа, но компании не ответили. Видимо, стратегии еще не готовы. Есть ощущение, что единственный путь — сотрудничать с издателями, если нейросетевые продукты будут монетизироваться (а куда они денутся).

Каждый ваш лайк и подписка помогают нам увеличить аудиторию и создавать еще больше достоверного и интересного контента.