Юристы давно предрекали этот момент, и он наконец-то поступил — New York Times стала первой крупной медиакомпанией, подавшей иск о нарушении авторских прав против компаний Microsoft и OpenAI. В иске, поданном на этой неделе в федеральный суд США, говорится, что большие языковые модели OpenAI, обученные на материалах The Times, теперь выступают в роли конкурента изданию в качестве источника онлайн-информации. В иске пока не указаны конкретные суммы убытков, однако отмечается, что ответчики должны будут выплатить «миллиарды долларов в качестве компенсации материального ущерба и нарушения законодательства об интеллектуальной собственности».
Действующие законы об авторском праве остаются практически неизменными на протяжении десятилетий. Появление бесконечно копируемых и легко распространяемых в интернете данных должно было бы привести к переосмыслению интеллектуальной собственности, однако произошло как раз обратное – защита авторских прав только усилилась перед лицом технологических перемен. Администраторы веб-сайтов по-прежнему вынуждены реагировать на нередко ошибочные требования об удалении контента на основании DMCA (закона об авторских правах), а срок действия авторских прав неоднократно продлевался. Такой консерватизм означает, что судебная система может оказаться не готова определиться с подходом к защите прав на обучающие данные для систем искусственного интеллекта – ведь это не то же самое, что прямое копирование и перепродажа чужого контента, но определенное сходство прослеживается.
Сообщается, что летом The Times вела переговоры с OpenAI с целью заключения лицензионного соглашения, аналогичного соглашению между OpenAI и Associated Press. Однако переговоры закончились отсутствием соглашения. Этот судебный процесс станет первым серьезным испытанием правовых вопросов, связанных с искусственным интеллектом. Большие языковые модели (LLM), лежащие в основе популярных сегодня систем искусственного интеллекта, огромны и иногда состоят из триллионов параметров машинного обучения. Такие большие размеры ИИ-модели необходимы для того, чтобы система могла формулировать ответы и вести диалог на естественном языке, а это значит, что они должны постоянно получать большое количество обучающих данных. OpenAI, как известно, скопировала огромную часть интернета (текста и картинок) для создания своих моделей GPT.
Для подтверждения использования своего контента Times воспользовалась поисковой системой Bing с интегрированным чат-ботом ChatGPT.
The Times утверждает, что многие запросы ChatGPT опираются на контент NYT, и юристы приводят несколько примеров. В иске утверждается, что ответы ChatGPT на многие запросы содержат почти дословное заимствование цитат из материалов с веб-сайта NYT, для доступа к которым ранее требовалась платная подписка. В ходе расследования также выяснилось, что ChatGPT в значительной степени заимствует информацию из Wirecutter, центра рекомендаций по товарам газеты Times. При этом ChatGPT не указывает Wirecutter в качестве источника информации и уж тем более не включает коммерческую рекламу, которая приносит сайту доход.
Помимо претензий по поводу авторских прав, в иске высказываются опасения по поводу неточности генеративного ИИ. Эти модели, по словам NYT, представляют собой всего лишь сложные «калькуляторы слов» без понимания того, что является правдой, а что нет. В результате модели могут «галлюцинировать» детали и даже защищать эту ложь, когда им об этом говорят. The Times отмечает, что люди могут задавать ChatGPT вопросы о текущих событиях, и бот будет использовать весь контент NYT, чтобы создать впечатление, что он знает ответ. Но на самом деле он может распространять опасную дезинформацию.
Данный иск ознаменовал резкую эскалацию юридического противостояния между новостными компаниями и OpenAI. OpenAI и до 2023 года привлекал к себе внимание юристов, но именно партнерство с Microsoft, о котором было объявлено в начале 2023 года, привлекло всеобщее внимание. С тех пор авторы контента и более мелкие медиа-организации начали юридические действия против OpenAI, утверждая, что их работа была использована моделью без их разрешения. Если иск Times увенчается успехом, издание может потребовать многомиллиардной компенсации, но, что более важно, он может заставить OpenAI удалить модели, которые она обучила с помощью данных NYT. Подобный исход нанесет сокрушительный удар по технологическому первенству Microsoft в сфере ИИ. По состоянию на момент этой публикации ни OpenAI, ни Microsoft пока не прокомментировали ситуацию.