Во вторник группа новостных организаций во главе с The New York Times подала иск против создателя ChatGPT, компании OpenAI, в федеральный суд. Слушания могут определить, придётся ли технологической компании предстать перед издателями в громком деле о нарушении авторских прав.
Иски трёх издательств против OpenAI и его финансового спонсора Microsoft были объединены в одно дело. В каждом из трёх объединённых дел лидируют Times, The New York Daily News и Центр журналистских расследований.
Другие издатели, такие как Associated Press, News Corp. и Vox Media, заключили с OpenAI соглашения о совместном использовании контента, но три истца в этом деле выбрали противоположный путь: они перешли в наступление.
Слушания во вторник были посвящены ходатайству OpenAI о прекращении дела — критическому этапу в рассмотрении дела, на котором судья либо разрешит судебное разбирательство, либо отклонит его.
Основной аргумент издателей заключается в том, что данные, на которых работает ChatGPT, включают в себя миллионы произведений, защищённых авторским правом, из новостных организаций, статьи, которые, по мнению изданий, были использованы без согласия или оплаты, что, по мнению издателей, является нарушением авторских прав в огромных масштабах.
«Мы должны изучить данные, — заявила Times адвокат Дженнифер Мейзел в суде во вторник. — Точно так же, как в уголовных делах вы следите за деньгами».
И если вы посмотрите на данные, то увидите, что, по мнению юристов издательств, ChatGPT и Microsoft получают прибыль от журналистских работ, которые были отсканированы, обработаны и воссозданы без оплаты или согласия. Microsoft внедрила технологию OpenAI в свою поисковую систему Bing.
«Это замена», — сказал адвокат Times Иэн Кросби, имея в виду, что для некоторых людей ChatGPT и Bing стали заменой оригинальной работы издателей. Если это будет доказано, то станет ключевым фактором для выигрыша дела о нарушении авторских прав.
В судебных документах Кросби уточнил, что «незаконное использование OpenAI работы The Times для создания конкурирующих продуктов на основе искусственного интеллекта угрожает способности The Times предоставлять эту услугу».
«Использование ценной интеллектуальной собственности других людей таким образом без оплаты было чрезвычайно выгодно» для OpenAI, продолжил он.
Компания OpenAI утверждает, что огромное количество данных, используемых для обучения её бота с искусственным интеллектом, защищено правилами «добросовестного использования». Это доктрина американского законодательства, которая позволяет использовать материалы, защищённые авторским правом, в образовательных, исследовательских или комментаторских целях.
Чтобы пройти проверку на добросовестное использование, рассматриваемая работа должна преобразовать объект авторского права в нечто новое, и, помимо прочего, новая работа не должна конкурировать с оригиналом на том же рынке.
Чтобы доказать, что использование текста меняет ситуацию к лучшему, юристы OpenAI и Microsoft объяснили судье Сидни Стейну, назначенному президентом Биллом Клинтоном, как работают большие языковые модели, такие как ChatGPT.
Адвокаты компаний заявили, что когда в модели искусственного интеллекта OpenAI поступают данные, они сортируются на ряд «токенов» — единиц, которые упрощают анализ данных. В конечном итоге модель может распознавать закономерности.
Джозеф Гратц, юрист OpenAI, сказал, что воспроизведение целых статей «не является тем, для чего он предназначен, и не является тем, что он делает», когда речь заходит о работе ChatGPT.
«Это не система поиска документов. Это режим работы с большим количеством языков», — сказал Гратц.
Гратц утверждал, что примеры нарушений, на которые ссылалась Times в иске, могли произойти только после «тысяч и десятков тысяч» запросов. По сути, Гратц утверждал, что издатели настроили чат-бота на выдачу текста, скопированного с их сайтов.
Microsoft заявляет, что Times использует свою «власть и влияние», чтобы бросить вызов угрожающим технологиям
В своём ходатайстве об отклонении иска юристы Microsoft, крупнейшего инвестора OpenAI, написали, что для OpenAI не было нарушением закона использовать этот журналистский текст.
«В данном случае The New York Times использует свою мощь и свой мегафон, чтобы бросить вызов новейшему технологическому прорыву: большой языковой модели, или LLM», — написали они в судебном иске, описывая технологию, лежащую в основе ChatGPT. «Несмотря на утверждения The Times, закон об авторском праве является для LLM таким же препятствием, как и для видеомагнитофона (или проигрывателя, копировального аппарата, персонального компьютера, интернета или поисковой системы)».
Но новостные организации утверждают, что не только глобальный успех ChatGPT отчасти обусловлен тем, что он собирает множество статей, защищённых авторским правом, но и то, что ChatGPT теперь фактически является конкурентом в качестве источника достоверной информации.
Это стало частью аргументации в суде во вторник, когда предметом обсуждения стал другой аспект работы ChatGPT. Он известен как «дополненное извлечение информации». Проще говоря, он интегрирует актуальную и более конкретную информацию из интернета в ответы чат-бота.
Хотя некоторые из этих сведений, например, большие отрывки из новостных статей, возможно, не входили в обучающие данные чат-бота, они всё равно могут появляться в результатах работы ChatGPT.
Стивен Либерман, адвокат The New York Daily News, сказал: «Это позволяет читателям пользоваться бесплатными материалами», имея в виду читателей, которые обращаются к воссозданным OpenAI газетным статьям, а не переходят на сайт издательства.
Что может произойти дальше?
Согласно жалобе, поданной the Times, OpenAI должна понести ущерб в миллиарды долларов за незаконное копирование и использование архива газеты. В иске также содержится призыв к уничтожению набора данных ChatGPT.
Это был бы радикальный исход. Если издатели выиграют дело и федеральный судья прикажет уничтожить набор данных, это может полностью разрушить компанию, поскольку вынудит OpenAI воссоздать набор данных, опираясь только на работы, которые ей разрешено использовать.
Федеральный закон об авторском праве также предусматривает суровые финансовые санкции: нарушителям грозят штрафы в размере до 150 000 долларов за каждое «умышленное» нарушение.
"Если вы копируете миллионы работ, вы можете увидеть, как это число становится потенциально фатальным для компании", - сказал NPR Дэниел Жерве, содиректор программы интеллектуальной собственности Университета Вандербильта, который изучает генеративный ИИ, в интервью NPR в августе 2023 года, когда Times рассматривала судебный иск против OpenAI до подачи иска в декабре того же года. «Закон об авторском праве — это меч, который будет висеть над головами компаний, занимающихся искусственным интеллектом, в течение нескольких лет, если они не придумают, как договориться о решении.»
Хотя судья Штейн не вынес решение во вторник, он сказал, что вскоре вынесет решение о том, будет ли дело против OpenAI рассматриваться или будет закрыто.