LLM, используя обширные массивы информации из Интернета, сталкивается с обвинениями со стороны The New York Times в нарушении авторских прав. NYT утверждает, что LLM сосредоточился на их контенте особым образом. Иск был подан в федеральный суд Манхэттена, в котором указывается, что компания пытается использовать огромные инвестиции NYT в журналистику для создания замещающих продуктов без согласия или оплаты.
В иске говорится о миллионах статей, расследований, мнений и другого контента NYT, защищенного авторскими правами, которые использовались для обучения искусственного интеллекта и чат-ботов. Эти чат-боты теперь конкурируют с различными информагенствами, служа источником информации. Также в иске упоминается неправильная идентификация содержания публикации Bing. В иске содержится список «15 самых полезных продуктов для сердца», в котором только трое из двенадцати продуктов были упомянуты в статье NYT. В дополнение к этому, созданный контент включает буквальные цитаты из статей NYT, что приводит к потере зрителей и убыткам для издания, включая клиентов, таких как ChatGPT.
Иск требует от ответчиков нести ответственность за миллиарды долларов ущерба и требует уничтожения всех чат-ботов и обучающих данных, которые использовались с материалами NYT, защищенными авторскими правами. OpenAI утверждает, что использование контента NYT носит «добросовестный характер», так как служит новой «преобразующей» цели. В сообщении также упоминается, что в августе Times вела переговоры о заключении лицензионного соглашения с OpenAI и Microsoft, которое позволило бы последним использовать материалы Times для обучения своей модели GPT. Однако переговоры были прерваны, что привело к подаче судебного иска. OpenAI уже имеет соглашение с Reuters на использование их контента в учебных целях.
В этом году сбор данных стал объектом многочисленных заголовков. Илон Маск угрожал подать в суд на Microsoft в апреле из-за незаконного использования данных Twitter для обучения искусственного интеллекта. В апреле более 8000 авторов, включая выдающиеся личности, подписали открытое письмо, в котором просили компании, занимающиеся искусственным интеллектом, не использовать их работы без предварительного согласия и компенсации. Несмотря на это, авторы несколько раз подавали иски против OpenAI за нарушение авторских прав. Помимо этого, в январе художники подали иск об авторских правах против генераторов искусственного искусства Stable Diffusion и Midjourney, что стало подобным случаем.