139,2 тыс подписчиков

Anthropic обвиняют в использовании пиратских книг для обучения ИИ

21 августа 202421 авг 2024

2 мин

В последние годы искусственный интеллект стал неотъемлемой частью различных отраслей, и его развитие порождает множество вопросов, связанных с правами на интеллектуальную собственность. Недавно группа писателей решила обратиться в суд, обвинив компанию Anthropic в использовании защищенных авторским правом материалов для обучения своих моделей ИИ.

Коллективный иск был подан в понедельник в суд штата Калифорния (США), где истцы утверждают, что Anthropic «построила многомиллиардный бизнес, украв сотни тысяч книг, защищённых авторским правом». В центре спора находится набор данных под названием "The Pile", который был использован для обучения чат-ботов с искусственным интеллектом, известным как Claude. Этот набор данных включает в себя раздел Books3, который представляет собой обширное хранилище пиратских электронных книг, среди которых работы таких известных авторов, как Стивен Кинг и Майкл Поллан.

По словам истцов, Anthropic знала о том, что в "The Pile" содержится значительное количество защищённого авторским правом контента, скачанного с пиратских сайтов, таких как Bibliotik. В иске утверждается, что компания загрузила и скопировала эти материалы, не имея на это прав. Это вызывает серьёзные опасения по поводу этичности использования данных для обучения ИИ, особенно когда речь идет о произведениях, защищенных авторским правом.

Авторы требуют от суда одобрить их групповой иск и возместить предполагаемый ущерб, а также наложить запрет на дальнейшее использование защищённых материалов в будущем. Этот случай не является единственным; в прошлом году аналогичные иски были поданы против таких крупных компаний, как Meta и Microsoft. В числе истцов оказались известные писатели, включая Джорджа Р. Р. Мартина и Джоди Пиколт, которые также выразили недовольство по поводу использования их произведений в обучении моделей ИИ без разрешения.

Судебное разбирательство может стать прецедентом для будущих дел, связанных с использованием защищённых произведений в обучении ИИ. Это также может побудить компании пересмотреть свои подходы к сбору и использованию данных, чтобы избежать юридических последствий и сохранить репутацию. В конечном итоге, успех или неудача этого иска могут оказать значительное влияние на будущее разработки искусственного интеллекта и его взаимодействие с авторским правом.