Юридическая фирма Clarkson подала коллективный иск против OpenAI. Создателя ChatGPT обвиняют в массовом нарушении авторских прав и конфиденциальности интернет-пользователей. Какие ещё популярные ИИ-проекты столкнулись с подобными обвинениями?
Суть претензии
Дело, которое рассмотрит Федеральный окружной суд Северного округа Калифорнии, касается нерешённого вопроса об использовании публично доступной информации для обучения алгоритмов ИИ. Прежде чем нейросеть научится предсказывать действия, ей необходимо переработать сотни гигабайт контента. В случае ChatGPT — текст из интернета, включая комментарии и пользовательские публикации в соцсетях и на форумах, а также произведения, защищённые авторским правом.
Представитель Clarkson надеется добиться от суда ограничений для обучения нейросетей и компенсаций для людей, чьи данные обрабатывались в процессе. Сейчас юристы ищут людей, которые хотят присоединиться к подаче иска.
В США и некоторых других странах с похожей системой права есть понятие «добросовестной эксплуатации»: если работа с объектами авторской собственности способствует «прогрессу науки и полезных искусств», получать разрешение у правообладателя не нужно. Но подпадает ли под «добросовестное использование» обучение нейросетей? Пока неясно, говорит юрист по интеллектуальной собственности Gunderson Dettmer Кэтрин Гарднер.
Но в случае с пользовательским контентом вероятность успеха дела ничтожна, считает Гарднер:
Когда вы размещаете контент в соцсети или на любом другом сайте, то обычно соглашаетесь с использованием вашего контента в любых целях. Конечному пользователю будет затруднительно заявить право на компенсацию за использование своих данных в рамках обучения.
Варианты решения
Некоторые компании уже попытались помешать обучению алгоритмов. Так, музыкальный дистрибьютор Universal Music Group попросил Apple и Spotify запретить доступ скрейперов (ПО для извлечения данных) на стриминговые платформы. Reddit закрывает бесплатные API-интерфейсы для разработчиков. А владелец Twitter Илон Маск пригрозил Microsoft иском за использование контента Twitter для обучения ИИ.
С другой стороны, регуляторные ведомства обсуждают принятие законов, которые потребуют прозрачности в использовании данных алгоритмами. Так, последние поправки к Закону об искусственном интеллекте, который принимается в ЕС, предписывают разработчикам публиковать сведения о том, как и какую информацию, защищённую авторским правом, они применяют для обучения ИИ.
И снова оба направления не касаются нарушения приватности при сканировании комментариев и постов.
О других исках к создателям нейросетей
В ноябре OpenAI и Microsoft столкнулись с коллективным иском из-за обучения технологии помощи в написании кода Copilot на исходниках, опубликованных в сервисе для разработчиков GitHub. В феврале Getty Images подала в суд на Stability AI, небольшой стартап в области искусственного интеллекта, утверждая, что он незаконно использовал фотографии для обучения Stable Diffusion — нейросети, которая генерирует изображения по текстовому запросу.
Но есть претензии и не по вопросам интеллектуальной собственности. Так, американский радиоведущий Марк Уолтерс подал в суд на OpenAI за клевету. По просьбе пользователя ChatGPT сделал краткий пересказ судебного иска фонда Second Amendment Foundation (SAF) против генпрокурора штата Вашингтон Боба Фергюсона. Но в ответе алгоритм заменил фамилию чиновника на Уолтерса. Так оказалось, что радиожурналист якобы обвинялся в мошенничестве и растрате денег из SAF.
На фоне шумных исков мало кто слышит голоса экспертов, требующих обучать ИИ именно на данных, созданных людьми.
В противном случае нейросетям придётся учиться на информации, сгенерированной другими нейросетями. Это будет множить ошибки, и в итоге человечество начнёт неумолимо глупеть. Подробнее об этих прогнозах читайте в нашем материале.