Авторы книг подают в суд на Nvidia, утверждая, что платформа искусственного интеллекта NeMo, созданная производителем чипов, используемая для работы настраиваемых чат-ботов, была обучена на спорном наборе данных, который незаконно копировал и распространял их книги без их согласия.
В предложенном групповом иске писатели Абди Наземиан ( «Как история любви » ), Брайан Кин (« Прогулка с призраком ») и Стюарт О'Нан (« Прошлой ночью у лобстера ») утверждали, что Nvidia должна возместить ущерб и уничтожить все копии использованного набора данных Books3. для поддержки больших языковых моделей NeMo (LLM)
Набор данных Books3, как утверждали романисты, скопировал «всю Библиотеку», теневую библиотеку, насчитывающую примерно 196 640 пиратских книг. Набор данных Books3, первоначально предоставленный сообществом искусственного интеллекта Hugging Face, сегодня «устарел и больше не доступен из-за сообщения о нарушении авторских прав», сообщается на веб-сайте Hugging Face .
По словам авторов, Hugging Face удалила набор данных в октябре прошлого года, но не раньше, чем компании, занимающиеся искусственным интеллектом, такие как Nvidia, захватили его и «сделали несколько копий». Обучая модели NeMo на этом наборе данных, авторы заявили, что Nvidia «нарушила свои исключительные права в соответствии с Законом об авторских правах». Авторы утверждали, что окружной суд США в Сан-Франциско должен вмешаться и остановить Nvidia, поскольку компания «продолжает делать копии Нарушенных работ для обучения других моделей».
Представитель Hugging Face пояснил Ars, что «Hugging Face никогда не удалял этот набор данных, и мы не размещали набор данных Books3 в Hub». Вместо этого «Hugging Face разместил сценарий, который загружает данные из The Eye, места, где ELeuther размещал данные», пока «Eleuther не удалил данные из The Eye» из-за проблем с авторскими правами, что привело к поломке сценария набора данных на Hugging Face. .
Требуя суда присяжных, авторы надеются, что суд постановит, что у Nvidia нет возможности защититься как за предполагаемое нарушение авторских прав, так и за намерение «вызвать дальнейшее нарушение авторских прав», распространяя модели NeMo «в качестве основы для создания дальнейших моделей».