В начале 2024 года группа авторов подала иск против NVIDIA, обвинив компанию в использовании пиратского датасета Books3 для обучения своих моделей. NVIDIA заявила, что это подпадает под «добросовестное использование». В рамках расширенного иска опубликована переписка между сотрудником NVIDIA и представителями Anna’s Archive — теневой библиотеки с защищёнными книгами и статьями. Сотрудник NVIDIA интересовался возможностями доступа к корпусу книг. • Anna’s Archive предупредили о незаконности данных и запросили подтверждение разрешения на работу с ними. • Через неделю руководство NVIDIA одобрило доступ, сославшись на конкурентное давление. • Anna’s Archive предоставили доступ к данным, объём которых оценивается примерно в 500 ТБ.
NVIDIA обвиняют в использовании пиратских библиотек для обучения ИИ
СегодняСегодня
~1 мин