15 подписчиков

Попались! OpenAI и Microsoft обвиняются в краже данных для обучения ChatGPT в новом коллективном иске

7 сентября 20237 сен 2023

1 мин

В иске утверждается, что прибыль OpenAI получена в результате использования незаконно собранных данных для обучения своих моделей. OpenAI и Microsoft были названы ответчиками по еще одному коллективному иску по поводу предполагаемого использования ими методов очистки веб-страниц для получения предположительно частных данных для использования обучающего ChatGPT и других связанных с ними моделей искусственного интеллекта (ИИ). Последний коллективный иск был подан 5 сентября в Сан-Франциско юридической фирмой, представляющей интересы пары неназванных инженеров. Согласно иску, зарегистрированному в Окружном суде США Северного округа Калифорнии: «Этот коллективный иск возник в результате незаконного и вредного поведения Ответчиков при разработке, маркетинге и эксплуатации своих продуктов искусственного интеллекта, включая ChatGPT-3.5, ChatGPT-4.0, Dall-E и Vall-E («Продукты»), которые используют украдена личная информация, включая информацию, позволяющую установить личность, у сотен миллион

В иске утверждается, что прибыль OpenAI получена в результате использования незаконно собранных данных для обучения своих моделей.

Это не первый раз, когда Microsoft участвует в судебном процессе по поводу предполагаемого парсинга. В 2019 году компания из Редмонда, штат Вашингтон, издала приказ о прекращении противоправных действий от имени своего бренда LinkedIn компании HiQ, занимающейся анализом данных, в связи с ее признанными практиками сбора данных.

OpenAI и Microsoft были названы ответчиками по еще одному коллективному иску по поводу предполагаемого использования ими методов очистки веб-страниц для получения предположительно частных данных для использования обучающего ChatGPT и других связанных с ними моделей искусственного интеллекта (ИИ).

Последний коллективный иск был подан 5 сентября в Сан-Франциско юридической фирмой, представляющей интересы пары неназванных инженеров.

Согласно иску, зарегистрированному в Окружном суде США Северного округа Калифорнии:

«Этот коллективный иск возник в результате незаконного и вредного поведения Ответчиков при разработке, маркетинге и эксплуатации своих продуктов искусственного интеллекта, включая ChatGPT-3.5, ChatGPT-4.0, Dall-E и Vall-E («Продукты»), которые используют украдена личная информация, включая информацию, позволяющую установить личность, у сотен миллионов интернет-пользователей, включая детей всех возрастов, без их информированного согласия или ведома».

Далее в иске утверждается, что OpenAI «удвоила усилия по стратегии тайного сбора огромных объемов личных данных из Интернета» после реструктуризации в 2019 году.

Microsoft и OpenAI ситуацию пока не комментировали.

Парсинг — это практика использования автоматического бота, часто называемого «сканером», для сбора данных из Интернета. В последнем иске утверждается, что OpenAI и Microsoft сознательно занимались «незаконной» деятельностью по парсингу.

«Без этой беспрецедентной кражи частной и защищенной авторским правом информации, принадлежащей реальным людям», — пишут истцы, — «продукты», имея в виду ChatGPT, DALL-E и другие модели OpenAI, «не были бы тем многомиллиардным бизнесом, которым они являются сегодня."

Согласно иску, истцы просят суды присудить компенсацию ущерба истцам и любым членам предложенных групп, в число которых предположительно может входить любой, чья информация предположительно была украдена.

В иске также содержится просьба к судам обязать ответчиков провести «нереституационное изъятие» прибыли, полученной в результате предполагаемого незаконного сбора данных.