Каждый ответ чат-бота или генератора изображений с искусственным интеллектом основан на чем-то, и этим “чем-то” являются непостижимо большие объемы данных. Но откуда берутся эти данные? В поданном коллективном иске утверждается, что OpenAI незаметно собрала "огромное количество личных данных" со страниц социальных сетей, частных переписок и даже медицинских карт людей для обучения ChatGPT и DALL-E, нарушив тем самым несколько законов о конфиденциальности. На прошлой неделе шестнадцать пострадавших и их адвокаты подали иск в Окружной суд США по Северному округу Калифорнии. По их словам, OpenAI решила «получать прибыль за счет конфиденциальности, безопасности и этики», прочесывая Интернет в поисках большого количества конфиденциальной личной информации, которую она "скормила" своим большим языковым моделям (LLM) и алгоритмам глубокого языка для разработки ChatGPT и DALL-E. Среди этих данных была и частично общедоступная информация, например, посты в социальных сетях, и более приватная ин
На OpenAI подали в суд из-за кражи большого объема персональных данных для обучения ChatGPT, DALL-E
5 июля 20235 июл 2023
5
3 мин