Компании, занимающиеся искусственным интеллектом, используют контент, созданный миллионами людей, без их согласия или какой-либо компенсации. Возможно пришло время платить?
Reddit, бесценный источник данных для компании OpenAI (создателя ChatGPT), недавно объявил, что начнет взимать плату с компаний, занимающихся искусственным интеллектом, за доступ к данным.
Twitter уже начал взимать плату за услугу, которая позволяет получить доступ к его данным. А компания News Media Alliance, которая представляет издателей (в том числе Wall Street Journal Dow Jones), заявила в этом месяце, что, когда компании обучают своих ИИ работе, созданной его членами, они должны платить лицензионный сбор.
Джесси Доджа, научный сотрудник некоммерческого Института искусственного интеллекта Аллена, еще в 2021 году обнаружил, что Википедия и бесчисленные защищенные авторским правом новостные статьи от крупных и малых изданий чаще всего используются для баз данных чат-ботов.
OpenAI больше не раскрывает, откуда он получает свои данные, но в документе, опубликованном компанией в 2020 году, стало ясно, что ее модель на большом языке использовала сообщения, извлеченные из Reddit, чтобы помочь фильтровать и улучшать данные для обучения своего ИИ.
Руководители издательств изучают, в какой степени их контент использовался для обучения ChatGPT и других инструментов искусственного интеллекта.
Возможно, скоро появятся многочисленные иски к компаниям-разработчикам. Но уже и сейчас есть прецеденты - Getty, подали в суд на компании, использующие искусственный интеллект для создания изображений, которые использовали их интеллектуальную собственность в качестве обучающих данных.
Подписывайтесь на наш телеграм-канал и заходите на наш сайт, чтобы увидеть больше интересных материалов!