20 подписчиков

Apple использует видеоролики YouTube для обучения ИИ без согласия авторов: что происходит?

25 июля 202425 июл 2024

1 мин

Недавнее расследование вскрыло, что Apple и другие технологические гиганты обучали свои модели искусственного интеллекта (ИИ) на видеороликах YouTube без согласия создателей контента. Для этого использовались файлы субтитров, загруженные из более чем 170 000 видео некоммерческой организацией EleutherAI. Среди пострадавших авторов — известные блогеры Marquees Brownlee (MKBHD), MrBeast и PewDiePie. Эти данные вошли в состав набора Pile, который использовался не только мелкими разработчиками и учеными, но и крупными компаниями, такими как Apple, Nvidia и Salesforce, для обучения ИИ-моделей, включая OpenELM от Apple. Использование субтитров, которые представляют собой расшифровки видео, противоречит политике YouTube относительно несанкционированного сбора данных. Этот инцидент подчеркивает значительные юридические пробелы в законодательстве об авторском праве, которое с 1970-х годов пытается угнаться за технологическим прогрессом. Если традиционные законы четко регулируют несанкционирован

Оглавление

Проблемы с авторскими правами
Необходимость обновленных правил
Призываем к обсуждению

Эти данные вошли в состав набора Pile, который использовался не только мелкими разработчиками и учеными, но и крупными компаниями, такими как Apple, Nvidia и Salesforce, для обучения ИИ-моделей, включая OpenELM от Apple.

Проблемы с авторскими правами

Использование субтитров, которые представляют собой расшифровки видео, противоречит политике YouTube относительно несанкционированного сбора данных. Этот инцидент подчеркивает значительные юридические пробелы в законодательстве об авторском праве, которое с 1970-х годов пытается угнаться за технологическим прогрессом. Если традиционные законы четко регулируют несанкционированное использование контента, то применение этих норм к обучению ИИ на огромных наборах данных вызывает много вопросов.

Закон об авторском праве, защищающий производные произведения, такие как фильмы по мотивам романов, становится менее ясным при применении к ИИ, обученному на миллионах слов из различных источников. Несмотря на то, что Apple не загружала данные напрямую, использование ей набора данных EleutherAI ставит компанию в спорное положение.

Необходимость обновленных правил

Этот случай иллюстрирует более широкие проблемы и правовую неопределенность, связанные с использованием данных из интернета для обучения ИИ. Инциденты, когда системы ИИ создают контент, схожий с плагиатом, подчеркивают риски использования неутвержденных материалов. Компании, возможно, действовали добросовестно, но этот инцидент подчеркивает необходимость в новых правилах, учитывающих этические и юридические последствия разработки ИИ.

Еще больше интересной и полезной информации на нашем телеграм канале: Ai Сознание

Призываем к обсуждению

Что вы думаете о текущей ситуации с использованием данных для обучения ИИ? Как, по-вашему, должны быть урегулированы правовые и этические вопросы в этой сфере? Поделитесь своим мнением в комментариях!