Найти тему
OVERCLOCKERS.RU

404 Media: Nvidia использовала для обучения ИИ видео с YouTube и Netflix

В гонке за все более совершенными моделями искусственного интеллекта Nvidia, очевидно, пошла по короткому пути. По данным 404 Media, производитель видеокарт использовал видео с YouTube, Netflix и многих других источников для обучения искусственного интеллекта. Отчет основан на сообщениях Slack, электронных письмах и внутренних документах Nvidia.

Согласно утечке, сотрудникам было предложено просто скачать соответствующие видеоролики с платформ. Чтобы не быть заблокированными на соответствующих сайтах, загрузка происходила через виртуальную машину на серверах AWS. Машина постоянно перезапускалась, чтобы получить новый IP.

Сообщается, что помимо YouTube и Netflix для обучения ИИ также были загружены база данных трейлеров к фильмам MovieNet и наборы видеоданных Github. Речь идёт, вероятно, о наборе данных HD-VG-130M, который содержит 130 миллионов видеороликов YouTube. Набор данных предназначен для использования исключительно в академических целях. Как стало известно из сообщений сотрудников Nvidia, это правило было намеренно проигнорировано и данные по-прежнему использовались для обучения ИИ.

Обучение в основном использовалось для 3D-платформы Nvidia Omniverse, автономных транспортных систем и ранее неопубликованного проекта под названием «Cosmos». Это проект «цифрового человека». Однако никаких дополнительных подробностей о проекте неизвестно.

Сообщается, что некоторые сотрудники Nvidia неоднократно выражали обеспокоенность по поводу процедуры обучения ИИ. Им сказали, что это было «решение сверху». Юридические вопросы, связанные с использованием этих наборов данных, по-прежнему будут оставаться «открытым юридическим спором», который необходимо будет прояснить. Пока неизвестно, подадут ли некоторые из пострадавших компаний судебные иски против Nvidia.

Однако многие компании уже выражали свое недовольство обучением ИИ через свою платформу в прошлом — и в некоторых случаях уже подали в суд. Лишь в апреле 2024 года генеральный директор YouTube Нил Мохан сделал заявление в отношении OpenAI, которая якобы использовала видео с платформы для ChatGPT. Тогда он сказал:

«Руководящие принципы не позволяют загружать транскрипции или видео. Это явное нарушение. Это своего рода правила дорожного движения для контента на нашей платформе».

📃 Читайте далее на сайте