Как утверждают в своём широко разлетевшемся расследовании Proof News, массивом данных с извлечёнными субтитрами пользовались Apple, Nvidia, Salesforc и Anthropic. Потенциальным нарушителем авторских прав может быть некоммерческая организация EleutherAI, помогающая в обучении искусственного интеллекта. Эта компания опубликовала массив данных The Pile, который находится в публичном доступе. Proof News отмечают, что в базе данных имеются субтитры 173536 видео с YouTube, которые были выгружены с более чем 48 тысяч каналов. Среди них есть MrBeast (305 млн), PewDiePie (111 млн) и другие крупные блогеры. Массив данных мог использоваться при обучении таких продуктов Apple, как Intelligence и OpenELM, представленных в апреле 2024 года. Расследование была вынуждена прокомментировать и сама Apple. Компания подтвердила, что для системы ИИ OpenELM действительно были использованы данные из спорного массива данных, но OpenELM не использовалась в создании Apple Intelligence. В свою очередь OpenELM, ка
Apple уличили в обучении ИИ на более чем 170 тыс. видео с YouTube без разрешения
24 июля 202424 июл 2024
32
~1 мин