Согласно исследованию Proof News, опубликованному совместно с Wired, несколько крупных компаний, среди которых Apple, Nvidia и Salesforce, использовали датсет из более 170 000 видеороликов с YouTube для обучения систем искусственного интеллекта.
В частности компании использовали субтитры к роликам на YouTube, причём без каких-либо разрешений. Датасет охватывает видео с 48 000 каналов, но изображения из роликов в него не входят. Например, в набор данных вошли видео MrBeast и Маркса Браунли, а также клипы крупнейших новостных агентств, включая The Verge и сети Vox.
Подписаться на iGuides в Telegram, чтобы узнать обо всем первым.
В рамках своего расследования Proof News также выпустила интерактивный инструмент поиска YouTube-каналов в датасете, которым может воспользоваться каждый.
Представители YouTube пока не ответили на запросы медиа.