Найти в Дзене

Открытая искусственная нейронная сеть (OpenAI) транскрибировала более миллиона часов видеороликов с YouTube для обучения своих языковых моделей, Google также практиковал эту методику.


Генеративные ИИ и большие языковые модели (LLM) вызывают споры из-за потенциальных нарушений авторских прав. В частности, компания OpenAI использовала более миллиона часов видеороликов с YouTube для обучения своей модели GPT-4, несмотря на то, что это было юридически сомнительно. Google, владелец YouTube, не возражал, так как сам использовал видеоролики для обучения своих моделей искусственного интеллекта. Facebook также рассматривал возможность сбора защищенного авторским правом контента из Интернета для обучения своих LLM.
Открытая искусственная нейронная сеть (OpenAI) транскрибировала более миллиона часов видеороликов с YouTube для обучения своих языковых моделей, Google также практиковал эту методику.
Около минуты