2615 подписчиков

OpenAI расшифровала более миллиона часов видео с YouTube, чтобы обучить GPT-4

Ранее на этой неделе газета The Wall Street Journal сообщила, что компании, занимающиеся разработкой искусственного интеллекта, сталкиваются с проблемой сбора высококачественных данных для обучения. Сегодня The New York Times подробно описала некоторые из способов, с помощью которых компании решают эту проблему. Неудивительно, что это связано с действиями, которые попадают в туманную серую зону закона об авторских правах на ИИ. В начале статьи рассказывается о компании OpenAI, которая, отчаянно нуждаясь в обучающих данных, как сообщается, разработала свою модель транскрипции аудио Whisper, чтобы преодолеть трудности, расшифровав более миллиона часов видео с YouTube для обучения GPT-4, своей самой продвинутой модели большого языка. По данным The New York Times, компания знала, что это сомнительно с юридической точки зрения, но считала это добросовестным использованием. Президент OpenAI Грег Брокман лично... #технологии #IT #gadgets

Около минуты

7 апреля 2024