MIT: Данным для обучения больших языковых моделей часто не хватает прозрачности

Для обучения мощных больших языковых моделей исследователи используют обширные коллекции данных из тысяч веб-источников.Новости мира инноваций
Например, если набор данных неправильно классифицирован, то человек может использовать для обучения модели неподходящие данные.Новости мира инноваций
Когда возникает путаница в происхождении данных, появляется проблема прозрачности, — говорит Роберт Махари, аспирант Массачусетского технологического института и кандидат юридических наук Гарвардской школы права, один из авторов статьи.Новости мира инноваций
В исследовании также приняли участие Шейн Лонгпре, аспирант Media Lab, Сара Хукер, возглавляющая исследовательскую лабораторию Cohere for AI, а также другие специалисты из разных университетов и компаний.Новости мира инноваций