10,3 тыс подписчиков
↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models
Data and code for L-Eval, a comprehensive long context language models evaluation benchmark.
Данные и код для L-Eval, комплексноого эталона оценки языковых моделей с длинным контекстом.
L-Eval, содержащий 411 длинных документов и более 2000 пар "вопрос-ответ", аннотированных и проверенных авторами вручную, охватывает такие области, как право, финансы, школьные лекции, длинные разговоры, новости, длинные романы.
🖥 Github: https://github.com/bshall/urhythmic
📕 Paper: https://arxiv.org/abs/2307.11088
🚀 Dataset: https://paperswithcode.com/dataset/quality
Около минуты
23 июля 2023