Найти в Дзене
10,3 тыс подписчиков

↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models


Data and code for L-Eval, a comprehensive long context language models evaluation benchmark.

Данные и код для L-Eval, комплексноого эталона оценки языковых моделей с длинным контекстом.

L-Eval, содержащий 411 длинных документов и более 2000 пар "вопрос-ответ", аннотированных и проверенных авторами вручную, охватывает такие области, как право, финансы, школьные лекции, длинные разговоры, новости, длинные романы.





↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models  Data and code for L-Eval, a comprehensive long context language models evaluation benchmark.
Около минуты