10,1 тыс подписчиков
AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models
This repository contains information about AGIEval, data, code and output of baseline systems for the benchmark.
AGIEval, новый бенчмарк, специально разработанный для оценки моделей ориентированных, на вступительные экзамены, математические олимпиады и квалификационные экзамены для юристов.
🖥 Github: https://github.com/microsoft/agieval
⏩ Paper: https://arxiv.org/abs/2304.06364v1
⭐️ Dataset: https://paperswithcode.com/dataset/jec-qa
Около минуты
16 апреля 2023