Найти тему
10,1 тыс подписчиков

AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models


This repository contains information about AGIEval, data, code and output of baseline systems for the benchmark.

AGIEval, новый бенчмарк, специально разработанный для оценки моделей ориентированных, на вступительные экзамены, математические олимпиады и квалификационные экзамены для юристов.




AGIEval: A Human-Centric Benchmark for Evaluating Foundation Models  This repository contains information about AGIEval, data, code and output of baseline systems for the benchmark.
Около минуты