📊 Можно ли доверять тестам ИИ?
Рубрика «Занимательные цифры» В тесте MMLU 57% заданий по биологии содержат ошибки, а русский аналог MMLU_RU просто машинный перевод. Перевод выполнен через API Яндекс.Переводчика. Есть некоторые ошибки перевода, особенно заметные в терминах и формулах, исправления не применялись...