Рубрика «Занимательные цифры» В тесте MMLU 57% заданий по биологии содержат ошибки, а русский аналог MMLU_RU просто машинный перевод. Перевод выполнен через API Яндекс.Переводчика. Есть некоторые ошибки перевода, особенно заметные в терминах и формулах, исправления не применялись. Вот такие пироги — выводы делайте сами! Смотрите подробнее в видео.
📊 Можно ли доверять тестам ИИ?
27 июня 202527 июн 2025
8
~1 мин