19 подписчиков
Обновляемый рейтинг лучших нейросетей — по ссылке.
Аналитики сравнили самые популярные LLM с помощью собственной версии теста MMLU. Оценочные скрипты доступны на GitHub.
Нейронкам отправили 12 тысяч запросов в 14 различных категориях человеческого знания, в том числе точных науках. Производительность моделей старались проверять на задачах, требующих от чат-ботов рассуждений.
По версии исследователей, топ-5 больших языковых моделей сейчас таков:
1. GPT-4o
2. Claude-3-Opus
3. Gemini-1.5-Flash
4. YI-large
5. Llama-3 на 70 млрд параметров (версия Instruct)
Около минуты
21 мая 2024