Найти тему

Обновляемый рейтинг лучших нейросетей — по ссылке.


Аналитики сравнили самые популярные LLM с помощью собственной версии теста MMLU. Оценочные скрипты доступны на GitHub.

Нейронкам отправили 12 тысяч запросов в 14 различных категориях человеческого знания, в том числе точных науках. Производительность моделей старались проверять на задачах, требующих от чат-ботов рассуждений.

По версии исследователей, топ-5 больших языковых моделей сейчас таков:

1. GPT-4o
2. Claude-3-Opus
3. Gemini-1.5-Flash
4. YI-large
5. Llama-3 на 70 млрд параметров (версия Instruct)
Обновляемый рейтинг лучших нейросетей — по ссылке.  Аналитики сравнили самые популярные LLM с помощью собственной версии теста MMLU. Оценочные скрипты доступны на GitHub.
Около минуты