В России заработала первая независимая платформа для оценки качества больших языковых моделей на русском языке под названием LLM Arena. Проект реализован Романом Куцевым в сотрудничестве с экспертами по нейросетям и бывшими разработчиками TrainingData.ru. LLM Arena позволяет в режиме реального времени тестировать русскоязычные нейросети и оценивать их ответы на основании пользовательских задач. Пользователи могут вводить запросы, сравнивать ответы двух случайно выбранных моделей и выбирать лучший. Это обеспечивает объективный рейтинг качества генеративных нейросетей на русском языке. На платформе доступна для тестирования 21 популярная генеративная нейросеть, включая как зарубежные языковые модели (ChatGPT, LLaMa), так и российские (YandexGPT, GigaChat, Saiga). Список регулярно обновляется. «Наша цель — создать объективный, открытый и актуальный рейтинг языковых моделей на русском языке. Тестирование российских LLM на родном языке на реальных задачах было сложно, поэтому мы решили созд