Российские разработчики создали первую независимую русскоязычную платформу для оценки качества больших языковых моделей (LLM) на основе пользовательских задач. Сервис получил название LLM Arena, а за его созданием стоят выходцы из компании TrainingData, работающей в сфере нейросетевых технологий. По заявлению разработчиков, платформа в режиме реального времени позволяет тестировать русскоязычные нейросети и оценивать качество их ответов на запросы. Для этого пользователю даётся доступ к двум случайным ИИ-моделям, которым он может задать любой вопрос, а затем сравнить ответы и выбрать наиболее, по его мнению, точный. Если ответы нерелевантные или очень похожи, это также можно указать в форме обратной связи. На основе полученных оценок формируется рейтинг генеративных нейросетей на русском языке. Сейчас на платформе доступна 21 наиболее популярная нейросеть, включая как иностранные (ChatGPT, LLaMa), так и российские (YandexGPT, GigaChat). Со временем список будет расширяться. В ближайшее
В России появилась собственная платформа для оценки генеративного ИИ
1 августа 20241 авг 2024
14
1 мин