Насколько безумна ваша любимая модель искусственного интеллекта?

Таблица лидеров использует инструмент оценки языковой модели EleutherAI для проведения тщательной оценки языковой модели с нулевым результатом и с небольшим количеством результатов в различных задачах.Блокчейн24
Основываясь на предварительных результатах таблицы лидеров Hallucinations, модели, которые демонстрируют меньше галлюцинаций — и, следовательно, входят в число лучших, — включают Meow (на основе Solar), Stable Beluga от Stable AI и LlaMA-2 от Meta*.Блокчейн24
Изображение: Обнимающее лицо В таблице лидеров Hallucinations более высокий средний балл модели указывает на меньшую склонность модели к галлюцинациям.Блокчейн24
Стоит отметить, что, хотя таблица лидеров Hallucinations предлагает всестороннюю оценку моделей с открытым исходным кодом, модели с закрытым исходным кодом еще не прошли такого тщательного тестирования.Блокчейн24