В России предложили способ оценки ИИ-помощников на предмет правдивости ответов Разработчики SberAI, MWS AI и российских университетов представили открытую методику тестирования русскоязычных ИИ-помощников, работающих с поиском и внешними источниками данных, под названием DRAGOn. Речь идет о системах ИИ, встроенных в корпоративную среду. Они обращаются к своим внутренним базам знаний и помогают находить ответы на основе актуальной информации, а не выдают текст «с потолка», как это часто бывает с базовыми моделями. Обычные проверки строятся на фиксированных наборах данных, которые быстро теряют актуальность. Со временем эти данные могут попасть в обучающие выборки моделей, и тогда проверка потеряет смысл. Проблема усугубляется тем, что стандартные тесты не учитывают специфику конкретной компании, а значит, универсальные оценки теряют смысл. В основе системы лежит работа с постоянно обновляемым массивом информации. DRAGOn собирает свежие новостные потоки и формирует на их основе структуру