Большие языковые модели получили широкое внимание за последние несколько лет — они могут писать статьи, отвечать на вопросы и даже решать математические задачи.Ferra

В новом исследовании ученые в DeepMind создали приложение на основе искусственного интеллекта, которое может проверять результаты ответов, данных LLM, и автоматически указывать на неточности.Ferra

Они создали LLM, который анализирует утверждения или факты в ответе, предоставленном исходным LLM, а затем использовали поиск Google, чтобы найти сайты, которые можно использовать для верификации, сравнивая два ответа для определения точности.Ferra

При тестировании расхождений между SAFE и проверкой людей исследователи обнаружили, что SAFE был прав в 76% случаев.Ferra

DeepMind разработала систему SAFE для проверки результатов ChatGPT