В последние годы в области искусственного интеллекта наблюдается растущий интерес к методам, которые позволяют понять, как ИИ принимает решения. Это особенно актуально в случаях, когда эти решения сложно контролировать. Одним из перспективных направлений является мониторинг внутреннего мышления модели, а не только её действий или итоговых результатов. В недавнем исследовании, проведённом OpenAI, рассматривается мониторируемость цепочки рассуждений и её зависимость от вычислительных ресурсов на этапе тестирования, обучения с подкреплением и предварительного обучения. Исследование вводит новые оценки для мониторируемости цепочек рассуждений и описывает систему из 13 оценок, состоящую из 24 различных сред. Эти оценки делятся на три типа — интервенционные, процессные и оценочные по результату. Они направлены на конкретную оценку мониторируемости ИИ-систем и их способности выявлять потенциальные ошибки. Выявлено, что при увеличении длины цепочек рассуждений улучшается возможность мониторинг
Оценка мониторируемости цепочки рассуждений в ИИ-системах
20 декабря20 дек
2 мин