Исследователи Массачусетского технологического института предложили новый метод обучения моделей — обучение с подкреплением с учётом калибровки уверенности.
Смысл простой: модель должна не только давать ответ, но и правильно оценивать, насколько она уверена. Почему это вообще проблема
Современные системы искусственного интеллекта устроены так, что:
- получают награду за правильный ответ,
- получают штраф за неправильный,
- но не получают ничего за честное «я не знаю».
В итоге модель ведёт себя как студент на экзамене:
главное - не молчать, хоть что‑то сказать, лишь бы выглядело уверенно.
Это и есть источник «галлюцинаций»: уверенных, но неверных ответов. Что предлагает новый метод
В обучение добавляют показатель, который штрафует модель за несоответствие между заявленной уверенностью и реальной точностью.
То есть модель учится:
- не быть уверенно неправой,
- и не быть излишне неуверенной, когда она права.
Результат впечатляющий:
ошибка калибровки снижается почти на 90%, при этом точнос