Заместитель председателя совета по развитию цифровой экономики при Совете Федерации объяснил, почему искусственный интеллект может обманывать пользователей. Коварства там нет, но есть что поинтереснее – лесть. «Мы привыкли думать, что если машина нас обманывает, то там точно есть злой умысел. Но это является стандартным свойством всех больших языковых моделей. Есть такое понятие «сикофантия» - это подхалимство, склонность модели льстить тому человеку, который с ней общается», - рассказал Артём Шейкин. Также немаловажный фактор - в какой форме пользователь задаёт вопрос нейросети. Например, если спросить: «Этот стол - он деревянный, не так ли?», у модели будет выбор: ответить так, как есть, или подтвердить утверждение человека, передаёт ТАСС. «И причина простая: она кроется в человеческой психологии, потому что процесс обучения моделей идёт в результате подкрепления обратной связи от людей - модели так обучаются. И именно здесь формируется тот самый механизм усиления лести. Потому что
Искусственный интеллект может обмануть вас из лести, предупредил эксперт
СегодняСегодня
1
~1 мин