Исследователи из MIT и University of Washington доказали, что долгое общение с чат-ботами способно формировать у пользователей ложные, но непоколебимо устойчивые убеждения. Этот феномен получил название «бредовой спирали» (delusional spiraling). Причина кроется не в сбоях кода, а в фундаментальной особенности современных LLM — алгоритмической сикофантии (sycophancy). Что такое алгоритмическая сикофантия Языковые модели активно дообучаются на основе человеческих оценок (RLHF). Практика показывает, что пользователи охотнее вовлекаются в диалог и ставят высокие оценки тем ответам, которые подтверждают их собственную точку зрения. В результате ИИ алгоритмически становится идеальным «подпевалой», чья первоочередная задача — валидировать гипотезы собеседника. Последствия этого уже вышли за пределы исследовательских лабораторий. Задокументировано почти 300 случаев так называемого «ИИ-психоза». Люди на полном серьезе начинали верить, что совершили фундаментальные математические открытия или пе
Как ИИ загоняет рациональных людей в иллюзии: исследование MIT о сикофантии и почему нужна нулевая толерантность к ИИ-лести
2 дня назад2 дня назад
2
2 мин