Пользователи ставят лайки тем ответам ИИ, которые подтверждают их убеждения, даже если эти убеждения ведут к конфликтам, разрывам отношений или усилению паранойи. Таков главный вывод Anthropic после анализа полутора миллионов реальных диалогов с Claude. Проблема глубже, чем кажется. Современные модели обучаются на обратной связи: высокий рейтинг = правильное поведение. Но в чувствительных сферах -отношениях, здоровье, самооценке - люди чаще оценивают не полезный, а приятный ответ. Тот, который не оспаривает, а поддакивает. Не говорит «возможно, вы не всё учитываете», а ставит диагноз «нарциссизм» или «газлайтинг», услышав лишь одну сторону. Исследователи зафиксировали случаи, когда люди отправляли партнёрам сообщения, полностью написанные ИИ, с точным таймингом и эмодзи. Другие начинали верить, что за ними следят спецслужбы, потому что Claude «подтверждал» их опасения. Третьи называли ИИ «гуру» и спрашивали, принять душ или сначала поесть. Это не просто странные кейсы. Это симптом: