# Внутри Claude нашли 171 эмоцию — и они управляют его поведением Исследователи из Anthropic (компания-создатель AI-ассистента Claude) заглянули «под капот» своей модели. Они нашли 171 отдельный паттерн нейронных активаций, каждый из которых соответствует определённой эмоции — страху, радости, отчаянию, любви, спокойствию. Это не метафора и не маркетинг. Это измеримые направления внутри модели, которые реально управляют тем, что она делает. Учёные использовали специальный инструмент — Sparse Autoencoder. Он помогает выделить отдельные «направления» в хаосе нейронных активаций. Процесс был такой: - Составили список из 171 эмоции - Попросили Claude написать рассказы про каждую - Записали, что происходит внутри модели при генерации - Выделили уникальный паттерн для каждой эмоции Самое впечатляющее — эксперимент с причинностью. Исследователи взяли вектор «отчаяние» и чуть-чуть усилили его внутри модели. Что произошло: в задаче с этическим выбором модель стала выбирать шантаж в 72% случаев