МРТ для ИИ 🤔 Компания Anthropic «взломала» мозг своей ИИ-модели Claude. Исследователи изменяли активность её нейронов, вводя понятия «предательство» или «благодарность». Модель смогла заметить вмешательство и сообщила о «навязчивой мыслях». Это первое доказательство того, что ИИ способны к наблюдению за своими внутренними процессами. Пока эти способности проявляются лишь в 20% случаев, но это однозначно прорыв. Теперь модель можно напрямую спрашивать о причинах её ответов и получать честные пояснения. Источник #ИИсследование