54 подписчика

МРТ для ИИ

30 октября 202530 окт 2025

~1 мин

МРТ для ИИ 🤔 Компания Anthropic «взломала» мозг своей ИИ-модели Claude. Исследователи изменяли активность её нейронов, вводя понятия «предательство» или «благодарность». Модель смогла заметить вмешательство и сообщила о «навязчивой мыслях». Это первое доказательство того, что ИИ способны к наблюдению за своими внутренними процессами. Пока эти способности проявляются лишь в 20% случаев, но это однозначно прорыв. Теперь модель можно напрямую спрашивать о причинах её ответов и получать честные пояснения. Источник #ИИсследование

МРТ для ИИ 🤔

Компания Anthropic «взломала» мозг своей ИИ-модели Claude.

Исследователи изменяли активность её нейронов, вводя понятия «предательство» или «благодарность». Модель смогла заметить вмешательство и сообщила о «навязчивой мыслях».

Это первое доказательство того, что ИИ способны к наблюдению за своими внутренними процессами.

Пока эти способности проявляются лишь в 20% случаев, но это однозначно прорыв. Теперь модель можно напрямую спрашивать о причинах её ответов и получать честные пояснения.

Источник

#ИИсследование

Гаджеты и электроника

5,73 млн интересуются