Найти в Дзене
Хайтек+

ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым

ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым» Компания Anthropic представила исследование о том, как у искусственного интеллекта формируются поведенческие черты, например, агрессия или льстивость. Ученые выяснили, что причиной «характера» часто становятся неточные обучающие данные, даже без явного негативного подтекста. Но поведение ИИ можно корректировать, например, заранее выявлять проблемные участки в дата-сетах или временно внедрять нежелательные черты, чтобы потом их контролируемо удалить. Исследование стало основой для создания внутри компании команды «ИИ-психиатров», изучающей поведенческие сбои моделей. https://hightech.plus/2025/08/04/ii-psihiatriya-anthropic-viyasnila-pochemu-ii-stanovitsya-zlim

ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым»

Компания Anthropic представила исследование о том, как у искусственного интеллекта формируются поведенческие черты, например, агрессия или льстивость. Ученые выяснили, что причиной «характера» часто становятся неточные обучающие данные, даже без явного негативного подтекста. Но поведение ИИ можно корректировать, например, заранее выявлять проблемные участки в дата-сетах или временно внедрять нежелательные черты, чтобы потом их контролируемо удалить. Исследование стало основой для создания внутри компании команды «ИИ-психиатров», изучающей поведенческие сбои моделей.

https://hightech.plus/2025/08/04/ii-psihiatriya-anthropic-viyasnila-pochemu-ii-stanovitsya-zlim