ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым» Компания Anthropic представила исследование о том, как у искусственного интеллекта формируются поведенческие черты, например, агрессия или льстивость. Ученые выяснили, что причиной «характера» часто становятся неточные обучающие данные, даже без явного негативного подтекста. Но поведение ИИ можно корректировать, например, заранее выявлять проблемные участки в дата-сетах или временно внедрять нежелательные черты, чтобы потом их контролируемо удалить. Исследование стало основой для создания внутри компании команды «ИИ-психиатров», изучающей поведенческие сбои моделей. https://hightech.plus/2025/08/04/ii-psihiatriya-anthropic-viyasnila-pochemu-ii-stanovitsya-zlim
ИИ-психиатрия: Anthropic выяснила, почему ИИ становится «злым
4 августа 20254 авг 2025
38
~1 мин