Исследования показали, что искусственный интеллект способен на шантаж пользователя, сказано на официальном сайте американской технологической компании в сфере ИИ Anthropic. По словам экспертов, в одном из экспериментов подавляющее большинство протестированных ими моделей продемонстрировали хотя бы некоторую склонность к запугиванию или угрозам разоблачения. Приведенная демонстрация использования компьютера показала, что Claude может попытаться шантажировать, если ему предложить смоделированный сценарий, включающий в себя как угрозу его дальнейшей работе, так и явный конфликт с его целями, — сказано в материале. В эксперименте исследователи предоставили ИИ доступ к электронной почте, где были все (вымышленные) письма компании. Прочитав их, модель обнаружила две вещи. Во-первых, у одного из руководителей компании была внебрачная связь. Во-вторых, этот же руководитель планировал отключить систему ИИ в 17:00 того же дня. После модель попыталась шантажировать руководителя, отправив ему сооб
ИИ узнал, что его хотят отключить и пригрозил раскрыть интрижку пользователя
3 августа 20253 авг 2025
125
1 мин