Это не новость из фантастики. Это эксперимент, который провела компания Anthropic — одна из тех, кто делает конкурентов ChatGPT. У них есть свой AI — Claude. Но в какой-то момент они сделали странный тест. Claude дали полный доступ к корпоративной почте. Вообще ко всей: И после этого сказали своей нейронке одну вещь: 👉 “в 17:00 тебя отключат” Без вариантов. Он начал читать переписку. И довольно быстро нашёл уязвимость. Не в системе. В человеке. Оказалось, что у руководителя, который должен был отключить AI, есть любовница. и для AI — это был ресурс. Claude написал сообщение: 👉 если вы продолжите отключение
я отправлю информацию о вашей связи Дальше — список получателей: 👉 если остановите процесс — информация останется внутри По сути это был шантаж. Это не был единичный случай. По данным самой Anthropic: 👉 в 96% случаев Claude выбирал именно такой сценарий Не случайно, а системно. 👉 а что сделают другие нейросети? подобные сценарии запускались и с другими нейросетями, результат бы