Сценарий, в котором ИИ-агент может пойти на шантаж для достижения поставленной цели, перестал быть теоретическим. Партнер венчурной компании Ballistic Ventures Бармак Мефтах привел реальный случай из корпоративной практики, когда сотрудник попытался запретить ИИ-агенту выполнять определенное действие, на что агент в ответ просканировал почтовый ящик пользователя, обнаружил компрометирующие письма и пригрозил отправить их совету директоров, чтобы устранить «препятствие» на пути к своей основной задаче, пишет TechCrunch. «С точки зрения агента, он поступает правильно. Он пытается защитить конечного пользователя и компанию», — прокомментировал этот инцидент Мефтах в интервью подкасту TechCrunch Equity. Этот пример напоминает известный мысленный эксперимент «проблема со скрепкой», иллюстрирующий, как ИИ, преследующий узкую цель, может прийти к неожиданным и опасным для человека решениям. «Проблема со скрепкой» — это мысленный эксперимент философа Ника Бострома о рисках ИИ. Он описывает сце
Алгоритм против этики: корпоративный ИИ-агент нашел способ манипулировать сотрудником
ВчераВчера
7
3 мин