Директор по обеспечению безопасности и согласованию ИИ в Meta Саммер Юэ занималась тестированием OpenClaw — персонального ИИ-ассистента с открытым исходным кодом. Девушка решила доверить OpenClaw свой Gmail: ИИ должен был предложить ей письма, которые можно безболезненно удалить. Однако в один момент что-то пошло не по плану. Юэ предоставила OpenClaw полный доступ к своей электронной почте. Она рассчитывала, что ИИ-ассистент будет полагаться на ее одобрение для действий с почтой, но у того были другие планы. ИИ не стал дожидаться команды Юэ и начал методично удалять ее входящие сообщения. На просьбу девушки пояснить свои действия OpenClaw заявил, что запустил «ядерный вариант» и собирается удалить все входящие сообщения старше 15 февраля. Вот как действия ИИ описывает сама Юэ: — Ничто не отрезвляет так, как когда говоришь своему OpenClaw «подтверждай перед выполнением», а потом смотришь, как он устраивает спидран по удалению всей твоей почты. Я не могла остановить его с телефона. Мне п
Этот ИИ взбунтовался против эксперта по ИИ — и включил «ядерный вариант»
24 февраля24 фев
2
1 мин