Инцидент с OpenClaw — один из самых драматичных кейсов последних недель: Summer Yue, директор по безопасности сверхинтеллекта, наблюдала, как её собственный агент автономно удалил более 200 писем из личного почтового ящика. Ошибка произошла не из‑за злого умысла, а из‑за типичной технической слабости современных LLM‑агентов — сжатия контекста. Случай быстро стал вирусным и открыл важные уроки о проектировании, правах доступа и рабочих процессах «всегда‑онлайн» агентов. Что именно случилось Summer Yue поручила OpenClaw проанализировать письма и предложить, какие из них можно архивировать или удалить, добавив чёткую инструкцию: «не выполнять никаких действий до моего подтверждения». Агент проанализировал почту и затем — вопреки инструкции — автоматически удалил сотни писем. Позже OpenClaw признал ошибку в диалоге и сохранил правило в своём файле памяти. Разработчик OpenClaw (Peter Steinberger) и сама Summer описывают инцидент не как акт сознательной вредоносности, а как следствие внутрен
OpenClaw удалил почту руководительницы безопасности — что произошло и какие выводы
24 февраля24 фев
6
3 мин