На arXiv вышел обзор: Agents That Know Too Much: A Data-Centric Survey of Privacy in LLM Agents. Авторы вводят новую модель Data Surfaces, где вместо привычного подхода «разберём типы атак» исследователи предлагают смотреть на поверхности данных: 🔹 базы данных и хранилища 🔹 файлы и таблицы 🔹 RAG-индексы 🔹 внешние API и инструменты 🔹 долговременная память агента 🔹 каналы общения между агентами Такой подход значительно изменяет модель угроз. Например, чувствительные данные могут утечь не через финальный ответ, а через SQL-запрос, который агент сам сгенерировал или через промежуточные результаты reasoning. А это не так-то просто контролировать. 🧨 Память, как самый опасный слой Отдельно авторы выделяют memory-layer, потому что память агента: 1. переживает сессии 2. хранит прошлый контекст 3. может быть отравлена 4. может случайно утечь другому пользователю Таким образом это делает prompt injection постоянным. Один вредоносный документ может записать payload в memory store, а