Большинство AI-систем относятся к embedding как к безопасному промежуточному формату, т.к. Вектор не выглядит как текст и не содержит очевидного payload. Поэтому embedding’и спокойно: 🔹 передаются между сервисами 🔹 индексируются в vector DB 🔹 попадают в shared storage 🔹 используются в retrieval pipeline Практически никто не анализирует их содержимое с точки зрения безопасности. А зря. ⚙️ Что такое VectorSmuggle Исследователи показали, что внутри embedding можно скрытно кодировать произвольные данные, сохраняя при этом его внешнюю «нормальность». Технически идея строится вокруг особенностей embedding space. LLM и embedding-модели преобразуют текст в высокоразмерные векторы. При этом небольшие изменения отдельных компонент обычно не ломают semantic similarity. Именно этот запас устойчивости злоумышленники используют, как covert channel. Часть измерений embedding’а начинает хранить скрытый payload, который можно позже извлечь специальным декодером. Со стороны embedding продолжа