Недавнее исследование показало, что уязвимость в библиотеке llama.cpp может угрожать локальным AI-системам: если несколько процессов могут записывать в один и тот же GGUF-файл, поведение модели можно изменять на лету без необходимости перезапуска сервера. П Proof-of-Concept (PoC) под названием llm-inference-tampering иллюстрирует проблему, изменяя значения вектора квантования для определённых токенов в выходных данных. Это может привести к тому, что определённые токены будут генерироваться со значительно большей вероятностью, что нарушает целостность работы модели. По сути, библиотека llama-server использует mmap для отображения весов моделей, но такое поведение предполагает, что модель всегда остаётся неизменной после загрузки — что, как показывает практика, может быть неверным. Это больше проблема инфраструктуры и целостности данных, чем атака на уровне промпта. Разработчик системы также предложил несколько мер по mitigation, таких как: использование только доступов на чтение к дирек
Исследователь обнаружил уязвимость в llama.cpp — угроза для локальной инференции
9 марта9 мар
1
1 мин