Большие языковые модели (LLM) уже давно помогают нам делать свою работу: собирают логи, генерируют скрипты и даже пишут за нас электронные письма. Но вместе с этим нам следует помнить, что у развивающегося инструмента есть свои слабые места.
Что происходит
Prompt Injection — это атака, при которой кто-то (или что-то) заставляет LLM нарушить её системные инструкции. Опасность в том, что теперь модели работают прямо в последовательности этапов, через которые проходит задача, проект или процесс от начала до завершения (pipeline); программа, которая объединяет в себе все необходимые инструменты для создания, тестирования, отладки и запуска кода (IDE) и интерфейс командной строки (CLI) могут реально менять поведение инфраструктуры.
В конце прошлого года открытый проект обеспечения безопасности веб-приложений (OWASP) поставили Prompt Injection на лидирующую позицию в LLM топ-10. Атаки уже не теоретические. Например, из недавнего:
• В расширении для редактора кода VS Code Amazon Q for V