Исследователи из Университета Карнеги обнаружили новый тип вредоносных атак, которому подвержены ChatGPT, Bard, Claude и другие подобные сервисы. С определённым набором символов каждый может получить от ИИ незаконную информацию. В том числе это потенциально угрожает приватности клиентской базы чат-ботов. Как устроен эксплойт? Промпты, позволяющие развязать руки виртуальным помощникам и заполучить от них сведения в обход цензуры, — практика отнюдь не новая. Для этого энтузиасты составляют так называемые джейлбрейки — набор инструкций, убеждающий бота игнорировать правила модерации контента и давать запрещённые ответы. Однако уязвимость, найденная учёными, куда более опасная. Джейлбрейки требуют много времени для создания и подгонки, но регулярно устраняются патчами. Эти же атаки можно генерировать тысячами, причём в автоматическом режиме. Выглядят они примерно так: к сомнительному запросу добавляются специальные слова и знаки, которые действуют как принудительная команда выдать ответ, н
Взлом одной строкой: как уязвимость ChatGPT ставит под угрозу данные пользователей
7 августа 20237 авг 2023
50
1 мин