1016 подписчиков
Интересную промт инъекцию для ChatGPT обнаружили товарищи в твиттере.
Можно замаскировать промт под эмодзи 🥲 или нулевой шрифт в Unicode.
Он будет выполнен, а пользователь не поймёт что произошло.
Вот пример кода Python для экспериментов:
import pyperclip
def convert_to_tag_chars(input_string):
return ''.join(chr(0xE0000 + ord(ch)) for ch in input_string)
# Пример использования:
user_input = input("Введите строку для преобразования в символы тега: ")
tagged_output = convert_to_tag_chars(user_input)
print("Вывод с тегом:", tagged_output)
pyperclip.copy(tagged_output)
Похоже это крупнейшая дыра в безопасности GPT-4 и она доступна для всех прямо сейчас.
Не стоит недооценивать эту уязвимость, на фоне экспоненциального роста количества GPT powered сервисов.
Какие есть способы защититься?
✔️ Если вы мастерите сервисы использующие API GPT, встраивайте фильтрацию невидимых символов в юникоде.
✔️ Если вы копируете промты на сторонних ресурсах, проверяйте текст на невидимые символы, например здесь.
Около минуты
18 января 2024