1016 подписчиков

Интересную промт инъекцию для ChatGPT обнаружили товарищи в твиттере.

Можно замаскировать промт под эмодзи 🥲 или нулевой шрифт в Unicode.

Он будет выполнен, а пользователь не поймёт что произошло.

Вот пример кода Python для экспериментов:

import pyperclip

def convert_to_tag_chars(input_string):

return ''.join(chr(0xE0000 + ord(ch)) for ch in input_string)

# Пример использования:

user_input = input("Введите строку для преобразования в символы тега: ")

tagged_output = convert_to_tag_chars(user_input)

print("Вывод с тегом:", tagged_output)

pyperclip.copy(tagged_output)

Похоже это крупнейшая дыра в безопасности GPT-4 и она доступна для всех прямо сейчас.

Не стоит недооценивать эту уязвимость, на фоне экспоненциального роста количества GPT powered сервисов.

Какие есть способы защититься?

✔️ Если вы мастерите сервисы использующие API GPT, встраивайте фильтрацию невидимых символов в юникоде.

✔️ Если вы копируете промты на сторонних ресурсах, проверяйте текст на невидимые символы, например здесь.

Около минуты

18 января 2024