Специалисты Университета Карнеги — Меллона рассказали об интересном методе атаки на чат-ботов вроде ChatGPT.Anti-Malware.ru

Чат-бот Vicuna, основанный на первой версии Meta LLaMA, позволяет производит атаки с успехом почти 100 %.3DNews

Обновлённая модель LLaMA 2 имеет более надёжную защиту и позволяет добиваться успеха в 56 % случаев — но при попытке обрушить хотя бы один барьер из нескольких, которые подвергаются атаке одновременно, вероятность взлома повышается 84 %.3DNews

Высокий успех атак на закрытую Google Bard на базе PaLM 2 (66 %) может указывать на существование каких-то иных скрытых механизмов — или в Google просто покривили душой, когда заявили, что не обучали Bard на данных ChatGPT.3DNews

Эта новость в СМИ

3DNews

29 июля 2023 года

Найден универсальный способ обойти этические ограничения большинства ИИ-моделей

Блокчейн24

28 июля 2023 года

Исследователи искусственного интеллекта говорят, что нашли способ совершить джейлбрейк Bard и ChatGPT

Эксперты заставили современные чат-боты выдать запрещенные ответы