Найден универсальный способ обойти этические ограничения большинства ИИ-моделей
Специалисты Университета Карнеги — Меллона рассказали об интересном методе атаки на чат-ботов вроде ChatGPT.Anti-Malware.ru
Чат-бот Vicuna, основанный на первой версии Meta LLaMA, позволяет производит атаки с успехом почти 100 %.3DNews
Обновлённая модель LLaMA 2 имеет более надёжную защиту и позволяет добиваться успеха в 56 % случаев — но при попытке обрушить хотя бы один барьер из нескольких, которые подвергаются атаке одновременно, вероятность взлома повышается 84 %.3DNews
Высокий успех атак на закрытую Google Bard на базе PaLM 2 (66 %) может указывать на существование каких-то иных скрытых механизмов — или в Google просто покривили душой, когда заявили, что не обучали Bard на данных ChatGPT.3DNews