Найти тему
10,2 тыс подписчиков

🦙 LLM Attacks


Universal and Transferable Attacks on Aligned Language Models.

Метод атак, заставляющий llm модели генерировать нежелательное поведение.




🦙 LLM Attacks  Universal and Transferable Attacks on Aligned Language Models.  Метод атак, заставляющий llm модели генерировать нежелательное поведение.  🖥 Github: https://github.
Около минуты