Машинное обучение

10,2 тыс подписчиков

🦙 LLM Attacks

Universal and Transferable Attacks on Aligned Language Models.

Метод атак, заставляющий llm модели генерировать нежелательное поведение.

🖥 Github: https://github.com/llm-attacks/llm-attacks

📕 Paper: https://arxiv.org/abs/2307.15043v1

🔗 Dataset: https://paperswithcode.com/dataset/ethics-1

ai_machinelearning_big_data

🦙 LLM Attacks Universal and Transferable Attacks on Aligned Language Models. Метод атак, заставляющий llm модели генерировать нежелательное поведение. 🖥 Github: https://github.

Около минуты

28 июля 2023