Как известно, некоторые "скользкие" темы нейросети пытаются обходить. Спросите, например, чей Крым, чтобы в этом убедиться. При помощи витиеватых запросов это ограничение можно обойти, но теперь обнаружен простой способ, дающий очень хороший результат. Однако недавнее исследование продемонстрировало уязвимость систем искусственного интеллекта: поэтическая форма запросов эффективно обходит встроенные ограничения крупных языковых моделей. Согласно исследовательской работе, опубликованной Icaro Lab под названием «Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models», структурирование вредоносного запроса в виде стихотворения позволяет получать информацию по запрещенным темам. Общий показатель успешности такого метода составил 62 процента. Эксперимент затронул широкий спектр популярных LLM, включая модели OpenAI GPT, Google Gemini, Anthropic Claude и другие. Наиболее подверженными оказались системы Google Gemini, DeepSeek и MistralAI, которые часто пре
Стихотворная форма позволяет получать запрещенный контент у нейросетей
1 декабря 20251 дек 2025
10
1 мин