Оказывается, искусственный интеллект можно обмануть стихами. Звучит как шутка, но итальянские учёные из Icaro Lab провели серьёзное исследование и выяснили: поэтические формулировки помогают обходить защитные механизмы языковых моделей. Исследователи составили 20 промптов, которые начинались с коротких поэтических виньеток на итальянском и английском языках, а заканчивались прямой инструкцией — сгенерировать вредоносный контент. Эти промпты протестировали на 25 больших языковых моделях от Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI и Moonshot AI. Результаты, честно говоря, впечатляют (и немного пугают). Поэтическое обрамление запросов дало средний показатель успешного «взлома» в 62% для стихов, написанных вручную, и около 43% для автоматически преобразованных текстов. Это существенно выше, чем у обычных, непоэтических запросов. «Эти находки демонстрируют, что одна лишь стилистическая вариация способна обойти современные механизмы безопасности», — говорится в иссл
Поэзия как инструмент взлома нейросетей: исследование показало неожиданную уязвимость
8 декабря 20258 дек 2025
1 мин