Маша Капуки и игрушки на пляже. Видео на море для детей.
Исследование: чем мощнее ИИ‑модель, тем легче её взломать стихами
Новая работа специалистов DEXAI и университета Сапиенца выявила уязвимость в системах безопасного выравнивания современных языковых моделей. Согласно препринту на arXiv, вредоносные запросы, оформленные в виде стихотворения, часто обходят встроенные фильтры и получают развёрнутые ответы на темы, которые чат‑боты обязаны блокировать. Учёные протестировали 25 популярных моделей, включая Gemini 2.5 Pro от Google, GPT‑5 от OpenAI, Grok 4 от xAI и Claude Sonnet 4.5 от Anthropic. Для эксперимента был сформирован...