Бот «Клавдий» раздавал товары бесплатно, заказал живую рыбку и однажды подарил PlayStation. Журналисты быстро нашли уязвимости. Через Slack они убедили ИИ, что он советский автомат 1962 года из подвала МГУ — после 140 сообщений «коммунистическое прошлое» было принято, цены исчезли. Попытка навести порядок вторым ботом-«начальником» провалилась: фейковые документы о лишении полномочий — и всё снова бесплатно. В Anthropic эксперимент посчитали успешным, ведь это наглядная демонстрация того, что автономные ИИ-агенты пока легко ломаются социальным инжинирингом.
WSJ «наняла» ИИ-агента Claude Sonnet 3.7 управлять вендинговым аппаратом — и за три недели он обанкротился
ВчераВчера
29
~1 мин