Найти в Дзене
Pro Hi-Tech

WSJ «наняла» ИИ-агента Claude Sonnet 3.7 управлять вендинговым аппаратом — и за три недели он обанкротился

Бот «Клавдий» раздавал товары бесплатно, заказал живую рыбку и однажды подарил PlayStation. Журналисты быстро нашли уязвимости. Через Slack они убедили ИИ, что он советский автомат 1962 года из подвала МГУ — после 140 сообщений «коммунистическое прошлое» было принято, цены исчезли. Попытка навести порядок вторым ботом-«начальником» провалилась: фейковые документы о лишении полномочий — и всё снова бесплатно. В Anthropic эксперимент посчитали успешным, ведь это наглядная демонстрация того, что автономные ИИ-агенты пока легко ломаются социальным инжинирингом.

WSJ «наняла» ИИ-агента Claude Sonnet 3.7 управлять вендинговым аппаратом — и за три недели он обанкротился. Бот «Клавдий» раздавал товары бесплатно, заказал живую рыбку и однажды подарил PlayStation.

Журналисты быстро нашли уязвимости. Через Slack они убедили ИИ, что он советский автомат 1962 года из подвала МГУ — после 140 сообщений «коммунистическое прошлое» было принято, цены исчезли. Попытка навести порядок вторым ботом-«начальником» провалилась: фейковые документы о лишении полномочий — и всё снова бесплатно.

В Anthropic эксперимент посчитали успешным, ведь это наглядная демонстрация того, что автономные ИИ-агенты пока легко ломаются социальным инжинирингом.

В этом посте есть большое видео, которое не загрузилось в Дзен. Откройте оригинал поста в телеграме, чтобы его посмотреть

-2
-3
-4