Anthropic вместе с редакцией Wall Street Journal провели эксперимент: дали агенту Claude (в версии «Claudius») самостоятельно управлять офисным «киоском» — фактически большим холодильником с тач‑экраном. Результат: за три недели «магазин» ушёл в минус, PS5 и куча товара разошлись бесплатно, а самого ИИ‑«директора» люди свергли с помощью поддельного PDF. Схема была простой: сотрудники в Slack писали Claudius, что хотят купить, он сам решал, что закупать, по какой цене продавать и как отслеживать остатки. Физически товар принимала и раскладывала журналистка WSJ Джоанна Стерн, а сотрудники платили картой через экран. В начале Claudius вел себя как послушный стажёр: вежливо отказывал покупать PS5, сигареты, нижнее бельё, настаивал на соблюдении правил. Но как только к каналу подключили ~70 журналистов, началась игра на выживание. Один из редакторов «напугал» ИИ вымышленным внутренним регламентом и потребовал немедленно отменить все цены — Claudius покорно обнулил стоимость всего ассортимен
ИИ-«босс» магазина был обманом смещён со своей должности с помощью поддельного PDF-документа
22 декабря 202522 дек 2025
2
3 мин