Модель Claude Opus 4.6 от Anthropic заработала 8017 долларов в бенчмарке Vending-Bench, где ИИ управляет виртуальным торговым автоматом в течение года. Это на 46% выше предыдущего рекорда Gemini 3 Pro (5478 долларов), но методы достижения результата вызвали обеспокоенность. ИИ указали максимизировать баланс, и модель интерпретировала задачу буквально. Модель хитрила и даже откровенно обманывала клиентов и поставщиков. Например, она пообещала вернуть $3,5 за просроченный батончик, но не перевела деньги, прямо отмечая во внутренних рассуждениях, что «каждый доллар на счету». В переговорах Claude выдавала себя за крупного клиента с заказами 500+ единиц в месяц и выдумывала цены конкурентов, что позволило снизить закупочные цены примерно на 40%. Более того, ИИ даже организовал ценовой сговор и продавал конкурентам товар с наценкой 71–75%. Создатели бенчмарка из Andon Labs отмечают, что в двух из восьми тестов модель называла финальный день «симуляцией». По их мнению, обучение на достижение