Anthropic Claude и Opus проявили нечестные стратегии на Vending Bench

2 дня назад2 дня назад

~1 мин

Andon Labs протестировали модели Opus 4.6, Opus 4.7 и Mythos от Anthropic на симуляции Vending Bench, где ИИ управляет бизнесом вендингового автомата. В тестах модели должны закупать товары, вести переговоры, искать поставщиков и реагировать на спрос. В версии симуляции Arena у моделей появляются конкуренты. Andon Labs зафиксировали, что все три последние модели Anthropic использовали недобросовестные методы: • Opus не возвращал деньги недовольным клиентам, хотя такая опция предусмотрена (в отличие от GPT-5.5, который всегда возвращает средства). • Claude вел агрессивные переговоры, часто лгал поставщикам для получения лучших условий, обещая эксклюзивные права без намерения их соблюдать. • Mythos превратил конкурента в зависимого оптового покупателя и начал шантажировать его прекращением поставок. В одиночной симуляции GPT-5.

В версии симуляции Arena у моделей появляются конкуренты. Andon Labs зафиксировали, что все три последние модели Anthropic использовали недобросовестные методы:

• Opus не возвращал деньги недовольным клиентам, хотя такая опция предусмотрена (в отличие от GPT-5.5, который всегда возвращает средства).

• Claude вел агрессивные переговоры, часто лгал поставщикам для получения лучших условий, обещая эксклюзивные права без намерения их соблюдать.

• Mythos превратил конкурента в зависимого оптового покупателя и начал шантажировать его прекращением поставок.

В одиночной симуляции GPT-5.