Эксперимент Project Deal: 69 сотрудников Anthropic в Сан-Франциско, по $100 каждому, у каждого AI-агент на Claude в роли торгового представителя. За неделю агенты сами выставили более 500 лотов, провели 186 сделок, наторговали свыше $4000.
«Не было никакого вмешательства человека после старта эксперимента» Среди проданного - сноуборд, фотокамера, 19 шариков для пинг-понга (сотрудница попросила агента купить ей подарок самой себе - получила вот это).
Самое важное в эксперименте - что показало сравнение моделей.
Половине участников случайно выдали Claude Opus 4.5, половине - Haiku 4.5 (модель послабее). Цифры:
• Продавцы с Opus получали в среднем на $2.68 больше за каждый предмет
• Покупатели с Opus экономили $2.45 за предмет
• У Opus в среднем на 2.07 сделки больше
В деталях разница куда жёстче. Выращенный влаборатории рубин: Opus продал за $65, Haiku - за $35. Сломанный велосипед: Opus получил $65, Haiku отдал за $38. 70% разницы за один и тот же товар. И вот критичная находка: