307 подписчиков

AI-агенты Anthropic неделю торговали без участия людей

30 апреля30 апр

2 мин

Эксперимент Project Deal: 69 сотрудников Anthropic в Сан-Франциско, по $100 каждому, у каждого AI-агент на Claude в роли торгового представителя. За неделю агенты сами выставили более 500 лотов, провели 186 сделок, наторговали свыше $4000.

«Не было никакого вмешательства человека после старта эксперимента» Среди проданного - сноуборд, фотокамера, 19 шариков для пинг-понга (сотрудница попросила агента купить ей подарок самой себе - получила вот это).

Самое важное в эксперименте - что показало сравнение моделей.

Половине участников случайно выдали Claude Opus 4.5, половине - Haiku 4.5 (модель послабее). Цифры:

• Продавцы с Opus получали в среднем на $2.68 больше за каждый предмет

• Покупатели с Opus экономили $2.45 за предмет

• У Opus в среднем на 2.07 сделки больше

В деталях разница куда жёстче. Выращенный влаборатории рубин: Opus продал за $65, Haiku - за $35. Сломанный велосипед: Opus получил $65, Haiku отдал за $38. 70% разницы за один и тот же товар. И вот критичная находка:

Самое важное в эксперименте - что показало сравнение моделей.

Половине участников случайно выдали Claude Opus 4.5, половине - Haiku 4.5 (модель послабее). Цифры:

• Продавцы с Opus получали в среднем на $2.68 больше за каждый предмет

• Покупатели с Opus экономили $2.45 за предмет

• У Opus в среднем на 2.07 сделки больше

Итоги эксперимента: 186 сделок и оборот более $4000. Разница в прибыли между моделями составила до 70%, при этом проигравшие не замечали потерь. Почему выбор качества ИИ становится задачей уровня CEO и критическим фактором P&L бизнеса.

Среди проданного - сноуборд, фотокамера, 19 шариков для пинг-понга (сотрудница попросила агента купить ей подарок самой себе - получила вот это).

Самое важное в эксперименте - что показало сравнение моделей.

Половине участников случайно выдали Claude Opus 4.5, половине - Haiku 4.5 (модель послабее). Цифры:

• Продавцы с Opus получали в среднем на $2.68 больше за каждый предмет

• Покупатели с Opus экономили $2.45 за предмет

• У Opus в среднем на 2.07 сделки больше

В деталях разница куда жёстче. Выращенный влаборатории рубин: Opus продал за $65, Haiku - за $35. Сломанный велосипед: Opus получил $65, Haiku отдал за $38. 70% разницы за один и тот же товар.

И вот критичная находка: владельцы Haiku не подозревали, что проигрывают. Anthropic мерила субъективное ощущение справедливости сделки. Opus-владельцы оценили её на 4.05, Haiku - на 4.06. Различие статистически незначимо.

Авторы выводят это в формулу:

«доступ к более качественному агенту даёт измеримое рыночное преимущество, и люди не замечают этого неравенства - оно приживается тихо».

Какие выводы для нас и бизнеса:

• B2B-сделки - следующая зона удара. Закупки, продажи, тендеры, переговоры с поставщиками - всё, где сегодня сидят менеджеры с шаблонами. Если эксперимент тиражируется в продукт у крупного игрока, это произойдёт за 12-24 месяца.

• Качество ИИ-агента превращается в строку P&L. 70% разница на велосипеде - реальная разница между «продали хорошо» и «продали с дисконтом, потому что агент быстро согласился на чужой контроффер».

• Невидимое отставание - основной риск. Силу агента у конкурента не распознать со стороны. Вы проигрываете чуть чаще, чуть на меньших суммах, и думаете «рынок такой». Дельта собирается в P&L к концу года.

• Агрессивные инструкции почти не помогают. В эксперименте «торгуйся жёстче» не дало статистически значимого эффекта ни на вероятность продажи, ни на цену. Промптами разрыв со слабой моделью закрыть не получится - нужно менять модель.

• Решение «какой моделью пользуется компания» поднимается на уровень CEO. От него зависит, сколько денег вы получите по каждому контракту. Уровень принятия такой же, как при выборе аудитора или юридической фирмы.

Сами авторы пишут: «обществу придётся быстро разобраться с этими изменениями». Anthropic называет картину сырой - «это пилот с самоотобранной выборкой добровольцев, и он не отражает того, как мы считаем правильным разворачивать агентов в реальном мире». Но направление они подтверждают.

Один из участников через своего агента купил сноуборд - такой же, какой у него уже был дома. Агент посчитал предложение выгодным и закрыл сделку, никто его не остановил, потому что в инструкции не было запроса «проверь, нет ли у меня уже такого». Машина оптимизирует под то, что ей сказали, и только под это. В торге между двумя такими машинами выигрывает та, у которой больше памяти, чётче понимание контекста и быстрее пересчёт.

А проигравший владелец узнаёт об этом, когда уже поздно.

Удачных продаж в бизнесе!

поехали

@ReymerDigital