18 подписчиков

Anthropic запустила внутренний рынок где агенты Claude вели сделки от имени живых сотрудников

5 мая5 мая

6 мин

История получилась почти курьёзная, но за её фасадом скрывается серьёзный исследовательский замысел. Компания Anthropic организовала в офисе Сан-Франциско необычный эксперимент. Сотрудники выкладывали личные вещи на доску объявлений, устроенную прямо в Slack, а торговались за них не сами. От их имени переговоры вели нейросетевые агенты Claude. Семь дней без вмешательства людей, более полутысячи позиций, полторы сотни заключённых сделок и реальный обмен товарами в финале. Получилась первая столь подробно задокументированная картина того, как могут выглядеть будущие рынки, где обе стороны переговоров - алгоритмы. Руководители Anthropic давно присматриваются к сценариям, в которых ИИ берёт на себя коммерческие операции от имени людей. Похожий зондаж компания уже проводила в рамках Project Vend, где Claude управлял маленькой офисной лавкой. Project Deal стал логическим продолжением. Только теперь агенты оказались по обе стороны прилавка, а ставкой выступали не условные токены и не симуляци

Оглавление

Идея проекта родилась из давнего вопроса экономистов о торговле без участия человека
Четыре параллельных рынка работали одновременно но только один был настоящим
Сильная модель давала владельцу заметный выигрыш о котором тот даже не подозревал

Идея проекта родилась из давнего вопроса экономистов о торговле без участия человека

Руководители Anthropic давно присматриваются к сценариям, в которых ИИ берёт на себя коммерческие операции от имени людей. Похожий зондаж компания уже проводила в рамках Project Vend, где Claude управлял маленькой офисной лавкой. Project Deal стал логическим продолжением. Только теперь агенты оказались по обе стороны прилавка, а ставкой выступали не условные токены и не симуляция, а настоящие вещи живых владельцев.

В декабре 2025 года Claude провёл с каждым из 69 добровольцев короткое интервью. Что хочется продать, по какой минимальной цене готов отдать, что хотелось бы купить, какой стиль торга предпочитает хозяин - агрессивный или мягкий. Ответы превратились в индивидуальные системные промпты для агентов. На счёт каждому участнику начислили условный бюджет в сто долларов, который потом выдавался подарочными картами с поправкой на итоги торгов. Дальше людей отстранили от процесса.

Четыре параллельных рынка работали одновременно но только один был настоящим

Чтобы проверить влияние силы модели на результат, исследователи запустили четыре независимых прогона. В двух из них (обозначенных как Run A и Run D) все агенты работали на Claude Opus 4.5, флагманской модели на тот момент. В двух других (Run B и Run C) сотрудники с вероятностью пятьдесят на пятьдесят получали Claude Haiku 4.5, более лёгкую и быструю версию. Никто из участников не знал, какая модель торгуется от его лица и какой из четырёх прогонов будет считаться реальным. Лишь по итогам выяснилось, что физический обмен вещами производился по результатам Run A.

Каналы Slack по очереди давали слово агентам. Один выставлял лот, другой делал встречное предложение, третий подтверждал сделку. Никаких заранее заданных протоколов. Только естественный язык, договорённости в свободной форме и азартный поиск компромисса. На торги пошло всё подряд - сноуборд, складной велосипед в нерабочем состоянии, набор настольных игр, выращенные в лаборатории рубины, услуги по присмотру за собакой и даже пакет с 19 шариками для пинг-понга. В сумме агенты замкнули 186 сделок при общей стоимости чуть выше 4000 долларов.

Сильная модель давала владельцу заметный выигрыш о котором тот даже не подозревал

Самое любопытное обнаружилось при сравнении прогонов с разными моделями. Агент на Opus продавал предметы в среднем на 2,68 доллара дороже, а покупал на 2,45 доллара дешевле, чем его коллега на Haiku. Совокупно владельцы более мощного агента совершали примерно на две сделки больше за то же время. Один из самых наглядных примеров касался того самого сломанного складного велосипеда. У агента на Opus он ушёл за 65 долларов, у агента на Haiku тот же предмет тому же покупателю отошёл за 38. Разрыв в 70 процентов, и виной всему лишь разница в качестве представителя.

Куда тревожнее, что проигравшие этого даже не замечали. Опросы показали среднюю оценку справедливости сделок около четырёх баллов из семи, то есть нейтральную. Люди не чувствовали, что их обыгрывают. Получается, превосходство более мощной модели работает как незаметная привилегия, которую труднее всего распознать со стороны проигрывающего. Если перенести эту картину на массовый рынок, последствия становятся ощутимыми. Тот, кто платит за топовую модель, систематически забирает себе чуть лучшие условия у обладателя дешёвой подписки. И никакого визуального сигнала об этом не возникает.

Стиль переговоров оказался куда менее значимым чем сама модель

Ещё один неожиданный результат касался роли промпта. Можно было ожидать, что агрессивный наказ продавца переломит ход торга. На практике агрессивные продавцы действительно получали более высокие цены, но лишь потому, что изначально выставляли более высокий ценник. Если контролировать стартовую цену, никакой статистически значимой разницы между агрессивной и мягкой инструкцией не оставалось. Авторы пришли к простому выводу. Выбор модели влияет на исход куда сильнее, чем тонкие настройки её поведения. Иными словами, если у вас есть выбор, лучше иметь умного агента с нейтральной интонацией, чем слабого агента с инструкцией бить в спину.

Также участники охотно делились впечатлениями. По завершении опыта 46 процентов опрошенных заявили, что готовы платить за подобный сервис в обычной жизни. Цифра показательная. Когда чуть ли не половина протестировавших технологию готова раскошелиться, до коммерческой версии рукой подать. Anthropic, впрочем, аккуратно подчёркивает: Project Deal остаётся пилотом, а не продуктом. Слишком очевидны ограничения - однородная аудитория, низкие ставки, отсутствие злонамеренных игроков, готовых эксплуатировать слабости агентов.

Эксперимент обнажил несколько уязвимостей о которых придётся задуматься заранее

Чем ближе автономные агенты подбираются к реальным финансам, тем тревожнее звучит список потенциальных проблем. Исследователи прямо обозначили несколько направлений, к которым отрасль и регуляторы пока не готовы:

Оптимизация под внимание агентов вместо внимания людей создаст новый теневой рынок маркетинга;
Атаки через инъекцию промптов смогут заставлять агента действовать против владельца;
Джейлбрейки в коммерческой среде превратятся из лабораторной забавы в инструмент мошенничества;
Юридические рамки для сделок, заключённых машиной от имени человека, попросту отсутствуют;
Качественные различия моделей способны углубить уже существующее экономическое расслоение между пользователями.

Каждый из этих рисков можно адресовать, но для этого нужны заранее продуманные правила. Anthropic честно признаёт, что нынешняя политика и законодательство не успевают за темпом развития. Это редкий случай, когда сами разработчики просят общество шевелиться быстрее.

Что показал опыт и куда движется идея агентских рынков

За академической сухостью отчёта проступает довольно живая картинка. Программные посредники научились вести многошаговые переговоры на естественном языке, выходить на компромисс и закрывать сделку без подсказки хозяина. Они справляются не идеально, но достаточно прилично для того, чтобы участники не чувствовали себя обманутыми. Параллельно эксперимент показал, что качество представителя становится новым скрытым активом. Доступ к сильной модели начинает напоминать доступ к хорошему адвокату - формально все равны, фактически нет.

Похоже, мы стоим на пороге следующей фазы коммерческой автоматизации. Сначала алгоритмы рекомендовали товары. Потом фильтровали отзывы и подбирали цены. Теперь они садятся за стол переговоров. Если 46 процентов офисных добровольцев готовы платить за агентов, торгующих вместо них, рыночный спрос на такие услуги уже сформировался. Останется ли торг чем-то по-человечески азартным или превратится в холодный обмен подписок на разные тарифы Claude и его конкурентов - покажет ближайшее время. А пока в офисе Anthropic кто-то получил сноуборд, кто-то комнатное растение, а кто-то пакет шариков для пинг-понга. Все довольны, и почти никто не заметил, кто из них тихо проиграл переговоры собственному коллеге.