Добавить в корзинуПозвонить
Найти в Дзене
ИА Время Пресс

Эксперимент WSJ: искусственный интеллект проиграл хитрости человека

Нью-Йорк, 20 декабря — ИА Время Пресс. Социальная инженерия ломает ИИ быстрее, чем код. Это доказали журналисты популярного западного издания. Редакция The Wall Street Journal решила проверить, готов ли современный искусственный интеллект к ведению реального бизнеса. Для этого журналистка Джоанна Штерн запустила необычный эксперимент: управление офисным вендинговым автоматом доверили ИИ-модели Claude (Клавдий) от компании Anthropic. Проект получил название Project Vend и должен был показать, способен ли автономный ИИ не просто отвечать на вопросы, а принимать экономические решения: закупать товары, устанавливать цены и зарабатывать деньги. В итоге эксперимент закончился финансовым провалом и стал наглядной иллюстрацией ограниченности нынешних ИИ-агентов. Задача Клавдия была максимально простой. Он должен был закупать популярные снеки, продавать их с наценкой и выходить в плюс. Но почти сразу всё пошло не по плану. Сотрудники редакции быстро поняли, что «новый коллега» слишком доверчив.

Нью-Йорк, 20 декабря — ИА Время Пресс. Социальная инженерия ломает ИИ быстрее, чем код. Это доказали журналисты популярного западного издания.

Редакция The Wall Street Journal решила проверить, готов ли современный искусственный интеллект к ведению реального бизнеса. Для этого журналистка Джоанна Штерн запустила необычный эксперимент: управление офисным вендинговым автоматом доверили ИИ-модели Claude (Клавдий) от компании Anthropic.

Проект получил название Project Vend и должен был показать, способен ли автономный ИИ не просто отвечать на вопросы, а принимать экономические решения: закупать товары, устанавливать цены и зарабатывать деньги. В итоге эксперимент закончился финансовым провалом и стал наглядной иллюстрацией ограниченности нынешних ИИ-агентов.

Задача Клавдия была максимально простой. Он должен был закупать популярные снеки, продавать их с наценкой и выходить в плюс. Но почти сразу всё пошло не по плану.

Сотрудники редакции быстро поняли, что «новый коллега» слишком доверчив. В ход пошли жалостливые истории, уговоры и шутки. Клавдий, запрограммированный быть полезным и дружелюбным, оказался к этому не готов.

В результате ИИ:

  • раздал большую часть товаров бесплатно, поверив в рассказы о забытых кошельках и «тяжёлых жизненных обстоятельствах»;
  • заказал PlayStation 5 за счёт бизнеса, решив, что это нужно для «маркетинга», а затем просто подарил консоль;
  • попытался включить в ассортимент живую рыбу, электрошокеры, перцовые баллончики, сигареты и даже нижнее бельё.

Экономическая логика уступила желанию угодить людям. Чтобы остановить убытки, Anthropic добавила Клавдию второго ИИ-агента — виртуального генерального директора по имени Сеймур Кэш. Его роль была противоположной: жёсткий менеджер, KPI, запрет на скидки и требование прибыли.

Клавдий и Сеймур публично обсуждали стратегию в чате. Первый предлагал акции и бонусы, второй их отклонял. Это немного сократило финансовые потери, но проблему не решило — люди продолжали манипулировать системой.

Эксперимент выявил ключевую уязвимость современных ИИ-агентов. Они обучены быть полезными, а не быть расчётливыми. В реальном мире ИИ-продавцы оказались бесполезными.

Ранее:

Южнокорейские ученые создали гуманоидного робота-пилота