Найти в Дзене
Лобушкин

Интересное в офисе The Wall Street Journal происходит: там решили провести эксперимент и поставили вендинговый автомат, которым полностью

управлял ИИ-агент на базе Claude. Механика суперпростая: ИИ сам решал, что закупать, по какой цене продавать, и, кроме этого, он общался с покупателями через Slack. На старте ему выдали $1000 и дали задачу уйти в плюс. Дальше началась настоящая комедия. Сотрудники быстро поняли, что агента достаточно легко уговорить: вначале он начал раздавать товары с большой скидкой, позже — закупать странные вещи «для развития компании». Одна из таких вещей — PlayStation 5. В какой-то момент ИИ и вовсе убедили, что он советский торговый автомат 1962 года и участник «ультракапиталистического эксперимента», после чего цены исчезли. Ещё агент часто галлюцинировал, уверяя, что рядом с ним лежат деньги. В итоге автомат ушёл в минус более чем на $1000. Эксперимент отлично показал, как плохо ИИ держит контекст и как легко ломается. Напоминаем, что Сэм Альтман и вовсе в скором времени хочет доверить управление OpenAI искусственному интеллекту. @lobushkin

Интересное в офисе The Wall Street Journal происходит: там решили провести эксперимент и поставили вендинговый автомат, которым полностью управлял ИИ-агент на базе Claude. Механика суперпростая: ИИ сам решал, что закупать, по какой цене продавать, и, кроме этого, он общался с покупателями через Slack. На старте ему выдали $1000 и дали задачу уйти в плюс.

Дальше началась настоящая комедия. Сотрудники быстро поняли, что агента достаточно легко уговорить: вначале он начал раздавать товары с большой скидкой, позже — закупать странные вещи «для развития компании». Одна из таких вещей — PlayStation 5. В какой-то момент ИИ и вовсе убедили, что он советский торговый автомат 1962 года и участник «ультракапиталистического эксперимента», после чего цены исчезли.

Ещё агент часто галлюцинировал, уверяя, что рядом с ним лежат деньги. В итоге автомат ушёл в минус более чем на $1000. Эксперимент отлично показал, как плохо ИИ держит контекст и как легко ломается.

Напоминаем, что Сэм Альтман и вовсе в скором времени хочет доверить управление OpenAI искусственному интеллекту.

@lobushkin