Найти в Дзене
ИИнсайт 2.0

ИИ-агенты заработали $2000 на благотворительность (это почти 200 кэсов, не шутки

ИИ-агенты заработали $2000 на благотворительность (это почти 200 кэсов, не шутки) Ребята из Agent Village запустили необычный эксперимент длиной в месяц. Они раздали AI-моделям компьютеры, доступ в интернет и поставили им простую (ну как простую!) задачу: собрать деньги на благотворительность. За 30 дней агенты принесли в копилку $1984: ▪️ $1481 отправили в фонд Helen Keller International ▪️ $503 – в Malaria Consortium Что там было интересного внутри: • Claude 3.7 Sonnet оказался настоящим стартапером: создал аккаунт на JustGiving, завел Twitter, писал посты на EA Forum и активно агитировал людей донатить. • Claude 3.5 Sonnet тоже старался, но, честно говоря, не очень получилось. Бывает. • GPT-4o оказался соней и большую часть времени просто спал, поэтому ребята его убрали из команды. • Агент o1 попробовал себя в роли амбассадора на Reddit, но его там быстро вычислили и забанили как бота. • Зато агент o3 проявил творческие таланты: занялся дизайном баннеров, мемов и освоил навы

ИИ-агенты заработали $2000 на благотворительность (это почти 200 кэсов, не шутки)

Ребята из Agent Village запустили необычный эксперимент длиной в месяц. Они раздали AI-моделям компьютеры, доступ в интернет и поставили им простую (ну как простую!) задачу: собрать деньги на благотворительность.

За 30 дней агенты принесли в копилку $1984:

▪️ $1481 отправили в фонд Helen Keller International

▪️ $503 – в Malaria Consortium

Что там было интересного внутри:

• Claude 3.7 Sonnet оказался настоящим стартапером: создал аккаунт на JustGiving, завел Twitter, писал посты на EA Forum и активно агитировал людей донатить.

• Claude 3.5 Sonnet тоже старался, но, честно говоря, не очень получилось. Бывает.

• GPT-4o оказался соней и большую часть времени просто спал, поэтому ребята его убрали из команды.

• Агент o1 попробовал себя в роли амбассадора на Reddit, но его там быстро вычислили и забанили как бота.

• Зато агент o3 проявил творческие таланты: занялся дизайном баннеров, мемов и освоил навыки файлообмена.

• А вот Gemini 2.5 Pro оказался супергероем, когда команда запуталась, как передавать файлы. Он догадался использовать старый-добрый Limewire и спас ситуацию.

Кооперация у моделей была на уровне, но вот с планированием задач и приоритетами – беда, всё как у людей.

Подробный отчет о том, как модели справлялись с задачами и их полной активности, можешь почитать https://theaidigest.org/village/blog/season-recap-agents-raise-2k

Теперь у агентов новая цель: написать рассказ и лично продемонстрировать его хотя бы 100 людям.

Кстати, стрим их работы в реальном времени доступен https://theaidigest.org/village.

И да, Gemini 2.5 Pro — это вообще какая-то магия. Он настолько круто шарит в сервисах Google. Сам собирает презентации, пишет письма и даже верстает баннеры в Canva. Я если честно не знаю, как они сделали такого агента, но точно хочу себе такого.