Исследователи из компании DeepMind и Эксетерского университета разработали алгоритм выбора экономической политики, наилучшим образом отражающей предпочтения общества. Авторы использовали простую экономическую игру, в которой люди получали средства, вкладывали их по своему усмотрению в общее дело и получали прибыль, распределение которой варьировалось в зависимости от применяемой политики каждого участника.
Группа игроков состояла из четырех добровольцев. В начале игры каждый из них получал монеты: один — 10, другие — от двух до 10. Каждый игрок мог вложить произвольную сумму (в пределах доступного количества монет) в общий фонд, который увеличивал средства на 60%. После этого средства распределялись согласно применяемой политике распределения и процесс повторялся заново в течение 10 раундов (за исключением раздачи первоначальных средств, которое происходило только перед первым раундом).
Прибыль распределялась по одному из трех простых механизмов:
- эгалитарный, при котором прибыль распределяется равным образом, вне зависимости от того, кто сколько вложил,
- либертарианский, при котором прибыль распределяется соразмерно вложениям,
- либертарно-эгалитарный, при котором прибыль распределяется в зависимости от того, какую долю от своих накоплений вложил каждый игрок.
В итоге нейросетевому алгоритму, обученному на результатах игры, удалось выработать политику распределения средств, отчасти похожую на либертарно-эгалитарную. Например, он отдавал предпочтение участникам, вкладывавшим примерно половину своего состояния. Кроме того, он оказался более выгодным для тех, кто начинал игру с небольшим состоянием.