Добавить в корзинуПозвонить
Найти в Дзене

Как всё оправдать

В статье «Рационально ли играть в казино?» я упустил один случай, на что мне вполне справедливо указали в комментариях. Человек может просто получать удовольствие от самого процесса игры. Мысль, в целом, очевидная, и именно поэтому я, скорее всего, её упустил. Очевидное не маркируется в голове как таковое, а выступает неявной посылкой в суждениях. Но если начать эту концепцию анализировать, всё становится гораздо сложнее. Давайте зайдём издалека. Существует так называемый парадокс Ньюкомба — один из краеугольных камней рациональности. Описание из Википедии: Предсказатель ставит перед игроком две коробки — открытую и закрытую. В открытой коробке находится тысяча долларов, в закрытой — либо миллион долларов, либо ничего. Игрок может взять себе или только закрытую коробку, или обе коробки вместе. Содержимое коробки зависит от предсказателя: Если он предскажет, что игрок выберет обе коробки, то закрытая коробка будет пустой. Если предсказывается, что игрок выберет закрытую коробку, то коро

В статье «Рационально ли играть в казино?» я упустил один случай, на что мне вполне справедливо указали в комментариях. Человек может просто получать удовольствие от самого процесса игры. Мысль, в целом, очевидная, и именно поэтому я, скорее всего, её упустил. Очевидное не маркируется в голове как таковое, а выступает неявной посылкой в суждениях. Но если начать эту концепцию анализировать, всё становится гораздо сложнее.

-2

Давайте зайдём издалека. Существует так называемый парадокс Ньюкомба — один из краеугольных камней рациональности. Описание из Википедии:

Предсказатель ставит перед игроком две коробки — открытую и закрытую. В открытой коробке находится тысяча долларов, в закрытой — либо миллион долларов, либо ничего. Игрок может взять себе или только закрытую коробку, или обе коробки вместе. Содержимое коробки зависит от предсказателя:
Если он предскажет, что игрок выберет обе коробки, то закрытая коробка будет пустой.
Если предсказывается, что игрок выберет закрытую коробку, то коробка будет содержать миллион долларов.
Какую коробку следует выбрать игроку, чтобы получить наибольшую сумму? Ему известны все условия игры, известно, что содержимое коробки зависит от предсказаний; единственное, что ему неизвестно, — это какое именно из двух предсказаний сделано.

Парадокс состоит в том, что рациональный агент не может получить в нём миллион долларов. Он будет рассуждать так: содержимое ящиков не может измениться, и миллион долларов в закрытой коробке уже либо есть, либо нет, так как 1 001 000 > 1 000 000, следует выбирать обе коробки. Только предсказатель знает, как будет мыслить рациональный агент, и закрытая коробка оказывается пустой. Все остальные просто выбирают закрытую коробку и получают миллион долларов.

Но теперь у нас есть решение проблемы. Добавим в модель рационалиста удовольствие от выбора закрытой коробки, которое перевесит дополнительную тысячу долларов. Действие не становится иррациональным, ведь в функцию полезности можно включать удовольствие. Так можно поступить с любой ситуацией, где действия рационалиста не соответствуют интуитивному выигрыванию.

Наверное, рациональность — это не попытка оправдать любой выбор, который кажется оптимальным, через удовольствие от его совершения. Рациональность — это метод выбора. Робот с матрицей готовых решений на все случаи жизни имитирует рационалиста, но им не является.

В случае казино ситуация обратная. Интуитивно иррациональное действие оправдывается удовольствием от его совершения. Это не запрещено математикой. Агент может оптимизировать любую функцию полезности. Вот только какой в этом смысл?

Это основная проблема оптимизации. Она говорит, как агент будет совершать выбор при имеющейся у него целевой функции, но никак не помогает её выбрать. Однако ошибка в процессе оптимизации должна быть безжалостно уничтожена. И, как мне кажется, часто введение удовольствия в функцию такую ошибку создаёт.

Внимательно посмотрите на парадокс Ньюкомба. Он возникает, потому что процесс принятия решения влияет на реальность. В классических задачах такое невозможно — с реальностью взаимодействует только результат выбора. Вводя концепцию удовольствия, вы получаете примерно то же самое, только наоборот. Она делает так, что реальность перестаёт влиять на процесс принятия решения. Решение становится обособленным от объективного результата и начинает зависеть от субъективного ощущения.

Фактически же разделение субъективного и объективного весьма условно. Всё сводится к удовольствию как от выигранных денег, так и от принятия риска. И эти два параметра в голове человека смешиваются! Он явно хочет выиграть денег и при этом неявно получает удовольствие от риска, которое прибавляется к удовольствию от выигрыша денег. То есть параметры оптимизации смешиваются. А так нельзя.

Короче говоря, корень зла в том, что никто не считает ожидаемую полезность. Можно получать удовольствие просто так, не от выигрыша, а от самого процесса? Можно, конечно. Только соизвольте нормально посчитать, сколько вы за это заплатите. Удовольствие от совершения действия — это не универсальное оправдание.

В примере из комментария вероятность выигрыша составляла 0,48. Математическое ожидание полученной суммы = 0,48 × 50 – 0,52 × 50 = –2. Ровно два рубля вы платите за удовольствие от самого процесса игры. Готовы столько заплатить?

Другое решение проблемы. Измените свою функцию полезности и перестаньте испытывать удовольствие от действий с отрицательным математическим ожиданием «объективной» полезности. Так будет проще.