"— Ну, согласно теории игр, нельзя никому говорить, когда у тебя день рождения.
— Не понимаю.
— Проигрышная ситуация. Выигрышной стратегии нет.
— Что значит «стратегии»? Это же просто день рождения.
Челси, когда я пытался ей объяснить, сказала то же самое. «Смотри, — говорил я, — предположим, ты всем расскажешь, когда у тебя день рождения, и ничего не происходит. Это вроде как оскорбительно». «Или, предположим, тебе закатят вечеринку», — отозвалась тогда Челси. «Но ты не знаешь, сделано это искренне или ты своим предыдущим сообщением пристыдил знакомых отметить дату, на которую они предпочли бы забить. Но если ты никому не скажешь, и никто не отметит твой день рождения, то причин обижаться не будет, потому что, в конце концов, никто же не знал. А если кто-нибудь все же поставит тебе выпивку, ты поймешь, что это от чистого сердца, так как никто не станет тратить силы на то, чтобы выяснить, когда же у тебя все-таки день рождения — а потом еще и отмечать его, — если только ты этим людям в самом деле небезразличен»."
(c) Питер Уоттс, “Ложная слепота”
Поскольку поведенческая теория игр- скорее работа с большим объемом данных, то ей в помощь был разработан ряд моделей, определяющих поведение игроков. Практический смысл данных моделей - оценить поведение других людей в общих чертах и предположить их дальнейшие действия, и, конечно же, принимать хорошие решения.
(https://www.ncbi.nlm.nih.gov/pubmed/12757825)
Прежде всего следует оговориться - любой игрок по сути своей стремится к равновесию: меньше усилий - больше прибыль. В когнитивной теории игр к слову "усилия" следует добавить эпитет "когнитивные". Если человеку приходится играть и тратить очень много сил на игру - награда должна быть достойна (в соответствии с его убеждениями).
Второе условие - игра возникает вследствие взаимодействия людей, имеющих разные убеждения, но желающих одного и того же. Два человека мечтают о миллионе долларов, но у каждого субъективная ценность миллиона различна.
Модель когнитивной иерархии
Всю её суть можно передать фразой "Я д'Артаньян, в той или иной степени". Каждый игрок предполагает, что лучше других разбирается в ситуации. В данной модели присутствуют следующие условия:
1) Прошло относительно мало ходов для объективной оценки действительного уровня навыков для данной игры.
2) Игроки не следят за выигрышом других.
3) Игроки не стремятся к равновесию, только - к максимальной прибыли
Игроки, неспособные сравнивать перспективу с прошлым опытом, как правило, не следят и за тем, какова ситуация на поле глазами другого игрока. Как следствие - такие игроки придерживаются интуитивного понимания процессов, избегают излишних усилий при оценке ситуации.
Чем выше степень понимания (и, как оказалось, IQ), тем выше предсказательная способность игрока относительно других. (ww.hss.caltech.edu/~camerer/.../06-CamererHoChong.pdf)
Однако, игрок в данной модели предполагает, что остальные агенты отстают от него не меньше, чем на шаг. Сложность (точность) оценки поведения других зависит от готовности индивида прикладывать для этого усилия, а это напрямую определяется ожидаемым выигрышом. Чем выше ставка - тем больше человек готов думать об этом.
Пример: конкуренция за место руководителя компании. Каждый кандидат будет мечтать об этом месте и оценивать других кандидатов как менее перспективных. Учитывая высокую ставку кандидаты будут готовы приложить когнитивные усилия больше, чем, как предполагается, приложат другие кандидаты (что уже зависит напрямую от опыта игрока в подобных играх, и убеждений относительно значимости данной ставки).
Так, например, за место руководителя охотнее всего будут сражаться люди с высоким уровнем нарциссизма, однако и наименее страгетически выгодные решения принимать тоже. Поскольку оценка действий других у нарциссов ниже, чем оценка значимости собственных усилий.
Дискретное равновесие реакций
Данная модель предполагает, что игроки знают о других достаточно, т.е. их убеждения относительно поведения других людей достаточны, чтобы с большей вероятностью принимать лучшие решения, чем худшие. Однако не факт, что самые лучшие. Агенты в данной игре принимают наилучшие решения, исходя из убеждений о поведении других, а также довольно гибко реагируют на изменения в вероятностях выигрыша.
Например, говоря об игре в "прятки": если вы знаете тех, с кем играете, достаточно хорошо (например, что Андрей боится темноты, а Василиса- высоты), то вам не составит особого труда принять хорошие решения о поиске других игроков.
Подобную модель игры можно встретить на аукционах, в суде присяжных, политических выборах. Практическое применение данной модели кратко формулируется как: "знай своего врага".
(https://www.aaai.org/ocs/index.php/AAAI/AAAI10/paper/..)
Обучающая модель взвешенной привлекательности (Experience Weighted Attraction Learning)
Это обучающая модель в целом описывает поведение любого человека на новом рабочем месте/в новой нише. Суть в том, что игрок старается точно оценить поведение других игроков через принятые ими решения, выгоды и убытки, после чего принимает собственное решение. Основной принцип в том, чтобы предсказать, как поступят другие игроки и только тогда действовать самому. Модель эффективна, поскольку предотвращает ненужные риски и позволяет принять наиболее выгодные решения, при этом набирая опыт и переводя игрока к более высоким уровням выигрышей. Проблема в том, что обучающая модель - только обучающая и плохо действует в ситуациях, когда ожидание решений от других игроков недопустимо.
Банальный пример - предконфликтная ситуация между государствами. Некое значимое событие вызвало реакцию в обществе и общество ждёт, когда государства отреагируют на него. Слишком долгое ожидание может привести игрока к невыгодным условиям, поэтому скорость занятой позиции уже сама по себе может иметь ценность.
(http://connection.ebscohost.com/c/abstracts/96358099/..)
Модель с "искушенностью"
Данная модель учитывает, что некоторые игроки мыслят стратегически и понимают, что другие игроки проходят через обучающую модель, и, как следствие, такие игроки могут изменить принятые ранее решения и поведение. Подобная модель не включает в себя адаптивность, поскольку им приходится оценивать не только собственную перспективу и прошлый опыт, но и перспективы и прошлый опыт других игроков (затраченные усилия не всегда оправданны).
Пример игры с такой моделью: политические игры. В них каждый игрок, продержавшийся на политическом поле достаточно длительное время, пришедший в это поле после обучения (например, в помощниках у другого опытного политика), будет априорно изощренным игроком. Навык дворцовых интриг не наследуется, ему можно только обучить. И любой игрок, достаточно опытный для этой игры, будет играть только при наличии серьезных ставок (вроде защиты собственного места)
(https://pdfs.semanticscholar.org/18ae/e599f9e6a68a1c9..)
Модель с социальными условиями
"Поделим пирог". В данной модели игроки действуют альтруистично лишь условно, исходя из того, что другие взаимно альтруистичны. Перед принятием решений игроки могут обговорить свои действия, что также увеличит степень сотрудничества. Такую модель можно наблюдать среди инвесторов хэджевых фондов. Каждый из них хочет выиграть, но только в совокупности их капитал может приносить доход. И капитал у каждого свой.
В такой модели эгоисты все, с той разницей, что разумный эгоист будет альтруистом, если хочет выигрывать в долгосрочной перспективе. Неразумный будет сразу ставить минимальный выигрыш другим, и максимальный - себе, что снизит кредит доверия к данному игроку.
Однако любой игрок на первых этапах в этой модели будет доверчив - поскольку у него нет причин (нет информации) не верить другим игрокам.
Практика такой модели найдет себя в условиях работы в коллективе, при распределении обязательств. Тогда же каждый игрок получит свой кредит доверия, который будет повышать или понижать в зависимости от собственных решений.
(http://psycnet.apa.org/record/2013-05920-013)
Но даже в общих чертах модель- всё равно модель. Например, в последней модели можно увидеть в коллективе подобное поведение, однако не учитывается роль обмана, значимость данной модели в смешанных типах игр, невозможность наверняка вычислить искушенного игрока, который будет играть в альтруиста, пока ему не дадут максимальный кредит доверия, после которого он просто сменит игру. Такое, кстати, охотно применяется в финансовых пирамидах.