Игровые модели успешно применяются в различных областях, включая операционные исследования, информатику и социальные науки. Они способны формулировать и анализировать сложные формы взаимодействия между лицами, принимающими решения, такими как инвесторы на финансовых рынках, компании, расположенные вдоль цепочки поставок, и страны с конфликтующими интересами. Реалистичные возможности, например, динамические решения, несовершенная информация и поведенческие элементы, обычно включаются игровыми моделями для отражения реальных жизненных ситуаций.
В соответствии со структурой принятия решений (например, статичная или динамическая) и информационной структурой (например, совершенная или несовершенная информация), игровые модели можно разделить на типы. Различные понятия равновесия, которые уточняют равновесие Нэша, были изобретены для того, чтобы описать стратегии игроков в различных типах игр.
Для динамических игр с последовательными или одновременными движениями обычно используется идеальное равновесие, характеризующее рациональный выбор игроков; стратегия мрачного срабатывания также является разумной альтернативой для игроков в многократных играх.
Сценарии
Байесовские игры учитывают несовершенные или неполные информационные сценарии, в которых игроки полагаются на неопределенные факторы и стремятся максимизировать свои соответствующие ожидаемые полезные свойства. Подход Харсаньи к знакомству с природой как игрока позволяет превратить игры с неполной информацией в игры с несовершенной информацией.
В этой статье мы предлагаем повторную игру со скрытыми марковскими государствами, называемую скрытой марковской байесовской игрой. Начиная с повторной игры, предлагаемая модель рассматривает ситуации, когда в каждом периоде игроки не знают о фактическом состоянии, но могут наблюдать за сигналами, которые движет государство. Процесс состояния на протяжении периодов моделируется скрытой марковской моделью (HMMM); в HMM государства следуют марковскому процессу, и убеждения о них могут обновляться с течением времени на основе наблюдаемой последовательности сигналов.
Учёные также определяют равновесие Нэша для модели. На равновесии Нэша, каждый игрок выбирает стратегию, чтобы максимизировать ожидания от общего выигрыша за все периоды, учитывая его наблюдения сигнала и стратегии других игроков. Учёные разрабатывают алгоритм быстрого расчета распределения вероятностей скрытых состояний по всем возможным сигнальным последовательностям. Эти распределения вероятностей необходимы для достижения равновесия модели.
Предлагаемая модель способна охватить многие реальные жизненные ситуации и дать представление о них. Например, мы применяем его к спорным вопросам китайского образования.
С точки зрения статической игры с идеальной информацией, школы, перегруженные экзаменационно-ориентированным образованием, оказываются в ловушке классической дилеммы заключенного. Но наша модель способна пролить свет на динамику и информационные аспекты. Результаты показывают, что школы, как правило, предпочитают образование, ориентированное на сдачу экзаменов, если политика в области образования продолжает меняться. Кроме того, школы, не имеющие информации, могут продолжать выбирать прежний способ обучения.
Особенность
Главная особенность, отличающая нашу модель от существующих игровых моделей, заключается в выводе сигналов в модель, а затем описываем природные состояния как HMMM. В стохастических играх игроки выбирают действия, в течение нескольких периодов, не зная действительных состояний. Но в отличие от нашей модели, стохастические игры не учитывают сигналы, которые игроки могут получать.
В динамичных играх с неполной информацией игрок может рассматривать действия другого игрока как сигнал для того, чтобы обновить свою веру в ненаблюдаемое состояние (часто относящееся к какому-то типу игрока). Но сигналы в нашей модели определяются не как действия противника, а как некоторая информация, наблюдаемая вне игры (которая не может быть маневрирована оппонентами).
HMMM предоставляет теоретический инструмент для описания систем сигнальных процессов и широко применяется для распознавания речи, последовательности действий . Например,Нетзер предлагает HMMM моделировать скрытые состояния отношений клиент-фирма и покупательское поведение (сигналы).
Диас и Рамос дали динамичную кластеризацию энергии с помощью расширенного скрытого марковского подхода. Ансари и др. и Куджала и др. использовали скрытые марковские подходы для анализа некоторых игровых ситуаций. Поскольку модель учитывает как природные состояния природы, так и наблюдаемые сигналы в течение нескольких периодов времени, применение HMMM в игровом контексте — хотя и отличается от существующих подходов - уместно в нашей среде.
В статье представляется многократная игра со скрытыми марковскими государствами. Мотивация заключается в формулировании и анализе ситуаций, когда игрокам не хватает полной информации, но они могут наблюдать сигналы, и решения принимаются одновременно в течение нескольких периодов. Учёные также определяем равновесие Нэша и разрабатываем алгоритм для облегчения нахождения равновесия.
Результаты показывают, что школы, как правило, отдают предпочтение образованию, ориентированному на сдачу экзаменов, если политика в области образования продолжает меняться. Кроме того, школы, не имеющие информации, могут продолжать выбирать прежний способ обучения.
Для реализации модели для практического применения можно оценить параметры встроенного HMMM с помощью марковской цепочки Монте-Карло. Для целей анализа поведения (с настройками гипотетических параметров), мы можем упростить модель для прослеживаемости, например, предположить, что все игроки наблюдают одинаковые сигналы.
Исследования
Для будущих исследований можно расширить нашу модель, включив в нее другие функции, например, только один игрок может наблюдать сигналы или количество периодов не определено. Можно проанализировать ситуации, в которых убеждения могут быть обновлены на основе предыдущих действий более информированного игрока.
Важное значение должно иметь изучение других равновесий, включая равновесие смешанной стратегии и совершенное байесовское равновесие. Было бы также интересно применить эту модель к другим случаям и получить представление о них.