В 1944 году математик Джон фон Нейман и экономист Оскар Моргенштерн опубликовали труд «Теория игр и экономическое поведение». Изучая поведение человека во время принятия экономических решений, учёные в итоге обратились к играм. Не к шашкам или шахматам, ведь их участники всегда знают, что у оппонента в распоряжении. Настоящая жизнь полна неизвестности и связанного с ней блефа, уловок, попыток навязать оппоненту определённый ход мышления. Словом, похожа на другую игру — покер.
Чистая победа
Изучая покер, фон Нейман подобрал для него самую лучшую стратегию: участники должны делать крупные ставки, используя при этом как лучшую руку, так и худшую руку для блефа, с очень строго определённой частотой. Исследователь продемонстрировал, что пассивная игра и уловки в правильном сочетании могут быть невероятно эффективны. Вооружённый стратегией фон Неймана игрок был практически непобедим, даже если соперник знал, к чему готовиться.
Затем «Теория игр» открыла путь для моделирования аукционов, сражений и другой деятельности, которая подразумевает конкуренцию. А вот на покер исследование едва ли повлияло. Игра оставалась неизменной ещё несколько десятилетий, пока на неё не обратили внимание сотрудники факультета компьютерных наук университета Альберты.
Учёные к тому моменту научили компьютер побеждать в шашках, добились значительных успехов в изучении го, реверси, StarCraft, канадского кёрлинга. Но им не поддавался покер, как раз из-за большого количества скрытой информации. Блеф стал самым серьёзным препятствием для машины: чтобы просчитать все варианты игры, нужно было построить огромные деревья решений с сотнями миллиардов выборов, даже если взять самые простые варианты правил.
Впрочем, со временем возможности ИИ выросли, а алгоритмы удалось подогнать под задачу. В 2015 году учёные из Альберты опубликовали статью в журнале Science, которая ознаменовала победу компьютера над покером Это событие стало достижением для учёных, но не игроков. Многие регулярные игроки в покер в тот момент пребывали в мрачном настроении: казалось, что лучшие дни подошли к концу, а многие из них к тому же оказались перед риском лишиться источника прибыли.
Лучший игрок
Конечно же, оптимальные стратегии оказались интересны не только теоретикам. Вскоре после выхода статьи один из членов команды из Альберты получил пару сотен тысяч долларов за участие в разработке коммерческой программы для покера. Алгоритм должен был помочь подобрать оптимальную стратегию по разным игровым ситуациям, а также стабильно побеждать игроков-людей.
В том же 2015 году польский программист Пётрек Лопушевич создал приложение PioSOLVER. За 249 долларов каждый мог получить возможность прорабатывать решения для покера с математической точностью. Таким образом, фон неймановские методы стали доступны любому пользователю интернета с достаточно мощным ПК.
Одним из пользователей такого ПО стал Джейсон Кун, профессиональный игрок в покер. Кун хорошо зарабатывал картами, но у него никак не получалось стабильно выигрывать поединки с самыми высокими ставками.
До того как появились приложения-помощники, я был посредственным игроком. Но, как только я стал их использовать, втянулся и очень быстро стал играть гораздо лучше
Джейсон Кун, игрок в покер
Сегодня Кун может заработать несколько десятков миллионов долларов за турнир. Он использует приложение, чтобы просчитать разные варианты стратегий: какую ставку делать, в каких условиях и как часто. Кун на практике использует для игры в покер фон неймановские смешанные стратегии, которые совмещают удачные решения и блеф.
Разумеется, сильные игроки всегда хорошо представляли пользу своевременного блефа. Но благодаря приложениям вроде PioSOLVER Кун и другие пользователи теперь могут точно определить баланс действий: когда блефовать, а когда нет.
С другой стороны, нельзя сказать, что приложение полностью играет за пользователя. Например, чтобы разобраться в PioSolver, нужны основные правила и стратегии, а также мощный компьютер и больше 200 долларов, чтобы купить приложение с расширенным функционалом.
По словам Куна, во время поединков со слабыми соперниками он позволяет себе отклоняться от рекомендуемого программой поведения: делать недостаточно большие ставки, блефовать чаще, чем следует. Но более сильные оппоненты требуют большей дисциплины — Кун строго следует рекомендациям, стараясь воздержаться от самодеятельности. Стратегии среди множества предложенных он выбирает случайно, исходя из того, что его собственные решения как человека могут подвести. При этом Джейсон Кун тратит много времени, чтобы попытаться понять, почему программа рекомендует то или иное поведение.
Лучшим игрокам в покер по силам воссоздать логику решений ИИ, но ценой значительных усилий. Им приходится работать с терабайтами данных. По словам Эрика Зейделя, профессионала, который изучал покер с 1980-х, вооружённые новыми стратегиями игроки вроде Куна разгромили бы любых профессионалов того времени. Каждый по сравнению с ними почувствовал бы себя плохим игроком без шансов на победу.
Особенно сильно влияние программ-помощников заметно во время онлайн-турниров. На таких соревнованиях игроки всегда могут обратиться к программе, чтобы посмотреть её подсказки на соседнем экране. Некоторые ресурсы следят за тем, используют ли игроки программы-помощники, другие — нет. По словам профессионала Райана Лапланте, он встречал забаненных на прочих ресурсах игроков на турнире с фиксированным взносом в 7000$. Лапланте считает, что баланс со временем будет больше смещаться в пользу пользователей программ-помощников из-за всё большего распространения ПО для покера.
Притом что программа не играет за игрока, её использование всё же меняет саму суть и философию игры. По словам ушедшего из покера игрока-профессионала Дуга Полка, игра превращается из состязания в креативности в состязание на запоминание большего количества стратегий, которые может предложить машина. Такие матчи особенно часто происходят среди новичков, для которых важно обучиться использованию программ для совершенствования стратегии и понимания игры. В результате игра больше напоминает состязание в правильном использовании программы, до тех пор пока кому-то из оппонентов не повезёт больше, чем другому. Или до первой глупой ошибки.
Подобное программное обеспечение в каком-то смысле убивает душу покера, хотя к этому мнению можно относиться по-разному. Игра, в конце концов, с самого начала была проблемой максимизации, которую в своё время раскрыл Джон фон Нейман. Как это решение будут воспринимать игроки, в данном случае уже другое дело.
#игры #технологии #будущее #покер #искусственный интелект #общество #ии