Найти тему
Video Games

Исследования по теории игр лучше распределяют военные ресурсы

https://cdn.pixabay.com/photo/2017/12/10/17/00/robot-3010309_960_720.jpg
https://cdn.pixabay.com/photo/2017/12/10/17/00/robot-3010309_960_720.jpg

Исследования теории игр армии США с использованием искусственного интеллекта могут помочь в лечении рака и других заболеваний, улучшить кибербезопасность, более эффективно развертывать солдат и средства и даже выиграть в покер.

Новые исследования, опубликованные в журнале Science и проведенные учеными Университета Карнеги-Меллон(Carnegie Mellon), разработали программу искусственного интеллекта под названием Pluribus, которая одержала победу над ведущими профессионалами в шестипользовательском безлимитном техасском холдем покер.

Армия и Национальный научный фонд финансировали математическое моделирование части исследования, в то время как финансирование со стороны Facebook было специфическим для покера.

"Все дело в стратегии", - сказал доктор Пуруш Айер (Purush Iyer), начальник отдела сетевых исследований в Исследовательском отделе Сухопутных войск, входящем в Исследовательскую лабораторию Сухопутных войск Командования Сухопутных войск США по развитию боевых возможностей. Покер - доступный пример того, как эти математические модели могут быть использованы для разработки стратегий в ситуациях, когда человек не имеет полной информации - он не знает, что будут делать противники и каковы их возможности".

По его словам, данное исследование чрезвычайно актуально для решения многих реальных и военных задач, в которые вовлечены различные стороны, таких как кибербезопасность и оборона.

Покер является вызовом ИИ, потому что это неполная информационная игра, в которой игроки не могут быть уверены, какие карты находятся в игре, а противники могут и будут блефовать, так же как и военная стратегия.

"До сих пор сверхчеловеческий ИИ в стратегическом мышлении ограничивался двухсторонней конкуренцией", - сказал доктор Туомас Сандхольм (Tuomas Sandholm), профессор информатики Angel Jordan, разработавший Pluribus вместе с Ноамом Брауном (Noam Brown), который заканчивает докторскую степень в отделе информатики Карнеги Меллон (Carnegie Mellon) в качестве ученого-исследователя в ИИ Facebook.

"Играть в шестипользовательскую игру, а не играть лицом к лицу, требует фундаментальных изменений в том, как ИИ развивает свою игровую стратегию", - сказал Браун, который присоединился к ИИ Facebook в прошлом году.

Pluribus пренебрегает теоретическими гарантиями успеха и, тем не менее, разрабатывает стратегии, которые позволяют ему последовательно переигрывать соперников. Pluribus сначала вычисляет чертеж стратегии, играя в шесть копий самого себя, что достаточно для первого раунда ставок. С этого момента Pluribus делает более детальный поиск возможных ходов в более тонкой абстракции игры. При этом он смотрит вперёд на несколько ходов, но не требует заглядывать вперёд до конца игры, что было бы запретительно с точки зрения вычислений. Поиск с ограниченной перспективой является стандартным подходом в играх с совершенной информацией, но чрезвычайно сложен в играх с несовершенной информацией. Новый алгоритм поиска с ограниченной перспективой является основным прорывом, который позволил Pluribus достичь сверхчеловеческого многопользовательского покера.

Программное обеспечение также стремится быть непредсказуемым. Например, ставка имела бы смысл, если бы ИИ держал лучшую руку, но если бы ИИ делал ставки только тогда, когда у него лучшая рука, оппоненты быстро бы догнали бы его. Поэтому Pluribus рассчитывает, как бы он действовал с каждой возможной рукой, которую он мог бы держать, а затем вычисляет стратегию, которая сбалансирована по всем этим возможностям.

При финансовой поддержке армии Сандхольм и некоторые другие его студенты разрабатывают соответствующие методы био-стирения, где исследователи вычисляют оптимальные планы лечения, которые управляют иммунной системой пациента для лучшей борьбы с раковыми заболеваниями, аутоиммунными заболеваниями, инфекциями и т.д.

Предыдущие исследования в области теории игр, финансируемые армией, в настоящее время используются Управлением транспортной безопасности, Береговой охраной США и метрополитеном Лос-Анджелеса для планирования ресурсов таким образом, чтобы снизить затраты для тех организаций, которые обеспечивают безопасность, увеличивая при этом затраты для противника, таким образом, снижая шансы на атаку.

Кроме того, финансируемые армией фундаментальные исследования в области алгоритмической теории игр были использованы в гражданском обществе для сокращения браконьерства слонов в лесу королевы Елизаветы, Уганда, и тигров в Юго-Восточной Азии, а также для решения проблемы бездомных и проведения кампаний по профилактике ВИЧ в Лос-Анджелесе.

"Исследовательская работа доктора Сандхольма и других специалистов в недалеком будущем будет использована самыми разными способами для экономически эффективного решения социальных проблем", - сказал Айер.

Исследовательская лаборатория армии CCDC (ARL) является элементом Командования по развитию боевых возможностей армии США. Являясь корпоративной исследовательской лабораторией армии, ARL обнаруживает, вводит новшества и осуществляет переходы в науке и технике для обеспечения доминирующей стратегической власти на суше. Посредством сотрудничества по всем основным техническим компетенциям командования, CCDC лидирует в открытии, развитии и доставке основанных на технологиях возможностей, необходимых для того, чтобы сделать солдат более смертоносными для победы в войнах нашей нации и безопасного возвращения домой. CCDC является основным подчиненным командованием Командования Сухопутных войск США.