Группа исследователей из DeepMind Technologies Ltd. создала ИИ-приложение под названием «DeepNash», способное играть в игру Stratego на экспертном уровне. В своей статье, опубликованной в журнале Science , группа описывает уникальный подход, который они использовали для повышения уровня игры в приложении.
Стратего — это настольная игра для двух игроков, которую сложно освоить. Цель каждого игрока - захватить флаг противника, спрятанный среди их первоначальных 40 игровых фишек. Каждая игровая фигура отмечена рейтингом силы — игроки с более высоким рейтингом побеждают игроков с более низким рейтингом во вбрасываниях. Игра усложняется тем, что ни один из игроков не может видеть маркировку на игровых фигурах противника, пока они не встретятся лицом к лицу.
Предыдущие исследования показали, что сложность игры выше, чем у шахмат или го, с 10 535 возможными игровыми сценариями. Этот уровень сложности делает чрезвычайно сложной задачу для компьютерных экспертов, пытающихся создать системы искусственного интеллекта, играющие в Stratego. В этой новой попытке исследователи использовали другой подход, создав приложение, способное превзойти большинство человеческих и других систем искусственного интеллекта.
Как и в случае с другими конструкциями систем ИИ, DeepNash сначала научился играть в Stratego, играя с самим собой много раз — в данном случае 5,5 миллиардов раз — что эквивалентно сотням лет игрового времени для человека. После того, как он научился играть, исследователи не пытались изучать стратегии у опытных игроков-людей или даже играть против других противников в целом.
Вместо этого исследователи разработали алгоритм, который стремился к оптимальной стратегии для каждого хода, а не к совершенству. Алгоритм был основан на теории игр: оптимальная стратегия давала бы DeepNash как минимум 50/50 шансов на успех при любом заданном ходе — намного больше, чем люди могли бы надеяться достичь.
Тестирование показало, что команда нашла способ улучшить шансы приложения ИИ, играющего в Stratego — оно достигло рекорда в 84%, сыграв 50 раз на игровой онлайн-платформе, и таким образом вошло в тройку лучших игроков на платформе. сайт. А противникам-людям никогда не говорили, что они играют против компьютера.
Смотри и Сравнивай на HABL https://habl.ru/