Как ИИ учили блефовать?
Сообщения о том, что искусственный интеллект играет в шахматы и даже очень успешно, стали привычными. В покер машину тоже учили играть, однако на этот раз она победила сразу пятерых профессиональных игроков.
Как сообщает hi-news.ru, 12 дней система под названием Pluribus сражалась в нелегкой схватке в «Техасский холдем». Это одна из самых популярных разновидностей покера. Именно ее чаще всего можно наблюдать в шпионских фильмах. Выглядит это так: за стол садятся 6 игроков, которые постепенно делают ставки и выбывают из игры по одному до тех пор, пока не останется один победитель.
Сложность в обучении ИИ этой игре состояла в ограниченном количестве информации. В отличие от тех же шахмат машина знает только о том, какие карты у нее в наличии, а какие выложены на стол.
Сначала обучение было стандартным, система играла против самой себя. Затем ее научили предугадывать всего несколько ходов вперед, что позволило использовать максимальное количество ресурсов компьютера для развития такого полезного навыка, как блеф.
В результате машина научилась зарабатывать деньги, по 1000 долларов за час. Разумеется, в открытый доступ алгоритмы выкладываться не будут. Систему планируют использовать в благих целях, например, для обнаружения финансовых махинаций на рынке ценных бумаг.
Понравилась новость? Поддержите наш канал лайками!