Это была война титанов, о которой вы, вероятно, никогда не слышали. Год назад два самых сильных шахматных движка в мире сражались в мачте из 100 партий, чтобы решить будущее компьютерных шахмат.
С одной стороны была Stockfish 8. Эта программа чемпионов мира обрабатывает 60 миллионов потенциальных ходов в секунду. Из этих миллионов ходов Stockfish выбирает то, что он считает самым лучшим - «лучшее» определяется сложным, настраиваемым вручную алгоритмом, разработанным совместно специалистами по компьютерам и шахматными гроссмейстерами. Этот алгоритм оценивает тонкий баланс факторов, таких как позиции пешки и безопасность своего короля.
С другой стороны была новая программа под названием AlphaZero («ноль» означает отсутствие человеческих знаний в цикле), шахматный движок в некотором смысле намного слабее, чем Stockfish - он может проанализировать всего 1/100 ходов своего противника. Но AlphaZero - это совершенно другая машина. Вместо того, чтобы выводить «лучшие» ходы с помощью алгоритма, разработанного сторонними экспертами, он самостоятельно изучает стратегию с помощью техники искусственного интеллекта, называемой машинным обучением. Программисты просто настроили алгоритм на основные правила игры в шахматы и позволили ему сыграть против себя самого несколько миллионов игр. AlphaZero постепенно выработала свою собственную стратегию.
Шахматная игра двух ИИ была потрясающей! AlphaZero не проиграл ни одну из 100 партий. Шахматный движок выиграл 28 игр и сыграл вничью с поражающими воображение жертвами, рискованными ходами и красивым стилем, совершенно новым для мира компьютерных шахмат.
Британский гроссмейстер по шахматам Мэтью Сэдлер, математик и шахматист Наташа Риган все еще пытаются разобраться, как работает стратегия AlphaZero в их новой книге Game Changer. Мы покажем два хода только в одной из игр, чтобы показать агрессивный стиль игры этого движка и чему люди могут научиться у нашего нового чемпиона по шахматам.
Ход 16: Ладья на G4
Сосредоточьтесь главным образом на пешках: AlphaZero уже потерял одну пешку, и жертвует еще одной с движением ладьи. Следующее движение Stockfish - ход ферзя на h2, который съедает одинокого солдата белых. Сыграйте эту позицию, используя множество продвинутых шахматных движков, и большинство рассчитает, что с пожертвованными фигурами AlphaZero теперь проигрывает. Так почему он это делает?
Жертвы фигур очень распространены в шахматах, но они почти всегда делаются для немедленного преимущества в тактике или другого очевидного превосходства. Но снова и снова AlphaZero, подобный магу, приносит такие ранние жертвы как часть долгосрочной стратегии, выгода которых не видна за десятки будущих ходов.
В конце концов AlphaZero собирается заполнить пробелы ладьями, оставленные отсутствующими пешками, как будто заряжает двуствольное ружье. Эти пешки, по-видимому, считает AlphaZero, стоят меньше, чем возможность атаковать короля с еще большего количества направлений.
Ход 42: Пешка на F4
К 42-му ходу AlphaZero пожертвовал еще большим количеством пешек. Но этот шаг закрепляет победу AlphaZero. Эта последняя пешка вот-вот расколет угол короля Stockfish, словно нож, открывающий устрицу.
Другим ключевым элементом стиля AlphaZero является его абсолютная одержимость атаками на короля противника, а не сосредоточение внимания на более деликатных тактических маневрах. К 42-му ходу оба слона AlphaZero контролируют длинные открытые диагонали, направленные прямо на короля. Его королева в одном прыжке от драки. И обе ладьи также яростно готовы к атаке на защиту Stockfish.
В своей книге Сэдлер и Риган пишут, что для шахматистов важно принять ранние стратегические жертвы пешки, несмотря на риск: «Не торопитесь! AlphaZero не пытается немедленно поставить мат, но гарантирует, что все его фигуры присоединяются к атаке».
#шахматы #искусственный интелект #deepmind