Сегодня один зарубежный бизнес-партнер назвал меня "мастером 37-х ходов". Я не знал, хорошо это или плохо, и погууглил "Move 37". Оказалось, очень интересно. И написал эту статью про "37-й ход".
AlphaGo освоила древнюю игру Го, победила чемпиона мира по Го и вдохновила новую эру систем искусственного интеллекта (ИИ).
AlphaGo
— это программа искусственного интеллекта (ИИ), разработанная компанией DeepMind Technologies, которая была приобретена Google в 2014 г. за примерно $500 миллионов. AlphaGo известна тем, что освоила сложную древнюю китайскую игру Го, продемонстрировав передовую стратегию и креативность. Игра Го, несмотря на свою кажущуюся простоту, служит мощной основой для расширения возможностей ИИ в области стратегических мышления и креативности.
AlphaGo творит историю
Система искусственного интеллекта (ИИ), AlphaG научилась осваивать древнюю китайскую игру Го — чрезвычайно сложную настольную игру, требующую стратегических мышления, креативности и изобретательности.
AlphaGo победила чемпиона мира по шашкам Го за десятилетие до того, как эксперты полагали, что это стане возможным, и тем самым вдохновила игроков и стратегов по всему миру на поиск и открытие новых подходов. AllphaGo доказала, что системы ИИ могут научиться решать сложнейшие стратегические задачи в очень сложных ситуациях, что стало катализатором поиска новых путей развития человеческой гениальности, обучения ИИ креативности и ИИ-оптимизации.
Большой вызов
Buhf Го долгое время считалась грандиозным вызовом для ИИ. Многие считают, что Игра Го намного сложнее шахмат — умопомрачительное число возможных конфигураций на доске составляет 10 в 170-й степени. Это намного больше, чем число песчинок на Земном шаре.
Самые сильные компьютерные программы для игры в Го достигли уровня лишь любителей, несмотря на десятилетия работы. Стандартные методы ИИ с трудом справлялись с оценкой огромного количества возможных ходов и не обладали креативностью и интуицией игроков-людей.
Инновационный подход AlphaGo
Компания создала систему ИИ, которая сочетает в себе глубокие нейронные сети с продвинутыми алгоритмами поиска. Одна нейронная сеть — известная как «сеть политики» — выбирает следующий ход. Другая нейронная сеть — «сеть ценности» — предсказывает победителя игры.
Первоначально разработчики познакомили AlphaGo с множеством любительских партий в Го, чтобы ИИ смог научиться играть так, как играют люди. Затем разработчики дали AlphaGo задание сыграть тысячи партий против разных версий самой себя, каждый раз учась на своих ошибках. Этот метод известен как "обучение на основе подкрепления" по восходящей спирали. AlphaGo постепенно повысила своё мастерство и стала прекрасным игроком.
Знаменитый креативный ход 37
Как сказал Ли Седоль, чемпион мира по шашкам Го, "Я думал, что AlphaGo основана на вероятностных вычислениях и является всего лишь машиной. Но когда я увидел этот ход, я изменил свое мнение. Безусловно, AlphaGo креативна." Этот "дикий" и супер-креативный ход, который хорошему человеку-игроку даже бы в голову не пришел, помог AlphaGo выиграть игру и опроверг многовековые традиции.
С тех пор выражение "Ход 37" ("Move 37") стал метафорой, означающей "дикий", неожиданный, креативный ход, ведущий к победе.
В октябре 2015 года AlphaGo сыграла свою первую партию против действующего трехкратного чемпиона Европы Фань Хуэя. AlphaGo выиграла первый в истории матч между системой искусственного интеллекта и профессиональным игроком в го со счетом 5-0.
Затем AlphaGo соревновалась с легендарным игроком в го Ли Седолем — победителем 18 мировых титулов, которого многие считают величайшим игроком десятилетия. За победой AlphaGo со счетом 4-1 в Сеуле, Южная Корея, в марте 2016 года наблюдали более 200 миллионов человек по всему миру. Это знаменательное достижение опередило свое время на десятилетие.
Изобретение выигрышных ходов
Эта игра принесла AlphaGo профессиональный рейтинг 9-го дана — первый случай, когда компьютерный игрок в го получил наивысшую возможную сертификацию. В ходе игр AlphaGo совершила несколько изобретательных выигрышных ходов. Во второй игре она сделала ход 37 — ход с вероятностью 1 к 10 000. Этот решающий и креативный, даже невообразимый для знатоков, ход помог AlphaGo выиграть игру.
Затем в четвёртой игре Ли Седоль сделал ход 78, с вероятностью 1 к 10 000. Этот ход, известный как «Божественное прикосновение», был таким же невероятным и изобретательным, как и ход AlphaGo двумя играми ранее, и помог Седолю выиграть игру.
С тех пор игроки всех уровней изучают эти ходы.
Техническое наследие
Победа AlphaGo вдохновила новую эру развития систем искусственного интеллекта. Она стало убедительным доказательством того, что лежащие в основе нейронные сети могут применяться в сложных областях, а использование обучения с подкреплением показало, как машины могут научиться решать невероятно сложные задачи самостоятельно, просто методом проб и ошибок. Способность AlphaGo заглядывать вперёд и планировать до сих пор используется в современных системах искусственного интеллекта.
Следующее поколение ИИ
Эти идеи позволили компании разработать более мощные версии AlphaGo, и система продолжила побеждать чемпионов мира. Теперь её преемники — AlphaZero, MuZero и AlphaDev — развивают наследие AlphaGo, помогая решать всё более сложные задачи, влияющие на нашу повседневную жизнь.
Родственные статьи
Подписывайтесь, да обрящете
Наш Телеграм-канал "Катализатор роста" >> https://t.me/geniusyou