Альберт Эйнштейн однажды сказал: «Вы должны выучить правила игры, и тогда вы сможете играть лучше, чем кто-либо другой». Это вполне может стать девизом DeepMind, дочерней компании Alphabet, поскольку новый отчет показывает, что компания разработала программу, которая осваивает сложные игры, даже не зная правил.
Программисты DeepMind использовали принцип, называемый «упреждающим поиском». При таком подходе программа MuZero оценивает количество возможных ходов в зависимости от реакции оппонента. Несмотря на то, что в таких играх, как шахматы, существует ошеломляющее количество потенциальных ходов, MuZero отдает приоритет наиболее актуальным и наиболее вероятным маневрам, извлекая уроки из успешных гамбитов и избегая неудачных.
«Впервые у нас есть система, способная построить собственное понимание того, как устроен мир, и использовать это понимание для выполнения сложного упреждающего планирования. MuZero начинает с нуля и путем проб и ошибок изучает правила мира, с тем чтобы использовать их для достижения своего рода сверхчеловеческой производительности», сказал главный исследователь DeepMind Дэвид Сильвер.
«Результаты работы DeepMind поразительны, и я поражаюсь тому, чего они смогут достичь в будущем, учитывая имеющиеся у них ресурсы», - сказала Венди Холл, профессор информатики Саутгемптонского университета и члена совета Англии по искусственному интеллекту.
Дэвид Сильвер отметил, что впереди стоит задача понять и реализовать такие эффективные и мощные алгоритмы, как у человеческого мозга. «Первый шаг на этом пути - попытаться понять, что вообще означает достижение интеллекта», - сказал он. «Это важно для понимания того, что на самом деле может делать ИИ, потому что никто не дает нам свод правил, в котором говорится: «Именно так устроен мир», - сказал Сильвер.
Подготовлено по материалам techxplore.com