Google DeepMind заявляет, что создала ИИ-агент, который может следовать вашим инструкциям на естественном языке и выполнять за вас ряд задач в различных виртуальных трехмерных средах. То есть он выполнит за вас самые сложные моменты видеоигр.
Компания DeepMind начала разработку искусственного интеллекта, научив его играть в старые аркадные игры, такие как Pong и Breakout, после чего быстро научилась играть в Го, шахматы, Stratego, Shogi, StarCraft II и другие. Затем, объединившись с Google Brain, DeepMind в последние годы занимается своим бизнесом, уделяя особое внимание таким вещам, как предсказатель структуры белка AlphaFold и технология обнаружения кристаллических материалов GNoME.
Но теперь, благодаря проекту SIMA, ИИ DeepMind получают шанс снова поиграть в видеоигры. Новая модель была обучена и протестирована в девяти 3D-играх с открытым миром, включая No Man's Sky, Teardown и Goat Simulator, но идея здесь состоит в том, чтобы создать обобщенный ИИ-агент, который сможет взять на себя управление практически в любой 3D-игре и выполнять поставленные задачи в ответ на голосовые команды.
В процессе обучения SIMA просто наблюдала за ходом игры, а также за действиями пользователя-человека, пользовавшегося клавиатурой и мышью, одновременно слушая, как этот пользователь выполняет приказы другого человека. В итоге ИИ был обучен и мог оценить примерно по 600 базовых навыков и в настоящее время может выполнять короткие одношаговые задачи продолжительностью около десяти секунд, хотя DeepMind утверждает, что вскоре он сможет выполнять более крупные задания, включающие «стратегическое планирование высокого уровня и множество подзадач».
SIMA показала себя почти так же хорошо в играх, в которых она не была специально обучена, как и в тех, в которых она была обучена, что указывает на то, что она действительно освоила общую способность зайти в 3D-игру, выяснять, что там происходит и начать играть.
SIMA использует клавиатуру и мышь для управления центральным персонажем игры и выполнения поставленных задач. Этот простой интерфейс используется людьми, а это означает, что SIMA потенциально может взаимодействовать с любой виртуальной средой.
Для чего это нужно? Оказывается, многие видеоигры, на которые мы тратим свои заработанные деньги, очень похожи на работу, заставляя нас добывать монеты, очки апгрейда, модные щиты и прочую ерунду. Вскоре SIMA сможет взять управление в свои руки и от души поработать, пока вы спите или ушли на работу, и вы вернетесь к тем накоплениям или уровню прокачки, которые вы прикажете ей добыть. Ваш замок будет построен. Ресурсы будут собраны. Ваша игра будет готова к самому интересному.
Конечно, есть и более масштабная цель: модели ИИ учатся ориентироваться в физическом мире и выполнять полезную работу, воплощаясь при этом во всевозможных роботах, гуманоидных или иных. Эти ИИ "видят" мир через видео и датчики, и хотя их схемы управления намного сложнее, чем у типичного геймера, использующего мышь и клавиши WASD, есть еще одно гигантское сходство: им устно говорят, что делать, и они должны разработать план высокого уровня, собрать ресурсы и выполнить его шаг за шагом.
Так что в этом смысле игровой агент SIMA может стать строительным блоком на пути к реальному роботизированному выполнению сложных и скучных задач, которые люди не хотят делать.