У исследователей есть новый способ оценить интеллект модели ИИ: поместите ее в игру Minecraft без информации об ее окружении и посмотрите, насколько хорошо она играет.
Minecraft — это не только самая продаваемая видеоигра в истории, она также может стать ключом к созданию адаптируемых моделей искусственного интеллекта, которые смогут решать самые разные задачи так же, как это делают люди.
Стивен Джеймс из Университета Витватерсранда в Южной Африке и его коллеги разработали эталонный тест в Minecraft для измерения общего интеллекта моделей ИИ. MinePlanner оценивает способность ИИ игнорировать неважные детали при решении сложной проблемы в несколько этапов.
Многие методы обучения ИИ «обманывают», предоставляя модели все данные, необходимые для обучения выполнению работы, и ничего лишнего, — говорит Джеймс. Это плодотворный подход, если вы хотите создать программное обеспечение для выполнения конкретной задачи – например, прогнозирования погоды или сворачивания белков – но не в том случае, если вы пытаетесь создать общий искусственный интеллект, или AGI.
Джеймс говорит, что будущим моделям ИИ придется решать сложные проблемы, и он надеется, что MinePlanner будет направлять эти исследования. ИИ, работающий над решением проблемы в игре, увидит ландшафт, посторонние объекты и другие детали, которые не обязательно необходимы для решения проблемы и их следует игнорировать. Ему придется обозревать свое окружение и самостоятельно решать, что нужно, а что нет.
MinePlanner состоит из 15 строительных задач, каждая из которых имеет 3 уровня сложности, всего 45 задач. Для выполнения каждой задачи ИИ, возможно, придется предпринять промежуточные шаги — например, построить лестницу, чтобы разместить блоки на определенной высоте. Это требует, чтобы ИИ мог отвлечься от проблемы и планировать заранее, чтобы достичь цели.
В экспериментах с современными моделями планирования ИИ ENHSP и Fast Downward, программ с открытым исходным кодом, предназначенных для выполнения последовательных операций для достижения общей цели, ни одна из моделей не смогла решить ни одну из сложных задач. Fast Downward смог решить только одну из средних задач и пять простых задач, в то время как ENHSP показал себя немного лучше, выполнив все, кроме одной, легкие задачи и все средние задачи, кроме двух.
«Мы не можем требовать от дизайнера-человека, чтобы он приходил и говорил ИИ, что именно ему следует и не следует использовать для каждой задачи, которую ему придется решать», — говорит Джеймс. «Это проблема, которую мы пытаемся решить».
Больше информации об ИИ читайте в нашем телеграм-канале.