Если вы когда-нибудь играли в карточную игру Ханаби, вы поймете, когда скажу, что она не похожа ни на одну другую. Ханаби - это совместная игра, в которой Вы имеете полное представление о картах всех остальных, но не о своих собственных.
Чтобы выиграть игру, каждый игрок должен дать другим подсказки о своих руках в течение ограниченного количества раундов, чтобы организовать все карты в определенном порядке. Это интенсивное упражнение в стратегии, выводах и сотрудничестве. Вот почему исследователи из Google Brain и DeepMind считают, что это идеальная игра для искусственного интеллекта, чтобы заняться следующим.
В новой статье они утверждают, что в отличие от других игр, которые освоил искусственный интеллект, таких как шахматы, го и покер, Ханаби требует теории ума и более высокого уровня рассуждений. Теории мышления понимания психических состояний других людей и понимание того, что они не могут быть такими же, как ваши собственные. Это основополагающий навык, который люди используют для эффективной работы в мире, и который мы обычно приобретаем, когда мы очень молоды.
Информация в Ханаби ограничена как количеством подсказок, предоставляемых игрокам в каждой игре, так и тем, что может быть сообщено в каждой подсказке. В результате агент искусственного интеллекта должен также получать скрытую информацию от действий других игроков, чтобы выиграть игру—вызов, с которым ему не приходилось сталкиваться раньше.
Кроме того, он должен научиться предоставлять максимально возможную информацию в своих собственных советов и действий, чтобы помочь другим игрокам добиться успеха. Если искусственный интеллект сможет успешно ориентироваться в такой несовершенной информационной среде, полагают исследователи, это будет на шаг ближе к эффективному сотрудничеству с людьми.
Все это новые вызовы для исследовательского сообщества и потребует новых алгоритмических достижений, которые свяжут воедино работу нескольких направлений искусственного интеллекта , включая машинное обучение, теорию игр и возникающую коммуникацию—изучение того, как возникает связь между несколькими агентами искусственного интеллекта в совместных настройках.
Чтобы подтвердить эту гипотезу, команда Google протестировала все современные алгоритмы обучения с подкреплением и обнаружила, что они работают плохо. В ответ они выпустили среду Ханаби с открытым исходным кодом, чтобы стимулировать дальнейшую работу в исследовательском сообществе.
Подписывайся на канал и узнавай много нового из мира технологий