Найти в Дзене
Feature IN

Взаимная адаптация человека-робота к новым условиям в совместных задачах

Адаптация крайне важна для эффективного сотрудничества между командами. В данной статье представлен вычислительный формализм для взаимной адаптации робота и человека к совместным задачам. Предлагаем модель адаптации с ограниченной памятью, в рамках которой вероятностный конечный контроллер фиксирует адаптивное поведение человека при ограниченной памяти.

Интегрируем модель адаптации робота с ограниченной памятью в вероятностный процесс принятия решений, позволяя ему направлять адаптируемых участников на лучший способ выполнения задачи. Эксперименты на человеке-субъекте предполагают, что предложенный формализм повышает эффективность команд роботов-людей в совместных задачах, по сравнению с односторонней адаптацией робота к человеку, при сохранении доверия человека к роботу.

Фото: unsplash.com пользователь: Randy Assell
Фото: unsplash.com пользователь: Randy Assell

Введение

Роботы проникают в наши дома и на рабочие места, дополняя человеческие способности и навыки во многих областях применения, включая производство, здравоохранение и т.д. Они могут сосуществовать в одном физическом пространстве с людьми и стремиться стать надежными партнерами в команде.

Исследования человеческих команд показывают, что взаимная адаптация, которая требует от всех членов команды адаптировать свое поведение для достижения общих целей, значительно улучшает работу команды. Считается, что то же самое можно сказать и о командах роботов-людей. Основной целью в этой работе является разработка вычислительной основы для взаимной адаптации человека и робота.

Можно рассматривать миллион задач, представим одну. Нужно выполнить задачу по переноске стола.

Выполнять это будет человек и HERB, автономный мобильный манипулятор, работают вместе, чтобы вынести стол из комнаты. Существует две стратегии: робот, стоящий лицом к двери (Цель А) или робот, стоящий лицом к двери (Цель В). Предположим, что робот предпочитает цель А, так как датчик робота, обращенный лицом вперед, имеет хороший обзор двери, что приводит к лучшему выполнению задач. Не зная об этом, неопытный партнер может предпочесть цель В.

Интуитивно понятно, что если человек может адаптироваться и готов это сделать в любой момент то робот будет двигаться к точке которая обеспечивает лучшее выполнение задачи в целом.

Если человек не может адаптироваться и настаивает на своих предпочтениях, робот выполняет их для выполнения задания, хотя и неоптимально. Если робот настаивает на своих предпочтениях, цель А, он может потерять доверие людей, что приведет к ухудшению работы команды или даже к неиспользованию робота.

Фото: unsplash.com пользователь: Ben Lodge
Фото: unsplash.com пользователь: Ben Lodge

Проблема заключается в том, что при встрече с новым партнером робот может не знать о своей адаптируемости и должен учиться ее на лету в процессе взаимодействия.

В этой м следующих статьях предлагается компьютерная модель взаимной адаптации человека-робота в совместных задачах. Будем строить модель адаптивного поведения человека и интегрируем ее в вероятностный процесс принятия решений. Одной из ключевых идей здесь является модель адаптации ограниченной памяти (Bound-Memory Adaptation Model - BAM), которая представляет собой вероятностный конечно-состоятельный контроллер, фиксирующий адаптивное поведение человека.

ВАМ предполагает, что человек работает в одном из нескольких "режимов" взаимодействия и адаптирует поведение, переключаясь между режимами. Чтобы выбрать новый режим, человек сохраняет ограниченную историю прошлых взаимодействий и вероятностно переключается на новый режим в соответствии с уровнем адаптируемости.

Уровень адаптируемости человека - это неизвестный априори роботу параметр модели BAM. Чтобы эффективно работать с таким адаптируемым человеком, робот должен учитывать две иногда противоречащие друг другу цели:

  • собирать информацию о неизвестном параметре посредством взаимодействия, чтобы выбрать между соблюдением предпочтений человека и направлением человека к лучшему режиму сотрудничества для выполнения задания;
  • выбирать действия, направленные на достижение цели, например, перемещение стола за пределы помещения.

Рассматриваем неизвестный модельный параметр как скрытую переменную и внедряем ВАМ в вероятностный процесс принятия решений, называемый "Смешанным процессом принятия наблюдаемых марковских решений" (MOMDP), для выбора действий робота.

Расчетная политика MOMDP оптимально балансирует компромисс между сбором информации о способности человека адаптироваться и продвижением к поставленной цели. С тех пор, как Министерство обороны и природных ресурсов имеет встроенный модуль BAM, выбранные действия позволяют роботу адаптироваться к адаптивному человеку, в результате чего достигается взаимная адаптация.

Спасибо что прочитали статью до самого конца, скоро будет продолжение на канале, ставьте лайки и подписывайтесь!