Найти в Дзене
Feature IN

Исследования по адаптации человека к роботу

Учеными проводилась большая работа по односторонней адаптации роботов к человеку. Подходы заключаются в том, что специалист по человеческой деятельности проводит демонстрации для обучения робота навыкам или выполнению конкретной задачи. Роботы также смогли определить предпочтения людей в интернете через взаимодействие.

В частности, частично наблюдаемые модели Марковского процесса принятия решений (POMDP) позволили рассуждать о неопределенности в отношении намерений человека. Формула MOMDP продемонстрировала значительную вычислительную эффективность и была использована в приложениях планирования движения.

Фото: unsplash.com пользователь: Franck V.
Фото: unsplash.com пользователь: Franck V.

Недавняя работа также сделала вывод о человеческих намерениях через разложение игрового задания на подзадачи для игровых приложений искусственного интеллекта. Одно из таких исследований сосредоточено на выводах о намерениях человеческого игрока, позволяя неигровому персонажу (NPC) помогать человеку.

В качестве альтернативы, Macindoe предложили частично наблюдаемую систему совместного планирования Монте-Карло, в которой человеческие намерения предполагаются для пошаговой игры. Ученые предложили формализм для изучения человеческого типа на примере демонстраций совместных действий.

Фото: unsplash.com пользователь: Charles 🇵🇭
Фото: unsplash.com пользователь: Charles 🇵🇭

Они сделали вывод что новому пользователю нужно вычислить политику робота в соответствии с его предпочтениями. Одновременное умозаключение и адаптация роботов также были достигнуты путем распространения государственных и временных ограничений.

Другой подход заключается в алгоритме кросс-тренинга человека-робота, где человек демонстрирует свои предпочтения, меняя роли с роботом, формируя функцию вознаграждения робота. Хотя возможно, что человек будет меняет стратегии во время тренировки, тогда алгоритм не использует модель человеческой адаптации, которая может позволить роботу активно влиять на действия.

Также были проведены исследования по адаптации человека к роботу. Работа была сосредоточена на подготовке операторов в военной, космической и поисково-спасательной областях с целью снижения нагрузки на оператора и операционных рисков. Кроме того, исследователи изучили влияние повторяющихся взаимодействий с гуманоидным роботом на навыки взаимодействия детей с аутизмом, на языковые навыки учащихся начальной школы, а также на пространственное поведение пользователей.

Фото: unsplash.com пользователь: Brett Jordan
Фото: unsplash.com пользователь: Brett Jordan

Человеческая адаптация также наблюдалась в задаче ходьбы, когда робот использует человеческую обратную связь для улучшения своего поведения, что в свою очередь влияет на физическую поддержку, оказываемую человеком. Хотя изменения в человеческом поведении являются неотъемлемой частью процесса обучения, система не ясно объясняет адаптацию человека на протяжении всего взаимодействия.

С другой стороны, Dragan and Srinivasa предложили вероятностную модель вывода информации наблюдателю о целях робота и ввели алгоритм генерации движения для максимизации этого вывода для достижения заранее определенной цели.

Предлагаемый формализм взаимной адаптации человека и робота представляет собой попытку замкнуть петлю между двумя направлениями исследований. Робот использует модель адаптации человека, характеризующуюся адаптируемостью человека.

Вероятно, это связано с различными способами, с помощью которых человек может изменить стратегию и адаптировать свои собственные действия, чтобы направить человека к более эффективной стратегии, тогда когда это возможно.

Взаимная адаптация между агентами была подробно изучена в теории игр. Теория игр часто основывается на сильных предположениях о рациональности агентов и знании функций отдачи.

Эти допущения могут оказаться непригодными, когда агенты не могут или не хотят рассуждать об оптимальных для себя или других стратегиях. Это особенно актуально для командного взаимодействия человека и робота, когда человек не уверен в том, как будет действовать робот, и у него мало времени на ответные действия. Ученые предлагают модель адаптивного поведения человека, основанную на предположении ограниченной памяти и интеграцию ее в процесс принятия решений роботами.

Надеюсь что тебе понравилось, мой читатель, обязательно поставь лайк и подпишись, буду рад! До новых встреч в интернете!