Вопрос переписки связан с выявлением связей между учителем и учеником, которые позволяют передавать информацию от одного учителя другому. В данном исследовании мы определяем соответствие между двумя отображениями.
- Картирование записи (Исполнение учителем, записанное Исполнение) относится к тому, записываются ли в набор данных точные состояния/действия, испытанные учителем во время демонстрационного исполнения.
- Картирование воплощения (Recorded Execution Learner) означает, являются ли состояния/действия, зафиксированные в наборе данных, именно теми, которые наблюдал/выполнял бы учащийся. Когда отображение записи является идентификатором состояния/действия, испытанные учителем во время выполнения, записываются непосредственно в набор данных.
В противном случае эта информация учителя кодируется в соответствии с некоторыми функциями отображения записи эта кодированная информация записывается в формате набора данных. Аналогичным образом, когда картирование воплощения - это идентичность, состояния/действия на карте набора данных непосредственно учащемуся.
В противном случае отображение воплощений состоит из некоторой функции gE .z; a/ 6D I.z; a/. Для любой данной системы обучения ни тождественность записей, ни тождество записей и воплощений не могут быть ни тем, ни другим. Обратите внимание, что отображения изменяют не содержание демонстрационных данных, а только ту референтную рамку, в которой они представлены. На рис. 4 показаны пересечения этих конфигураций, которые мы рассмотрим далее в последующих разделах.
Картирование воплощений особенно важно при рассмотрении реальных роботов, по сравнению с симулируемыми агентами. Поскольку настоящие роботы выполняют реальные действия в физической среде, их демонстрация включает в себя физическое исполнение учителем. Обучение в этой среде в значительной степени зависит от точного сопоставления записанного набора данных и способностей учащегося.
Напомним еще раз наш пример перемещения коробки, рассмотрим учителя-человека, использующего свое тело для демонстрации перемещения коробки, и камеру, которая будет записывать демонстрацию. Пусть действия учителя, AT , будут представлены как совместные человеческие углы, а действия ученика, AL, будут представлены как углы роботизированных соединений.
В этом контексте, робот наблюдает за тем, как учитель демонстрирует выполнение задания с помощью изображений, полученных с камеры. Точные действия учителя неизвестны роботу; вместо этого, эта информация должна быть извлечена из данных изображения.
Пример отображение записи AT!D. Кроме того, физическое воплощение учителя отличается от физического воплощения робота, и поэтому его действия (AT) не такие же, как у робота (AL). Поэтому для того, чтобы демонстрационные данные были значимыми для робота, необходимо создать карту D!AL должен быть применен для преобразования демонстрации в систему координат робота. Это один из примеров отображения вариантов реализации.
Категоризация источников данных LfD, которые мы представляем в данной статье, подходит в зависимости от отсутствия или присутствия отображений записей и воплощений. Мы выбираем эту классификацию, чтобы выделить уровни, на которых соответствие играет роль в демонстрационном обучении.
В рамках данного обучения включение каждой дополнительной карты вводит потенциальную точку впрыска для затруднений соответствия; короче говоря, чем больше отображений, тем труднее распознать и воспроизвести поведение учителя.
Однако картографирование также уменьшает ограничения для учителя и повышает общий уровень демонстрационной техники. В нашей классификации мы сначала разделили методы сбора данных LfD на две категории, основанные на отображении вариантов реализации, и, таким образом, на платформе исполнения:
- Демонстрация: Картирование вариантов реализации отсутствует, так как демонстрация выполняется на собственно учащемся роботе (или на физически идентичной платформе).
- Подражание: Существует схема реализации, потому что демонстрация выполняется на платформе, которая не является обучающимся роботом (или физически не идентичной платформой).
Затем мы далее различаем подходы в рамках каждой из этих категорий в соответствии с картографированием записи, в зависимости от того, как записывается демонстрация.
Дорогие мои, спасибо что прочитали мою статью до конца! Буду очень рад Вашей поддержке, мне как никогда нужна ваша поддержка! До новых встреч!