Найти в Дзене

Построение агентно-ориентированной символической модели среды

Перспектива взятия . Под визуальной перспективой понимается способность визуально воспринимать окружающую среду с точки зрения другого человека. Эта способность позволяет нам правильно обрабатывать и представлять ситуации, когда визуальное восприятие одного человека отличается от другого. Типичный пример, обнаруженный в психологии развития, состоит из двух похожих объектов в комнате (например, двух шариков), которые оба видимы для ребенка, но только один виден для взрослого. Когда взрослый просит ребенка передать «мяч», он может правильно определить, к какому мячу относится взрослый (т. е. тот, который виден с точки зрения взрослого), не спрашивая . Наша архитектура наделяет робота таким познавательным навыком. Пространственная перспектива относится к качественному пространственному расположению объектов (или агентов) относительно кадра (например, клавиш слева от меня ). Исходя из этой системы отсчета, описание объекта варьируется. Люди часто смешивают перспективы во время взаимодейств

Перспектива взятия . Под визуальной перспективой понимается способность визуально воспринимать окружающую среду с точки зрения другого человека. Эта способность позволяет нам правильно обрабатывать и представлять ситуации, когда визуальное восприятие одного человека отличается от другого. Типичный пример, обнаруженный в психологии развития, состоит из двух похожих объектов в комнате (например, двух шариков), которые оба видимы для ребенка, но только один виден для взрослого. Когда взрослый просит ребенка передать «мяч», он может правильно определить, к какому мячу относится взрослый (т. е. тот, который виден с точки зрения взрослого), не спрашивая . Наша архитектура наделяет робота таким познавательным навыком.

Пространственная перспектива относится к качественному пространственному расположению объектов (или агентов) относительно кадра (например, клавиш слева от меня ). Исходя из этой системы отсчета, описание объекта варьируется. Люди часто смешивают перспективы во время взаимодействия. Это более эффективно, чем поддержание согласованного, либо потому, что (когнитивная) стоимость переключения ниже, чем при той же перспективе, либо если стоимость примерно одинакова, потому что пространственная ситуация может быть более легко описана с одной точки зрения, а не чем другой, Неопределенности возникают, когда один оратор ссылается на объект в системе отсчета (или меняет систему отсчета, т.е. меняет перспективу), не сообщая об этом своему партнеру . Например, говорящий может попросить «клавиши слева». Поскольку справочная система не была предоставлена, слушатель не знал, где именно искать. Тем не менее, запрос «клавиш слева» дает слушателю достаточно информации, чтобы понять, о чем говорит говорящий. Напротив, при использовании точного, однозначного круга ведения для описания местоположения (например, «идти на север») не возникает двусмысленности. В Spark зависящие от агента пространственные отношения вычисляются из системы отсчета каждого агента.

Символические локации . Люди обычно ссылаются на позиции объектов с символическими дескрипторами (например, на , рядом с ...) вместо точных абсолютных позиций (качественное пространственное рассуждение). Этот тип дескрипторов широко изучался в контексте языкового обоснования. Spark различает независимые от агента символические местоположения (аллоцентрические пространственные отношения) и зависимые от агента относительные местоположения (эгоцентрические пространственные отношения).Построение модели агентов.

Построение обоснованной символической модели физической среды в общем случае недостаточно для полного обоснования взаимодействия человека с роботом , а также требуется модель текущих возможностей агентов, взаимодействующих с роботом.

Spark вычисляет следующие возможности с точки зрения каждого агента:

Видит : это отношение описывает то, что видит агент, то есть то, что находится в пределах его поля зрения (FOV). В нашей текущей реализации эта стоимость вычисляется путем динамического размещения камеры OpenGL в месте расположения глаз и выполнения проверок окклюзии на ней. Хотя она может видеть две маленькие коробки на столе перед ней, большая коробка справа от нее вне поля зрения, и, следовательно, она не может видеть ее.

Кроме того,Spark также вычисляет отношение sees With Head Movement , имитируя небольшое вращение головы влево-вправо. Это представляет то, что агент мог видеть с минимальными усилиями.

Взгляды : это отношение соответствует тому, на чем сосредоточен агент, т. Е. Куда направлен его фокус внимания. Эта модель основана на более узком поле зрения, поле внимания (FOA).

Точки At удерживаются, когда на объект указывает агент. Это соотношение вычисляется путем размещения виртуальной камеры на руке, выровненной по предплечью. Points At обычно используется во время заземления диалога, например, когда один из агентов ссылается на объект, говоря «это» или «то», указывая на него.

Мы применяем гистерезисный фильтр на геометрическом уровне, чтобы обеспечить достаточно стабильное распознавание этих трех возможностей.

https://avatars.mds.yandex.net/get-zen_doc/28845/pub_5bd61210ff5f2d00a94790e1_5bd7672b6b4c0f361ae915cb/scale_1200
https://avatars.mds.yandex.net/get-zen_doc/28845/pub_5bd61210ff5f2d00a94790e1_5bd7672b6b4c0f361ae915cb/scale_1200

Продолжение следует...