Найти тему
Наука | SciTeam

Алгоритм помогает роботам думать как люди при поиске объектов

Согласно исследованию из Мичиганского университета, роботы могут научиться находить вещи быстрее, если будут учиться распознавать связи различных объектов в доме. Новый алгоритм обеспечивает роботов визуальной стратегией поиска, которая, как говорится в одном из примеров, может научить их искать кофейник поблизости, если они уже находятся перед холодильником.

Эта работа, возглавляемая профессором Чадом Дженкинсом и аспиранткой CSE Чжень Цзэн, была признана лучшей работой в области когнитивной робототехники на Международной Конференции по робототехнике и автоматизации в 2020 году.

Общая цель робототехников — предоставить машинам возможность ориентироваться в реальных условиях — в неупорядоченных, неидеальных домах, где мы проводим всё своё время. Эти условия могут быть хаотичны, без двух абсолютно одинаковых вариантов, и роботы в поисках конкретных объектов, которые они никогда не видели ранее, должны будут выбрать их из беспорядка.

«Эффективно искать объекты в окружающей среде — ключевая способность для служебных роботов, необходимая для автономного выполнения задач», — говорит Цзэн. «Мы предоставляем практический метод, позволяющий роботу активно искать заданные объекты в сложных условиях среды».

Но дома́ — это не полный хаос. Мы организовываем наше пространство вокруг различных видов деятельности, и некоторые группы предметов чаще хранятся или устанавливаются в непосредственной близости друг к другу. На кухне обычно стоят плиты, холодильники, микроволновые печи и другие небольшие кухонные устройства; в спальне находятся комоды, кровати и тумбочки, и так далее.

Чжень Цзэн и Чад Дженкинс предложили метод, позволяющий использовать преимущество этих общих пространственных отношений. Их алгоритм «SLiM» («семантические связанные карты») соотносит некоторые «объекты-ориентиры» в памяти робота с другими связанными объектами, наряду с данными о том, как они обычно взаимно расположены в пространстве. Они используют модель SLiM для учета особенностей как целевого объекта, так и объекта-ориентира, чтобы предоставить роботам более надежное понимание того, как вещи могут быть упорядочены в окружающей среде.

«Когда людей спрашивают, где могут быть найдены какие-нибудь объекты, люди способны дать гипотетическое место, выраженное пространственными отношениями с другими объектами», — пишут авторы работы. «Роботы должны уметь точно так же рассуждать о расположении объектов».

Алгоритм — это не просто жестко прописанный сценарий, насколько близко обычно расположены одни объекты по отношению к другим: осмотри комнату в разные дни, и ты точно найдёшь достаточно изменений и поймёшь, что это не работает. Вместо этого модель SLiM объясняет неопредёленность в расположении объекта.

«Предыдущие работы предполагают, что выбранные объекты статичны, поскольку они в большинстве случаев находятся там, где их наблюдали в последний раз», — объясняют авторы в своей статье о проекте. Чтобы преодолеть это ограничение, ученые использовали вероятностный график — особый вид графика, который представляет распределение вероятностей для возможного моделирования отношений между различными объектами.

С этим знанием о возможных объектных отношениях у предметов модель SLiM направляет робота исследовать вероятную область, где может находиться либо целевой, либо ориентировочный объект. Этот подход поиска основан на предыдущих исследованиях, демонстрирующих, что поиск ориентира сначала (косвенный поиск) может быть быстрее, чем просто поиск цели (прямой поиск). Модель, используемая Чадом Дженкинсом и Чжень Цзэн — это гибрид двух вариантов.

В ходе экспериментов команда проверила работоспособность пяти различных поисковых моделей в одинаково смоделированной окружающей среде. Одна из них была наивным прямым поиском без знания пространственных отношений объектов, а остальные четыре использовали пространственное отображение SLiM в сочетании с различными стратегиями поиска или стартовыми преимуществами:

  • Прямой поиск с известным положением цели, но без учета какой-либо вероятности, что предмет мог быть перемещен;
  • Прямой поиск с известным положением цели, учитывая вероятность, что предмет мог быть перемещен;
  • Прямой поиск без заранее известного положения цели;
  • Гибридный поиск без заранее известного положения цели;

В итоге модели SLiM в сочетании с гибридным поиском успешно находили целевые объекты с наиболее прямым маршрутом и с наименьшим временем поиска в каждом тесте.

Данная работа была опубликована в статье «Семантические связанные карты для активного визуального поиска объектов».

Источник

Перевод: Надя Огаркова.

Редактор: Мария Беликова.

Дизайн: Алина Петрухина.