Благодаря наличию более дешевых роботов, надежных тренажеров и высокой скорости обработки данных в последнее десятилетие наблюдается рост числа основанных на данных подходов к робототехнике. Вместо того чтобы использовать разработанные вручную модели, эти подходы сосредоточены на сборе крупномасштабных наборов данных для изучения политики, которая позволяет перейти от крупномасштабных наблюдений к действиям.
Текущие подходы, основанные на данных, в основном ориентированы на использование симуляторов, так как сбор имитируемых данных обходится значительно дешевле, чем сбор данных о реальном роботе в режиме реального времени. Есть надежда, что эти подходы будут либо достаточно надежными для изменения области, либо что модели могут быть адаптированы с использованием небольшого объема реальных данных путем передачи знаний. Однако помимо простых роботизированных задач подбора, этот уровень оптимизма не находит поддержки. Одной из основных причин этого является большой разрыв между симуляторами и реальным миром. Таким образом, в робототехническом сообществе одновременно наблюдается тенденция к сбору реальных данных о физическом взаимодействии в различных лабораториях робототехники.
Основной движущей силой этих усилий является снижение стоимости аппаратного обеспечения, позволяющее расширить возможности по сбору данных для решения различных задач робототехники. Этот подход действительно оказался весьма успешным в решении таких задач, как понимание, толкование и имитация обучения. Тем не менее, эти изученные модели часто оказываются слишком подходящими (даже после увеличения количества точек данных), и эффективность этих методов обучения роботов, как правило, быстро останавливается на достигнутом.
Это подводит нас к важному вопросу:
Почему данные о действиях роботов не приводят к тем же результатам, которые мы наблюдаем в других важных областях, таких как компьютерное зрение и обработка естественного языка?
Многие подходы утверждают, что данные, собранные в лаборатории, являются реальными. Но правда ли это? Как часто мы видим белую столовую одежду или зеленый фон в реальных сценариях? В этой статье мы утверждаем, что в современных роботизированных наборах данных не хватает разнообразия сред, необходимых для использования подходов, основанных на данных, для изучения вариантов. Поэтому ключевым моментом является перенос усилий по сбору данных из лабораторных условий в реальные дома людей.
Ученые утверждают что, роботизированные подходы, основанные на обучении, должны быть выведены из-под контроля тренажеров и лабораторий и введены в дома людей, где живут "реальные" данные. Однако при перемещении усилий по сбору данных внутри страны возникает ряд проблем. Во-первых, даже самые дешевые промышленные роботы, такие как Sawyer или Baxter, слишком дороги (>20т. USD). Для того чтобы собирать данные в домашних условиях, нам нужен дешевый и компактный робот. Однако проблема недорогих роботов заключается в том, что отсутствие точного контроля делает данные ненадежными. Кроме того, сбор данных в домашних условиях не может осуществляться под круглосуточным наблюдением людей, что в сочетании с внешними факторами приведет к увеличению шума при сборе данных.
Наконец, существует проблема куриного яйца для домашней робототехники:
нынешние роботы недостаточно хороши для сбора данных в домашних условиях, но для улучшения качества роботов нам нужны данные в домашних условиях.
Для достижения этой цели:
- Ученые собирают робота стоимостью менее 3 000 долларов США;
- Ученые используют этого робота для сбора данных внутри 6 различных домов для обучения и 3 домов для тестирования;
- Ученые представляют подход, который моделирует и учитывает шум в маркированных данных;
- Ученые показывают, как данные, полученные из этих различных домашних условий, приводят к превосходной производительности и практически не требуют адаптации домена.
Разработчики надеются, что эти усилия заставят робототехническое сообщество покинуть лабораторию и использовать обучающие подходы для работы с неточными дешевыми роботами.