Навигационное управление роботами с эффективной оптимизацией всегда было предметом исследований. Эффективность любой заявки доказала свою эффективность, если ее легко применить. В данной статье представлен обзор литературы различных авторов. В литературе конкретно рассматриваются методы распознавания жестов и речи. Предложенное состояние работ направлено на разработку эффективной техники управления роботизированной навигацией с использованием сочетания жестов и техники распознавания речи. Это эргономичный подход для простоты роботизированного применения. После разработки и внедрения методики будет проведена дальнейшая работа по анализу движения манипулятора робота.
Автоматическое распознавание жестикуляции рук и распознавание голоса на основе визуального восприятия в последние годы стало очень активной темой исследований в таких мотивирующих приложениях, как HCI (Взаимодействие человека и робота), роботизированное управление и сурдоперевод. Общая проблема довольно сложна в силу ряда причин, включая сложную природу статических и динамических жестов рук, сложный фон и окклюзии. Атака на проблему в целом требует сложного алгоритма, требующего больших компьютерных ресурсов. Мотивом для этой работы является проблема навигации робота, чтобы управлять роботом вручную, ставя знаки и передавая голос человека-оператора.
Обзор:
Сантераби и др. (2004):
В данной литературе приводится быстрый алгоритм автоматического распознавания набора жестов из рук для приложения управления роботом. Они использовали пять этапов для распознавания жестов от локализации рук, например, области, на основе красного/зеленого значений цветного изображения. Красные зеленые пиксели изображают стрелку, как область. Если задать единицу для этих красных/зеленых пикселей и ноль для остальных, то получится черно-белое изображение. Рука, как область, затем сегментируется с заднего плана, устраняя маленькую руку, как область и принимая во внимание непрерывную белую область. Центр тяжести вычисляется для области кисти руки, и радиус радиуса рисуется немного меньше, чем расстояние до самого дальнего пальца. Расчет пальцев производится по окружности и вычитается из оставшейся части запястья. Это доказывает очень простую и быструю технику управления роботами.
Мэд. Абдулла и др. (2011):
В данной статье объясняется управление роботизированной навигацией с помощью речи. Авторы преобразуют произнесенные слова в текст, используя грамматические упражнения по программированию на языке Си. Если текст совпадает с любой командой из базы данных, она выполняет эту команду. Этот вход классифицируется как непрерывное распознавание и интерпретированное распознавание. Интерпретированное распознавание имеет транскрипцию, контроль, сочетание обоих. Непрерывное распознавание — это, по сути, просто запись звука. Это не подразумевает попытки понять, что находится в форме волны, и, следовательно, нет необходимости в дальнейшей обработке. Транскрипция — это диктовка слов в текстовый редактор. Хотя обычно это делается с помощью клавиатуры, это также можно сделать с помощью речи.
Раджу и Нитин (2010):
Данная статья посвящена распознаванию жестов при помощи компьютеров. В этой литературе подчеркивается тот факт, что по сравнению с различными существующими интерфейсами, жесты рук обладают преимуществами простой в использовании, естественной и интуитивно понятной системы управления. Проблема распознавания решается путем сопоставления сегментированной руки с большим количеством поз в памяти системы с помощью нового иерархического алгоритма, основанного на динамической модели движения руки, модели Хайден Маркова и сопоставления графиков.
Георгия и др. (2011):
В данной статье в качестве наблюдателя рассматриваются различные техники жестов кисти рук, основанные на зрении. В данной статье также приводятся различные способы применения техники распознавания рук на основе зрения. Согласно этой статье, сфера применения варьируется от виртуальной реальности, робототехники и телеприсутствия, здравоохранения в больницах для гигиенических целей, сурдоперевода для людей с ограниченными возможностями.
Прагати и др. (2009):
Авторы данной статьи подчеркивают прямое использование рук в качестве устройства ввода, которое является хорошим методом обеспечения естественного компьютерного взаимодействия человека, которое прошло путь от текстовых интерфейсов через 2D графические интерфейсы и мультимедийные интерфейсы к полноценным системам виртуальной среды, поддерживающим участие многих сторон. Они классифицировали существующие подходы по категориям на основе 3D-моделей и подходов, основанных на внешнем виде, выделив их преимущества и недостатки и определив открытые вопросы для распознавания жестов.
Фэн-Шэн и др. (2003):
В данной статье автор представил систему распознавания жестов рук для распознавания непрерывного жеста перед неподвижным фоном.
Система состоит из четырех модулей:
- ручное отслеживание и извлечение в режиме реального времени,
- извлечение функций,
- обучение работе с моделью Хайден Маркова,
- распознавание жестов.
Рогалла и др. (2002):
В документе описывается установка робота с именем ALBERT. Он состоит из мобильной платформы, оснащенной лазерным сканером SICK для навигации. Он дает классификацию жестов по визуальным входам, отслеживание рук по цветовой сегментации оттенка. Автор предложил новую архитектуру для работы с входами датчиков. Это помогло представить информацию на удобном для пользователя уровне.
На основании обзора вышеуказанной литературы, рассмотренного различными авторами, можно прийти к выводу, что существует необходимость в разработке и внедрении методики, использующей как жесты, так и методы распознавания голоса. Это создаст простоту применения для управления навигацией робота с помощью пальцев руки и голоса оператора соответствующего робота. Предлагаемая работа будет затем подкреплена кинематическим и динамическим анализом одноканального манипулятора робота. Работа окажется полезной как для промышленности, так и для общества, где различными роботизированными приложениями можно будет легко управлять без использования подвесных или сложных соединений.