В журнале Electronics издательства MDPI вышла статья под названием: “Reinforcement-Learning-Based Decision and Control for Autonomous Vehicle at Two-Way Single-Lane Unsignalized Intersection”.
Перекрестки привлекают особое внимание из-за своей сложности и высокого уровня дорожно-транспортных происшествий. В процессе разработки технологий автономного вождения уровня L3 и выше необходимо решить проблемы принятия решений и управления автономным вождением на перекрестках. В статье предлагается метод принятия решений и управления, основанный на обучении с подкреплением и прогнозировании скорости, для управления связкой прямолинейных и поворачивающих транспортных средств на двухсторонних однополосных нерегулируемых перекрестках. Проблема предотвращения столкновения в процессе движения по слиянию решается путем создания модели геометрии дороги, и на этой основе рассчитывается ожидаемая скорость прямолинейного транспортного средства, обеспечивающая безопасность проезда. Затем применяется алгоритм обучения с подкреплением для решения задачи управления решением прямолинейного транспортного средства, движущегося в прямолинейном направлении, и его ожидаемая скорость оптимизируется, чтобы направить агент на обучение и сблизить результат с запланированным решением. Для проверки эффективности предложенного метода проведено моделирование, и результаты показали, что предложенный метод может генерировать правильные решения для прямолинейного транспортного средства , движущегося в прямолинейном направлении при проезде перекрестка, гарантируя при этом безопасность и эффективность движения.
В статье предлагается метод принятия решений и управления, основанный на RL (Reinforcement Learning) и прогнозировании скорости транспортного средства. Строится дорожно-геометрическая модель перекрестка, анализируется распределение скорости и ускорения, а также основные факторы, влияющие на процесс принятия решения, на основе открытого набора данных по траекториям слияния перекрестков. На основе метода ARIMA (autoregressive integrated moving average) проводится прогнозирование скорости поворачивающего транспортного средства в будущей временной области, и предлагается метод принятия решений для перекрестков на основе RL и ARIMA. Для подтверждения эффективности предложенного алгоритма проводятся имитационные моделирования для созданной сцены перекрестка. Результаты моделирования показывают, что обученный агент RL может принимать соответствующие решения для безопасного и эффективного проезда перекрестка при двух рабочих условиях (или в двух рабочих режимах). Наконец, эффективность предложенного метода оценивается на основе предложенного стандарта оценки по пяти показателям. Результаты показывают, что в различных рабочих условиях предложенный метод демонстрирует превосходную производительность по всем показателям и комплексным оценкам.
Однако предполагается, что восприятие окружающей обстановки является точным, а информация о дорожной обстановке может быть получена транспортным средством. Влияние ошибок, вызванных на этапе предсказания, должно быть рассмотрено на следующем этапе исследований. Кроме того, рассматривая мультитранспортные средства в качестве агентов, необходимо продолжить изучение взаимодействия между транспортными средствами.
В журнале Remote Sensing издательства MDPI вышла статья под названием: “Adaptive Multi-Pedestrian Tracking by Multi-Sensor: Track-to-Track Fusion Using Monocular 3D Detection and MMW Radar”.
Точное и надежное слежение за несколькими пешеходами имеет большое значение для автономного вождения, взаимодействия человека и робота и видеонаблюдения. Поскольку в различных сценариях используются различные датчики, обладающие наилучшими характеристиками, считается, что стратегии объединения данных датчиков должны иметь взаимодополняющие модальности и быть способными справиться с ситуациями, которые сложны для одного датчика. В работе предлагается новая стратегия объединения датчиков для отслеживания нескольких пешеходов с помощью радара миллиметровых волн (MMW) и монокулярной камеры. Пешеходы отслеживаются каждым датчиком в соответствии с его характеристиками. В частности, 3D-монокулярное видео обнаружение пешеходов производится с помощью сверточной нейронной сети (CNN). Траектория формируется с помощью метода отслеживания по обнаружению в сочетании с байесовской оценкой. Шум измерений при трехмерном монокулярном обнаружении моделируется значением неопределенности обнаружения, полученным с помощью той же CNN, как подход для более точной оценки пешехода. Радар MMW использует метод отслеживания до обнаружения из-за нехватки радиолокационных характеристик. После этого траектории пешеходов определяются с помощью предложенной стратегии слияния совмещения траекторий, которая может адаптивно работать в сложных погодных условиях, условиях низкой освещенности и при наличии помех.
Измерения радара MMW проходят через алгоритм “отслеживания до обнаружения” для контроля пешеходов. Изображения монокулярного зрения используются для формирования траектории движения пешеходов с помощью нейронной сети 3D обнаружения и фильтра Калмана, моделирование шума которого улучшено. Радарный метод слежения имеет преимущества в точности, но недостатки в надежности. Монокулярный метод 3D-слежения имеет надежное обнаружение, но менее точную локализацию. По сравнению с радаром, информация о глубине не может быть непосредственно измерена монокулярной камерой. Хотя принятый метод нейронной сети способен определять местоположение пешеходов, его ошибку трудно интерпретировать и уменьшить. Искажение камеры также может внести дополнительную погрешность в точность локализации, поскольку погрешность внутреннего параметра камеры трудно калибровать, и она меняется со временем. Благодаря объединению двух датчиков, эффективность отслеживания пешеходов улучшается по сравнению с отслеживанием по одному датчику или современным последовательным объединенным отслеживанием. Предложенная стратегия слияния траекторий была протестирована в различных сценариях, включая ситуации ухудшения зрения, дым и слабое освещение. Результаты показывают, что система слежения камера-радар может работать в условиях сложных помех с предложенной адаптивной стратегией слияния. В будущем работа будет заключаться в ее реализации на встроенной системе с производительностью в реальном времени, для чего будет необходимо найти баланс между высокой точностью и высокой частотой кадров.
В журнале Control Engineering Practice издательства Elsevier вышла статья под названием: “Design and experimental evaluation of an efficient MPC-based lateral motion controller considering path preview for autonomous vehicles”.
Управление боковым движением сталкивается с серьезной проблемой точного отслеживания опорной траектории в сложных и изменчивых маневрах вождения. В связи с этим в данном исследовании разрабатывается эффективный контроллер бокового движения на основе модельного прогнозирующего управления (MPC) с учетом предварительного просмотра траектории для повышения надежности и вычислительной эффективности при управлении боковым движением с большим боковым ускорением или высокоскоростным боковым движением. Точность прогнозирующей модели MPC существенно влияет на устойчивость контроллера. Таким образом, для повышения надежности контроллера бокового движения предлагается модуль онлайн-адаптации параметров шины (TPOAM) для обновления прогнозирующей модели MPC в режиме онлайн, чтобы уменьшить несоответствие модели. В отличие от других методов онлайн-адаптации, предлагаемый TPOAM не опирается на сложные и многопараметрические модели шин или таблицы поиска. Благодаря увеличению задержки, предложенный метод точно моделирует задержку системы рулевого управления и компенсирует ее в прогнозной модели MPC. В инженерной реализации регулятора бокового движения на основе MPC длинный горизонт прогнозирования существенно ухудшает вычислительную эффективность отступающей оптимизации. Для решения этой проблемы в модель прогнозирования вводится теория предварительного просмотра-слежения, чтобы полностью использовать информацию о будущем пути. Отклонение слежения в соответствующей точке предварительного просмотра может быть получено путем предварительного просмотра маневров аналогично водителю-человеку в каждый момент времени в горизонте прогнозирования. Это отклонение слежения также считается частью функции стоимости MPC. Общий горизонт прогнозирования контроллера бокового движения с учетом предварительного просмотра траектории может быть эффективно расширен практически без увеличения времени вычислений. Разработанный контроллер проверен на платформе автономного транспортного средства в сценариях низкоскоростного движения с большой кривизной и высокоскоростной смены полосы движения. Результаты экспериментов показывают, что предложенный контроллер может эффективно повысить надежность и вычислительную эффективность управления боковым движением по сравнению с обычно используемым подходом бокового движения на основе MPC.
В журнале Transportation Research Record издательства SAGE вышла статья под названием: “Effects of Autonomous Driving Behavior on Intersection Performance and Safety in the Presence of White Phase for Mixed-Autonomy Traffic Stream”.
В данной работе изучается влияние различных моделей автономного вождения на показатели безопасности и мобильности изолированного перекрестка в условиях смешанного трафика. Движение транспортных средств через перекресток контролируется зеленым, красным и "белым" сигналами. Движение во время зеленого и красного сигналов идентично обычному перекрестку. Однако при наличии белой фазы подключенные автомобили под управлением человека (CHVs) должны следовать за подключенными автономными автомобилями (CAVs), чтобы безопасно проехать перекресток. Рассматриваются три уровня агрессивности вождения для CAV: (1) осторожное поведение, (2) нормальное поведение и (3) агрессивное поведение. Влияние этих моделей поведения CAV на мобильность и безопасность изучается на основе различных уровня распространенности на рынке и уровня спроса. Результаты показывают, что более агрессивное поведение CAV приводит к снижению средней задержки при увеличении среднего количества остановок. Кроме того, более агрессивное поведение CAV приводит к более частому включению белой фазы, что способствует значительному снижению дисперсии скорости. В то же время, общее количество наблюдаемых опасных сближений, с временем до столкновения менее 10 секунд уменьшается по мере увеличения распространенности CAV и уровня агрессивности. Основная причина этого наблюдения заключается в том, что агрессивные CAV имеют более высокие значения ускорения и более низкие значения замедления и, следовательно, обладают большей гибкостью, чтобы избежать столкновения.
В журнале Journal of Advanced Transportation (JAT) издательства Hindawi вышла статья под названием: “Factors Influencing the Acceptance of Robo-Taxi Services in China: An Extended Technology Acceptance Model Analysis”.
С развитием технологий автономного вождения робо-такси (автономные транспортные средства для совместных поездок) проходят испытания на реальных дорогах. В Китае, в частности, жители некоторых городов, таких как Пекин и Шанхай, могут заказать робо-такси онлайн и воспользоваться услугой. Для изучения факторов, влияющих на принятие пользователями услуг робо-такси, в данном исследовании предлагается и используется расширенная модель принятия технологии (TAM) с четырьмя внешними факторами: воспринимаемое доверие, государственная поддержка, социальное влияние и воспринимаемое удовольствие. Данные были собраны с помощью онлайн-анкеты в Китае, и ответы 403 респондентов были проанализированы с помощью модели структурных уравнений. Было установлено, что как типичные факторы TAM, включая воспринимаемую простоту использования, воспринимаемую полезность и отношение, так и внешние факторы играют значительную роль в прогнозировании намерения пользователей использовать роботакси. Четыре внешних фактора косвенно влияли на принятие пользователей через типичные факторы TAM.
Основываясь на этих результатах, были сделаны следующие предложения для улучшения принятия населением робо-такси. Во-первых, поскольку безопасность является главной проблемой, производители и поставщики услуг должны повысить безопасность услуг робо-такси. Более того, информация о безопасности таких услуг должна распространяться среди населения через рекламу и другие формы коммуникации, чтобы повысить их популярность. Во-вторых, государственная поддержка может улучшить внедрение роботакси. Предоставление стимулов для пользователей и производителей может помочь пользователям сэкономить деньги и повысить их доверие к услугам робо-такси. Приоритет робо-такси на дорогах, например, разрешение использовать их на автобусных полосах, может помочь пассажирам сэкономить время. В-третьих, поощрения и купоны могут быть предоставлены существующим пользователям, которые приглашают новых пользователей, для дальнейшего содействия принятия технологий. Наконец, робо-такси могут предоставлять развлекательные услуги, такие как фильмы, еда и игры, чтобы сделать поездку пассажиров более приятной.
Данное исследование, однако, имеет некоторые ограничения, которые следует отметить. Данные были собраны с помощью онлайн-опроса, что может привести, помимо прочего, к погрешности в ответах. Среди респондентов 93,5% относились к возрастной группе 18-44 года, а 85,6% имели степень бакалавра или выше, что снижает обобщаемость результатов. Однако, хотя некоторые компании уже протестировали робо-такси на реальных дорогах, им потребуется больше времени для успешного внедрения услуг робо-такси на рынок. Молодые и образованные люди являются потенциальными группами, которые первыми примут такие услуги. Поэтому результаты данного исследования все еще полезны для разработчиков робо-такси. В будущих исследованиях можно опросить людей, которые пользовались услугами робо-такси, чтобы провести более глубокое исследование того, как улучшить принятие пользователями робо-такси.
В журнале Sustainable Energy Technologies and Assessments издательства Elsevier вышла статья под названием: “Multi-object tracking based on attention networks for Smart City system”.
В настоящее время объект"умный город" является актуальной темой. Отслеживание пешеходов и анализ их поведения играют важную роль в системе "умного города". Поэтому необходимо разработать универсальный и надежный алгоритм многообъектного слежения (MOT). MOT - сложная задача, имеющая множество важных применений, включая навигацию роботов, автономное вождение и анализ поведения пешеходов. Среди существующих подходов к MOT все большее внимание привлекают модели, которые сочетают в себе совместное распознавание с обучением и повторную идентификацию. Впоследствии в сети возникает конкуренция между этими двумя задачами, что неизбежно приводит к снижению производительности. Для решения этих проблем в данной работе предложен адаптивный подход к совместному обучению, названный UnionTrack. Он решает проблему равномерного обучения между задачами в онлайновой системе MOT. Во-первых, UnionTrack представляет сеть внимания с учетом масштаба, которая объединяет признаки разных масштабов для локализации объекта и обучения соответствующих дискриминационных вкраплений. Во-вторых, модуль кросс-корреляции предназначен для построения релевантных задаче карт признаков и адаптивного взаимодействия в процессе обучения обнаружения и повторного опознавания. Затем мы выполняем межкадровую корреляцию на разных этапах, используя обнаружение с высокой и низкой степенью достоверности, чтобы избежать преграждения и влияния фона. UnionTrack обучается сквозным образом, чтобы лучше адаптировать обучение между задачами обнаружения и повторного опознавания. Наконец, UnionTrack сравнивается с современными методами в обширных экспериментах, а подробный анализ производительности выполняется в MOT15, MOT16, MOT17 и MOT20, которые представляют собой городские сцены, чтобы продемонстрировать эффективность предложенного метода.