Группа учёных из Тайваня, Индонезии, Германии и Великобритании опубликовали научную статью, посвящённую нейросетевым алгоритмам для распознавания дорожных знаков.
Дорожные знаки достаточно трудно обнаружить во время движения в автономном режиме, так как требуется обработка больших данных в режиме реального времени.
В работе учёных анализируются такие методы обнаружения объектов, как Yolo V4 и Yolo V4-tiny consolidated with Spatial Pyramid Pooling (SPP). Также оценивается важность принципа SPP для повышения производительности базовых сетей Yolo V4 и Yolo V4-tiny в извлечении признаков и более эффективном обучении. Обе модели оцениваются и сравниваются по важнейшим параметрам измерения, включая среднюю точность (mAP), размер рабочей области, время обнаружения и миллиард чисел с плавающей запятой (BFLOPS). Эксперименты показывают, что Yolo V4_1 (с SPP) превосходит современные схемы, достигая точности в 99,4%, наряду с лучшими показателями общего количества BFLOPS (127,26) и mAP (99,32%). В отличие от предыдущих исследований, процесс обучения Yolo V3 SPP получает только 98,99% точности для mAP при IoU 90,09. При использовании Yolo V4_1 (mAP 99,32%) в эксперименте точность обучения mAP увеличивается на 0,44%. Далее, SPP может улучшить результаты всех моделей в эксперименте.
Китайские учёные посвятили работу совершенствованию системы адаптивного круиз-контроля.
Традиционный адаптивный круиз-контроль (ACC) при обнаружении впереди идущих автомобилей с низкой скоростью предпочитает следовать за ними, но это может привести к снижению эффективности вождения.
Авторы работы - Вэйцян Чжао, Сяовэй Ма и Чжиген Ни - предлагают контроллер улучшенного адаптивного круиз-контроля с функцией помощи при смене полосы движения (LCACC) для сочлененного транспортного средства.
В данном исследовании принята двухуровневая иерархическая структура управления. Верхний определяет высокоуровневые команды, а нижний, состоящий из двух модифицированных DDPG (deep deterministic policy gradient) сетей, управляет рулевым колесом и дросселем/тормозом, соответственно, в соответствии с командами верхнего слоя. Поперечное и продольное управление транспортным средством разделено и управляется двумя модифицированными сетями DDPG. Благодаря правильному проектированию состояния и функции вознаграждения, действия сочлененного транспортного средства, такие как рулевое управление и ускорение/торможение, приближаются к человеческим, что обеспечивает комфорт во время езды. По сравнению с традиционными АСС и LCACC, предложенная система, повышает эффективность движения сочлененного транспортного средства в среднем на 16% при наличии низкоскоростного впередиидущего автомобиля.
Оптимизацию алгоритмов передачи данных в автомобильных самоорганизующихся сетях (VANET) рассмотрели учёные из ОАЭ и Австралии.
Это новая технология, которая обеспечивает комфортное, безопасное и эффективное передвижение, предоставляя механизмы для выполнения приложений, связанных с пробками, дорожно-транспортными происшествиями, автономным вождением и развлекательными программами. Транспортные средства в VANET характеризуются низкими вычислительными возможностями и возможностями хранения данных.
В таких сценариях, чтобы удовлетворить требования приложений к производительности, запросы от транспортных средств перегружаются на пограничные (edge) и облачные (cloud) серверы. Высокое энергопотребление этих серверов увеличивает эксплуатационные расходы и оказывает негативное влияние на окружающую среду. Для решения этой проблемы были разработаны стратегии выгрузки с учетом энергопотребления. Существующие работы по выгрузке вычислений сосредоточены на оптимизации энергопотребления либо устройств IoT/транспортных средств и/или пограничных серверов. В данной работе предлагается новый алгоритм выгрузки, который оптимизирует энергопотребление интегрированных вычислительных платформ "edge-cloud" на основе эволюционно-генетического алгоритма (EGA) при сохранении соглашения об уровне обслуживания (SLA) приложений. В предложенном алгоритме используется адаптивная штрафная функция для включения ограничений оптимизации в EGA. Проведены сравнительный анализ и численные эксперименты между предложенным алгоритмом, выгрузкой на основе случайного и генетического алгоритмов и базовым подходом без выгрузки. В среднем результаты показывают, что предложенный алгоритм экономит в 2,97 раза и 1,37 раза больше энергии, чем алгоритмы со случайной выгрузкой и без выгрузки соответственно. Предложенный алгоритм имеет 0,3% нарушений по сравнению с 52,8% и 62,8% в случайном подходе и подходе без выгрузки соответственно. Генетический алгоритм без учета SLA экономит в среднем в 1,22 раза больше энергии, чем предложенный подход, однако он нарушает SLA в 159 раз чаще.
Группа учёных из США и Китая представила многоступенчатую стереосеть на основе обучения по пикселям и видимости для систем стереозрения.
Многоракурсное стереозрение имеет потенциальное применение в робототехнике и автономном вождении. С помощью информации о глубине инерциальные навигационные системы могут обеспечить точную навигацию. Это особенно актуально при сбоях GPS в сложных условиях. Точная оценка глубины является сложной задачей в низкотекстурированных или окклюзированных областях.
Для снижения ошибок при определении глубины в данной работе представлена многоступенчатая стереосеть на основе обучения по пикселям и видимости. Ее усовершенствования заключаются в следующем:
1) разработан новый адаптивный к содержанию механизм агрегирования объемов стоимостей на основе видимости соседних пикселей для эффективного получения более точных и гладких прогнозов карты глубины на границе объекта;
2) разработаны блок глобальной свертки и блок уточнения границ для регуляризации уровня стоимости (cost volume), они могут изучать присущие ограничения соответствия характеристик и эффективно смягчать неопределенность оценки глубины в областях с низкой текстурой;
3) разработана новая функция потерь для измерения неопределенности предсказанного распределения вероятности и повышения надежности вывода карты глубины.
Результаты экспериментов на датасетах DTU для помещений и Tanks & Temples для открытых площадок показывают, что представленный метод может достичь превосходной производительности и обладает мощной способностью к обобщению, что сравнимо с современными работами.
Вэньюй Чэнь, Пейшуань Ли и Хуайци Чжао из Китая представили новую глубокую архитектуру, объединяющую несколько датчиков для обнаружения 3D-объектов, под названием MSL3D.
Хотя в последнее время методы объединения данных лидар-камера вводят дополнительные семантические признаки, работая с меньшим количеством ложных обнаружений, все еще существует разрыв в производительности по сравнению с методами, использующими только LiDAR.
В статье утверждается, что этот разрыв вызван двумя причинами:
1) 3D сферические рецептивные поля множества облаков точек не согласованы с 2D пиксельными рецептивными полями изображения;
2) преждевременное введение информации об изображении затрудняет синхронное применение данных LiDAR и изображения.
Для решения первой проблемы была расширена абстракция 3D множества до абстракции 2D множества, которая может преобразовать 2D характеристики изображения в 3D сферу для унификации рецептивного поля мультимодальных данных. Для решения второй задачи была разработана новая двухэтапная система 3D-обнаружения, которая на первом этапе использует только LiDAR для оценки высокоточных и высококачественных предположений, а затем объединяет данные изображений и облаков точек для уточнения границ и прогнозирования достоверности. Кроме того, были добавлены две вспомогательные сети для эффективного изучения особенностей изображений и облаков точек при синхронном использовании различных стратегий мультимодального дополнения данных. Более того, разработан генератор консистентных структур, использующий стереоизображения для определения принадлежности любой точки в трехмерном пространстве к контуру объекта, тем самым дополняя разреженную информацию облака точек. Обширные эксперименты на популярном датасете KITTI для обнаружения трехмерных объектов показывают, что предложенная система MSL3D достигает лучших результатов по сравнению с другими подходами, использующими только LiDAR или алгоритмы объединения данных лидара и камеры.
Не менее важную проблему изучили и Жанпенг Жанг, Цзяху Цинь, Шуай Ванг, Ю Канг, Цинчен Лю. Китайские учёные посвятили работу изучению новой единой сети обнаружения полос движения и препятствий ULODNet.
Понимание зоны возможного движения является важной проблемой в области автономной навигации роботов. Мобильные роботы или другие автономные транспортные средства должны воспринимать окружающую среду, такую как препятствия, полосы движения и свободное пространство, чтобы обеспечить безопасность движения. Многие недавние работы достигли больших успехов благодаря прорыву в области глубокого обучения. Однако эти методы решают задачу по отдельности, что в некоторых случаях приводит к повторному использованию вычислительных мощностей.
Авторы предлагают использовать единую сеть обнаружения полос движения и препятствий ULODNet, которая может одновременно обнаруживать полосы движения и препятствия и в дальнейшем выделять зоны, доступные для движения мобильных роботов или других автономных транспортных средств. Для лучшей координации обучения сети ULODNet также был создан новый датасет CULane-ULOD Dataset, основанный на широко используемом датасете CULane Dataset. Новый набор данных содержит метки полос движения и метки препятствий, которых нет в оригинальном датасете. Наконец, для построения интегрированной схемы автономного движения внедряется парадигма пересечения областей для генерации команд управления путем вычисления доли площади препятствий в свободных для движения областях. Авторы заявляют, что хорошо спланированные сравнительные эксперименты подтверждают эффективность и действенность нового алгоритма.