127,5 тыс подписчиков

Ученые улучшили способность ИИ создавать 3D-карты из 2D-изображений

15 июня 202415 июн 2024

~1 мин

Исследователи из Университета штата Северная Каролина разработали методику, Multi-View Attentive Contextualization (MvACon), направленную на улучшение отображения трехмерных пространств из двухмерных изображений, полученных с помощью нескольких камер. Команда под руководством Тяньфу Ву усовершенствовала существующие программы искусственного интеллекта, известные как трансформаторы зрения, используемые в автономных транспортных средствах. MvACon позволяет трансформаторам зрения более эффективно идентифицировать объекты на изображениях и, таким образом, лучше картировать трехмерное окружение. При тестировании ведущих трансформаторов зрения, таких как BEVFormer и PETR, с использованием данных с шести камер, MvACon неизменно повышал производительность в обнаружении объектов, скорость и точность ориентации. В планах на будущее — бенчмарк и тестирование в реальных условиях с возможным широким распространением, если будет продемонстрирован успех.

Команда под руководством Тяньфу Ву усовершенствовала существующие программы искусственного интеллекта, известные как трансформаторы зрения, используемые в автономных транспортных средствах. MvACon позволяет трансформаторам зрения более эффективно идентифицировать объекты на изображениях и, таким образом, лучше картировать трехмерное окружение.

При тестировании ведущих трансформаторов зрения, таких как BEVFormer и PETR, с использованием данных с шести камер, MvACon неизменно повышал производительность в обнаружении объектов, скорость и точность ориентации.

В планах на будущее — бенчмарк и тестирование в реальных условиях с возможным широким распространением, если будет продемонстрирован успех.

Гаджеты и электроника

5,73 млн интересуются