Новый алгоритм стереозрения Un-ViTAStereo позволяет роботам видеть мир в объеме в том числе там, где «слепнут» прочие современные алгоритмы: в туман, в густой листве и перед гладкими стенами. Технология, разработанная международным коллективом с участием МФТИ, не требует дорогих лидаров или ручной разметки. Она использует модель Depth Anything V2, которая оценивает относительную глубину по одному изображению, учитывая тени, перспективу и перекрытия. Алгоритм обучается, сопоставляя предсказания стереосистемы с подсказками «наставника». Продвинутое машинное зрение работает в три этапа: проверка пикселей, поиск «маяков» для коррекции ошибок и сглаживание для построения контуров. Un-ViTAStereo показала превосходство над аналогами, снизив грубые ошибки на бенчмарке KITTI 2015 до 5%. В будущем планируется создание самообучающейся нейросети, адаптирующейся к различным средам, и использование лидарных измерений для повышения точности технологии. Понравился материал? Подписывайтесь на наши кана
Машинное стереозрение Un-ViTAStereo позволит роботам видеть мир в объеме даже в сложных условиях
27 марта27 мар
5
1 мин