基于语义概率预测的动态场景单目视觉SLAM

引用

摘要：

目的基于视觉的同步定位与建图(visual-based simultaneous localization and mapping,vSLAM)是计算机视觉以及机器人领域中的关键技术,其通过对输入的图像进行处理分析来感知周围的3维环境以及进行自身的定位.现有的SLAM系统大多依赖静态世界假设,在真实环境中的动态物体会严重影响视觉SLAM系统的稳定运行.同时,场景中静止与运动部分往往和其语义有密切关系,因而可以借助场景中的语义信息来提升视觉SLAM系统在动态环境下的稳定性.为此,提出一种新的基于语义概率预测的面向动态场景的单目视觉SLAM算法.方法结合语义分割的结果以及鲁棒性估计算法,通过对分割进行数据关联、状态检测,从概率的角度来表示观测的静止/运动状态,剔除动态物体上的观测对相机位姿估计的干扰,同时借助运动概率及时剔除失效的地图点,使系统在复杂动态的场景中依然能够稳定运行.结果在本文构建的复杂动态场景数据集上,提出的方法在跟踪精度和完整度上都显著优于现有的单目视觉SLAM方法,而且在TUM-RGBD数据集中的多个高动态序列上也取得了更好的结果.此外,本文定性比较了动态场景下的建图质量以及AR(augmented reality)效果.结果表明,本文方法明显优于对比方法.结论本文通过结合语义分割信息以及鲁棒性估计算法,对分割区域进行数据关联以及运动状态检测,以概率的形式表示2D观测的运动状态,同时及时剔除失效地图点,使相机位姿估计的精度以及建图质量有了明显提升,有效提高了单目视觉SLAM在高度动态环境中运行的鲁棒性.

关键词：视觉SLAM(vSLAM)、语义分割、动态场景、鲁棒性估计、概率预测

所属期刊栏目：28

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金61822310

在线出版日期：2023-08-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共16页

页码：2151-2166

英文信息展示

期刊专题