室内动态场景下移动机器人的视觉SLAM算法研究
发布时间:2021-08-07 20:49
基于视觉的同时定位与地图构建(Simultaneous Localization and Mapping,SLAM),是自主移动机器人的核心功能之一。然而,现有视觉SLAM算法大多为了计算方便,常将外部场景作为静态假设,其所构建的静态系统模型对外部环境独立运动物体敏感,导致SLAM系统在动态场景中具有较大误差而无法应用于实际生产生活。鉴于此,本文以ORB-SLAM2 RGB-D框架为基础,研究一种针对室内动态场景下的鲁棒视觉SLAM算法,涉及的核心问题有ORB特征点均匀化提取、动态特征点检测及滤除和静态三维地图构建。基于ORB-SLAM2构建了一种多线程SLAM框架。添加了语义检测线程,用于识别场景中的先验动态目标。新增三维地图构建线程,用于构建场景中的静态三维点云和八叉树地图。在跟踪线程中,改进了原始系统特征提取模块,新添加特征滤除模块用于滤除场景中的动态特征。针对 ORB-SLAM2 中基于四叉树的 ORB 算法(Quadtree-based ORB algorithm,QtreeORB)存在对提取的特征点过均匀化现象,提出一种改进四叉树ORB特征点提取算法。...
【文章来源】:西安理工大学陕西省
【文章页数】:89 页
【学位级别】:硕士
【部分图文】:
经典视觉SLAM框架
1绪论5等[37]基于HOG特征提出一种目标检测器DPM,该检测器对目标形变及尺度变化等有较好鲁棒性,是目标检测研究历史中最经典的方法之一。随后有国内外学者先后对DPM在精度和效率方面提出一些改进方法[38][39][40],但这些检测器大为通过人为设定特征完成目标检测。这些特征对噪声以及环境干扰敏感,且人为设定的特征难以表达目标全面信息。此外,通过设定复杂特征可提升检测器精度,但同时增加了检测器的处理负担,实时性能大幅降低。因此,难以权衡检测精度和实时性能。图1-2经典目标检测系统框架Fig.1-2Classictargetdetectionsystemframework近年来,卷积神经网络(ConvolutionalNeuralNetwork,CNN)的快速发展,为运动目标检测方案提供了新的研究思路。R-CNN[41]、FastR-CNN[42]、FasterR-CNN[43]相继提出将目标检测算法推上一个新高度。这些网络使用候选区域预测来提高网络检测精度,但候选区域的检测时间影响了算法的效率。随后,YOLO[44]、SSD[45]等网络采用回归思想优化实时性。YOLO可对复杂场景目标实时检测,但存在对小目标不敏感缺陷。SSD相对于YOLO提高了目标检测进度,同时保证了较好实时性。此外,还有很多优秀的目标检测网络,如FCN[45]、SegNet[47]和DeepLab[48]。虽然使用深度学习方法可以更好的适应环境变化,但大部分网络实时性较差,且需要几何方法来判断目标状态。1.2.3动态环境中SLAM问题研究现状在静态环境下,SLAM系统根据静态路标点可得到全局一致高精度地图。但现实环境不可能永远保持静态,如图1-3所示为SLAM系统在场景中的位姿估计示意,当场景中出现运动目标(图1-3(b)中红点),会使相邻帧出现较大的不一致,使SLAM系统的位姿估计精度降低,影响SLAM系统的实际应用。在动态环境中提高SLAM系统鲁棒性的核心
文6出了一种使用深度信息和视觉测距法检测场景中的运动物体。通过将检测到的外点信息和视觉传感器的深度信息相融合可容易获得场景中的运动目标位置。但是由于深度信息的不确定性和相邻帧间的变换矩阵计算误差,该算法目标检测分割精度较低。Yi[56]等使用双单高斯模型(SingleGaussianmodel,SGM)来构建前景和背景模型,通过滤除从前景上提取到的动态特征来提升SLAM系统的定位精度。Derome[57]等提出一种立体匹配和光流结合的方法,通过考虑各种估算误差,得出了一种综合的不确定性模型,可以很好的检测场景中的动态目标。图1-3动态场景下的SLAM问题Fig.1-3TheSLAMproblemunderdynamicscenarios近年来,深度学习方法发展迅速,学者们开始使用其解决SLAM问题。ChaoYu[16]等人基于ORB-SLAM2框架提出DS-SLAM,该框架在独立线程使用SegNet网络检测场景中的语义信息,通过RANSAC算法估算帧间变换矩阵,然后使用极线几何判断特征点状态。当某一目标上的动态特征点的数量大于阈值,则该目标被认为动态,滤除其所有特征点。该算法在TUM数据集上表现优秀,但因其在对极约束中使用的基本矩阵是基于所有特征点推算,当图像中异常特征点较多时,会导致所估算基本矩阵出现严重偏差。同样地,BertaBescos[17]等人提出一种DynaSLAM算法,其在ORB-SLAM2的基础上通过结合几何和深度学习来滤除场景中的动态特征点。该算法在TUM数据集上取得了优秀的成绩,但其采用的Mask-RCNN网络不能实时,影响其在现实中的应用。最近,Han和Xi[58]提出一种PSPNet-SLAM(PyramidSceneParsingNetwork-SLAM)来改进ORB-SLAM2,其中PSPNet和光流用于检测动态特征。从标记为动态对象上提取的特征和具有较大光流值的特征均被滤除,其余特征用于跟踪。该方法在TUM数据集中实现了较高定位精?
【参考文献】:
期刊论文
[1]基于改进ORB算法的移动机器人视觉SLAM方法研究[J]. 成怡,佟晓宇. 电子技术应用. 2019(01)
[2]移动机器人SLAM关键问题和解决方法综述[J]. 杨雪梦,姚敏茹,曹凯. 计算机系统应用. 2018(07)
[3]视觉SLAM综述[J]. 权美香,朴松昊,李国. 智能系统学报. 2016(06)
本文编号:3328517
【文章来源】:西安理工大学陕西省
【文章页数】:89 页
【学位级别】:硕士
【部分图文】:
经典视觉SLAM框架
1绪论5等[37]基于HOG特征提出一种目标检测器DPM,该检测器对目标形变及尺度变化等有较好鲁棒性,是目标检测研究历史中最经典的方法之一。随后有国内外学者先后对DPM在精度和效率方面提出一些改进方法[38][39][40],但这些检测器大为通过人为设定特征完成目标检测。这些特征对噪声以及环境干扰敏感,且人为设定的特征难以表达目标全面信息。此外,通过设定复杂特征可提升检测器精度,但同时增加了检测器的处理负担,实时性能大幅降低。因此,难以权衡检测精度和实时性能。图1-2经典目标检测系统框架Fig.1-2Classictargetdetectionsystemframework近年来,卷积神经网络(ConvolutionalNeuralNetwork,CNN)的快速发展,为运动目标检测方案提供了新的研究思路。R-CNN[41]、FastR-CNN[42]、FasterR-CNN[43]相继提出将目标检测算法推上一个新高度。这些网络使用候选区域预测来提高网络检测精度,但候选区域的检测时间影响了算法的效率。随后,YOLO[44]、SSD[45]等网络采用回归思想优化实时性。YOLO可对复杂场景目标实时检测,但存在对小目标不敏感缺陷。SSD相对于YOLO提高了目标检测进度,同时保证了较好实时性。此外,还有很多优秀的目标检测网络,如FCN[45]、SegNet[47]和DeepLab[48]。虽然使用深度学习方法可以更好的适应环境变化,但大部分网络实时性较差,且需要几何方法来判断目标状态。1.2.3动态环境中SLAM问题研究现状在静态环境下,SLAM系统根据静态路标点可得到全局一致高精度地图。但现实环境不可能永远保持静态,如图1-3所示为SLAM系统在场景中的位姿估计示意,当场景中出现运动目标(图1-3(b)中红点),会使相邻帧出现较大的不一致,使SLAM系统的位姿估计精度降低,影响SLAM系统的实际应用。在动态环境中提高SLAM系统鲁棒性的核心
文6出了一种使用深度信息和视觉测距法检测场景中的运动物体。通过将检测到的外点信息和视觉传感器的深度信息相融合可容易获得场景中的运动目标位置。但是由于深度信息的不确定性和相邻帧间的变换矩阵计算误差,该算法目标检测分割精度较低。Yi[56]等使用双单高斯模型(SingleGaussianmodel,SGM)来构建前景和背景模型,通过滤除从前景上提取到的动态特征来提升SLAM系统的定位精度。Derome[57]等提出一种立体匹配和光流结合的方法,通过考虑各种估算误差,得出了一种综合的不确定性模型,可以很好的检测场景中的动态目标。图1-3动态场景下的SLAM问题Fig.1-3TheSLAMproblemunderdynamicscenarios近年来,深度学习方法发展迅速,学者们开始使用其解决SLAM问题。ChaoYu[16]等人基于ORB-SLAM2框架提出DS-SLAM,该框架在独立线程使用SegNet网络检测场景中的语义信息,通过RANSAC算法估算帧间变换矩阵,然后使用极线几何判断特征点状态。当某一目标上的动态特征点的数量大于阈值,则该目标被认为动态,滤除其所有特征点。该算法在TUM数据集上表现优秀,但因其在对极约束中使用的基本矩阵是基于所有特征点推算,当图像中异常特征点较多时,会导致所估算基本矩阵出现严重偏差。同样地,BertaBescos[17]等人提出一种DynaSLAM算法,其在ORB-SLAM2的基础上通过结合几何和深度学习来滤除场景中的动态特征点。该算法在TUM数据集上取得了优秀的成绩,但其采用的Mask-RCNN网络不能实时,影响其在现实中的应用。最近,Han和Xi[58]提出一种PSPNet-SLAM(PyramidSceneParsingNetwork-SLAM)来改进ORB-SLAM2,其中PSPNet和光流用于检测动态特征。从标记为动态对象上提取的特征和具有较大光流值的特征均被滤除,其余特征用于跟踪。该方法在TUM数据集中实现了较高定位精?
【参考文献】:
期刊论文
[1]基于改进ORB算法的移动机器人视觉SLAM方法研究[J]. 成怡,佟晓宇. 电子技术应用. 2019(01)
[2]移动机器人SLAM关键问题和解决方法综述[J]. 杨雪梦,姚敏茹,曹凯. 计算机系统应用. 2018(07)
[3]视觉SLAM综述[J]. 权美香,朴松昊,李国. 智能系统学报. 2016(06)
本文编号:3328517
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3328517.html
最近更新
教材专著