基于词袋模型的立体点云场景识别方法设计与实现
发布时间:2021-01-16 18:04
对自身位置的认知是机器人学中的核心内容之一,是一切动作任务实现的基础。对于工作环境较复杂的机器人,正确认识所处场景,不仅有利于对环境中关键目标的识别感知,还可以极有效地辅助定位模块的工作。此外,在机器人学的重要领域——即时定位与地图构建(Simultaneous Localization and Mapping,SLAM)中,场景识别技术已被广泛地应用到回环闭合的操作中。基于里程计的SLAM技术的核心思想是对地图进行迭代式更新,这个过程会不可避免地引入累计误差,该问题在大范围的制图任务中尤为明显。回环闭合利用场景识别技术,能使机器人运动轨迹发生闭环时检测出对应的历史场景,认识到累计误差的存在并针对性地修复地图,从而减小累计误差。本研究针对自动驾驶的应用场景,设计并实现了一种具备鲁棒性的基于词袋模型的新型立体点云场景识别方法,并基于该方法采用公开数据集进行了闭环检测的功能测试。本研究尝试利用词袋模型直接处理原始立体点云数据,针对立体点云数据的特点,实现了基于整体的特征描述方法。对于几何一致性检查工作,本研究在随机采样一致(Random Sample Consensus,RANSAC)方法...
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
(a):在基于里程计制图的过程中应用闭环检测识别到对应数据帧,以蓝色线段标
【笆侗鸱椒ㄉ杓朴胧迪?2但这个过程会不可避免地引入累计误差,该问题在大范围的制图任务中尤为明显[7]。为应对该问题,回环闭合技术被提出并广泛应用于基于视觉的SLAM(Visual-SLAM,V-SLAM1)方法中[1]。如图1-1所示,该技术使机器人在运动轨迹发生闭环时,能够通过闭环检测技术识别出曾经访问过的历史场景,认识到累计误差的存在并针对性地修复地图,从而减小地图的累计误差。本文所研究的场景识别方法通过计算两个场景间的相似度,判断场景是否一致,从而实现闭环检测的功能,是回环闭合技术的核心内容。(a)(b)图1-2(a):Velodyne公司激光雷达,自左向右分别是AlphaPrime,Velarray和VelaDome;(b):由Velodyne的旋转式激光雷达VLP-128S采集的点云图像机器人的工作环境多种多样,许多应用场景对定位质量有极高要求,如自动驾驶等。相较于受环境光照影响大,缺乏深度信息,更适合于室内场景的摄像机,包含深度信息的主动式传感器更适用于该类应用场景,如多线束旋转式激光雷达,主要以Velodyne公司的AlphaPrime、HDL-64E和VLP-32C等产品为代表,图1-2(a)中最左侧为AlphaPrime。旋转式激光雷达可以探测到周身360度的立体点云图像,如图1-2(b)所示。在自动驾驶应用场景中,基于激光雷达的SLAM(LiDARSLAM,L-SLAM2)方法因为其原始数据本身具备高精度立体位置信息、不受环境光照影响等优点,可以实现非常高的定位精度。但由于计算机立体视觉技术的发展稍慢于平面视觉,以及激光雷达数据相较于摄像机数据的稀疏性,一般的回环闭合方法很难应用到L-SLAM中。因此L-SLAM虽然在小范围内表现良好,但是在大范围的制图中难免存在累计误差难以消除的问题。本文的研究适用于立体点云的场景识别方法,可以实现基于激光雷达的回环闭合应用,以及对超大规
兰州大学硕士学位论文基于词袋模型的立体点云场景识别方法设计与实现4计算的搜索域,实时地计算在高精度地图中的相对位置。由于该方法不受外界信号覆盖的局限,只需要有预先制作的高精度地图便可以实现高精度的定位结果,因此是近年来的研究热点之一。在自动驾驶领域,最主要的传感器包括激光雷达和相机。其中V-SLAM的匹配定位方法由于相机固有的深度信息缺失、受外部光线、色彩影响大等问题,即使是包含深度信息的立体相机也很难工作在户外场景中,因此很难满足自动驾驶对定位的精度要求。具体来说,户外的同一个场景在每天不同时段,每年不同季节的图像数据会有十分明显的差别。而激光雷达采集的立体点云数据本身包含几何特征,具有测距准确、数据处理方便、数据不易受环境影响等特点,适用于各种场景。因此,基于激光雷达的高精度地图匹配方法(如图1-3所示)是自动驾驶的主要定位实现方法之一。图1-3使用激光雷达点云在高精度地图上实现厘米级匹配定位,其中白色点是预制作的高精度地图,彩色点是实时激光雷达点云1.2.2闭环检测研究现状基于高精度地图的定位方法,其定位精度主要取决于地图本身的精度,因此如何制作大范围的、精度高的数据地图是非常重要的研究目标。目前高精度地图的制作技术参考了SLAM方法,借助里程计对地图进行迭代式更新,但随着制图范围的不断扩大,不断增加的累计误差是该类方法难以回避的问题。尽管L-SLAM本身具备较高的定位精度,但随着制图范围的扩大,也面临累计误差难以接受的问题。因此,如何构建超大规模的高精度地图是一个普遍的难题。在V-SLAM方法中,往往使用回环闭合技术解决这一问题[1]。该方法利用闭环检测技
本文编号:2981287
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
(a):在基于里程计制图的过程中应用闭环检测识别到对应数据帧,以蓝色线段标
【笆侗鸱椒ㄉ杓朴胧迪?2但这个过程会不可避免地引入累计误差,该问题在大范围的制图任务中尤为明显[7]。为应对该问题,回环闭合技术被提出并广泛应用于基于视觉的SLAM(Visual-SLAM,V-SLAM1)方法中[1]。如图1-1所示,该技术使机器人在运动轨迹发生闭环时,能够通过闭环检测技术识别出曾经访问过的历史场景,认识到累计误差的存在并针对性地修复地图,从而减小地图的累计误差。本文所研究的场景识别方法通过计算两个场景间的相似度,判断场景是否一致,从而实现闭环检测的功能,是回环闭合技术的核心内容。(a)(b)图1-2(a):Velodyne公司激光雷达,自左向右分别是AlphaPrime,Velarray和VelaDome;(b):由Velodyne的旋转式激光雷达VLP-128S采集的点云图像机器人的工作环境多种多样,许多应用场景对定位质量有极高要求,如自动驾驶等。相较于受环境光照影响大,缺乏深度信息,更适合于室内场景的摄像机,包含深度信息的主动式传感器更适用于该类应用场景,如多线束旋转式激光雷达,主要以Velodyne公司的AlphaPrime、HDL-64E和VLP-32C等产品为代表,图1-2(a)中最左侧为AlphaPrime。旋转式激光雷达可以探测到周身360度的立体点云图像,如图1-2(b)所示。在自动驾驶应用场景中,基于激光雷达的SLAM(LiDARSLAM,L-SLAM2)方法因为其原始数据本身具备高精度立体位置信息、不受环境光照影响等优点,可以实现非常高的定位精度。但由于计算机立体视觉技术的发展稍慢于平面视觉,以及激光雷达数据相较于摄像机数据的稀疏性,一般的回环闭合方法很难应用到L-SLAM中。因此L-SLAM虽然在小范围内表现良好,但是在大范围的制图中难免存在累计误差难以消除的问题。本文的研究适用于立体点云的场景识别方法,可以实现基于激光雷达的回环闭合应用,以及对超大规
兰州大学硕士学位论文基于词袋模型的立体点云场景识别方法设计与实现4计算的搜索域,实时地计算在高精度地图中的相对位置。由于该方法不受外界信号覆盖的局限,只需要有预先制作的高精度地图便可以实现高精度的定位结果,因此是近年来的研究热点之一。在自动驾驶领域,最主要的传感器包括激光雷达和相机。其中V-SLAM的匹配定位方法由于相机固有的深度信息缺失、受外部光线、色彩影响大等问题,即使是包含深度信息的立体相机也很难工作在户外场景中,因此很难满足自动驾驶对定位的精度要求。具体来说,户外的同一个场景在每天不同时段,每年不同季节的图像数据会有十分明显的差别。而激光雷达采集的立体点云数据本身包含几何特征,具有测距准确、数据处理方便、数据不易受环境影响等特点,适用于各种场景。因此,基于激光雷达的高精度地图匹配方法(如图1-3所示)是自动驾驶的主要定位实现方法之一。图1-3使用激光雷达点云在高精度地图上实现厘米级匹配定位,其中白色点是预制作的高精度地图,彩色点是实时激光雷达点云1.2.2闭环检测研究现状基于高精度地图的定位方法,其定位精度主要取决于地图本身的精度,因此如何制作大范围的、精度高的数据地图是非常重要的研究目标。目前高精度地图的制作技术参考了SLAM方法,借助里程计对地图进行迭代式更新,但随着制图范围的不断扩大,不断增加的累计误差是该类方法难以回避的问题。尽管L-SLAM本身具备较高的定位精度,但随着制图范围的扩大,也面临累计误差难以接受的问题。因此,如何构建超大规模的高精度地图是一个普遍的难题。在V-SLAM方法中,往往使用回环闭合技术解决这一问题[1]。该方法利用闭环检测技
本文编号:2981287
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2981287.html
最近更新
教材专著