基于语义信息与多视图几何的动态SLAM方法研究
发布时间:2021-03-07 19:53
基于视觉的同时定位与建图技术(Visual SLAM)被认为是移动机器人走向智能化的重要基础之一,这项技术赋予了机器人在未知环境中进行自主定位和构建地图的能力。但是目前大部分的视觉SLAM研究大多默认机器人所处的环境是静态的,若场景内存在体积较大的运动物体,则传统方法在计算过程中将会受到严重的干扰而出现相机定位误差增大以及地图产生重影等问题,这极大地限制了视觉SLAM在现实场景中的应用。针对移动机器人在动态环境中进行精确定位和地图构建的迫切需求,本文在使用深度神经网络获得语义信息的基础上,对动态场景下的相机定位与建图方法进行了研究。同时针对深度神经网络分割不准确以及传统方法在计算位姿时受运动物体影响较大等问题,重点开展了基于语义信息的特征提取、点线融合的帧间位姿估计、结合多视图几何方法的运动物体检测等研究,并且搭建了基于RGBD相机的动态SLAM系统。最后通过标准数据集和真实场景数据对算法的有效性进行了对比验证。本文的具体工作内容如下:首先,针对动态场景下的图像特征提取与匹配问题,本文使用了MaskRCNN对彩色图像进行语义分割获得掩码图,而后结合深度图像的几何信息对掩码图进行了细化处...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
搭载了激光雷达传感器的移动机器人
境中的 SLAM 应用,RGBD 相机以其同时可以获得彩色和深度信息的独特优点受到了研究者的青睐,本文正是使用此类传感器进行研究。近十年以来,基于视觉的 SLAM 技术取得了长足的进展,逐渐发展出了相对成熟的算法体系和程序架构。但是,目前的视觉 SLAM 研究以及流行的技术方案大都基于静态环境的假设,经典方法在人流密集的商场,有车辆行驶的街道等高动态环境下经常会出现相机跟踪失败和地图构建出现重影等问题。这极大地限制了 SLAM 算法在实际生活中的应用。而动态环境中的视觉 SLAM 所面临的关键问题就是环境中动态物体的识别,但是,目前较为成熟地 SLAM 系统仅仅能够做到恢复静态环境的三维结构,直观上讲,如果想要稳定高效地检测出动态物体就需要机器人对由传感器获得的信息有一定的理解。而最近在图像识别领域取得了巨大进展的深度学习为解决上述问题提供了切实可行的方案。如图 1-2 所示深度神经网络在 GPU 的加速下可以以近乎实时的速率对图像中的物体进行精确识别,从一个个离散的像素灰度值中提取并抽象出语义信息,进而帮助机器人理解环境,区分环境中的各个物体。
波(filtering)和平滑(smoothing)两类。其中,滤波方法将 SLAM 视为一时的状态估计问题,其中所谓的状态包含了机器人当前的位姿以及所构建图模型。当传感器获得新的观测数据时,算法便会对当前状态的估计值进新。比较流行的滤波方法包括卡尔曼滤波[2]、粒子滤波[3]和信息滤波[4]等看出,这是一种增量式的方法。与之相对的,利用所有时刻的所有测量数机器人整个移动轨迹进行统一计算[5]的平滑方法被称为 Full-SLAM,通常目标函数构造为最小二乘形式,并通过非线性优化技术解决其估计问题。SLAM 问题还可以直观的通过基于图的结构进行表示,如图 1-2 所示,在图的过程中,图的节点 代表了机器人的位姿,节点之间的边则代表了约束位姿的观测数据,可以看到当机器人回到之前到过的位置附近时,同样会前的位姿产生约束,如 4与 1。显然,因为噪声的存在无法避免,这些约束被同时满足,即它们相互之间会产生一些冲突。一旦图构建完成,主要的就是寻找能最大程度上满足上述约束且能与测量数据相匹配的各个节点参这就涉及到了如何解决大型的误差最小化问题。
【参考文献】:
期刊论文
[1]视觉SLAM综述[J]. 权美香,朴松昊,李国. 智能系统学报. 2016(06)
[2]基于单目视觉的同时定位与地图构建方法综述[J]. 刘浩敏,章国锋,鲍虎军. 计算机辅助设计与图形学学报. 2016(06)
本文编号:3069708
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
搭载了激光雷达传感器的移动机器人
境中的 SLAM 应用,RGBD 相机以其同时可以获得彩色和深度信息的独特优点受到了研究者的青睐,本文正是使用此类传感器进行研究。近十年以来,基于视觉的 SLAM 技术取得了长足的进展,逐渐发展出了相对成熟的算法体系和程序架构。但是,目前的视觉 SLAM 研究以及流行的技术方案大都基于静态环境的假设,经典方法在人流密集的商场,有车辆行驶的街道等高动态环境下经常会出现相机跟踪失败和地图构建出现重影等问题。这极大地限制了 SLAM 算法在实际生活中的应用。而动态环境中的视觉 SLAM 所面临的关键问题就是环境中动态物体的识别,但是,目前较为成熟地 SLAM 系统仅仅能够做到恢复静态环境的三维结构,直观上讲,如果想要稳定高效地检测出动态物体就需要机器人对由传感器获得的信息有一定的理解。而最近在图像识别领域取得了巨大进展的深度学习为解决上述问题提供了切实可行的方案。如图 1-2 所示深度神经网络在 GPU 的加速下可以以近乎实时的速率对图像中的物体进行精确识别,从一个个离散的像素灰度值中提取并抽象出语义信息,进而帮助机器人理解环境,区分环境中的各个物体。
波(filtering)和平滑(smoothing)两类。其中,滤波方法将 SLAM 视为一时的状态估计问题,其中所谓的状态包含了机器人当前的位姿以及所构建图模型。当传感器获得新的观测数据时,算法便会对当前状态的估计值进新。比较流行的滤波方法包括卡尔曼滤波[2]、粒子滤波[3]和信息滤波[4]等看出,这是一种增量式的方法。与之相对的,利用所有时刻的所有测量数机器人整个移动轨迹进行统一计算[5]的平滑方法被称为 Full-SLAM,通常目标函数构造为最小二乘形式,并通过非线性优化技术解决其估计问题。SLAM 问题还可以直观的通过基于图的结构进行表示,如图 1-2 所示,在图的过程中,图的节点 代表了机器人的位姿,节点之间的边则代表了约束位姿的观测数据,可以看到当机器人回到之前到过的位置附近时,同样会前的位姿产生约束,如 4与 1。显然,因为噪声的存在无法避免,这些约束被同时满足,即它们相互之间会产生一些冲突。一旦图构建完成,主要的就是寻找能最大程度上满足上述约束且能与测量数据相匹配的各个节点参这就涉及到了如何解决大型的误差最小化问题。
【参考文献】:
期刊论文
[1]视觉SLAM综述[J]. 权美香,朴松昊,李国. 智能系统学报. 2016(06)
[2]基于单目视觉的同时定位与地图构建方法综述[J]. 刘浩敏,章国锋,鲍虎军. 计算机辅助设计与图形学学报. 2016(06)
本文编号:3069708
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3069708.html