基于图像和点云融合的道路障碍物感知与参数化分析
发布时间:2021-12-01 19:34
目前,人工智能时代已经到来,各种传感器制造水平也取得了长足的进步,车辆的智能化水平不断提高,自动驾驶逐渐从幻想变为现实。感知系统作为车辆获取道路信息的关键部分,其性能与自动驾驶车辆的安全性有着直接关系。当前,自动驾驶对感知的需求正在由二维空间向三维空间演变,这要求感知系统不仅能够得到道路关键目标在空间中的位置,而且还需要知道目标的姿态。目前存在的问题是双方面的,一方面是如何实现对目标参数的精确估计,另一方面是如何保证感知的实时性,基于这两个问题,本文从图像、点云以及二者融合的方向进行研究,提出了一种基于融合的感知算法,实现了对道路障碍物的实时精确感知与参数化分析。本文的主要研究内容和成果如下:首先,本文对基于图像的视觉感知算法进行了研究,设计了一个适用于目标检测和语义分割的Backbone,在此基础上构建了目标检测和语义分割模型,通过特征共享,构建了二者的联合模型,极大地减少了参数量和计算量,实验证明,联合模型能够以较快的速度同时执行目标检测和语义分割任务,在保证精度的前提下,满足了实时性的要求;然后,本文以Point Net为基础,设计了一个直接处理原始点云的网络Point SSD,...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
百度ApolloRobotaxi车队截至2019年6月,我国汽车保有量已经突破3.5亿,汽车带给人们出行
哈尔滨工业大学工学硕士学位论文-11-测B个边界框,每个边界框的参数由三部分组成,首先是其坐标(x,y,w,h),(x,y)是边界框的中心相对于该网格左上角的偏移,(w,h)是边界框的长宽相对于整幅图像的长和宽;然后是边界框置信度得分,置信度得分反映的是边界框包含一个目标的置信度和位置预测的准确性;最后是类别分数,类别分数是网格的条件类别概率|Pri(ClassObject)与边界框的置信度相乘,在物理意义上指的是每个边界框的特定类别置信度得分。这样,网络一共预测了S*S*B个边界框,然后,采用非极大值抑制(Non-MaximumSuppression,NMS)算法去除置信度低的和重叠严重的边界框,得到最终的检测结果。图2-1YOLO算法原理图2.2.2语义分割经典算法语义分割是对图像中的每个像素分配一个标签,即像素级分类,图像中具有相同语义信息的像素被分为同一类别,如图2-2所示。语义分割可以提供对场景的完整解析,在深度卷积网络出现之前,只能提取到一些简单的语义,比如类别,深度神经网络具有提取抽象语义的能力,在这之后,语义分割才真正的应用到了各个领域。图2-2图语义分割结果图全卷积网络FCN是第一个应用深度卷积神经网络进行语义分割的算法,截至目前出现的各种算法虽然表现性能有所提升,但大都是以FCN为基础的。顾名思义,FCN是一个全部由卷积层组成的深度神经网络,其网络结构如图2-
哈尔滨工业大学工学硕士学位论文-11-测B个边界框,每个边界框的参数由三部分组成,首先是其坐标(x,y,w,h),(x,y)是边界框的中心相对于该网格左上角的偏移,(w,h)是边界框的长宽相对于整幅图像的长和宽;然后是边界框置信度得分,置信度得分反映的是边界框包含一个目标的置信度和位置预测的准确性;最后是类别分数,类别分数是网格的条件类别概率|Pri(ClassObject)与边界框的置信度相乘,在物理意义上指的是每个边界框的特定类别置信度得分。这样,网络一共预测了S*S*B个边界框,然后,采用非极大值抑制(Non-MaximumSuppression,NMS)算法去除置信度低的和重叠严重的边界框,得到最终的检测结果。图2-1YOLO算法原理图2.2.2语义分割经典算法语义分割是对图像中的每个像素分配一个标签,即像素级分类,图像中具有相同语义信息的像素被分为同一类别,如图2-2所示。语义分割可以提供对场景的完整解析,在深度卷积网络出现之前,只能提取到一些简单的语义,比如类别,深度神经网络具有提取抽象语义的能力,在这之后,语义分割才真正的应用到了各个领域。图2-2图语义分割结果图全卷积网络FCN是第一个应用深度卷积神经网络进行语义分割的算法,截至目前出现的各种算法虽然表现性能有所提升,但大都是以FCN为基础的。顾名思义,FCN是一个全部由卷积层组成的深度神经网络,其网络结构如图2-
【参考文献】:
博士论文
[1]基于智能计算的图像检索算法研究[D]. 许相莉.吉林大学 2011
硕士论文
[1]面向自动驾驶的双传感器信息融合目标检测及姿态估计[D]. 曹培.哈尔滨工业大学 2019
[2]基于单目视觉的自动驾驶视觉感知算法设计[D]. 张迪.华中科技大学 2019
[3]移动机器人全局定位与运动目标检测方法研究[D]. 葛振华.中国科学技术大学 2018
[4]自动驾驶场景下的车辆检测技术研究[D]. 黄鸿胜.广东工业大学 2018
[5]基于卷积神经网络特征共享与目标检测的跟踪算法研究[D]. 李贺.武汉大学 2017
本文编号:3526927
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
百度ApolloRobotaxi车队截至2019年6月,我国汽车保有量已经突破3.5亿,汽车带给人们出行
哈尔滨工业大学工学硕士学位论文-11-测B个边界框,每个边界框的参数由三部分组成,首先是其坐标(x,y,w,h),(x,y)是边界框的中心相对于该网格左上角的偏移,(w,h)是边界框的长宽相对于整幅图像的长和宽;然后是边界框置信度得分,置信度得分反映的是边界框包含一个目标的置信度和位置预测的准确性;最后是类别分数,类别分数是网格的条件类别概率|Pri(ClassObject)与边界框的置信度相乘,在物理意义上指的是每个边界框的特定类别置信度得分。这样,网络一共预测了S*S*B个边界框,然后,采用非极大值抑制(Non-MaximumSuppression,NMS)算法去除置信度低的和重叠严重的边界框,得到最终的检测结果。图2-1YOLO算法原理图2.2.2语义分割经典算法语义分割是对图像中的每个像素分配一个标签,即像素级分类,图像中具有相同语义信息的像素被分为同一类别,如图2-2所示。语义分割可以提供对场景的完整解析,在深度卷积网络出现之前,只能提取到一些简单的语义,比如类别,深度神经网络具有提取抽象语义的能力,在这之后,语义分割才真正的应用到了各个领域。图2-2图语义分割结果图全卷积网络FCN是第一个应用深度卷积神经网络进行语义分割的算法,截至目前出现的各种算法虽然表现性能有所提升,但大都是以FCN为基础的。顾名思义,FCN是一个全部由卷积层组成的深度神经网络,其网络结构如图2-
哈尔滨工业大学工学硕士学位论文-11-测B个边界框,每个边界框的参数由三部分组成,首先是其坐标(x,y,w,h),(x,y)是边界框的中心相对于该网格左上角的偏移,(w,h)是边界框的长宽相对于整幅图像的长和宽;然后是边界框置信度得分,置信度得分反映的是边界框包含一个目标的置信度和位置预测的准确性;最后是类别分数,类别分数是网格的条件类别概率|Pri(ClassObject)与边界框的置信度相乘,在物理意义上指的是每个边界框的特定类别置信度得分。这样,网络一共预测了S*S*B个边界框,然后,采用非极大值抑制(Non-MaximumSuppression,NMS)算法去除置信度低的和重叠严重的边界框,得到最终的检测结果。图2-1YOLO算法原理图2.2.2语义分割经典算法语义分割是对图像中的每个像素分配一个标签,即像素级分类,图像中具有相同语义信息的像素被分为同一类别,如图2-2所示。语义分割可以提供对场景的完整解析,在深度卷积网络出现之前,只能提取到一些简单的语义,比如类别,深度神经网络具有提取抽象语义的能力,在这之后,语义分割才真正的应用到了各个领域。图2-2图语义分割结果图全卷积网络FCN是第一个应用深度卷积神经网络进行语义分割的算法,截至目前出现的各种算法虽然表现性能有所提升,但大都是以FCN为基础的。顾名思义,FCN是一个全部由卷积层组成的深度神经网络,其网络结构如图2-
【参考文献】:
博士论文
[1]基于智能计算的图像检索算法研究[D]. 许相莉.吉林大学 2011
硕士论文
[1]面向自动驾驶的双传感器信息融合目标检测及姿态估计[D]. 曹培.哈尔滨工业大学 2019
[2]基于单目视觉的自动驾驶视觉感知算法设计[D]. 张迪.华中科技大学 2019
[3]移动机器人全局定位与运动目标检测方法研究[D]. 葛振华.中国科学技术大学 2018
[4]自动驾驶场景下的车辆检测技术研究[D]. 黄鸿胜.广东工业大学 2018
[5]基于卷积神经网络特征共享与目标检测的跟踪算法研究[D]. 李贺.武汉大学 2017
本文编号:3526927
本文链接:https://www.wllwen.com/kejilunwen/daoluqiaoliang/3526927.html