基于深度学习实现视频中车辆检测与空间定位
发布时间:2021-07-07 21:01
近几年来,由于人工智能的不断普及,智能汽车以及汽车辅助驾驶等方向逐渐成为技术变革新一轮的前进方向,并取得了相当不错的成果。其中对视频流中目标(包括行人、汽车以及交通灯等)的检测、识别、分割与测距是智能汽车辅助驾驶系统的重要组成部分。自从2012年的Alex Net在Image Net大赛中博得第一名,深度学习不断在目标的检测、识别与分割等领域取得佳绩,同时在计算机视觉领域,采用双目立体视觉对目标进行距离探测也逐渐被许多研究学者关注。但以上方案仍然存在算法计算量过大导致的实时性不足的问题。目标的检测、识别与分割是目标测距的前提和基础,由于本文的目的是获得目标的精准分割图,且目前将检测、识别与分割综合到一起的算法只有Mask RCNN,所以本文实现目标检测、识别与分割的基本方案为Mask R-CNN算法;同时利用双目立体视觉对目标进行测距。并且针对以上几种算法中所涉及到的实时性不足的问题,提出了如下解决方案。首先,本文针对Mask R-CNN的参数过多、计算量较大以致实时性不足的问题,提出了基于Mobile Net V2的Mask R-CNN算法,利用Mobile Net V2替换Mask...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
中心像素点的anchors在RPN中,卷积操作的步长为1,输出为所有包围框的分类预测值以及
RPN预测后的ROIs
哈尔滨工业大学工程硕士学位论文-22-正样本中被预测正确数目的比例。理想情况,希望P和R都是越高越好,但是通常情况下随着P增大R会减小,反之亦然,例如在正负样本都为100的情况下,当把所有的样本都预测为正样本,此时P=0.5,但是R=1;但如果把其中98个正样本和100各负样本都预测为负样本,余下2个正样本预测为正样本,此时P=1,但是R=0.02。由此可见对MaskR-CNN的评价需要综合P和R的属性来得到平均精度。AP的定义为:以P以及R为纵横坐标绘制的二维曲线为标准,将曲线以及横纵坐标轴包含的近似面积为AP。AP的计算流程如下:1.根据设定的IOU阈值对每一个预测目标进行分类,即IOU大于等于阈值的视为TP,反之则视为FP;2.按照置信度大小对预测结果排序;3.依次计算P与R;4.根据P和R绘制P-R曲线,如图2-10蓝色折线图所示;5.利用面积法计算AP,即根据P的递减曲线绘制的新P-R曲线的面积,如图2-10红色折线图所示。图2-10P-R曲线的绘制由分析可得,AP越接近于1,说明模型的效果越好,例如在理想情况下,所有样本预测正确其负样本没有被错误预测为正样本的情况下,可以算得P-R曲线为一条平行于R轴且P始终为1的线段,由此可以求得AP为1。由于本文所感兴趣的目标类别并不单一,而且图片中的类别也不单一,因此在对MaskR-CNN进行评价时不能仅用某一类别来衡量,或者仅使用一张
【参考文献】:
期刊论文
[1]光流法及其在临近预报中的应用[J]. 曹春燕,陈元昭,刘东华,李程,李辉,贺佳佳. 气象学报. 2015(03)
[2]一种基于改进光流法的电子稳像算法[J]. 程德强,郭政,刘洁,钱建生,张媛媛,张佳琳. 煤炭学报. 2015(03)
[3]基于光流法与特征统计的鱼群异常行为检测[J]. 于欣,侯晓娇,卢焕达,余心杰,范良忠,刘鹰. 农业工程学报. 2014(02)
[4]光流算法比较分析研究[J]. 张佳威,支瑞峰. 现代电子技术. 2013(13)
[5]运动细节估计的光流场方法[J]. 潘金山,苏志勋,王伟. 计算机辅助设计与图形学学报. 2011(08)
博士论文
[1]月球车立体视觉与视觉导航方法研究[D]. 侯建.哈尔滨工业大学 2007
硕士论文
[1]基于双目立体视觉的不规则物体体积测量方法研究[D]. 梁乐.西安理工大学 2019
[2]双目视觉机器人的目标识别与抓取技术研究[D]. 毛孟娜.沈阳工业大学 2019
[3]基于立体视觉的可见光通信室内定位技术研究与实现[D]. 于朋鑫.北京邮电大学 2019
[4]基于双目立体视觉的玉米叶片识别与定位[D]. 田东旭.吉林大学 2018
[5]基于双目视觉的移动充电车的设计与实现[D]. 杜鹤峰.西安电子科技大学 2018
[6]基于双目视觉的巡视机器人避障研究[D]. 倪晨阳.天津大学 2018
[7]基于双目立体视觉的心脏软组织三维重构技术研究[D]. 马波涛.电子科技大学 2017
[8]基于智能手机的车辆检测与车距测量[D]. 顾兆伦.浙江大学 2017
[9]基于双目立体视觉的眼球突出度测量方法研究[D]. 张帅.北京交通大学 2016
本文编号:3270363
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:78 页
【学位级别】:硕士
【部分图文】:
中心像素点的anchors在RPN中,卷积操作的步长为1,输出为所有包围框的分类预测值以及
RPN预测后的ROIs
哈尔滨工业大学工程硕士学位论文-22-正样本中被预测正确数目的比例。理想情况,希望P和R都是越高越好,但是通常情况下随着P增大R会减小,反之亦然,例如在正负样本都为100的情况下,当把所有的样本都预测为正样本,此时P=0.5,但是R=1;但如果把其中98个正样本和100各负样本都预测为负样本,余下2个正样本预测为正样本,此时P=1,但是R=0.02。由此可见对MaskR-CNN的评价需要综合P和R的属性来得到平均精度。AP的定义为:以P以及R为纵横坐标绘制的二维曲线为标准,将曲线以及横纵坐标轴包含的近似面积为AP。AP的计算流程如下:1.根据设定的IOU阈值对每一个预测目标进行分类,即IOU大于等于阈值的视为TP,反之则视为FP;2.按照置信度大小对预测结果排序;3.依次计算P与R;4.根据P和R绘制P-R曲线,如图2-10蓝色折线图所示;5.利用面积法计算AP,即根据P的递减曲线绘制的新P-R曲线的面积,如图2-10红色折线图所示。图2-10P-R曲线的绘制由分析可得,AP越接近于1,说明模型的效果越好,例如在理想情况下,所有样本预测正确其负样本没有被错误预测为正样本的情况下,可以算得P-R曲线为一条平行于R轴且P始终为1的线段,由此可以求得AP为1。由于本文所感兴趣的目标类别并不单一,而且图片中的类别也不单一,因此在对MaskR-CNN进行评价时不能仅用某一类别来衡量,或者仅使用一张
【参考文献】:
期刊论文
[1]光流法及其在临近预报中的应用[J]. 曹春燕,陈元昭,刘东华,李程,李辉,贺佳佳. 气象学报. 2015(03)
[2]一种基于改进光流法的电子稳像算法[J]. 程德强,郭政,刘洁,钱建生,张媛媛,张佳琳. 煤炭学报. 2015(03)
[3]基于光流法与特征统计的鱼群异常行为检测[J]. 于欣,侯晓娇,卢焕达,余心杰,范良忠,刘鹰. 农业工程学报. 2014(02)
[4]光流算法比较分析研究[J]. 张佳威,支瑞峰. 现代电子技术. 2013(13)
[5]运动细节估计的光流场方法[J]. 潘金山,苏志勋,王伟. 计算机辅助设计与图形学学报. 2011(08)
博士论文
[1]月球车立体视觉与视觉导航方法研究[D]. 侯建.哈尔滨工业大学 2007
硕士论文
[1]基于双目立体视觉的不规则物体体积测量方法研究[D]. 梁乐.西安理工大学 2019
[2]双目视觉机器人的目标识别与抓取技术研究[D]. 毛孟娜.沈阳工业大学 2019
[3]基于立体视觉的可见光通信室内定位技术研究与实现[D]. 于朋鑫.北京邮电大学 2019
[4]基于双目立体视觉的玉米叶片识别与定位[D]. 田东旭.吉林大学 2018
[5]基于双目视觉的移动充电车的设计与实现[D]. 杜鹤峰.西安电子科技大学 2018
[6]基于双目视觉的巡视机器人避障研究[D]. 倪晨阳.天津大学 2018
[7]基于双目立体视觉的心脏软组织三维重构技术研究[D]. 马波涛.电子科技大学 2017
[8]基于智能手机的车辆检测与车距测量[D]. 顾兆伦.浙江大学 2017
[9]基于双目立体视觉的眼球突出度测量方法研究[D]. 张帅.北京交通大学 2016
本文编号:3270363
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3270363.html