基于Faster RCNN的道路车辆检测算法研究
发布时间:2021-03-26 06:36
基于视觉的车辆检测,即利用某种目标检测算法对图像或者视频中潜在的车辆目标进行定位和识别,是视觉目标检测领域的一个重要研究课题。过往数十年的研究已经取得了重要的进展,然而在面对真实交通环境的各种复杂场景时,基于视觉的行人和车辆检测系统的表现仍然无法满足实际的要求。近年来,深度学习领域有了非常大的研究进展,尤其是深度卷积神经网络在图像识别、目标检测、语义分割等计算机视觉领域表现出了远超传统算法的优势,基于深度卷积神经网络的行人和车辆检测也逐渐成为了自动驾驶技术、智能交通系统等领域的研究新潮流,受到了学界以及工业界的高度重视。本文基于深度卷积神经网络在相关的开源数据集上开展行人和车辆检测的研究工作,主要内容包括:(1)总结前人已有的车辆检测成果,主要是传统的目标检测算法和基于深度卷积神经网络的目标检测算法,并详细分析Faster RCNN的检测原理;(2)基于车辆标签中的高度属性的统计结果设计了一种类似于传统的K-Means聚类的锚点参数生成策略,每一个标签只统计与之欧氏距离最近的四个中心点所对应的锚点的尺寸;(3)详细对比了残差网络和谷歌网络模型在特征融合环节的区别,并在残差网络的基础上结...
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
某型自动驾驶车辆环境感知模块示意图
图 2. 1 图像金字塔示意图文献[53]证明了除高斯核函数以外的核会对图像造成除模糊以外的其他影响。因此,SI用了二维的高斯核函数使图像平滑,同时免除了图像除模糊以外其他的变化。假设一幅单图像,SIFT 对于该图像的尺度空间的构建方法如公式 2.12 2 2( )/ 22( , , )2( , , ) ( , , ) ( , )x yeG x yL x y G x y I x y (2中, I ( x, y )代表降采样后的图像或者原始图像, G ( x, y , )代表高斯核函数, L( x, y , )代表为 时得到的特征; 的大小决定了图像的平滑程度,也就对应了图像的不同的模糊程度了降低运算量,SIFT 对于 进行了降采样处理作为下一个尺度的输入图像,同时 需要相应地增大。2)关键点提取为了得到尺度不变性的特征,SIFT 对于上述生成的尺度空间使用了二阶拉普拉斯算子求值点,但是直接二阶拉普拉斯算子处理的运算量极大,SIFT 使用了近似处理,如公式 2.22 22G G
以期模型的性能可以再度提升者们普遍观察到模型的性能反而出现了下降 等机器学习方法开展得如火如荼,开源的大没能普及,种种因素使得卷积神经网络的发展U 等硬件设备的计算能力逐渐攀升,大规模ton 教授提出了经典的 AlexNet 模型。的层数过深带来的梯度消失的问题在 AlexN的 sigmoid 变成 ReLu,如公式 2.8, 00, 0x xyx 活函数改善了多个 sigmoid 函数的导数想乘的梯度值也可以参与到网络参数的调整中来函数的有效性。新的归一化方法防止过拟合,主要包括:(1制。其中局部响应归一化的操作如图 2.2 所示
【参考文献】:
期刊论文
[1]基于BOOSTING框架的视觉语音多模态情感识别检测方法[J]. 张芬. 现代电子技术. 2017(23)
[2]运用开端神经网络进行人体姿态识别[J]. 柴铎,徐诚,何杰,张少阳,段世红,齐悦. 通信学报. 2017(S2)
[3]基于BING和数据融合的行人检测算法研究[J]. 程刚,张治国. 计算机与数字工程. 2016(01)
[4]基于后验HOG特征的多姿态行人检测[J]. 刘威,段成伟,遇冰,柴丽颖,袁淮,赵宏. 电子学报. 2015(02)
[5]基于DPM模型的行人检测技术的研究[J]. 熊聪,王文武. 电子设计工程. 2014(23)
[6]基于K-means算法的行人检测方法研究[J]. 游峰,张荣辉,李福樑,冯琼莹,徐建闽. 公路交通科技. 2014(07)
[7]基于支持向量机的目标检测算法综述[J]. 郭明玮,赵宇宙,项俊平,张陈斌,陈宗海. 控制与决策. 2014(02)
[8]基于显著性检测与HOG-NMF特征的快速行人检测方法[J]. 孙锐,陈军,高隽. 电子与信息学报. 2013(08)
[9]决策树分类算法研究[J]. 张琳,陈燕,李桃迎,牟向伟. 计算机工程. 2011(13)
[10]一种基于K-Means分类的状态机车辆检测算法[J]. 曹喆,闻育,潘霓,刘泓. 工业控制计算机. 2010(01)
本文编号:3101142
【文章来源】:南京航空航天大学江苏省 211工程院校
【文章页数】:72 页
【学位级别】:硕士
【部分图文】:
某型自动驾驶车辆环境感知模块示意图
图 2. 1 图像金字塔示意图文献[53]证明了除高斯核函数以外的核会对图像造成除模糊以外的其他影响。因此,SI用了二维的高斯核函数使图像平滑,同时免除了图像除模糊以外其他的变化。假设一幅单图像,SIFT 对于该图像的尺度空间的构建方法如公式 2.12 2 2( )/ 22( , , )2( , , ) ( , , ) ( , )x yeG x yL x y G x y I x y (2中, I ( x, y )代表降采样后的图像或者原始图像, G ( x, y , )代表高斯核函数, L( x, y , )代表为 时得到的特征; 的大小决定了图像的平滑程度,也就对应了图像的不同的模糊程度了降低运算量,SIFT 对于 进行了降采样处理作为下一个尺度的输入图像,同时 需要相应地增大。2)关键点提取为了得到尺度不变性的特征,SIFT 对于上述生成的尺度空间使用了二阶拉普拉斯算子求值点,但是直接二阶拉普拉斯算子处理的运算量极大,SIFT 使用了近似处理,如公式 2.22 22G G
以期模型的性能可以再度提升者们普遍观察到模型的性能反而出现了下降 等机器学习方法开展得如火如荼,开源的大没能普及,种种因素使得卷积神经网络的发展U 等硬件设备的计算能力逐渐攀升,大规模ton 教授提出了经典的 AlexNet 模型。的层数过深带来的梯度消失的问题在 AlexN的 sigmoid 变成 ReLu,如公式 2.8, 00, 0x xyx 活函数改善了多个 sigmoid 函数的导数想乘的梯度值也可以参与到网络参数的调整中来函数的有效性。新的归一化方法防止过拟合,主要包括:(1制。其中局部响应归一化的操作如图 2.2 所示
【参考文献】:
期刊论文
[1]基于BOOSTING框架的视觉语音多模态情感识别检测方法[J]. 张芬. 现代电子技术. 2017(23)
[2]运用开端神经网络进行人体姿态识别[J]. 柴铎,徐诚,何杰,张少阳,段世红,齐悦. 通信学报. 2017(S2)
[3]基于BING和数据融合的行人检测算法研究[J]. 程刚,张治国. 计算机与数字工程. 2016(01)
[4]基于后验HOG特征的多姿态行人检测[J]. 刘威,段成伟,遇冰,柴丽颖,袁淮,赵宏. 电子学报. 2015(02)
[5]基于DPM模型的行人检测技术的研究[J]. 熊聪,王文武. 电子设计工程. 2014(23)
[6]基于K-means算法的行人检测方法研究[J]. 游峰,张荣辉,李福樑,冯琼莹,徐建闽. 公路交通科技. 2014(07)
[7]基于支持向量机的目标检测算法综述[J]. 郭明玮,赵宇宙,项俊平,张陈斌,陈宗海. 控制与决策. 2014(02)
[8]基于显著性检测与HOG-NMF特征的快速行人检测方法[J]. 孙锐,陈军,高隽. 电子与信息学报. 2013(08)
[9]决策树分类算法研究[J]. 张琳,陈燕,李桃迎,牟向伟. 计算机工程. 2011(13)
[10]一种基于K-Means分类的状态机车辆检测算法[J]. 曹喆,闻育,潘霓,刘泓. 工业控制计算机. 2010(01)
本文编号:3101142
本文链接:https://www.wllwen.com/kejilunwen/jiaotonggongchenglunwen/3101142.html