基于Faster R-CNN的两轮车载人检测及车流量统计研究
发布时间:2022-01-02 05:12
在智能交通系统中,两轮车已成为不可缺少的交通工具。但两轮车的违规驾驶尤其是载人不规范,极易引发交通事故,所以对两轮车载人的检测迫在眉睫。传统的检测方法是通过人工提取特征的方式实现,并不适用于环境复杂的交通场景;而深度学习的检测方法可以自动学习不同环境下的目标特征,泛化能力强,适用于复杂交通环境的检测任务。本文先采用Faster R-CNN算法对两轮车和车上乘客进行检测,再通过车辆跟踪计数方法对车流量统计,最后采用Django应用框架搭建两轮车载人检测及车流量统计平台,具体的研究内容如下:1.两轮车载人检测,确定了Faster R-CNN算法作为检测模型。原始的Fast R-CNN算法对交通图片中车载人员的检测效果不佳。主要原因有两个,一个是乘客头部的像素尺寸偏小导致检测算法的漏检,另一个是车上多名乘客之间存在遮挡也会增加检测算法的工作难度。针对小尺寸乘客的漏检,本文参考实验数据集对锚框的尺寸进行修改。针对不同尺寸的目标,检测模型采用了多特征融合结构。针对重叠度高的乘客存在漏检现象,Faster RCNN算法选用柔和的非极大值抑制来筛选候选框。最后,实验验证了改进的Faster R-CN...
【文章来源】:江西理工大学江西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数图像
第二章相关理论11(2)Tanh函数Tanh函数是一种双曲线函数,函数表达式见式(2.8),函数的曲线图如图2.5。当输入大于零时,函数值趋向于1;当输入值小于零时,函数值趋向于-1。Tanh函数可以看作在Sigmoid函数的基础上,向下平移和伸缩变形得到的。由于函数值域在-1和+1之间,函数的均值更接近于零,使得函数的累计误差趋向于零,有利于模型快速收敛。()=+(2.8)图2.5tanh函数图像(3)ReLU函数ReLU函数是个分段函数,其表达式见式(2.9),函数的曲线图可参考图2.6。当输入小于零时,函数的输出为零,函数的导为零。当输入大于零时,函数的输出等于输入,函数的导数为1。与Sigmoid函数相比,ReLU函数有效的解决输入大于零时梯度消失问题。更重要的是,ReLU函数表达式中采用的是线性运算,提高了卷积神经网络更新节点参数的效率。因此,ReLU激活函数被广泛应用于各种深度模型,并在VGG模型上取得了巨大成功。=(0,)(2.9)
第二章相关理论12图2.6ReLU函数图像2.2.3池化层数据经过卷积层和激励层后,输出的数据量几乎不变。为了压缩数据量,提高模型的运行效率,池化层被引入CNN中。池化层也称下采样层,处于两个的卷积层中间,起到压缩数据量并且保留了数据中特征信息[42,43],从而有效地缓解过拟合的问题。如果输入的是图片,池化层通过池化操作不仅压缩了图像数据量,还保留图像的重要特征信息。通常的池化操作分为最大值池化、平均值池化和随机池化。下面详细介绍这三种池化:(1)最大值池化最大值池化是在操作区域内找出所有数据中最大的数值作为输出,其操作过程见图2.7。图中输入是4×4的矩阵,最大值池化操作区域2×2,池化步长为2。最大值池化操作把输入矩阵切分为4个小矩阵,分别选择4个小矩阵数据中最大值作为结果输出,构成新的2×2输出矩阵。通过最大值池化,数据量减少了75%,计算量也随之大幅减少,从而提高模型的运行效率。
【参考文献】:
期刊论文
[1]井下视频行人检测方法[J]. 李现国,李斌,刘宗鹏,冯欣欣,刘晓,宋金水,张磊. 工矿自动化. 2020(02)
[2]改进的SSD红外图像行人检测算法[J]. 刘学,李范鸣,刘士建. 电光与控制. 2020(01)
[3]基于卷积神经网络的行人人头检测方法对比研究[J]. 邢志祥,顾凰琳,魏振刚,钱辉,张莹,汪李金. 安全与环境工程. 2019(01)
[4]基于深度神经网络的行人头部检测[J]. 陶祝,刘正熙,熊运余,李征. 计算机工程与科学. 2018(08)
[5]基于特征光流的多运动目标检测跟踪算法与评价[J]. 屈治华,邵毅明,邓天民. 科学技术与工程. 2018(22)
[6]改进的Faster RCNN煤矿井下行人检测算法[J]. 李伟山,卫晨,王琳. 计算机工程与应用. 2019(04)
[7]基于混合高斯模型与联合特征的行人检测方法[J]. 郑锐,邵宗凯. 传感器与微系统. 2017(07)
[8]基于YOLO网络的行人检测方法[J]. 高宗,李少波,陈济楠,李政杰. 计算机工程. 2018(05)
[9]结合单双行人DPM模型的交通场景行人检测[J]. 曾接贤,程潇. 电子学报. 2016(11)
[10]基于人头颜色空间和轮廓信息的行人检测方法研究[J]. 高春霞,董宝田,王爱丽. 交通运输系统工程与信息. 2015(04)
本文编号:3563543
【文章来源】:江西理工大学江西省
【文章页数】:66 页
【学位级别】:硕士
【部分图文】:
Sigmoid函数图像
第二章相关理论11(2)Tanh函数Tanh函数是一种双曲线函数,函数表达式见式(2.8),函数的曲线图如图2.5。当输入大于零时,函数值趋向于1;当输入值小于零时,函数值趋向于-1。Tanh函数可以看作在Sigmoid函数的基础上,向下平移和伸缩变形得到的。由于函数值域在-1和+1之间,函数的均值更接近于零,使得函数的累计误差趋向于零,有利于模型快速收敛。()=+(2.8)图2.5tanh函数图像(3)ReLU函数ReLU函数是个分段函数,其表达式见式(2.9),函数的曲线图可参考图2.6。当输入小于零时,函数的输出为零,函数的导为零。当输入大于零时,函数的输出等于输入,函数的导数为1。与Sigmoid函数相比,ReLU函数有效的解决输入大于零时梯度消失问题。更重要的是,ReLU函数表达式中采用的是线性运算,提高了卷积神经网络更新节点参数的效率。因此,ReLU激活函数被广泛应用于各种深度模型,并在VGG模型上取得了巨大成功。=(0,)(2.9)
第二章相关理论12图2.6ReLU函数图像2.2.3池化层数据经过卷积层和激励层后,输出的数据量几乎不变。为了压缩数据量,提高模型的运行效率,池化层被引入CNN中。池化层也称下采样层,处于两个的卷积层中间,起到压缩数据量并且保留了数据中特征信息[42,43],从而有效地缓解过拟合的问题。如果输入的是图片,池化层通过池化操作不仅压缩了图像数据量,还保留图像的重要特征信息。通常的池化操作分为最大值池化、平均值池化和随机池化。下面详细介绍这三种池化:(1)最大值池化最大值池化是在操作区域内找出所有数据中最大的数值作为输出,其操作过程见图2.7。图中输入是4×4的矩阵,最大值池化操作区域2×2,池化步长为2。最大值池化操作把输入矩阵切分为4个小矩阵,分别选择4个小矩阵数据中最大值作为结果输出,构成新的2×2输出矩阵。通过最大值池化,数据量减少了75%,计算量也随之大幅减少,从而提高模型的运行效率。
【参考文献】:
期刊论文
[1]井下视频行人检测方法[J]. 李现国,李斌,刘宗鹏,冯欣欣,刘晓,宋金水,张磊. 工矿自动化. 2020(02)
[2]改进的SSD红外图像行人检测算法[J]. 刘学,李范鸣,刘士建. 电光与控制. 2020(01)
[3]基于卷积神经网络的行人人头检测方法对比研究[J]. 邢志祥,顾凰琳,魏振刚,钱辉,张莹,汪李金. 安全与环境工程. 2019(01)
[4]基于深度神经网络的行人头部检测[J]. 陶祝,刘正熙,熊运余,李征. 计算机工程与科学. 2018(08)
[5]基于特征光流的多运动目标检测跟踪算法与评价[J]. 屈治华,邵毅明,邓天民. 科学技术与工程. 2018(22)
[6]改进的Faster RCNN煤矿井下行人检测算法[J]. 李伟山,卫晨,王琳. 计算机工程与应用. 2019(04)
[7]基于混合高斯模型与联合特征的行人检测方法[J]. 郑锐,邵宗凯. 传感器与微系统. 2017(07)
[8]基于YOLO网络的行人检测方法[J]. 高宗,李少波,陈济楠,李政杰. 计算机工程. 2018(05)
[9]结合单双行人DPM模型的交通场景行人检测[J]. 曾接贤,程潇. 电子学报. 2016(11)
[10]基于人头颜色空间和轮廓信息的行人检测方法研究[J]. 高春霞,董宝田,王爱丽. 交通运输系统工程与信息. 2015(04)
本文编号:3563543
本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/3563543.html