当前位置:主页 > 科技论文 > 自动化论文 >

复杂场景下自适应行人检测算法研究

发布时间:2021-06-06 06:53
  卷积神经网络(CNN)通过机器卷积运算完全替代人工来获取输入层的图像特征,提高了对输入数据的识别能力。在本文设计的算法中使用了一种已经非常成熟的卷积神经网络框架来设计行人检测算法。针对行人之间的背景干扰和行人之间的遮挡问题,将行人的头部作为被检测对象,减少了被检测对象的特征提取。在行人检测过程中,借助鲁棒性的Fast R-CNN中的区域提议网络(RPN)作为行人检测器,来获得更好的检测效果以及提高计算速度和精度,不足之处这个分类器可能会降低检测过程中的性能。因此本文基于鲁棒性的Fast R-CNN对目标检测网络进行了改进,并将卷积层获取的图像特征图进行融合以便获得更加丰富精密的样本。实验表明,本文改进的方法可以准确有效提高行人检测的效率。本文的主要完成工作:(1)图像融合其成像原理不同,因此所得图像信息具有互补性。所以将Fast R-CNN与图像融合技术二者结合增强了人们对原始图像的认知与理解,为了获得更好的姿态感知,可视化显著性提取方法能够很好的突出源图像的显著信息。(2)本文提出了一种新的基于视觉显著性特征的权重映射构建过程,这个过程能够将源图像的视觉重要信息整合到融合图像中。通过... 

【文章来源】:沈阳师范大学辽宁省

【文章页数】:50 页

【学位级别】:硕士

【部分图文】:

复杂场景下自适应行人检测算法研究


019“G60”上海佘山国际半程马拉松;沈阳站人流高峰比如说智能车辆安全设计已经成为研究人员和汽车制造商的主要关注点之一

源图像,感受野,卷积运算,卷积


复杂场景下自适应行人检测算法研究-9-特征卷积层源图像图2.5卷积层特征提取过程卷积层将线性变换应用在输出部分,因此为了引入一些非线性,通常的做法是将它们与一些激活函数相结合。文献中提出了几种激活函数,如sigmoid、tanh和激活函数(ReLU)及其变体。实际上,ReLU变量被用作激活函数,由于其他函数的缺点(例如,sigmoid和tanh的梯度消失问题),这些因素对加速随机梯度下降的收敛有很大影响。卷积层和激活层可以通过添加一些归一化层来进一步丰富组合,例如,批量归一化通常应用于卷积层的输出和激活的输入之间。最近Yu[26]的研究已经提出在卷积层结构中引入第四个超参数--卷积核膨胀。它是解决pixel-wise输出模型的一种常用的卷积方式,一种普遍的认识是池化下采样的操作造成信息的丢失是不可逆的,进入分类识别模型后,仅仅预测其中一类的概率,因此就不再考虑池化会导致损失图像细节信息的问题,但是做像素级的预测时(譬如语义分割),就要考虑到这个问题了。所以就要有一种卷积代替pooling的作用(成倍地增加感受野),而空洞卷积就是为了做这个的。通过卷积核插“0”的方式,如图2.6所示它可以比普通的卷积获得更大的感受野。红点表示指定应用过滤器的单元格,而绿色单元格突出显示感受野。图2.6使用扩张卷积运算将指数扩大到有效感受野,同时线性增加参数的数量

过程图,算法,过程,特征图


复杂场景下自适应行人检测算法研究-11-图2.7Im2col算法过程那么以同时处理三个三通道的图像输入数据:N=3,C=3,卷积核:N=3,C=3,输出数据:N=3,C=1,图2-8为算法优化过程。图2.8Im2col优化过程UNet体系结构[14]是一种最先进的分段网络,如图2.9它将该网络与积极的数据扩充相结合,可以有效利用可用的训练数据,因此能够在小型数据集上实现良好的性能,同时加快测试时间。U形由用于上下文提取的下降阶段(编码)和用于输出地图重构的上采样阶段(解码)给出。灰色箭头表示快捷方式连接,该快捷方式连接使得上采样的重构和特征图的组合。UNet将完善的全卷积网络(FCN)进行分段扩展,该网络已成为语义分段的最先进架构。最初的FCN引入了使用较低分辨率(由于池化原因)特征图的上采样(双线性插值或反卷积层)的想法,以便重构输出图。研究发现在高分辨率特征和重建的地图之间插入快捷方式连接,以改善定位。

【参考文献】:
期刊论文
[1]融合深度感知特征与核极限学习机的行人检测[J]. 孙锐,王慧慧,叶子豪.  电子测量与仪器学报. 2019(02)
[2]基于改进全卷积网络的多尺度感知行人检测算法[J]. 刘辉,彭力,闻继伟.  激光与光电子学进展. 2018(09)
[3]四元数小波变换联合稀疏表示的图像融合[J]. 常莉红,冯象初,张瑞.  系统工程与电子技术. 2017(07)
[4]基于嵌入式多尺度分解和可能性理论的多波段纹理图像融合(英文)[J]. 蔺素珍,王栋娟,王肖霞,朱小红.  光谱学与光谱分析. 2016(07)
[5]结合目标提取和压缩感知的红外与可见光图像融合[J]. 王昕,吉桐伯,刘富.  光学精密工程. 2016(07)
[6]基于投影模型和图像融合的拼接畸变消除算法[J]. 姚路,陈昌志,周桥,安世全.  计算机应用与软件. 2016(07)
[7]基于拉普拉斯金字塔与PCNN-SML的图像融合算法[J]. 王佺,聂仁灿,金鑫,周冬明,贺康建,余介夫.  计算机科学. 2016(S1)
[8]基于小波变换的多特征融合sEMG模式识别[J]. 于亚萍,孙立宁,张峰峰,张建法.  传感技术学报. 2016(04)
[9]基于彩色图像融合的隐藏武器检测技术[J]. 王亚杰,冉晓艳,叶永生,石祥滨.  光电工程. 2016(02)
[10]结合SVM分类器与HOG特征提取的行人检测[J]. 徐渊,许晓亮,李才年,姜梅,张建国.  计算机工程. 2016(01)

硕士论文
[1]医学图像融合与三维重建研究[D]. 孟庆明.吉林大学 2015



本文编号:3213841

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3213841.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户782d8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com