基于深度全卷积网络的目标检测方法研究
发布时间:2020-04-25 02:41
【摘要】:随着互联网技术的快速发展,目标检测任务与人们的日常生活紧密地联系在一起,该任务在道路监控、医疗诊断以及视频信息检索等诸多领域都有广泛的应用,因此,图像目标检测技术成为计算机视觉领域中的热门研究方向。近几年来,深度学习的出现使该领域的研究迈出了一大步,利用深度学习的目标检测框架取得较好的检测效果,卷积神经网络依靠其强大的特征提取能力,可以在保证较高准确率的情况下适应更多复杂的场景,当前主流算法可以归为两大类:基于候选区域的目标检测算法,该算法存在检测速度慢、过程繁琐等问题,而另一种基于回归的目标检测算法是以牺牲精度为代价的,降低了算法的实用性。因此本文针对算法中存在的问题,结合基于区域和非区域目标检测算法的优点,提出改进方案。论文的主要工作如下:(1)针对检测复杂背景下的目标和小尺度目标过程中存在的易漏检问题,在基于候选区域的全卷积网络目标检测算法RFCN的基础上进行改进,提出多尺度特征融合模型。该模型采用反向连接的方式对网络中的多层卷积特征进行融合,并采用目标先验减少样本搜索空间,最终得到融合了低层高分辨率特征和高层丰富语义信息的更有利于描述目标的卷积特征。实验结果表明,融合卷积特征的检测模型有效提升了对背景复杂的目标和小尺度目标的检测能力,同时兼顾目标检测的速度。(2)针对候选区域框的回归定位问题,本文提出二维损失函数来减少预测候选框和真实包围框之间的损失,以保证对目标的精准定位。实验结果证明了该损失函数有效实现了对目标的准确定位,这将更有助于小目标的检测。(3)针对训练过程中正负样本的比例不平衡导致模型训练收敛速度慢、模型泛化能力不强的问题,提出采用在线难例样本挖掘算法对网络模型进行优化训练。该算法能够平衡训练时所用正负样本的比例,加快模型收敛速度的同时使得网络训练更加充分。经过实验验证,改进后的网络模型检测精度有了明显提高,在一定程度上解决了小目标易漏检的问题。
【图文】:
述目标检测的研究背景及意义,然后对目前国内外的研究现状进行了分析,总结主要研究内容,最后给出行文安排。1.1 研究背景与意义当前社会,随着信息科技的快速发展,信息化越来越显示出对经济社会发展的用,尤其是自媒体行业的异军突起,使得媒体的传播和交流方式产生了极为重大,,让这场信息化战略格局越发尖锐,而在这场战略中,计算机视觉处理技术起着用。计算机视觉[2]是计算机通过摄像机或者电脑代替人眼,从外部获取图像信息感知,从而对目标进行识别跟踪和定位,包括在复杂场景下的目标识别定位,即像中目标的位置和所属类别。显而易见,图像的目标检测在计算机视觉领域有着缺的作用,是处理视频监控[3]、行为分析[4]等复杂问题的基本途径。图像目标检测的步骤是,对图像进行预处理并提取图像信息,最终判定目标的所属类别并对其定图 1-1 所示为图像的目标检测示意图。
卷积神经网络本质上是一个由多层网络组成的感知器,擅长通多一系列方法将图片中的特征不断降维,从中提取图片信息完成检测任务。一个基本的卷积神经网络通过卷积层与池化层的配合连接,组合成多个卷积组,逐层提取图像中的特征,在最后连接若干个全连接层完成图像的分类,达到目标检测的功能。网络中各类层用可微函数将激活数据从前一层传到后一层,输出模型参数和计算复杂度会受卷积核大小、池化层策略等的影响。卷积神经网络是针对二维形状进行识别而特殊设计的神经网络,凭借独特的局部连接和权值共享方式被成功应用于计算机视觉的各个领域,除此之外,还具有良好的平移、缩放及扭曲不变性,这些特性能够大大减少网络中的训练参数。卷积神经网络的结构图如图 2-1 所示,通过该网络最终输出 10 个尺度大小为 5×5 的特征图。网络受局部感受野概念的启发来模拟特征区分,并通过共享权值的卷积和池化来降低网络参数的数量级,最终通过传统神经网络完成检测分类等任务。
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
本文编号:2639700
【图文】:
述目标检测的研究背景及意义,然后对目前国内外的研究现状进行了分析,总结主要研究内容,最后给出行文安排。1.1 研究背景与意义当前社会,随着信息科技的快速发展,信息化越来越显示出对经济社会发展的用,尤其是自媒体行业的异军突起,使得媒体的传播和交流方式产生了极为重大,,让这场信息化战略格局越发尖锐,而在这场战略中,计算机视觉处理技术起着用。计算机视觉[2]是计算机通过摄像机或者电脑代替人眼,从外部获取图像信息感知,从而对目标进行识别跟踪和定位,包括在复杂场景下的目标识别定位,即像中目标的位置和所属类别。显而易见,图像的目标检测在计算机视觉领域有着缺的作用,是处理视频监控[3]、行为分析[4]等复杂问题的基本途径。图像目标检测的步骤是,对图像进行预处理并提取图像信息,最终判定目标的所属类别并对其定图 1-1 所示为图像的目标检测示意图。
卷积神经网络本质上是一个由多层网络组成的感知器,擅长通多一系列方法将图片中的特征不断降维,从中提取图片信息完成检测任务。一个基本的卷积神经网络通过卷积层与池化层的配合连接,组合成多个卷积组,逐层提取图像中的特征,在最后连接若干个全连接层完成图像的分类,达到目标检测的功能。网络中各类层用可微函数将激活数据从前一层传到后一层,输出模型参数和计算复杂度会受卷积核大小、池化层策略等的影响。卷积神经网络是针对二维形状进行识别而特殊设计的神经网络,凭借独特的局部连接和权值共享方式被成功应用于计算机视觉的各个领域,除此之外,还具有良好的平移、缩放及扭曲不变性,这些特性能够大大减少网络中的训练参数。卷积神经网络的结构图如图 2-1 所示,通过该网络最终输出 10 个尺度大小为 5×5 的特征图。网络受局部感受野概念的启发来模拟特征区分,并通过共享权值的卷积和池化来降低网络参数的数量级,最终通过传统神经网络完成检测分类等任务。
【学位授予单位】:河南大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183
【参考文献】
相关期刊论文 前1条
1 魏颖,佟国峰,史泽林,于海斌;一种基于多尺度分形新特征的目标检测方法[J];东北大学学报;2005年11期
本文编号:2639700
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2639700.html