复杂场景下的小目标检测算法研究
发布时间:2021-07-21 15:12
近年来,目标检测技术发展迅速,各行各业都可以看到目标检测技术的身影。经过十几年的发展,各式各样的目标检测算法被提出,目标检测的准确率越来越高,但是小目标检测的效果却一直不尽如人意。由于小目标尺寸较小,提取到的特征少,匹配的锚点框少,从而不易被检测。小目标检测需要综合多个尺度特征信息。当前目标检测特征提取采用基础骨干网络结合特征金字塔(feature pyramid networks,FPN)的方式来提取不同尺度特征。FPN在特征融合时只融合了相邻层的特征,非相邻层的特征被稀释,不利于小目标检测。当前感兴趣区域提取主要采用的是手工设置锚点框方式。手工设置的锚点框形状大小单一,不能很好的覆盖小目标,导致锚点框的小目标召回率过低,不利于小目标检测。本文针对现有目标检测框架对于小目标检测的以上缺陷,提出了一种基于密集融合的特征金字塔网络(Dense fused feature pyramid network,Dense FPN)。Dense FPN将各个尺度的特征图直接跳跃连接到特征金字塔,特征金字塔可以直接融合所有尺度特征图信息,减少了信息在网络传递过程中的消耗,增加了特征金字塔每层特征的丰...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
目标检测示意图
哈尔滨工业大学工学硕士学位论文3目标可能只包含十几个像素,往往几个像素的标注误差就会造成较大的误差偏移。如图1-2所示,图片中的很多小鸟是小目标,没能被正确的检测出来。图1-2小目标检测示意图由于小目标检测信息量匮乏、数据量稀缺、标注成本高、标注误差大、小目标场景多样等特点,通用的目标检测算法往往不能直接迁移到小目标检测,小目标检测的mAP通常只有正常目标的一半。小目标检测又是当前目标检测不可或缺的一部分。在无人机的研发上,无人机通过摄像头从高空拍摄地面上的物体,地面上的物体在拍摄的图像上就被显示为一个个的小目标。另外在交通监控中拍到的车牌号、自动驾驶要求识别的交通指示牌等等在图像中呈现出来的都是小目标[4]。因此小目标检测在航拍、安防、自动驾驶领域显得尤为重要。在图像语意理解、目标重识别等高层计算机视觉任务上,如果对于某些小目标的检测不准确,将会影响后面图像语意理解和目标重识别的准确度。综上所述,小目标检测的研究对于人们的生活和人工智能的发展有着巨大的意义。1.2国内外研究现状通过国内外研究人员几十年的研究,目标检测算法按照是否使用神经网络可以分为两大类:一种是不使用神经网络的传统目标检测算法,另一种是使用神经网络的基于深度学习的目标检测算法。传统目标检测算法是对图像提取候选区域,然后使用手工设计的特征对候选区域提取特征,然后用分类器分类。深度学习目标检测算法直接将一整张图片作为输入,通过神经网络自主学习特征,直接端到端的完成特征提娶目标分类、矩形框回归等操作。1.2.1传统目标检测算法研究现状如图1-3所示,目标检测算法主要包含五个步骤。
哈尔滨工业大学工学硕士学位论文16图2-8FastR-CNN架构图[27]目标分类是先将特征通过一个全连接层,再使用softmax层来得到候选区域的类别概率。因为感兴趣区域不一定与真实框完美重合,所以需要对感兴趣区域的候选框位置微调,使预测框与真实框的交并比尽可能大。因此目标检测算法的损失函数一般包括两部分:分类损失和回归损失。如式(2-3)所示。(,,,)=(,)+[≥1](,)(2-3)其中是预测候选区域通过softmax预测的各类别的概率。是候选区域真实类别,=0表示背景。(,)是分类损失,(,)=表示当候选框真实类别为时的损失。是预测框的转化后的相对坐标,是目标框的真实相对坐标。[≥1]表示只有前景目标才参与回归损失计算。(,)是平滑1损失,计算方式如式(2-4)、(2-5)。(,)=∑1()∈{,,,}(2-4)1()={0.2||<1||0.,(2-5)2.4后处理步骤目标检测算法对同一个目标往往会输出很多个检测框,这些检测框相互重合,而一个目标只需要一个最优的检测框。在目标分类和位置回归之后,本文需要后处理步骤来删除那些冗余的检测框,只留下最优的那个检测框。非极大值抑制是研究人员常用的筛选检测框算法。表2-1是NMS算法的流程,NMS算法首先将预测框按照置信度从大到小排序,保留最大置信度的预测框到输出集合中,然后删除剩余预测框中与最大置信度预测框交并比大于所设阈值的预测框,再对剩下的预测框重复上面的操作直到任何两个预测框的交并比小于所设阈值。图2-9是经过NMS处理后的效果图,可以看到左图中有很多个黄色的冗余
【参考文献】:
期刊论文
[1]自底向上的显著性目标检测研究综述[J]. 吴加莹,杨赛,堵俊,林宏达. 计算机科学. 2019(03)
[2]基于难分样本挖掘的快速区域卷积神经网络目标检测研究[J]. 张烨,许艇,冯定忠,蒋美仙,吴光华. 电子与信息学报. 2019(06)
[3]基于转置卷积操作改进的单阶段多边框目标检测方法[J]. 郭川磊,何嘉. 计算机应用. 2018(10)
[4]目标检测算法研究综述[J]. 方路平,何杭江,周国民. 计算机工程与应用. 2018(13)
本文编号:3295264
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
目标检测示意图
哈尔滨工业大学工学硕士学位论文3目标可能只包含十几个像素,往往几个像素的标注误差就会造成较大的误差偏移。如图1-2所示,图片中的很多小鸟是小目标,没能被正确的检测出来。图1-2小目标检测示意图由于小目标检测信息量匮乏、数据量稀缺、标注成本高、标注误差大、小目标场景多样等特点,通用的目标检测算法往往不能直接迁移到小目标检测,小目标检测的mAP通常只有正常目标的一半。小目标检测又是当前目标检测不可或缺的一部分。在无人机的研发上,无人机通过摄像头从高空拍摄地面上的物体,地面上的物体在拍摄的图像上就被显示为一个个的小目标。另外在交通监控中拍到的车牌号、自动驾驶要求识别的交通指示牌等等在图像中呈现出来的都是小目标[4]。因此小目标检测在航拍、安防、自动驾驶领域显得尤为重要。在图像语意理解、目标重识别等高层计算机视觉任务上,如果对于某些小目标的检测不准确,将会影响后面图像语意理解和目标重识别的准确度。综上所述,小目标检测的研究对于人们的生活和人工智能的发展有着巨大的意义。1.2国内外研究现状通过国内外研究人员几十年的研究,目标检测算法按照是否使用神经网络可以分为两大类:一种是不使用神经网络的传统目标检测算法,另一种是使用神经网络的基于深度学习的目标检测算法。传统目标检测算法是对图像提取候选区域,然后使用手工设计的特征对候选区域提取特征,然后用分类器分类。深度学习目标检测算法直接将一整张图片作为输入,通过神经网络自主学习特征,直接端到端的完成特征提娶目标分类、矩形框回归等操作。1.2.1传统目标检测算法研究现状如图1-3所示,目标检测算法主要包含五个步骤。
哈尔滨工业大学工学硕士学位论文16图2-8FastR-CNN架构图[27]目标分类是先将特征通过一个全连接层,再使用softmax层来得到候选区域的类别概率。因为感兴趣区域不一定与真实框完美重合,所以需要对感兴趣区域的候选框位置微调,使预测框与真实框的交并比尽可能大。因此目标检测算法的损失函数一般包括两部分:分类损失和回归损失。如式(2-3)所示。(,,,)=(,)+[≥1](,)(2-3)其中是预测候选区域通过softmax预测的各类别的概率。是候选区域真实类别,=0表示背景。(,)是分类损失,(,)=表示当候选框真实类别为时的损失。是预测框的转化后的相对坐标,是目标框的真实相对坐标。[≥1]表示只有前景目标才参与回归损失计算。(,)是平滑1损失,计算方式如式(2-4)、(2-5)。(,)=∑1()∈{,,,}(2-4)1()={0.2||<1||0.,(2-5)2.4后处理步骤目标检测算法对同一个目标往往会输出很多个检测框,这些检测框相互重合,而一个目标只需要一个最优的检测框。在目标分类和位置回归之后,本文需要后处理步骤来删除那些冗余的检测框,只留下最优的那个检测框。非极大值抑制是研究人员常用的筛选检测框算法。表2-1是NMS算法的流程,NMS算法首先将预测框按照置信度从大到小排序,保留最大置信度的预测框到输出集合中,然后删除剩余预测框中与最大置信度预测框交并比大于所设阈值的预测框,再对剩下的预测框重复上面的操作直到任何两个预测框的交并比小于所设阈值。图2-9是经过NMS处理后的效果图,可以看到左图中有很多个黄色的冗余
【参考文献】:
期刊论文
[1]自底向上的显著性目标检测研究综述[J]. 吴加莹,杨赛,堵俊,林宏达. 计算机科学. 2019(03)
[2]基于难分样本挖掘的快速区域卷积神经网络目标检测研究[J]. 张烨,许艇,冯定忠,蒋美仙,吴光华. 电子与信息学报. 2019(06)
[3]基于转置卷积操作改进的单阶段多边框目标检测方法[J]. 郭川磊,何嘉. 计算机应用. 2018(10)
[4]目标检测算法研究综述[J]. 方路平,何杭江,周国民. 计算机工程与应用. 2018(13)
本文编号:3295264
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3295264.html
最近更新
教材专著