当前位置:主页 > 科技论文 > 自动化论文 >

基于无锚点框的目标检测及实例分割方法研究

发布时间:2021-03-07 13:14
  深度神经网络作为实现人工智能的重要方法之一,近年来已获得广泛应用。其中,卷积神经网络极大的促进了计算机视觉领域的发展。随着研究的逐渐深入,计算机已经可以实现对图像从实例级到像素级的处理。目标检测和实例分割作为最基本也是难度最大的两个任务,因为受制于庞大的模型和复杂的算法一直无法在实际生产中发挥有效的作用。本课题基于无锚点框方法提出了更为高效和精确的目标检测和实例分割方法,在大幅减少模型的超参数和训练参数的同时,通过将检测框编码为矢量进行回归,提出了矢量编码损失,可以大幅提升在公开数据集上的准确度。此外,本课题提出了新的激活函数以帮助网络更快速地收敛到全局最优值,减少训练时间。本课题在图像分类、目标检测、实例分割的多个公开数据集上进行了设计完备的实验以验证所提出算法的有效性,结果表明本课题的方法可以在不增加额外训练参数的情况下,更快地得到更准确的检测框和分割掩膜。首先,研究了现有激活函数的设计思想。由于激活函数是一个非线性函数,因此它具有帮助神经网络拟合一个从输入到输出的非线性映射的能力。然而在实现非线性的同时还要考虑到激活函数的计算复杂度、梯度更新幅度、对收敛效果的影响等等。本课题综合... 

【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校

【文章页数】:90 页

【学位级别】:硕士

【部分图文】:

基于无锚点框的目标检测及实例分割方法研究


DenseBox网络框架

框架图,框架,置信度


哈尔滨工业大学工学硕士学位论文4图1-1DenseBox网络框架Fig.1-1ThearchitectureofDenseBoxDenseBox[10]的基本架构是一个端到端(end-to-end)的全卷积架构,可以直接回归出图像中所有人脸的位置和分类置信度信息而不带有预设的锚点框。DenseBox[10]算法证实了全卷积网络(FullyConvolutionalNetwork,FCN)[11]有着可以检测出遮挡严重、不同尺度的目标的能力,而且不需要人为地给出回归的先验信息。如图1-1所示,经过全卷积网络的输出是两个分支:一个分支产生多个预测框,另一个分支给出的是置信度的输出。置信度实际上就是分类网络得到的当前框是否是人脸的概率值。测试时,输入还是一张图片,输出则是Channel值为5的一副特征图。每个位置的特征图对应一个1*1*5的向量,这五个通道分别对应置信分数、当前位置到包围框的边界的四个距离。最后,将输出的结果做一个后处理,其采用的是非极大值抑制(NMS)算法[12]。此外,作者还引入了landmarklocalization来帮助提升性能。这种这种算法至今依旧是百度无人车和地平线机器人的核心算法之一。但是,由于这种人脸检测算法只能检测回归框不能区分类别,所以在实际应用中还是有一定的限制存在。为了在回归出包围框的同时也得到类别和置信度,人们做了众多的研究内容。直到三年之后,在2018年,CornerNet[13]被提出之后,基于无锚点框的检测算法才又回归到了大众的视野当中。图1-2CornerNet网络框架Fig.1-2ThearchitectureofCornerNet

框架图,框架,物体,作者


CornerNet[13]的成功,无疑印证了无锚点框算法在检测领域的确是非常有研究价值的,也引起了学术界对于这种检测算法的关注。基于角点可以检测,那么对于不规则物体,它们的角点不易检出,要怎么办呢?ExtremeNet[16]是在CornerNet[13]的基础上进行了深入思考设计出的新算法。作者认为,许多图像上的物体不是沿着x或者y坐标轴对齐的,而且将它们在包围框中进行检测里面会包含很多背景像素,影响检测精度,此外,包围框的表达方式对于姿态和形状提供的信息也较少。因此,在CornerNet[13]的基础上,作者做了如下改进:图1-3ExtremeNet网络框架Fig.1-3ThearchitectureofExtremeNet将物体的检测从两个角点作为关键点改成了四个边的中心点作为关键点。再加上中心的定位信息,可以更精确的找到目标的位置,因此有了更好的效果。此外,作者还尝试了把中心点换成GroundTruth的位置信息,发现效果的提升

【参考文献】:
期刊论文
[1]卷积神经网络研究综述[J]. 李彦冬,郝宗波,雷航.  计算机应用. 2016(09)
[2]深度卷积神经网络在计算机视觉中的应用研究综述[J]. 卢宏涛,张秦川.  数据采集与处理. 2016(01)
[3]一种用于道路避障的双目视觉图像分割方法[J]. 刘正东,高鹏,杨静宇.  计算机应用研究. 2005(04)
[4]图像分割的阈值法综述[J]. 韩思奇,王蕾.  系统工程与电子技术. 2002(06)



本文编号:3069162

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3069162.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户0268f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com