当前位置:主页 > 科技论文 > 自动化论文 >

利用CNN进行目标检测的特征图放大方法研究

发布时间:2020-04-24 05:34
【摘要】:本论文主要是在保证卷积神经网络速度和精度的前提下,比较并找到用于目标检测的特征放大方法的最佳可能组合。卷积神经网络的作用是将图像缩小为更容易处理的形式,同时不会丢失影响预测准确度的重要特征。之所以选择神经网络是因为其能够对二维图像的内部特征进行表示。这使得模型能够从数据中的变体结构中学习到图像处理中的重要特征即位置和比例特征。目前有许多深度学习的框架,新的框架经常被提出用于特定的领域。以深度学习框架为基础是因为它允许我们在不深入了解底层算法细节的基础上能够简单、快速地构建深度学习模型。此外,它提供了一种清晰简洁的方法来定义模型,即使用预先构建和优化组件。这些优化组件能够优化性能,并行化流程,从而减少计算并能够自动计算梯度。此外,以上所提到的算法都是使用卷积神经网络提取图像特征。近年来,随着计算机视觉学科的发展,目标检测的发展越来越快。计算机技术中的目标检测技术已成为计算机视觉和图像处理的重要组成部分。目标检测是指从数字图像和视频中检测特定类的语义对象(如人、建筑物、汽车、树、自行车等)的实例。在现代卷积目标检测系统中,有许多方法可以用来权衡精度与速度和内存的关系。但在不同的目标探测器中,很难进行公平的比较。近年来,许多不同的成功开发系统被提出,但由于不同的基本特征提取器(如VGG、残差网络)、固定图像分辨率以及不同的开发环境(硬件和软件)的原因很难进行公平的比较。在本文中,我们关注三个特征提取器模型,如双线性插值,最近邻插值和像素洗牌插值,并找到最佳的比较结果。此外,目标检测算法的主要任务是通过绘制边界框来寻找感兴趣的目标。另外,在一个目标检测的例子中,不仅仅只绘制一个边界框。几个边界框可能表示一个图像中存在多个感兴趣的对象。目标检测的另一个基本问题是图像中多个尺度目标的检测。为了平衡分辨率与语义之间的冲突,提出了尺度转换模块。此外为了获得检测目标的高分辨率特征图和检测较大目标的最大接收域的特征图,分别使用了尺度转换层和池化层。然而,在浅层特征图上仍存在一些检测问题。小目标的背景和前景的区分仅仅使用浅层语义是不够的,需要更多的语义。为了在每个位置同时预测目标边界和目标得分,区域选取网络(RPN)即一个全卷积网络被使用。区域选取算法用于假设目标位置,并与检测网络共享完整的图像卷积特征。随着对象检测和语义分割发展的不断发展,实例分割出现了一些新的问题,并添加了一个用于预测对象掩模的新分支,该分支与现有用于边界框回归的分支并行。近年来,不同类型的目标检测模型被提出,如基于区域的卷积神经网络(R-CNN),Fast R-CNN,Faster R-CNN,单次检测器(SSD),You Only Look Once(YOLO)网络,基于区域全卷积网络(R-FCN),特征金字塔网络(FPN),规模可传输检测网络(STDN)和掩码R-CNN。特征金字塔网络(FPN)是一种将准确性和速度考虑在内的金字塔概念的特征提取器。它取代了像Faster R-CNN这样的探测器的特征提取器,生成了多个质量信息比用物体检测的常规特征金字塔更好特征图图层(多尺度特征图)。在快速R-CNN的扩展FPN的基础上,我们将检测模型修改为双线性插值,最近邻插值和像素洗牌插值,以比较基于边界框的平均精度(AP)的不同约束。我们还测量了所有这些模型的平均召回率(AR)。我们将epochs的时间从90K缩短到60K,以更快地训练数据集。所有模型都固定交并比0.5并且每个图像的最大对象数设为100,但是对小特征目标,像素洗牌插值提高了所有模型的结果(0.215的平均精度)。我们还列出了COCO 2014 minval数据集的实验结果,并对实验结果进行比较。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP183

【相似文献】

相关期刊论文 前10条

1 王守义;周海英;杨阳;;基于卷积特征的核相关自适应目标跟踪[J];中国图象图形学报;2017年09期

2 李新祥;两圆位置关系中的特征图[J];中学数学教学参考;2001年07期

3 徐瑞龙;用于地下通风系统管理的系统特征图[J];暖通空调;2000年05期

4 邓慧琴;两圆位置关系中的特征图[J];山西教育;2003年22期

5 丁力行,李松 ,曾宪钧;系统特征图在地铁车辆通风设计中的应用[J];城市轨道交通研究;2003年06期

6 徐瑞龙;地下通风系统管理的新技术——系统特征图[J];地下空间;1998年S1期

7 葛芸;马琳;江顺亮;叶发茂;;基于高层特征图组合及池化的高分辨率遥感图像检索[J];电子与信息学报;2019年10期

8 齐峰,谭建荣,张树有;基于装配特征图树的装配模型与建模方法[J];农业机械学报;2003年02期

9 马礼;王强;杨银刚;马东超;张永梅;;基于三维物体特征图的动态碰撞检测方法[J];计算机测量与控制;2016年08期

10 王维凡;李超;;非负特征图的线性染色[J];中国科学(A辑:数学);2008年12期

相关会议论文 前3条

1 宋钧才;;再论棉花色特征的综合评定兼论中国棉花色特征图[A];山东纺织工程学会十二届第二次优秀论文评选获奖论文集[C];2011年

2 牛欣;司银楚;王滨;文仁都;;七种中医脉诊教学模型的建立及评价[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

3 车武军;杨勋年;汪国昭;;内在参量下的骨架驱动变形方法[A];第一届全国几何设计与计算学术会议论文集[C];2002年

相关博士学位论文 前3条

1 王冲;基于深度学习的协同显著性检测方法研究[D];中国科学技术大学;2019年

2 宋凯凯;基于深度学习的图像情感分析研究[D];中国科学技术大学;2018年

3 四建楼;智能视觉监控中行人再识别技术研究[D];北京邮电大学;2018年

相关硕士学位论文 前10条

1 刘杰;基于局部特征的人体重识别技术研究[D];北京交通大学;2019年

2 张佳佳;基于生成对抗机制的跨模态特征关联及应用[D];合肥工业大学;2019年

3 黄启恒;基于多级深度特征表示的视频行人再识别相关方法研究[D];合肥工业大学;2019年

4 胡海龙;基于行为生物特征的移动用户身份持续认证方法研究[D];西南大学;2019年

5 郭芳;视觉注意机制建模中的特征剪裁策略研究[D];济南大学;2019年

6 Islam Mohammad Khairul;利用CNN进行目标检测的特征图放大方法研究[D];华南理工大学;2019年

7 王鹏;基于深度特征表示的行人再识别算法研究[D];华南理工大学;2019年

8 罗彭婷;基于特征工程和深度学习的乳腺癌前哨淋巴结转移预测方法研究[D];华南理工大学;2019年

9 杨超;融合评论文本内容和评论者行为特征的虚假评论检测方法研究[D];上海师范大学;2019年

10 史雪凤;3D-AVS预测技术与特征图压缩技术研究[D];哈尔滨工业大学;2018年



本文编号:2638584

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2638584.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户94003***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com