基于深度学习的多尺度目标检测与分割算法研究

发布时间：2021-06-15 18:37

　　深度学习技术得益于算力的提升和大数据时代的到来,取得了重大突破,尤其是以卷积神经网络为基础的计算机视觉领域得到迅猛地发展,并在目标检测,目标分割等多个任务上取得了远超传统算法的效果。但是由于深度学习算法需要海量的数据进行训练,待检测目标的多尺度变化带来了新的挑战。通常情况下,研究人员从卷积网络结构设计,数据处理,卷积操作三个方面来解决多尺度问题。在卷积网络结构设计方面,并行设计让网络使用尽量少的参数的同时提取到目标的多尺度特征,串行设计使得不同尺度的特征信息得以融合,多尺度预测在不同尺度的特征图上进行预测。本文以此为基础,设计了一种轻量级的多尺度目标检测网络结构,该网络同时考量计算复杂度和模型效果,在尺度变化较大的COCO数据集上得到了双赢的结果。在数据处理方面,基于裁剪和缩放的算法使得不同尺度的目标在相同尺度下进行预测。在面对极小目标和“超大图像”时,通过有效的切片操作,使得图像不需要经过下采样直接进行预测。本文在切片算法的基础上提出了一种切片融合算法,可以将被切分的目标融合为完整的目标,解决了原本算法不可以有效检测“超大图像”中尺度变化目标的问题。在卷积操作方面,可变形卷积通过对卷...

【文章来源】：江南大学江苏省 211工程院校教育部直属院校

【文章页数】：62 页

【学位级别】：硕士

【部分图文】：

目标检

示意图,语义

江南大学硕士学位论文2(a)(b)图1-2语义分割任务示意图实例分割的目的是判断在单张图片或者连续图片（视频）中，感兴趣的单个或者多个物体是否存在，如果存在，需要将感兴趣的单个或者多个物体的具体像素位置在图片中标注出来。通常情况下我们使用一个同原图像长宽相同的单通道二值矩阵对一个感兴趣物体的实例分割结果进行标注，未出现感兴趣物体的像素使用0表示，出现感兴趣物体的像素用1表示。若有若干个感兴趣物体，则需要若干个单通道二值矩阵表示实例分割的结果。如图1-3所示，图[1]中包含多个感兴趣的物体，如人，自行车，道路，草地，天等，当我们感兴趣的目标为人和自行车时，语义分割的任务就是将不同个体的人和自行车所在的像素点位置识别出来，并用单通道二值矩阵表示。(a)(b)图1-3语义分割任务示意图目标检测和实例分割这两项任务所需要识别的对象都是单独的个体，需要算法不仅要识别出来感兴趣的物体是什么类别，而且要把相同类别的不同个体分隔开来。语义分割和实例分割这两项任务对于被识别的对象来说，对于位置的识别比检测中用矩形框表示的“大概的位置”更加严格，需要得到被识别对象的确切边缘信息。可以说实例分割是目标检测和语义分割这两项任务综合起来得到的一个任务，事实上，深度学习中语义分割算法也是由目标检测算法和语义分割算法发展而来。通常把计算机及信息技术革命称之为第三次工业革命，在信息技术的浪潮下，人们的生活发生翻天覆地的变化。拥有视觉能力是人类赖以生存的技能，将信息技术应

示意图,语义

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3231569.html

上一篇：基于生成式对抗网络的半监督学习研究
下一篇：陶瓷砖几何量参数测量装置中的运动控制系统研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|