基于多尺度探测与掩码评估网络的目标实例分割算法研究
发布时间:2021-10-04 23:29
图像实例分割是人工智能与图像识别领域的重要发展方向,其像素级的目标分割被广泛应用于工业生产、医疗卫生和社会安全等领域。传统图像实例分割算法容易受到目标形变、重叠、光照等因素的影响,其分割精度不高。基于卷积神经网络的特征提取方法虽然在目标检测、语义分割等任务中取得了较高的测试精度,但仍然存在一些问题。一方面,由于图像中目标尺度差异较大,导致检测精度降低,且分割结果不准确;另一方面,在语义分割阶段,池化过程导致特征图尺寸下降,像素点通过全连接层的映射和分类出现偏差,同时传统的实例分割模型不能对生成掩码的完整性进行评估,使得生成的目标掩码不准确。在现有实例分割算法框架的基础上,本文通过研究MTCNN和DNN等深度学习方法,以解决实例分割过程中目标尺度差异较大、掩码生成不准确的难题。本文的主要工作如下:(1)本文设计了一种多尺度探测器MSD(multi-scale detector),用于在特征图中提取不同尺度的实例目标特征,以消除目标尺寸差异较大的影响,提高实例分割精度。传统基于深度学习的目标实例分割算法在特征提取阶段通常使用单一的卷积核尺寸,难以提取特征图中不同尺寸的实例特征,并且在池化过...
【文章来源】:河南大学河南省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
图2-2卷积神经网络基本框架??
?第2章图像实例分割基础知识???层、池化层、激活函数以及全连接层组成,形成级联的网络结构,如图2-2所示。其中,??卷积层主要用于特征的提取以及特征向量的生成;池化层和激活函数在特征图的基础上,??增强特征尺度信息、加入非线性因素,使提取的特征具有良好的平移不变性和一定的旋??转不变性;同时,在卷积群组中利用不同的池化手段和独特的连接方式,能够将不同尺??寸的特征向量互相融合,从而构建出更有效的特征提取网络。??120??|特征可视化|?:?\??j?_麵_齡:爲I?\??特征图:14M4?.?,?\?84??I?I?\??I?mmammaet?\??输入■特—?1|^?!?;??|?1—?:?t—i!?^?^?|??卷积?最大池化?卷积?特征重构?全连接1全连接2?输出??图2-2卷积神经网络基本框架??2.2.1?CNN特征提取网络理论基础??卷积层(Convolutionallayer)是传统卷积神经网络的最基本的组成结构,用于提取??输入图片的特征。卷积层的设计来源于模拟人类视觉皮层细胞中的神经元,对感受野的??特征进行选择性的获取,如图2-3所示。??特征描述子?^?神经元??传统特征提取?CNN卷积特征提取??图2-3传统特征提取与CNN特征提取感受野??在进行卷积运算时,通常给定一个大小为的方阵,称为卷积核(filter),卷积核??的大小(filter?size)即像素点在输入图像中映射的区域大小,被称为感受野。从数学的??9??
式?扩张卷积(Dilated?Convolutions)?[56],又称空洞卷积。该方??法提出了一种7x7的空洞卷积,其正则表达式等效于3个3x3的卷积叠加。同时,Yu等??人在提出的网络结构中减少了池化层的数量,这一方法不仅大幅度地减少了神经网络的??参数,同时又增大了特征提取的感受野,使得图像识别的精度得到了显著提升。??^?原始像素值?C0nc3t??3x3conv?3x3conv?3x3conv??(a)传统卷积运算?(b)空洞卷积运算?(c)深度可分离卷积??图2-4卷积运算分类??随着图像分割技术的进一步研究,空洞卷积逐渐出现小目标丢失等诸多问题。空洞??卷积的特征提取并不连续,损失了图像信息本身的连续性,甚至一些像素自始至终没有??参与运算。另一方面这种一味地扩大卷积感受野的思想并不能很好地处理不同大小物体??的关系,虽然减少了卷积运算的计算量,但严重影响了图像中小目标的特征提龋2013??年,谷歌的实习生Laurent?Sifre提出了一种新的卷积结构[55],被称为深度可分离卷积??(depthwise?separable?convolutions)。作者假设卷积层间的通道相关性和空间相关性是可??以退耦合的,因此将它们分开映射,达到了更好的效果。深度可分离卷积首先利用1x1??的卷积核将输入的特征图映射到几个维度比原来更小的空间上,每个通道的特征图乘以??不同的权重因子进行线性组合;然后使用不同大小的卷积核对这些更小的空间进行卷积??运算,对空间相关性和通道相关性同时进行映射;最终将所有子空间输出的卷积结果进??10??
【参考文献】:
期刊论文
[1]深度学习目标检测方法综述[J]. 赵永强,饶元,董世鹏,张君毅. 中国图象图形学报. 2020(04)
[2]MDSSD:multi-scale deconvolutional single shot detector for small objects[J]. Lisha CUI,Rui MA,Pei LV,Xiaoheng JIANG,Zhimin GAO,Bing ZHOU,Mingliang XU. Science China(Information Sciences). 2020(02)
[3]基于深度学习的语义分割算法综述[J]. 赵霞,白雨,倪颖婷,陈萌,郭松,杨明川,陈凤. 上海航天. 2019(05)
[4]远红外车载图像实时行人检测与自适应实例分割[J]. 于博,马书浩,李红艳,李春庚,安居白. 激光与光电子学进展. 2020(02)
[5]3D Object Detection Incorporating Instance Segmentation and Image Restoration[J]. HUANG Bo,HUANG Man,GAO Yongbin,YU Yuxin,JIANG Xiaoyan,ZHANG Juan. Wuhan University Journal of Natural Sciences. 2019(04)
[6]基于深度学习的目标检测框架进展研究[J]. 寇大磊,权冀川,张仲伟. 计算机工程与应用. 2019(11)
[7]基于深度学习的群猪图像实例分割方法[J]. 高云,郭继亮,黎煊,雷明刚,卢军,童宇. 农业机械学报. 2019(04)
[8]基于内容的图像分割方法综述[J]. 姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄. 软件学报. 2017(01)
硕士论文
[1]基于多尺度特征融合与上下文分析的目标检测技术研究[D]. 许必宵.南京邮电大学 2019
[2]基于深度学习的遥感图像处理系统的设计与实现[D]. 肖潇.北京邮电大学 2019
[3]基于深度学习的心室核磁共振图像分割研究与应用[D]. 尹航.兰州大学 2019
[4]RGB-D图像和点云图像实例分割方法研究[D]. 王玉婷.合肥工业大学 2019
[5]基于深度学习的物流道路场景分割系统的设计与实现[D]. 管超.电子科技大学 2019
[6]RGB-D室内场景图像的目标提取算法研究[D]. 吴晓秋.南京邮电大学 2018
[7]基于深度学习的室内点云场景语义理解研究[D]. 李文强.哈尔滨工业大学 2018
[8]面向步态识别的显著前景分割[D]. 张晶晶.安徽大学 2018
[9]基于实例分割的场景图像文字检测[D]. 张小爽.浙江大学 2018
[10]深度学习在图像识别中的研究及应用[D]. 李卫.武汉理工大学 2014
本文编号:3418543
【文章来源】:河南大学河南省
【文章页数】:84 页
【学位级别】:硕士
【部分图文】:
图2-2卷积神经网络基本框架??
?第2章图像实例分割基础知识???层、池化层、激活函数以及全连接层组成,形成级联的网络结构,如图2-2所示。其中,??卷积层主要用于特征的提取以及特征向量的生成;池化层和激活函数在特征图的基础上,??增强特征尺度信息、加入非线性因素,使提取的特征具有良好的平移不变性和一定的旋??转不变性;同时,在卷积群组中利用不同的池化手段和独特的连接方式,能够将不同尺??寸的特征向量互相融合,从而构建出更有效的特征提取网络。??120??|特征可视化|?:?\??j?_麵_齡:爲I?\??特征图:14M4?.?,?\?84??I?I?\??I?mmammaet?\??输入■特—?1|^?!?;??|?1—?:?t—i!?^?^?|??卷积?最大池化?卷积?特征重构?全连接1全连接2?输出??图2-2卷积神经网络基本框架??2.2.1?CNN特征提取网络理论基础??卷积层(Convolutionallayer)是传统卷积神经网络的最基本的组成结构,用于提取??输入图片的特征。卷积层的设计来源于模拟人类视觉皮层细胞中的神经元,对感受野的??特征进行选择性的获取,如图2-3所示。??特征描述子?^?神经元??传统特征提取?CNN卷积特征提取??图2-3传统特征提取与CNN特征提取感受野??在进行卷积运算时,通常给定一个大小为的方阵,称为卷积核(filter),卷积核??的大小(filter?size)即像素点在输入图像中映射的区域大小,被称为感受野。从数学的??9??
式?扩张卷积(Dilated?Convolutions)?[56],又称空洞卷积。该方??法提出了一种7x7的空洞卷积,其正则表达式等效于3个3x3的卷积叠加。同时,Yu等??人在提出的网络结构中减少了池化层的数量,这一方法不仅大幅度地减少了神经网络的??参数,同时又增大了特征提取的感受野,使得图像识别的精度得到了显著提升。??^?原始像素值?C0nc3t??3x3conv?3x3conv?3x3conv??(a)传统卷积运算?(b)空洞卷积运算?(c)深度可分离卷积??图2-4卷积运算分类??随着图像分割技术的进一步研究,空洞卷积逐渐出现小目标丢失等诸多问题。空洞??卷积的特征提取并不连续,损失了图像信息本身的连续性,甚至一些像素自始至终没有??参与运算。另一方面这种一味地扩大卷积感受野的思想并不能很好地处理不同大小物体??的关系,虽然减少了卷积运算的计算量,但严重影响了图像中小目标的特征提龋2013??年,谷歌的实习生Laurent?Sifre提出了一种新的卷积结构[55],被称为深度可分离卷积??(depthwise?separable?convolutions)。作者假设卷积层间的通道相关性和空间相关性是可??以退耦合的,因此将它们分开映射,达到了更好的效果。深度可分离卷积首先利用1x1??的卷积核将输入的特征图映射到几个维度比原来更小的空间上,每个通道的特征图乘以??不同的权重因子进行线性组合;然后使用不同大小的卷积核对这些更小的空间进行卷积??运算,对空间相关性和通道相关性同时进行映射;最终将所有子空间输出的卷积结果进??10??
【参考文献】:
期刊论文
[1]深度学习目标检测方法综述[J]. 赵永强,饶元,董世鹏,张君毅. 中国图象图形学报. 2020(04)
[2]MDSSD:multi-scale deconvolutional single shot detector for small objects[J]. Lisha CUI,Rui MA,Pei LV,Xiaoheng JIANG,Zhimin GAO,Bing ZHOU,Mingliang XU. Science China(Information Sciences). 2020(02)
[3]基于深度学习的语义分割算法综述[J]. 赵霞,白雨,倪颖婷,陈萌,郭松,杨明川,陈凤. 上海航天. 2019(05)
[4]远红外车载图像实时行人检测与自适应实例分割[J]. 于博,马书浩,李红艳,李春庚,安居白. 激光与光电子学进展. 2020(02)
[5]3D Object Detection Incorporating Instance Segmentation and Image Restoration[J]. HUANG Bo,HUANG Man,GAO Yongbin,YU Yuxin,JIANG Xiaoyan,ZHANG Juan. Wuhan University Journal of Natural Sciences. 2019(04)
[6]基于深度学习的目标检测框架进展研究[J]. 寇大磊,权冀川,张仲伟. 计算机工程与应用. 2019(11)
[7]基于深度学习的群猪图像实例分割方法[J]. 高云,郭继亮,黎煊,雷明刚,卢军,童宇. 农业机械学报. 2019(04)
[8]基于内容的图像分割方法综述[J]. 姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄. 软件学报. 2017(01)
硕士论文
[1]基于多尺度特征融合与上下文分析的目标检测技术研究[D]. 许必宵.南京邮电大学 2019
[2]基于深度学习的遥感图像处理系统的设计与实现[D]. 肖潇.北京邮电大学 2019
[3]基于深度学习的心室核磁共振图像分割研究与应用[D]. 尹航.兰州大学 2019
[4]RGB-D图像和点云图像实例分割方法研究[D]. 王玉婷.合肥工业大学 2019
[5]基于深度学习的物流道路场景分割系统的设计与实现[D]. 管超.电子科技大学 2019
[6]RGB-D室内场景图像的目标提取算法研究[D]. 吴晓秋.南京邮电大学 2018
[7]基于深度学习的室内点云场景语义理解研究[D]. 李文强.哈尔滨工业大学 2018
[8]面向步态识别的显著前景分割[D]. 张晶晶.安徽大学 2018
[9]基于实例分割的场景图像文字检测[D]. 张小爽.浙江大学 2018
[10]深度学习在图像识别中的研究及应用[D]. 李卫.武汉理工大学 2014
本文编号:3418543
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3418543.html
最近更新
教材专著