基于深度特征学习的人像精细分割研究
发布时间:2022-01-20 16:21
人像语义精细分割作为计算机视觉与模式识别领域中非常重要的一个研究方向,广泛应用于无人驾驶、医学图像等领域,传统的人像分割方法基于人工特征设计,提取方法单一,特征的鲁棒性不强,并且传统的特征方式提取速度慢。深度学习可以对特征自动表征和学习,并且深度学习在并行计算平台的支撑之下,分割识别速度快。本文针对人像分割领域存在的边界模糊问题,设计了两种基于深度学习的人像精细分割方法,实现了对人像自然数据集的高效分割。本文的主要研究内容及成果如下。针对深度学习卷积特征感受野单一问题,和人像分割的多尺度问题,设计了一种基于深度特征集成融合的人像精细分割方法,该方法提出了将多尺度特征进行集成学习的融合方式。首先通过深度学习的迁移学习方法,采用基于cityscapes数据集训练的PspNet语义分割模型进行权重初始化,对后面的特征进行特征集成融合,增强了模型特征的鲁棒性,并且整个模型是端到端学习和优化的。将所设计的集成特征融合模型与现有的深度检测算法进行对比,从实验结果可以看出本方法相比其它方法精度更加高。在特征集成融合模型的基础上,针对自然图像分割边界模糊问题,设计了一种深度特征增强机制的人像精细分割方...
【文章来源】:大连交通大学辽宁省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2.1深度卷积神经网络分类示意图??Fig.?2.1?Classification?of?Deep?Convolution?Neural?Network?Manner??
????第二章基于深度学习的人像语义分割???得到更加稀疏的特征;最大池化还有额外的功能,即得到的特征具有平移不变性,即对??于图像分类任务来说,一张图片分类的结果为猫,但是对于神经网络模型来说,猫在图??像中的位置不是很重要,不管猫的关键点特征平移到了什么位置。最大池化示意图如下??图2.2所示,池化核大小为2*2,步长为2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步长:2x2??12?3?4??y?,??图2.2最大池化示意图??Fig.?2.2?Maximum?pooling?indication??除了卷积核池化,激活函数的功能主要是将特征进行非线性映射,现有的激活函数??主要为Sigmod、Tanh、Hadlim、ReLU等。Sigmod函数和Tanh导数比较小,都会导致??模型在训练过程中导致的梯度弥散问题,即梯度消失问题,ReLU在输入为正数的时候,??激活输出同输入为线性关系,而在输入为负数的时候,激活输出为0,如下图2.3所示,??ReLU函数的提出缓解了梯度消失问题,缺点在于祌经元死掉问题。PReLU激活函数在??输入为负数的时候,在负数区域内提供一个线性运算,防止神经元的坏死情况。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??图2.3ReliT激活函数示意图??Fig.?2.3?Relu?activation?function??9??
????第二章基于深度学习的人像语义分割???得到更加稀疏的特征;最大池化还有额外的功能,即得到的特征具有平移不变性,即对??于图像分类任务来说,一张图片分类的结果为猫,但是对于神经网络模型来说,猫在图??像中的位置不是很重要,不管猫的关键点特征平移到了什么位置。最大池化示意图如下??图2.2所示,池化核大小为2*2,步长为2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步长:2x2??12?3?4??y?,??图2.2最大池化示意图??Fig.?2.2?Maximum?pooling?indication??除了卷积核池化,激活函数的功能主要是将特征进行非线性映射,现有的激活函数??主要为Sigmod、Tanh、Hadlim、ReLU等。Sigmod函数和Tanh导数比较小,都会导致??模型在训练过程中导致的梯度弥散问题,即梯度消失问题,ReLU在输入为正数的时候,??激活输出同输入为线性关系,而在输入为负数的时候,激活输出为0,如下图2.3所示,??ReLU函数的提出缓解了梯度消失问题,缺点在于祌经元死掉问题。PReLU激活函数在??输入为负数的时候,在负数区域内提供一个线性运算,防止神经元的坏死情况。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??图2.3ReliT激活函数示意图??Fig.?2.3?Relu?activation?function??9??
【参考文献】:
期刊论文
[1]基于语义分割-对抗的图像语义分割模型[J]. 王鑫,于重重,马先钦,陈秀新. 计算机仿真. 2019(02)
[2]类别非均衡遥感图像语义分割的全卷积网络方法[J]. 吴止锾,高永明,李磊,薛俊诗. 光学学报. 2019(04)
[3]深度残差网络的多光谱遥感图像显著目标检测[J]. 戴玉超,张静,Fatih PORIKLI,何明一. 测绘学报. 2018(06)
[4]结合深度学习与条件随机场的遥感图像分类[J]. 夏梦,曹国,汪光亚,尚岩峰. 中国图象图形学报. 2017(09)
[5]一种多尺度CNN的图像语义分割算法[J]. 刘丹,刘学军,王美珍. 遥感信息. 2017(01)
[6]基于内容的图像分割方法综述[J]. 姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄. 软件学报. 2017(01)
[7]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[8]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
硕士论文
[1]基于卷积神经网络的图像语义分割[D]. 陈鸿翔.浙江大学 2016
本文编号:3599145
【文章来源】:大连交通大学辽宁省
【文章页数】:59 页
【学位级别】:硕士
【部分图文】:
图2.1深度卷积神经网络分类示意图??Fig.?2.1?Classification?of?Deep?Convolution?Neural?Network?Manner??
????第二章基于深度学习的人像语义分割???得到更加稀疏的特征;最大池化还有额外的功能,即得到的特征具有平移不变性,即对??于图像分类任务来说,一张图片分类的结果为猫,但是对于神经网络模型来说,猫在图??像中的位置不是很重要,不管猫的关键点特征平移到了什么位置。最大池化示意图如下??图2.2所示,池化核大小为2*2,步长为2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步长:2x2??12?3?4??y?,??图2.2最大池化示意图??Fig.?2.2?Maximum?pooling?indication??除了卷积核池化,激活函数的功能主要是将特征进行非线性映射,现有的激活函数??主要为Sigmod、Tanh、Hadlim、ReLU等。Sigmod函数和Tanh导数比较小,都会导致??模型在训练过程中导致的梯度弥散问题,即梯度消失问题,ReLU在输入为正数的时候,??激活输出同输入为线性关系,而在输入为负数的时候,激活输出为0,如下图2.3所示,??ReLU函数的提出缓解了梯度消失问题,缺点在于祌经元死掉问题。PReLU激活函数在??输入为负数的时候,在负数区域内提供一个线性运算,防止神经元的坏死情况。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??图2.3ReliT激活函数示意图??Fig.?2.3?Relu?activation?function??9??
????第二章基于深度学习的人像语义分割???得到更加稀疏的特征;最大池化还有额外的功能,即得到的特征具有平移不变性,即对??于图像分类任务来说,一张图片分类的结果为猫,但是对于神经网络模型来说,猫在图??像中的位置不是很重要,不管猫的关键点特征平移到了什么位置。最大池化示意图如下??图2.2所示,池化核大小为2*2,步长为2。??特征??xl?.丄?1?2?4?、?.??5?6?7?8?最大'池化??6?8??3?2?C?Size:2x2,步长:2x2??12?3?4??y?,??图2.2最大池化示意图??Fig.?2.2?Maximum?pooling?indication??除了卷积核池化,激活函数的功能主要是将特征进行非线性映射,现有的激活函数??主要为Sigmod、Tanh、Hadlim、ReLU等。Sigmod函数和Tanh导数比较小,都会导致??模型在训练过程中导致的梯度弥散问题,即梯度消失问题,ReLU在输入为正数的时候,??激活输出同输入为线性关系,而在输入为负数的时候,激活输出为0,如下图2.3所示,??ReLU函数的提出缓解了梯度消失问题,缺点在于祌经元死掉问题。PReLU激活函数在??输入为负数的时候,在负数区域内提供一个线性运算,防止神经元的坏死情况。??10卜?/??,?/??6???/??,/??/??/???[/???-10?-5?5?10??图2.3ReliT激活函数示意图??Fig.?2.3?Relu?activation?function??9??
【参考文献】:
期刊论文
[1]基于语义分割-对抗的图像语义分割模型[J]. 王鑫,于重重,马先钦,陈秀新. 计算机仿真. 2019(02)
[2]类别非均衡遥感图像语义分割的全卷积网络方法[J]. 吴止锾,高永明,李磊,薛俊诗. 光学学报. 2019(04)
[3]深度残差网络的多光谱遥感图像显著目标检测[J]. 戴玉超,张静,Fatih PORIKLI,何明一. 测绘学报. 2018(06)
[4]结合深度学习与条件随机场的遥感图像分类[J]. 夏梦,曹国,汪光亚,尚岩峰. 中国图象图形学报. 2017(09)
[5]一种多尺度CNN的图像语义分割算法[J]. 刘丹,刘学军,王美珍. 遥感信息. 2017(01)
[6]基于内容的图像分割方法综述[J]. 姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄. 软件学报. 2017(01)
[7]图像理解中的卷积神经网络[J]. 常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安. 自动化学报. 2016(09)
[8]Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond[J]. Fei-Yue Wang,Jun Jason Zhang,Xinhu Zheng,Xiao Wang,Yong Yuan,Xiaoxiao Dai,Jie Zhang,Liuqing Yang. IEEE/CAA Journal of Automatica Sinica. 2016(02)
硕士论文
[1]基于卷积神经网络的图像语义分割[D]. 陈鸿翔.浙江大学 2016
本文编号:3599145
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3599145.html
最近更新
教材专著