基于深度学习的图像语义分割算法研究
发布时间:2021-01-24 20:09
基于深度学习的图像语义分割算法可以提高图像分割的精度,其优越性远大于传统机器学习算法,主要体现在分割速度快和分割精度更精准。但是由于浅层网络输出的特征图中信息主要为局部信息,深层网络输出的特征图中主要为全局信息,经常面临着语义和位置信息不可兼得的问题。提出以Res Net-34为骨架,用迁移学习的方法在训练好的网络权重上进行微调,使用跳跃连接将浅层特征与深层特征融合起来用以丰富特征图的信息,同时引入注意力机制,使整个模型对图像的不同位置有侧重点,以此来提高分割的精度。通过在Cam Vid数据集上的实验表明,该方法比传统的全卷积网络模型在分割准确率上有所提升。
【文章来源】:计算机应用研究. 2020,37(S2)北大核心
【文章页数】:3 页
【部分图文】:
全卷积网络结构
2015年Ronneberger等人[9]提出了U-Net,其网络结构如图2所示,在该网络结构中使用了编解码器的概念。网络左半部分使用卷积层与池化层进行下采样,右半部分再使用反卷积同时上采样。这种编解码器结构可以很好地提取特征,在医疗图像分割中取得了不错的成果,但是整个网络仍然会产生梯度消失的现象,所以本文的模型使用残差网络来提取特征是十分有必要的。另外U-Net并没有对输入待分割的图像有侧重点,这使得训练速度慢,并且不利于提升分割的精度。为了解决以上问题,本文使用注意力机制对图像中需要分割的地方进行重点标记。2017年Badrinarayanan等人[10]提出Seg Net,其网络结构如图3所示。该网络同样运用了编码器/解码器的方法,分别以两个VGG网络为编码器和解码器。编码器进行特征提取,解码器进行上采样,同时也运用跳跃连接将上一次上采样得到的特征图与相对应的下采样产生的特征图融合之后再进行上采样。但是面对如此深层的网络,很容易产生梯度消失问题,本文模型在提取特征时使用残差网络以解决该问题。
2017年Badrinarayanan等人[10]提出Seg Net,其网络结构如图3所示。该网络同样运用了编码器/解码器的方法,分别以两个VGG网络为编码器和解码器。编码器进行特征提取,解码器进行上采样,同时也运用跳跃连接将上一次上采样得到的特征图与相对应的下采样产生的特征图融合之后再进行上采样。但是面对如此深层的网络,很容易产生梯度消失问题,本文模型在提取特征时使用残差网络以解决该问题。2019年Hu等人[11]提出了SENet,该网络首次将注意力机制用于图像分割并取得了不错的效果,注意力机制网络结构如图4所示。然而该方法忽视了一个重要问题就是图像的全局信息与局部信息不可兼得,这就使得网络提取到的特征图缺乏浅层网络所有的局部信息,导致在图像分割时一些边缘细节无法准确分割。本文在其特征提取网络上进行改进,引入注意力机制使其更好地为图像不同部分分配权重,使得整个网络对图像的侧重点更明确;同时为了解决图像的全局信息与局部信息不可兼得问题,使用跳跃连接将深层特征与浅层特征相融合,从而提升分割效果。
本文编号:2997856
【文章来源】:计算机应用研究. 2020,37(S2)北大核心
【文章页数】:3 页
【部分图文】:
全卷积网络结构
2015年Ronneberger等人[9]提出了U-Net,其网络结构如图2所示,在该网络结构中使用了编解码器的概念。网络左半部分使用卷积层与池化层进行下采样,右半部分再使用反卷积同时上采样。这种编解码器结构可以很好地提取特征,在医疗图像分割中取得了不错的成果,但是整个网络仍然会产生梯度消失的现象,所以本文的模型使用残差网络来提取特征是十分有必要的。另外U-Net并没有对输入待分割的图像有侧重点,这使得训练速度慢,并且不利于提升分割的精度。为了解决以上问题,本文使用注意力机制对图像中需要分割的地方进行重点标记。2017年Badrinarayanan等人[10]提出Seg Net,其网络结构如图3所示。该网络同样运用了编码器/解码器的方法,分别以两个VGG网络为编码器和解码器。编码器进行特征提取,解码器进行上采样,同时也运用跳跃连接将上一次上采样得到的特征图与相对应的下采样产生的特征图融合之后再进行上采样。但是面对如此深层的网络,很容易产生梯度消失问题,本文模型在提取特征时使用残差网络以解决该问题。
2017年Badrinarayanan等人[10]提出Seg Net,其网络结构如图3所示。该网络同样运用了编码器/解码器的方法,分别以两个VGG网络为编码器和解码器。编码器进行特征提取,解码器进行上采样,同时也运用跳跃连接将上一次上采样得到的特征图与相对应的下采样产生的特征图融合之后再进行上采样。但是面对如此深层的网络,很容易产生梯度消失问题,本文模型在提取特征时使用残差网络以解决该问题。2019年Hu等人[11]提出了SENet,该网络首次将注意力机制用于图像分割并取得了不错的效果,注意力机制网络结构如图4所示。然而该方法忽视了一个重要问题就是图像的全局信息与局部信息不可兼得,这就使得网络提取到的特征图缺乏浅层网络所有的局部信息,导致在图像分割时一些边缘细节无法准确分割。本文在其特征提取网络上进行改进,引入注意力机制使其更好地为图像不同部分分配权重,使得整个网络对图像的侧重点更明确;同时为了解决图像的全局信息与局部信息不可兼得问题,使用跳跃连接将深层特征与浅层特征相融合,从而提升分割效果。
本文编号:2997856
本文链接:https://www.wllwen.com/jianzhugongchenglunwen/2997856.html