基于中高分辨率遥感影像人工地表提取方法研究
发布时间:2021-04-14 06:47
随着空间传感器技术的发展,遥感技术逐渐成为一种重要的地表观测手段。深度学习方法在计算机视觉领域,自然语言处理领域中都获得了长足的发展与良好的效果。近年来,在地表覆盖分类,遥感图像变化检测,遥感图像目标检测等遥感图像处理领域中也逐渐在引入深度学习算法。不同于传统的遥感图像处理方法,如遥感指数阈值提取、支持向量机、决策树分类器等方法人为地构建特征,深度学习通过神经网络中可学习的权重来自动提取图像特征并对图像特征加以利用,同时也能更好的拟合数据的本质特征。本文针对深度学习的语义分割方法在遥感图像的地表覆盖分类和人工地表覆盖提取的应用进行了研究并提出了一些改进的方法。本文主要研究了如何将计算机视觉领域中语义分割方法迁移到遥感图像人工地表覆盖提取任务上并针对遥感影像进行改进。其次,本文通过融入稀疏化的Non-local空间注意力来对语义编码器的性能进行改进。通过融入通道注意力机制到深层特征与浅层特征解码器中对语义信息解码中来优化解码性能。再次,考虑到样本中的类别分布不均的问题,在交叉熵损失函数中引入了在线难例挖掘算法方法帮助模型收敛。最后,本文根据遥感图像特点结合使用了多元数据融合的方法对深度学...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
批归一化操作过程[73]
电子科技大学硕士学位论文12LeNet-5由于模型体量太小,虽然在手写字体识别上能由不错的效果,但是对于如今繁杂的计算机视觉任务,其结构并不能满足需求。而AlexNet在2012年的ImageNet分类任务一举颠覆了传统的计算机视觉认知,但是深度仍然不足。牛津大学视觉组和GoogleDeepMind团队随后于2014年提出VGG网络[74],但是随着网络层数的加深,深层特征难以提取,同时也会带来梯度爆炸问题。何凯明团队最后提出恒等残差映射结构,一举将ResNet[75]的网络层数提升到152层,同时也避免了梯度弥散的问题。ResNet的残差结构如下图2-2所示:图2-2残差结构[75]本实验主要采用ResNet-50和ResNet-101作为骨架(Backbone)网络,其参数结构如下表2-1所示:表2-1ResNet网络结构[75]LayerNameOutputSize50-Layer101-LayerConv1256x2567x7,64s=2Pool1128x1283x3maxpool,s=2Block1/conv_x[1×1,643×3,641×1,256]×3[1×1,643×3,641×1,256]×3Block2/conv_x64x64[1×1,1283×3,1281×1,512]×4[1×1,1283×3,1281×1,512]×4Block3/conv_x32x32[1×1,2563×3,2561×1,1024]×6[1×1,2563×3,2561×1,1024]×23Block4/conv_x32x32[1×1,5123×3,5121×1,2048]×3[1×1,5123×3,5121×1,2048]×3ResNet这种残差连接方式极大地避免了深层网络反向传播的梯度弥散问题,同时这种结构也适用于在语义分割的语义编码器部分,通过在语义码器部分融入残差结构能有效地帮助模型对深层特征和和语义编码特征进行融合编码。
第二章基于深度卷积神经网络的语义分割方法132.2基于深度学习的语义分割方法2.2.1编码器解码器结构语义分割模型起源于全卷积网络,他将骨架网络最后的全连接层替换为卷积层,实现了像素级的分割任务,目前流行的语义分割网络大多都可以分为两个模块,编码器(Encoder)和解码器(Decoder),编码器包含两个部分即为前端的骨架网络,大多大同小异,和后端语义编码器,也称为语义分割头,这些语义分割模型的性能差异主要体现在后端的语义编码器以及解码器的设计上。骨架网络使用池化操作逐渐缩减数据的空间尺度,语义编码器对骨架网络提取的特征进行语义编码获取语义信息,而解码器通过反卷积层或者其他的解码方式来逐步回复目标的细节和相应的空间信息。编码解码器结构如下图2-3所示:图2-3编码器解码器结构通过设计优秀的语义编码器可以更有效的提取出深层特征的语义信息进行编码,而设计优秀的解码器能更好的从编码器输出的编码特征中提取出有效的特征信息并对其进行解码。2.2.2全卷积网络通常的卷积神经网络再卷积后会使用若干个全连接层(FullyConnectedLayer,FCLayer)用于产生一个固定长度的特征向量,而这个特征向量通常用于图像的分类或者回归任务,不能满足语义分割的像素级分类需求。全卷积网络对图像进行像素级的分类,从而解决了语义级别的图像分割(SemanticSegmentation)问题。与经典的分类卷积神经网络结构在卷积层之后使用全连接层得到固定长度的特征
【参考文献】:
期刊论文
[1]基于深度学习的高分辨率遥感影像分类研究[J]. 刘大伟,韩玲,韩晓勇. 光学学报. 2016(04)
[2]随机森林在高光谱遥感数据中降维与分类的应用[J]. 杨珺雯,张锦水,朱秀芳,谢登峰,袁周米琪. 北京师范大学学报(自然科学版). 2015(S1)
[3]基于面向对象分类法的高分辨率遥感滑坡信息提取[J]. 张毅,谭龙,陈冠,郭鹏,乔良,孟兴民. 兰州大学学报(自然科学版). 2014(05)
[4]基于Roberts边缘检测的面向对象建筑物信息提取[J]. 赵月云,王波. 城市勘测. 2012(02)
[5]基于稀疏表示及光谱信息的高光谱遥感图像分类[J]. 宋相法,焦李成. 电子与信息学报. 2012(02)
[6]遥感影像变化检测自适应阈值分割的Kriging方法[J]. 申邵洪,万幼川,龚浩,赖祖龙. 武汉大学学报(信息科学版). 2009(08)
[7]基于PCA和SVM的高光谱遥感图像分类研究[J]. 张亮. 光学技术. 2008(S1)
[8]一种快速提取不透水面的新型遥感指数[J]. 徐涵秋. 武汉大学学报(信息科学版). 2008(11)
[9]基于SVM算法和纹理特征提取的遥感图像分类[J]. 丁海勇,卞正富. 计算机工程与设计. 2008(08)
[10]基于决策树的遥感影像分类方法研究[J]. 李爽,张二勋. 地域研究与开发. 2003(01)
硕士论文
[1]基于彩色航空影像的阴影检测算法研究[D]. 王军利.武汉大学 2005
本文编号:3136870
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
批归一化操作过程[73]
电子科技大学硕士学位论文12LeNet-5由于模型体量太小,虽然在手写字体识别上能由不错的效果,但是对于如今繁杂的计算机视觉任务,其结构并不能满足需求。而AlexNet在2012年的ImageNet分类任务一举颠覆了传统的计算机视觉认知,但是深度仍然不足。牛津大学视觉组和GoogleDeepMind团队随后于2014年提出VGG网络[74],但是随着网络层数的加深,深层特征难以提取,同时也会带来梯度爆炸问题。何凯明团队最后提出恒等残差映射结构,一举将ResNet[75]的网络层数提升到152层,同时也避免了梯度弥散的问题。ResNet的残差结构如下图2-2所示:图2-2残差结构[75]本实验主要采用ResNet-50和ResNet-101作为骨架(Backbone)网络,其参数结构如下表2-1所示:表2-1ResNet网络结构[75]LayerNameOutputSize50-Layer101-LayerConv1256x2567x7,64s=2Pool1128x1283x3maxpool,s=2Block1/conv_x[1×1,643×3,641×1,256]×3[1×1,643×3,641×1,256]×3Block2/conv_x64x64[1×1,1283×3,1281×1,512]×4[1×1,1283×3,1281×1,512]×4Block3/conv_x32x32[1×1,2563×3,2561×1,1024]×6[1×1,2563×3,2561×1,1024]×23Block4/conv_x32x32[1×1,5123×3,5121×1,2048]×3[1×1,5123×3,5121×1,2048]×3ResNet这种残差连接方式极大地避免了深层网络反向传播的梯度弥散问题,同时这种结构也适用于在语义分割的语义编码器部分,通过在语义码器部分融入残差结构能有效地帮助模型对深层特征和和语义编码特征进行融合编码。
第二章基于深度卷积神经网络的语义分割方法132.2基于深度学习的语义分割方法2.2.1编码器解码器结构语义分割模型起源于全卷积网络,他将骨架网络最后的全连接层替换为卷积层,实现了像素级的分割任务,目前流行的语义分割网络大多都可以分为两个模块,编码器(Encoder)和解码器(Decoder),编码器包含两个部分即为前端的骨架网络,大多大同小异,和后端语义编码器,也称为语义分割头,这些语义分割模型的性能差异主要体现在后端的语义编码器以及解码器的设计上。骨架网络使用池化操作逐渐缩减数据的空间尺度,语义编码器对骨架网络提取的特征进行语义编码获取语义信息,而解码器通过反卷积层或者其他的解码方式来逐步回复目标的细节和相应的空间信息。编码解码器结构如下图2-3所示:图2-3编码器解码器结构通过设计优秀的语义编码器可以更有效的提取出深层特征的语义信息进行编码,而设计优秀的解码器能更好的从编码器输出的编码特征中提取出有效的特征信息并对其进行解码。2.2.2全卷积网络通常的卷积神经网络再卷积后会使用若干个全连接层(FullyConnectedLayer,FCLayer)用于产生一个固定长度的特征向量,而这个特征向量通常用于图像的分类或者回归任务,不能满足语义分割的像素级分类需求。全卷积网络对图像进行像素级的分类,从而解决了语义级别的图像分割(SemanticSegmentation)问题。与经典的分类卷积神经网络结构在卷积层之后使用全连接层得到固定长度的特征
【参考文献】:
期刊论文
[1]基于深度学习的高分辨率遥感影像分类研究[J]. 刘大伟,韩玲,韩晓勇. 光学学报. 2016(04)
[2]随机森林在高光谱遥感数据中降维与分类的应用[J]. 杨珺雯,张锦水,朱秀芳,谢登峰,袁周米琪. 北京师范大学学报(自然科学版). 2015(S1)
[3]基于面向对象分类法的高分辨率遥感滑坡信息提取[J]. 张毅,谭龙,陈冠,郭鹏,乔良,孟兴民. 兰州大学学报(自然科学版). 2014(05)
[4]基于Roberts边缘检测的面向对象建筑物信息提取[J]. 赵月云,王波. 城市勘测. 2012(02)
[5]基于稀疏表示及光谱信息的高光谱遥感图像分类[J]. 宋相法,焦李成. 电子与信息学报. 2012(02)
[6]遥感影像变化检测自适应阈值分割的Kriging方法[J]. 申邵洪,万幼川,龚浩,赖祖龙. 武汉大学学报(信息科学版). 2009(08)
[7]基于PCA和SVM的高光谱遥感图像分类研究[J]. 张亮. 光学技术. 2008(S1)
[8]一种快速提取不透水面的新型遥感指数[J]. 徐涵秋. 武汉大学学报(信息科学版). 2008(11)
[9]基于SVM算法和纹理特征提取的遥感图像分类[J]. 丁海勇,卞正富. 计算机工程与设计. 2008(08)
[10]基于决策树的遥感影像分类方法研究[J]. 李爽,张二勋. 地域研究与开发. 2003(01)
硕士论文
[1]基于彩色航空影像的阴影检测算法研究[D]. 王军利.武汉大学 2005
本文编号:3136870
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3136870.html