基于深度学习的高分辨率遥感影像语义分割研究

发布时间:2020-12-06 07:15
  高分辨率遥感影像成为了人类对地观测的重要窗口。遥感影像的语义分割通过为图像每个像素分配语义标签完成对目标的分类和识别,是遥感影像理解的重要手段之一,在地物变化、城镇变迁、灾难救援等中得到广泛应用。由于高分辨率遥感影像具有空间分辨率高、地物种类复杂、类内差异大等特点,导致传统方法下语义分割精度较低。随着深度学习在图像分类、目标检测等视觉任务展示出来优异的性能,近些年,使用深度学习方法进行图像解译和视觉分析的研究越来越多。深度学习突破传统方法需要人工参与设计特征的思想,从大量图像数据中自动学习特征信息,为遥感影像语义分割的研究带来了新的思路。本论文基于卷积神经网络,对高分辨遥感影像的语义分割开展了相关的研究工作。通过研究和分析深度学习技术及常见语义分割模型特点,构建了一个基于双注意力多尺度特征融合的网络模型。该模型主要有以下几个特点:针对高分辨遥感影像细节多,在编码部分,采用ResNet50提取特征,并在ResNet50最后两阶段使用了空洞卷积方式,在保持参数量不变的情况下增大感受野,捕获更多全局信息;针对目标尺度差异变化,在ResNet50各阶段分别引入金字塔池化结构,充分利用多尺度上下... 

【文章来源】:江西师范大学江西省

【文章页数】:57 页

【学位级别】:硕士

【部分图文】:

基于深度学习的高分辨率遥感影像语义分割研究


单层单个神经网络结构

神经网络,层数,单层,函数


工程硕士专业学位论文8的有:sigmoid函数、ReLU函数、tanh函数等。将若干相同结构的神经单元按照一定规则连接在一起就可以构建多层的神经网络,层数三层及以上可以称为深度神经网络或深度学习,常说的深度学习的“深度”含义便体现在此。如图2-2所示:图2-2多层神经网络与单层的神经网络相比较,可以看到多层神经网络拥有更多网络层数(中间的称为隐藏层),每一层的输出结果作为下一层的输入,最后经过多层的运算得到了最终输出结果。其内部实质是学习一组包含大量参数的数学函数模型,通过不断的调整内部参数来逼近最优解。多层神经网络增强了模型的表达能力,可以提取更多特征信息。2.1.2损失函数和梯度下降法构建好了合适的网络模型结构,如何去优化模型是深度学习最关键的问题之一。这里得先提到损失函数,在深度学习中,该函数的意义表达是模型最后的预测数值和真实值之间的差距,这个差距越小,即损失值越小,那么说明对数据的拟合或说特征表达能力越好。因此,模型的优化过程实质就是去使得损失函数最小的过程,使用公式(2-2)表达:tpLossff(1-2)其中,tf代表真实值,pf代表预测值,Loss即为需要优化的目标函数。如何得到目标函数最小值,在数学上可以通过转换为去求解函数极值的问题。如图2-3所示:图2-3函数优化示例

示例,函数,神经网络,损失函数


工程硕士专业学位论文8的有:sigmoid函数、ReLU函数、tanh函数等。将若干相同结构的神经单元按照一定规则连接在一起就可以构建多层的神经网络,层数三层及以上可以称为深度神经网络或深度学习,常说的深度学习的“深度”含义便体现在此。如图2-2所示:图2-2多层神经网络与单层的神经网络相比较,可以看到多层神经网络拥有更多网络层数(中间的称为隐藏层),每一层的输出结果作为下一层的输入,最后经过多层的运算得到了最终输出结果。其内部实质是学习一组包含大量参数的数学函数模型,通过不断的调整内部参数来逼近最优解。多层神经网络增强了模型的表达能力,可以提取更多特征信息。2.1.2损失函数和梯度下降法构建好了合适的网络模型结构,如何去优化模型是深度学习最关键的问题之一。这里得先提到损失函数,在深度学习中,该函数的意义表达是模型最后的预测数值和真实值之间的差距,这个差距越小,即损失值越小,那么说明对数据的拟合或说特征表达能力越好。因此,模型的优化过程实质就是去使得损失函数最小的过程,使用公式(2-2)表达:tpLossff(1-2)其中,tf代表真实值,pf代表预测值,Loss即为需要优化的目标函数。如何得到目标函数最小值,在数学上可以通过转换为去求解函数极值的问题。如图2-3所示:图2-3函数优化示例

【参考文献】:
期刊论文
[1]深度学习在遥感影像分类与识别中的研究进展综述[J]. 王斌,范冬林.  测绘通报. 2019(02)
[2]基于深度学习的语音识别方法研究[J]. 邵娜,李晓坤,刘磊,陈虹旭,郑永亮,杨磊.  智能计算机与应用. 2019(02)
[3]联合显著性特征与卷积神经网络的遥感影像舰船检测[J]. 余东行,张保明,郭海涛,赵传,徐俊峰.  中国图象图形学报. 2018(12)
[4]一种基于遗传算法的图像分割算法[J]. 唐琳,蔡德荣,黄猛.  计算机与数字工程. 2008(07)
[5]基于主动轮廓模型和水平集方法的图像分割技术[J]. 罗红根,朱利民,丁汉.  中国图象图形学报. 2006(03)



本文编号:2900955

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2900955.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户89bf5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com