深度学习在多时相大棚提取应用研究
发布时间:2021-12-15 22:56
蔬菜大棚对于农业生产具有重要意义。受季节和环境影响,其在遥感影像上不同时期呈现不同形态,仅通过单时相特征提取精度不能满足要求。近几年,深度学习被证明适合遥感数据的分类,为实现深度学习在农业遥感上的有效应用,提出了一种改进的多时相语义分割模型(Multi-temporal Spatial Segmentation Network,MSSN)用于蔬菜大棚提取。提出基于补丁长短时记忆网络(Patch-LSTM),该网络充分利用图像的空间和时序信息。采用带空洞卷积的空间金字塔池化(ASSP)解决网络对尺度敏感问题。进一步添加跳连层(Skip-layer)和反卷积层提升特征图的还原能力。选择山东高密GF-2遥感影像进行实验。结果表明,该分割模型在测试集上有0.95的Precision、0.92的F1 score以及0.93的前景IoU(Intersection Over Union),可以实现高精度的蔬菜大棚提取,为深度学习在农业遥感的应用提供新的方法。
【文章来源】:计算机工程与应用. 2020,56(24)北大核心CSCD
【文章页数】:7 页
【部分图文】:
GF-2图像融合
流行的前馈网络主要由卷积层或者全连接层组成,输入数据为xt,经过前向传播,仿射变换得到h(z),其中h(z)=h(θTxi+b),对于时序数据,这样的结构对于上下文信息的特征表达能力差。许多研究者证明了RNN在处理多时序数据上的有效性[35-36],但是随着网络的不断加深,梯度爆炸和梯度消失问题使得网络记忆的信息越来越少,Hochreiter和Schmidhube等人提出的RNN的变体LSTM网络[37-38],通过‘门’控制记忆的时间,使得整个网络可以长时间记忆信息,其整体结构如图2所示。图2显示LSTM单元网络结构,每个LSTM单元由输入门、遗忘门、输出门组成。首先,yt-1和xt经过一个Sigmoid函数与内部状态信息Ct-1相乘,当值为0时,表示完全舍弃,当值为1时,表示完全保留。该网络内部数学关系表示为:
卷积神经网络通过卷积加和运算可以有效地融合图像的光谱信息(遥感影像由多个光谱叠加而成)。3.1节介绍的LSTM可以通过记忆的方式保留时序信息,但是在压缩图像生成时序向量过程中空间信息被破坏。因此,为解决LSTM无法充分利用图像的空间信息的局限性,本文设计了一种基于补丁的Patch-LSTM结构(如图3所示)。网络的输入是时序图像,分别对应不同拍摄时间。针对每一组时序图像,截取Patch区域(不同时序相同区域),生成时序向量x1、x2、x3。考虑计算量,每个Patch区域的尺寸设为5×5大小,因此生成时序向量长度为(25,1)。LSTM采用多对1的结构,即多个输入1个输出,时序向量x1,x2,x3分别输入到LSTM单元,输出向量经过Reshape生成区域特征图。每一块区域特征图信息包含对应时序图像Patch区域的叠加信息,重复操作直到获得完整的输出特征图。为直观展示时相特征,特征图进行了可视化(如图4所示),第一列是不同时期的时序图像,后面是对应不同阶段的特征图可视化结果(特征图可视化结果通过时序向量Reshape保存输出),可以看出不同时期蔬菜大棚的特征差异明显。通过Patch-LSTM时序网络可以将不同时相特征进行融合,充分保留各个时相的特征,提升特征表达能力。
【参考文献】:
期刊论文
[1]基于Deeplabv3+与CRF的遥感影像典型要素提取方法[J]. 王俊强,李建胜,周华春,张旭. 计算机工程. 2019(10)
[2]基于SegNet语义模型的高分辨率遥感影像农村建设用地提取[J]. 杨建宇,周振旭,杜贞容,许全全,尹航,刘瑞. 农业工程学报. 2019(05)
[3]基于U-Net的高分辨率遥感图像语义分割方法[J]. 苏健民,杨岚心,景维鹏. 计算机工程与应用. 2019(07)
[4]基于MODIS时序NDVI主要农作物种植信息提取研究[J]. 郭昱杉,刘庆生,刘高焕,黄翀. 自然资源学报. 2017(10)
[5]基于MODISNDVI多年时序数据的农作物种植识别[J]. 许青云,杨贵军,龙慧灵,王崇倡,李鑫川,黄登成. 农业工程学报. 2014(11)
[6]面向高光谱遥感影像的分类方法研究[J]. 杨国鹏,余旭初,刘伟,陈伟. 测绘通报. 2007(10)
[7]面向对象的高光谱遥感影像分类方法研究[J]. 尹作霞,杜培军. 遥感信息. 2007(04)
本文编号:3537294
【文章来源】:计算机工程与应用. 2020,56(24)北大核心CSCD
【文章页数】:7 页
【部分图文】:
GF-2图像融合
流行的前馈网络主要由卷积层或者全连接层组成,输入数据为xt,经过前向传播,仿射变换得到h(z),其中h(z)=h(θTxi+b),对于时序数据,这样的结构对于上下文信息的特征表达能力差。许多研究者证明了RNN在处理多时序数据上的有效性[35-36],但是随着网络的不断加深,梯度爆炸和梯度消失问题使得网络记忆的信息越来越少,Hochreiter和Schmidhube等人提出的RNN的变体LSTM网络[37-38],通过‘门’控制记忆的时间,使得整个网络可以长时间记忆信息,其整体结构如图2所示。图2显示LSTM单元网络结构,每个LSTM单元由输入门、遗忘门、输出门组成。首先,yt-1和xt经过一个Sigmoid函数与内部状态信息Ct-1相乘,当值为0时,表示完全舍弃,当值为1时,表示完全保留。该网络内部数学关系表示为:
卷积神经网络通过卷积加和运算可以有效地融合图像的光谱信息(遥感影像由多个光谱叠加而成)。3.1节介绍的LSTM可以通过记忆的方式保留时序信息,但是在压缩图像生成时序向量过程中空间信息被破坏。因此,为解决LSTM无法充分利用图像的空间信息的局限性,本文设计了一种基于补丁的Patch-LSTM结构(如图3所示)。网络的输入是时序图像,分别对应不同拍摄时间。针对每一组时序图像,截取Patch区域(不同时序相同区域),生成时序向量x1、x2、x3。考虑计算量,每个Patch区域的尺寸设为5×5大小,因此生成时序向量长度为(25,1)。LSTM采用多对1的结构,即多个输入1个输出,时序向量x1,x2,x3分别输入到LSTM单元,输出向量经过Reshape生成区域特征图。每一块区域特征图信息包含对应时序图像Patch区域的叠加信息,重复操作直到获得完整的输出特征图。为直观展示时相特征,特征图进行了可视化(如图4所示),第一列是不同时期的时序图像,后面是对应不同阶段的特征图可视化结果(特征图可视化结果通过时序向量Reshape保存输出),可以看出不同时期蔬菜大棚的特征差异明显。通过Patch-LSTM时序网络可以将不同时相特征进行融合,充分保留各个时相的特征,提升特征表达能力。
【参考文献】:
期刊论文
[1]基于Deeplabv3+与CRF的遥感影像典型要素提取方法[J]. 王俊强,李建胜,周华春,张旭. 计算机工程. 2019(10)
[2]基于SegNet语义模型的高分辨率遥感影像农村建设用地提取[J]. 杨建宇,周振旭,杜贞容,许全全,尹航,刘瑞. 农业工程学报. 2019(05)
[3]基于U-Net的高分辨率遥感图像语义分割方法[J]. 苏健民,杨岚心,景维鹏. 计算机工程与应用. 2019(07)
[4]基于MODIS时序NDVI主要农作物种植信息提取研究[J]. 郭昱杉,刘庆生,刘高焕,黄翀. 自然资源学报. 2017(10)
[5]基于MODISNDVI多年时序数据的农作物种植识别[J]. 许青云,杨贵军,龙慧灵,王崇倡,李鑫川,黄登成. 农业工程学报. 2014(11)
[6]面向高光谱遥感影像的分类方法研究[J]. 杨国鹏,余旭初,刘伟,陈伟. 测绘通报. 2007(10)
[7]面向对象的高光谱遥感影像分类方法研究[J]. 尹作霞,杜培军. 遥感信息. 2007(04)
本文编号:3537294
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3537294.html