高分五号高光谱影像的关联对齐域适应与分类
发布时间:2021-04-02 15:24
高分五号(GF-5)搭载的高光谱传感器兼顾宽覆盖和高分辨率的特性,但在实际应用中宽覆盖范围内各种地物类别的标注十分困难。当标记样本很少甚至没有标记样本时,遥感图像分类异常困难。此时,可以采用域适应方法,借助已标记的历史数据(源域)实现对未标记数据(目标域)的分类。本文提出了一种基于稀疏矩阵变换的关联对齐域适应分类算法。首先,利用稀疏矩阵变换估计源域和目标域的协方差矩阵;然后,运用协方差关联对齐方法估计源域到目标域的变换矩阵;接着,运用估计得到的变换矩阵将源域数据进行变换,使得其与目标域对齐;最后,在变换后的源域数据上建立分类器,实现对目标域数据的分类。本文的算法在两个真实的GF-5高光谱数据集上进行了验证。实验结果表明,本文算法要优于常用的子空间对齐算法和关联对齐算法。特别地,在黄河口GF-5数据上,本文算法比原始关联对齐方法的最近邻分类准确率提升了3.5%,支持向量机分类准确率提升了2.3%。
【文章来源】:遥感学报. 2020,24(04)北大核心EICSCD
【文章页数】:10 页
【部分图文】:
黄河口GF-5数据的伪彩色合成图像(图(a)波段1,30,20分别设定为红、绿、蓝分量)和选定的5类样本标记图
(2)盐城GF-5数据集:利用GF5_AHSI传感器于2019-04-04获取的江苏盐城地区的高光谱分辨率影像。影像大小为1175×585。成像区域中心的经纬度分别为120.177876°E和34.270704°N。传感器的空间分辨率为30 m。总共含330个波段,剔除63个坏波段,余下267个波段用于分类。该影像对应盐城滨海湿地,通过地物类别实地调研,该影像共标注地物类别20类,包括浅海、海滩、池塘、沼泽、树林、裸土等。将数据集分为两个互不相交的区域,从而模拟有偏差采样的情形,如图2所示,红线下方为源域,上方为目标域。在源域和目标域中挑选6类样本用于迁移学习,具体信息见表2,其中源域和目标域样本总数分别为1140和1880。3.2 对比算法
为了从视觉上直观地呈现NA,CORAL,CORAL-SMT算法的差异,本文分别将原始数据以及CORAL和CORAL-SMT变换之后的源域和目标域样本,采用PCA变换投影到2维空间,展示相应图形如图3所示。从图3(a),可以明显看出:原始数据上源域和目标域之间存在一个较为明显的分布漂移情况。源域数据靠近图形下方,而目标域分布在图形上方。尽管NA算法能够产生较高分类准确率,仍然有必要通过域适应将源域和目标域数据进行对齐,消除这种分布偏差,从而进一步提升分类性能。图3(b)中,通过CORAL变换,源域和目标域数据之间更加接近,但是红色和蓝色部分有大量重叠。从图3(c)可以看出,经过SMT变换之后,源域和目标域对应的同类样本之间更加紧密。特别地,红色部分有向左上角收缩的趋势、绿色部分向下方收缩、蓝色部分向右收缩。这表明,SMT变换之后,估计得到的协方差更加准确,每类样本对应的方差和变化范围更加准确,从而使得对齐之后的结果更加可靠。将NA,CORAL,CORAL-SMT在各类上的分类结果进行详细比较。表4—表6分别给出了NA,CORAL,CORAL-SMT方法的分类混淆矩阵(Confusion Matrix)。可以发现,NA中,错分主要出现在第1类和第4类,其中,第1类(红色)错分到第2类(绿色)和第3类(蓝色)、第4类(紫色)错分到第5类(青色)。第1类为湿地,第2类为水产养殖区,第3类为池塘,这3类都与水有关系,光谱上具有一定相似性,因此难以完全区分开。经过CORAL变换之后,第1类只错分到第3类,另外,紫色分到青色的错分也得到了一定的缓解。经过CORAL-SMT处理之后,已基本上能将紫色和青色分开。红色部分的错分也得到了极大减少。
【参考文献】:
期刊论文
[1]中国高光谱遥感的前沿进展[J]. 童庆禧,张兵,张立福. 遥感学报. 2016(05)
[2]高光谱图像稀疏信息处理综述与展望[J]. 张良培,李家艺. 遥感学报. 2016(05)
本文编号:3115503
【文章来源】:遥感学报. 2020,24(04)北大核心EICSCD
【文章页数】:10 页
【部分图文】:
黄河口GF-5数据的伪彩色合成图像(图(a)波段1,30,20分别设定为红、绿、蓝分量)和选定的5类样本标记图
(2)盐城GF-5数据集:利用GF5_AHSI传感器于2019-04-04获取的江苏盐城地区的高光谱分辨率影像。影像大小为1175×585。成像区域中心的经纬度分别为120.177876°E和34.270704°N。传感器的空间分辨率为30 m。总共含330个波段,剔除63个坏波段,余下267个波段用于分类。该影像对应盐城滨海湿地,通过地物类别实地调研,该影像共标注地物类别20类,包括浅海、海滩、池塘、沼泽、树林、裸土等。将数据集分为两个互不相交的区域,从而模拟有偏差采样的情形,如图2所示,红线下方为源域,上方为目标域。在源域和目标域中挑选6类样本用于迁移学习,具体信息见表2,其中源域和目标域样本总数分别为1140和1880。3.2 对比算法
为了从视觉上直观地呈现NA,CORAL,CORAL-SMT算法的差异,本文分别将原始数据以及CORAL和CORAL-SMT变换之后的源域和目标域样本,采用PCA变换投影到2维空间,展示相应图形如图3所示。从图3(a),可以明显看出:原始数据上源域和目标域之间存在一个较为明显的分布漂移情况。源域数据靠近图形下方,而目标域分布在图形上方。尽管NA算法能够产生较高分类准确率,仍然有必要通过域适应将源域和目标域数据进行对齐,消除这种分布偏差,从而进一步提升分类性能。图3(b)中,通过CORAL变换,源域和目标域数据之间更加接近,但是红色和蓝色部分有大量重叠。从图3(c)可以看出,经过SMT变换之后,源域和目标域对应的同类样本之间更加紧密。特别地,红色部分有向左上角收缩的趋势、绿色部分向下方收缩、蓝色部分向右收缩。这表明,SMT变换之后,估计得到的协方差更加准确,每类样本对应的方差和变化范围更加准确,从而使得对齐之后的结果更加可靠。将NA,CORAL,CORAL-SMT在各类上的分类结果进行详细比较。表4—表6分别给出了NA,CORAL,CORAL-SMT方法的分类混淆矩阵(Confusion Matrix)。可以发现,NA中,错分主要出现在第1类和第4类,其中,第1类(红色)错分到第2类(绿色)和第3类(蓝色)、第4类(紫色)错分到第5类(青色)。第1类为湿地,第2类为水产养殖区,第3类为池塘,这3类都与水有关系,光谱上具有一定相似性,因此难以完全区分开。经过CORAL变换之后,第1类只错分到第3类,另外,紫色分到青色的错分也得到了一定的缓解。经过CORAL-SMT处理之后,已基本上能将紫色和青色分开。红色部分的错分也得到了极大减少。
【参考文献】:
期刊论文
[1]中国高光谱遥感的前沿进展[J]. 童庆禧,张兵,张立福. 遥感学报. 2016(05)
[2]高光谱图像稀疏信息处理综述与展望[J]. 张良培,李家艺. 遥感学报. 2016(05)
本文编号:3115503
本文链接:https://www.wllwen.com/guanlilunwen/gongchengguanli/3115503.html