当前位置:主页 > 硕博论文 > 农业硕士论文 >

基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究

发布时间:2020-11-12 04:08
   草地作为全球最常见的植被类型之一,在维护全球生态安全、防止沙漠化及涵养水源等方面具有十分重要的作用。准确获取草地空间分布信息不仅具有十分重要的生态环境意义,还有助于相应保护管理政策的制定。传统的草地覆被信息监测方法主要采用野外采样法,该方法耗时,耗力,效能低且成本高,受到许多人为因素的限制,并且不能快速检测大范围的草地覆被信息。遥感监测技术近几十年来发展迅速,在全球植被信息获取方面发挥着重大作用。当前基于遥感影像的大区域土地覆被信息提取研究中,通常存在相同时相的遥感影像获取困难,不同时相的遥感影像因拍摄时的不同角度、照明以及物候时相等因素的影响产生明显的色彩差异,训练样本获取难度大,相邻影像重叠区域冗余信息处理困难等问题。因此,对于覆盖多景遥感影像的大范围区域,如何实现草地覆被信息的高精度提取,仍然有待探索。其一,相邻影像间重叠区域的地理空间具有一致性,地物类型一般不会随着时间推移发生很大改变。将重叠区域影像对象作为附加样本自动选择的有效区域,可有效利用重叠区域冗余信息,并减少样本选取工作量。其二,迁移学习方法中的联合分布自适应(Joint Distribution Adaptation,JDA)和平衡分布自适应(Balanced Distribution Adaptation,BDA)的领域自适应方法可通过数据特征之间的变换,削弱不同数据域间的差异。采用迁移学习方法平衡遥感影像间存在的时相差异,可削弱因时相差异引起的影像数据特征变化程度。其三,借助机器学习分类器算法完成遥感影像信息提取可大大提高其自动化水平,选择分类能力强的分类器算法对信息提取结果影响较大。研究立足以上三点,本文提出了一种基于影像重叠区域特征迁移机器学习的大区域草地信息自动提取算法,实现了甘肃祁连山保护区草地植被分布的高精度提取。本文以甘肃祁连山自然保护区草地植被分布为例,以Sentinel-2影像数据为主,30m数字高程模型数据为辅。通过卫星遥感影像重叠区域选取不同比例标记样本对分类精度影响实验、迁移学习方法对分类精度影响实验、4种分类器算法对比实验、甘肃祁连山自然保护区草地覆被信息提取实验和5种分类策略对比实验进行对比分析,得到如下结论:(1)本文基于影像重叠区域特征迁移机器学习的大区域草地自动提取算法,能够有效、高精度提取甘肃祁连山自然保护区的草地覆被信息,在一定程度上满足了大区域遥感影像的专题信息提取需求。文中以1景影像分类,迁移学习模型平衡影像时相差异,自适应完成重叠区域信息迁移,拓展完成了12景目标影像分类。研究区平均总体分类精度达到92.59%,平均卡帕系数达到0.84。实验结果论证了本文所提方法可有效实现大区域范围少训练样本的甘肃祁连山自然保护区的草地覆被信息提取。(2)通过选取不同比例的重叠区域标记样本与源训练样本混合完成草地覆被信息提取对比实验,发现随着影像重叠区域标记样本量的增加,草地覆被信息的提取精度先迅速提高,再趋于稳定或有略微下降趋势。当重叠区域标记样本所占比例达到10%时,研究区草地信息提取的平均总体精度最高。(3)通过2种迁移学习方法对分类精度的影响实验,可以发现BDA模型对分类精度的有效性要高于JDA模型。本文所使用的BDA迁移学习方法可有效削弱因时相差异引起的影像数据特征分布差异。(4)通过4种分类器算法对比实验,BP神经网络作为源分类器的平均总体精度和卡帕系数最高,泛化能力最强,其总体精度、卡帕系数达到92.59%、0.84。随机森林和支持向量机次之,其总体精度、卡帕系数分别达到91.61%、0.82和90.34%、0.78。决策树的泛化能力最差,其总体精度、卡帕系数达到87.28%、0.74。(5)本文方法既利用影像的重叠区域信息,又采用迁移学习方法。为了验证两者对草地信息提取的有效性,本文采用5种分类策略进行研究区草地信息提取对比试验。试验结果表明,融合影像重叠区域信息和进行迁移学习均能提高草地提取精度,融合重叠区域信息对提取精度的促进作用要高于迁移学习,同时融合影像重叠区域信息和进行迁移学习对草地信息提取精度有效性最高。本文方法取得的分类精度略优于监督分类,且具有显著减少大区域遥感信息提取过程中训练样本选取的潜力,可有效提升遥感专题信息提取的自动化水平。
【学位单位】:兰州大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:S812
【部分图文】:

技术路线图,机器学习,硕士学位,兰州


技术路线图

示意图,决策树,示意图,森林


兰州大学硕士学位论文基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究14越大。图2-1决策树示意图C4.5算法继承了ID3算法的优点,采用信息增益率(信息增益与内在信息的比值)作为测试特征选择的度量标准。内在信息是指单个特征信息分支所需要的信息量。内在信息量与值数量成正比,可校正值数量对信息增益率的影响,克服了在选择信息增益的属性时,存有多个属性值的偏向选择的缺点。在构造树的过程中进行修剪可实现连续属性的离散化,并且可以处理不完整的数据。2.2.2随机森林随机森林(RandomForest,RF)[76]是集成算法中的一种,它依靠决策树的投票选择来决定最后的分类结果(图2-2)。自2001年随机森林算法被提出以来,在遥感影像信息提取领域得到了不断的改进,被证明是一种具有鲁棒性的分类器[77]。其基本思想是在训练数据和相关变量的随机子集上生长多棵决策树,随机森林通过聚合单棵决策树的不同输出来减少可能导致决策树错误的方差。通过多数投票算法,可以找到大多数单棵树给出的平均输出,从而平滑了方差,这样的集成在复杂的数据集上表现出了鲁棒和准确的性能,几乎不需要进行微调,并且可以抑制有许多噪声的变量[42]。随机森林为了保证较强的抗过拟合和抗噪声能力,在构建每一棵CART决策树的时候采用了行抽样和列抽样的随机化。行抽样是指:假设训练集的数据行数为N,对于每一棵CART树,从N个原始样本中有放回地随机抽取N个作为单棵树的训练集。假设随机森林中CART树数目为K,那么通过该办法生成K个独立的训练集用于CART的训练。列抽样是指:假设原始数据集的特征数为

示意图,森林,示意图,超平面


兰州大学硕士学位论文基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究15M,在通过行采样获取每棵CART树的训练集后,随机森林会随机选取m个特征(m<M)训练用于每一棵CART树的生成。当m越小时,模型的抗干扰性和抗过拟合性越强,但是模型的准确率会下降,因此在实际建模过程中,常需要用交叉验证等方式选择合适的m值。图2-2随机森林示意图2.2.3支持向量机支持向量机(SupportVectorMachines,SVM)是一种非参数监督学习分类器算法,在遥感应用中得到了越来越广泛的应用[78]。SVM理论最初由Vapnik和Chervonenkis在1971年提出[79],在1999年由Vapnik详细讨论[80]。支持向量机是一个二分类算法,支持线性分类和非线性分类。其基本思想是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,并将其作为决策边界区分不同的类[45]。图2-3[81]为二维输入空间中一个二分类问题的简单场景。术语“最佳分离超平面”是指在训练步骤中获得的最小化误分类的决策边界,即图2-3(a)中黑色实线。在虚线上被蓝色和红色圆圈圈出的点即为支持向量。所谓支持向量是指距离分隔超平面最近的点。关于二元分类的问题,若是有一个分离超平面可以分离不同类别的数据(也就是说,两种类型的数据恰好位于超平面的两侧),则称为线性可分。如果没有这样的超平面,则称其为线性不可分的。在现实分类的过程中,训练数据集中会包含有噪声,而且手动的添加训练样本类别的过程中也可能存在一些误差,因此,训练集数据的分类函数不需要太完美,太完美会使模型本身过拟合,对其他数据难以适应。为了纠正这些分类中容易出现的错误,
【参考文献】

相关期刊论文 前10条

1 任海娟;董建军;李晓媛;牛建明;张雪峰;;利用多时相Landsat8图像提取苜蓿人工草地信息[J];中国草地学报;2015年02期

2 吴田军;骆剑承;夏列钢;杨海平;沈占锋;胡晓东;;迁移学习支持下的遥感影像对象级分类样本自动选择方法[J];测绘学报;2014年09期

3 郭钇宏;王博;刘勇;杨亦宁;;综合优度法和不一致性法的最优分割参数选择方法[J];遥感技术与应用;2014年03期

4 牛赟;刘贤德;敬文茂;雷军;苗毓新;;祁连山北坡土壤特性与植被垂直分布的关系[J];山地学报;2013年05期

5 汪有奎;;祁连山国家级自然保护区有效管理评价研究[J];中南林业科技大学学报(社会科学版);2013年04期

6 吴炜;沈占锋;李均力;杨海平;骆剑承;;联合概率密度脊提取的影像镶嵌色彩一致性处理方法[J];测绘学报;2013年02期

7 钱育蓉;于炯;贾振红;孙华;古丽给娜·达列力汗;;基于决策树的典型荒漠草地遥感分类策略[J];西北农林科技大学学报(自然科学版);2013年02期

8 于海达;杨秀春;徐斌;金云翔;高添;李金亚;;草原植被长势遥感监测研究进展[J];地理科学进展;2012年07期

9 张健康;程彦培;张发旺;岳德鹏;郭晓晓;董华;王计平;唐宏才;;基于多时相遥感影像的作物种植信息提取[J];农业工程学报;2012年02期

10 朱江洪;李江风;叶菁;;利用决策树工具的土地利用类型遥感识别方法研究[J];武汉大学学报(信息科学版);2011年03期


相关博士学位论文 前2条

1 于惠;青藏高原草地变化及其对气候的响应[D];兰州大学;2013年

2 刘庄;祁连山自然保护区生态承载力评价研究[D];南京师范大学;2004年


相关硕士学位论文 前8条

1 陆海霞;集成机器学习与面向对象影像分类的大区域林地信息提取及其泛化能力研究[D];兰州大学;2019年

2 王小鹏;基于弱监督深度学习的图像检索技术研究与实现[D];西北大学;2018年

3 李肖娟;气候变化和人类活动对祁连山草地演变影响程度的研究[D];陕西师范大学;2018年

4 韩希光;面向对象的高分辨率遥感影像土地覆被分类制图研究[D];兰州大学;2018年

5 蒋捷峰;基于BP神经网络的高分辨率遥感影像分类研究[D];首都师范大学;2011年

6 王富贵;祁连山自然保护区民族地区经济可持续发展研究[D];兰州大学;2010年

7 李励恒;祁连山自然保护区社会经济发展模式研究[D];兰州大学;2009年

8 刘祺;决策树ID3算法的改进研究[D];哈尔滨工程大学;2009年



本文编号:2880223

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiyanjiusheng/2880223.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户265be***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com