基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究
【学位单位】:兰州大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:S812
【部分图文】:
技术路线图
兰州大学硕士学位论文基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究14越大。图2-1决策树示意图C4.5算法继承了ID3算法的优点,采用信息增益率(信息增益与内在信息的比值)作为测试特征选择的度量标准。内在信息是指单个特征信息分支所需要的信息量。内在信息量与值数量成正比,可校正值数量对信息增益率的影响,克服了在选择信息增益的属性时,存有多个属性值的偏向选择的缺点。在构造树的过程中进行修剪可实现连续属性的离散化,并且可以处理不完整的数据。2.2.2随机森林随机森林(RandomForest,RF)[76]是集成算法中的一种,它依靠决策树的投票选择来决定最后的分类结果(图2-2)。自2001年随机森林算法被提出以来,在遥感影像信息提取领域得到了不断的改进,被证明是一种具有鲁棒性的分类器[77]。其基本思想是在训练数据和相关变量的随机子集上生长多棵决策树,随机森林通过聚合单棵决策树的不同输出来减少可能导致决策树错误的方差。通过多数投票算法,可以找到大多数单棵树给出的平均输出,从而平滑了方差,这样的集成在复杂的数据集上表现出了鲁棒和准确的性能,几乎不需要进行微调,并且可以抑制有许多噪声的变量[42]。随机森林为了保证较强的抗过拟合和抗噪声能力,在构建每一棵CART决策树的时候采用了行抽样和列抽样的随机化。行抽样是指:假设训练集的数据行数为N,对于每一棵CART树,从N个原始样本中有放回地随机抽取N个作为单棵树的训练集。假设随机森林中CART树数目为K,那么通过该办法生成K个独立的训练集用于CART的训练。列抽样是指:假设原始数据集的特征数为
兰州大学硕士学位论文基于邻域影像重叠实现特征迁移机器学习的大区域草地分布提取方法研究15M,在通过行采样获取每棵CART树的训练集后,随机森林会随机选取m个特征(m<M)训练用于每一棵CART树的生成。当m越小时,模型的抗干扰性和抗过拟合性越强,但是模型的准确率会下降,因此在实际建模过程中,常需要用交叉验证等方式选择合适的m值。图2-2随机森林示意图2.2.3支持向量机支持向量机(SupportVectorMachines,SVM)是一种非参数监督学习分类器算法,在遥感应用中得到了越来越广泛的应用[78]。SVM理论最初由Vapnik和Chervonenkis在1971年提出[79],在1999年由Vapnik详细讨论[80]。支持向量机是一个二分类算法,支持线性分类和非线性分类。其基本思想是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,并将其作为决策边界区分不同的类[45]。图2-3[81]为二维输入空间中一个二分类问题的简单场景。术语“最佳分离超平面”是指在训练步骤中获得的最小化误分类的决策边界,即图2-3(a)中黑色实线。在虚线上被蓝色和红色圆圈圈出的点即为支持向量。所谓支持向量是指距离分隔超平面最近的点。关于二元分类的问题,若是有一个分离超平面可以分离不同类别的数据(也就是说,两种类型的数据恰好位于超平面的两侧),则称为线性可分。如果没有这样的超平面,则称其为线性不可分的。在现实分类的过程中,训练数据集中会包含有噪声,而且手动的添加训练样本类别的过程中也可能存在一些误差,因此,训练集数据的分类函数不需要太完美,太完美会使模型本身过拟合,对其他数据难以适应。为了纠正这些分类中容易出现的错误,
【参考文献】
相关期刊论文 前10条
1 任海娟;董建军;李晓媛;牛建明;张雪峰;;利用多时相Landsat8图像提取苜蓿人工草地信息[J];中国草地学报;2015年02期
2 吴田军;骆剑承;夏列钢;杨海平;沈占锋;胡晓东;;迁移学习支持下的遥感影像对象级分类样本自动选择方法[J];测绘学报;2014年09期
3 郭钇宏;王博;刘勇;杨亦宁;;综合优度法和不一致性法的最优分割参数选择方法[J];遥感技术与应用;2014年03期
4 牛赟;刘贤德;敬文茂;雷军;苗毓新;;祁连山北坡土壤特性与植被垂直分布的关系[J];山地学报;2013年05期
5 汪有奎;;祁连山国家级自然保护区有效管理评价研究[J];中南林业科技大学学报(社会科学版);2013年04期
6 吴炜;沈占锋;李均力;杨海平;骆剑承;;联合概率密度脊提取的影像镶嵌色彩一致性处理方法[J];测绘学报;2013年02期
7 钱育蓉;于炯;贾振红;孙华;古丽给娜·达列力汗;;基于决策树的典型荒漠草地遥感分类策略[J];西北农林科技大学学报(自然科学版);2013年02期
8 于海达;杨秀春;徐斌;金云翔;高添;李金亚;;草原植被长势遥感监测研究进展[J];地理科学进展;2012年07期
9 张健康;程彦培;张发旺;岳德鹏;郭晓晓;董华;王计平;唐宏才;;基于多时相遥感影像的作物种植信息提取[J];农业工程学报;2012年02期
10 朱江洪;李江风;叶菁;;利用决策树工具的土地利用类型遥感识别方法研究[J];武汉大学学报(信息科学版);2011年03期
相关博士学位论文 前2条
1 于惠;青藏高原草地变化及其对气候的响应[D];兰州大学;2013年
2 刘庄;祁连山自然保护区生态承载力评价研究[D];南京师范大学;2004年
相关硕士学位论文 前8条
1 陆海霞;集成机器学习与面向对象影像分类的大区域林地信息提取及其泛化能力研究[D];兰州大学;2019年
2 王小鹏;基于弱监督深度学习的图像检索技术研究与实现[D];西北大学;2018年
3 李肖娟;气候变化和人类活动对祁连山草地演变影响程度的研究[D];陕西师范大学;2018年
4 韩希光;面向对象的高分辨率遥感影像土地覆被分类制图研究[D];兰州大学;2018年
5 蒋捷峰;基于BP神经网络的高分辨率遥感影像分类研究[D];首都师范大学;2011年
6 王富贵;祁连山自然保护区民族地区经济可持续发展研究[D];兰州大学;2010年
7 李励恒;祁连山自然保护区社会经济发展模式研究[D];兰州大学;2009年
8 刘祺;决策树ID3算法的改进研究[D];哈尔滨工程大学;2009年
本文编号:2880223
本文链接:https://www.wllwen.com/shoufeilunwen/zaizhiyanjiusheng/2880223.html