基于CatBoost算法的面向对象土地利用分类
发布时间:2021-11-07 04:28
为实现较高层次的遥感影像分类及有效去除高维特征的信息冗余,以Sentinel-2遥感影像为数据源,应用Cat Boost算法对龙江县进行了面向对象的土地利用分类。利用Cat Boost算法对全部特征集进行降维,分别使用Cat Boost、RF(Random Forest)和Ada Boost算法进行土地利用分类并对分类结果进行对比。研究结果表明,Cat Boost、RF和Ada Boost算法的Kappa系数均在0. 77以上,且Cat Boost算法的Kappa系数高达0. 911 4。因此Cat Boost分类法是土地利用分类的有效方法,为土地类型的划分提供了快捷可行的方法。
【文章来源】:吉林大学学报(信息科学版). 2020,38(02)
【文章页数】:7 页
【部分图文】:
研究区位置图
CatBoost使用次序原则,将TS值的计算依靠目前已经观察的样本集。基于贪婪算法选择树的结构,找出所有可能的分割方式,计算每种方式的惩罚函数,选择最小的,将结果分配给叶节点,后续叶节点重复此过程,在构建新树前进行随机重排,按梯度下降方向构建新树,CatBoost在不同的梯度提升步中使用不同的排列。CatBoost算法利用计算特征变量的重要性。其中c1,c2为叶节点中的文档数,v1,v2为叶节点中计算公式的值。通过计算48个特征变量的重要性,并根据其重要程度提取前20个特征变量(见图2)对高维数据进行降维,减少信息冗余,降低模型的时间复杂度。
建立CatBoost模型对研究区的主要土地利用类型,即建设用地、旱地、水田、草地、林地、河流、沼泽以及其他水域进行分类,结果如图3a所示,并与RF模型(见图3b)和AdaBoost模型(见图3c)的分类图对比可知,CatBoost算法仍然能清晰地区分各类地物以及在CatBoost特征选择下的RF和AdaBoost模型均达到较好的分类效果。计算混淆矩阵,对应的各类地物的制图精度、总体分类精度和Kappa系数如表2所示。CatBoost分类模型的总体精度为92.79%,Kappa系数为0.911 4,建设用地、旱地、水田、草地、林地、河流、沼泽及其他水域的制图精度分别为95.00%、95.45%、98.63%、73.91%、92.96%、90.00%、50.55%和93.33%。其中沼泽的分类情况较差,主要是由于在草相对茂盛的区域,沼泽与草地有相似的光谱特征,而且部分沼泽与林地的边界模糊,研究区所选取的沼泽的样本与河流和林地相邻,混合像元的数量相对较多,这也是导致沼泽和草地错分、漏分现象的主要原因;在本次研究中将内陆滩涂与河流划分为一类,一定时期内的内陆滩涂与少量农作物长势较差的旱地有相似的纹理与光谱特征,从而导致河流与旱地存在部分混淆;其余地物间的混淆主要由于光谱特征的相似性造成。但在总体评价上,该模型的分类精度较高,适用于研究区的土地利用分类。
【参考文献】:
期刊论文
[1]基于GF-1影像的东江流域面向对象土地利用分类[J]. 李恒凯,吴娇,王秀丽. 农业工程学报. 2018(10)
[2]训练样本对农作物遥感分类的精度影响研究[J]. 潘洪涛,王轩,王晓飞. 红外与激光工程. 2017(S1)
[3]Sentinel-2卫星影像的大气校正方法[J]. 苏伟,张明政,蒋坤萍,朱德海,黄健熙,王鹏新. 光学学报. 2018(01)
[4]基于随机森林算法的农耕区土地利用分类研究[J]. 马玥,姜琦刚,孟治国,李远华,王栋,刘骅欣. 农业机械学报. 2016(01)
[5]基于高分辨率遥感影像分类的城镇土地利用规划监测[J]. 张超,李智晓,李鹏山,杨建宇,朱德海. 农业机械学报. 2015(11)
[6]农业遥感研究与应用进展[J]. 赵春江. 农业机械学报. 2014(12)
[7]基于时间序列HJ-1/CCD数据的土地覆盖分类方法[J]. 仲波,马鹏,聂爱华,杨爱霞,姚延娟,吕文博,张航,柳钦火. 中国科学:地球科学. 2014(05)
[8]面向对象的土地利用/覆盖遥感分类方法与流程应用[J]. 郭琳,裴志远,吴全,刘跃辰,赵占营. 农业工程学报. 2010(07)
[9]面向对象的成都平原高分辨率遥感影像分类研究[J]. 林先成,李永树. 西南交通大学学报. 2010(03)
[10]基于决策树的遥感影像分类方法研究[J]. 李爽,张二勋. 地域研究与开发. 2003(01)
硕士论文
[1]基于Sentinel-2A的矿化蚀变异常信息提取分析与应用[D]. 王磊.西南科技大学 2018
[2]面向对象的高分辨率遥感影像多尺度分割参数及分类研究[D]. 王露.中南大学 2014
本文编号:3481162
【文章来源】:吉林大学学报(信息科学版). 2020,38(02)
【文章页数】:7 页
【部分图文】:
研究区位置图
CatBoost使用次序原则,将TS值的计算依靠目前已经观察的样本集。基于贪婪算法选择树的结构,找出所有可能的分割方式,计算每种方式的惩罚函数,选择最小的,将结果分配给叶节点,后续叶节点重复此过程,在构建新树前进行随机重排,按梯度下降方向构建新树,CatBoost在不同的梯度提升步中使用不同的排列。CatBoost算法利用计算特征变量的重要性。其中c1,c2为叶节点中的文档数,v1,v2为叶节点中计算公式的值。通过计算48个特征变量的重要性,并根据其重要程度提取前20个特征变量(见图2)对高维数据进行降维,减少信息冗余,降低模型的时间复杂度。
建立CatBoost模型对研究区的主要土地利用类型,即建设用地、旱地、水田、草地、林地、河流、沼泽以及其他水域进行分类,结果如图3a所示,并与RF模型(见图3b)和AdaBoost模型(见图3c)的分类图对比可知,CatBoost算法仍然能清晰地区分各类地物以及在CatBoost特征选择下的RF和AdaBoost模型均达到较好的分类效果。计算混淆矩阵,对应的各类地物的制图精度、总体分类精度和Kappa系数如表2所示。CatBoost分类模型的总体精度为92.79%,Kappa系数为0.911 4,建设用地、旱地、水田、草地、林地、河流、沼泽及其他水域的制图精度分别为95.00%、95.45%、98.63%、73.91%、92.96%、90.00%、50.55%和93.33%。其中沼泽的分类情况较差,主要是由于在草相对茂盛的区域,沼泽与草地有相似的光谱特征,而且部分沼泽与林地的边界模糊,研究区所选取的沼泽的样本与河流和林地相邻,混合像元的数量相对较多,这也是导致沼泽和草地错分、漏分现象的主要原因;在本次研究中将内陆滩涂与河流划分为一类,一定时期内的内陆滩涂与少量农作物长势较差的旱地有相似的纹理与光谱特征,从而导致河流与旱地存在部分混淆;其余地物间的混淆主要由于光谱特征的相似性造成。但在总体评价上,该模型的分类精度较高,适用于研究区的土地利用分类。
【参考文献】:
期刊论文
[1]基于GF-1影像的东江流域面向对象土地利用分类[J]. 李恒凯,吴娇,王秀丽. 农业工程学报. 2018(10)
[2]训练样本对农作物遥感分类的精度影响研究[J]. 潘洪涛,王轩,王晓飞. 红外与激光工程. 2017(S1)
[3]Sentinel-2卫星影像的大气校正方法[J]. 苏伟,张明政,蒋坤萍,朱德海,黄健熙,王鹏新. 光学学报. 2018(01)
[4]基于随机森林算法的农耕区土地利用分类研究[J]. 马玥,姜琦刚,孟治国,李远华,王栋,刘骅欣. 农业机械学报. 2016(01)
[5]基于高分辨率遥感影像分类的城镇土地利用规划监测[J]. 张超,李智晓,李鹏山,杨建宇,朱德海. 农业机械学报. 2015(11)
[6]农业遥感研究与应用进展[J]. 赵春江. 农业机械学报. 2014(12)
[7]基于时间序列HJ-1/CCD数据的土地覆盖分类方法[J]. 仲波,马鹏,聂爱华,杨爱霞,姚延娟,吕文博,张航,柳钦火. 中国科学:地球科学. 2014(05)
[8]面向对象的土地利用/覆盖遥感分类方法与流程应用[J]. 郭琳,裴志远,吴全,刘跃辰,赵占营. 农业工程学报. 2010(07)
[9]面向对象的成都平原高分辨率遥感影像分类研究[J]. 林先成,李永树. 西南交通大学学报. 2010(03)
[10]基于决策树的遥感影像分类方法研究[J]. 李爽,张二勋. 地域研究与开发. 2003(01)
硕士论文
[1]基于Sentinel-2A的矿化蚀变异常信息提取分析与应用[D]. 王磊.西南科技大学 2018
[2]面向对象的高分辨率遥感影像多尺度分割参数及分类研究[D]. 王露.中南大学 2014
本文编号:3481162
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/3481162.html