当前位置:主页 > 论文百科 > 森林论文 >

基于决策树集成学习的桉树蓄积预估模型研究

发布时间:2024-05-08 23:44
  林分蓄积是衡量小班林分生产力的重要指标。以广西高峰林场速生桉为研究对象,以年龄、密度两个林分因子和坡向、坡位、坡度、土壤等立地因子作为自变量,公顷蓄积作为因变量,利用非集成、集成学习方法构建9个决策树模型,选择最优决策树模型预估不同年龄的桉树蓄积。结果表明:①集成学习决策树模型精度高于非集成模型,串行集成类模型boosting精度高于并行集成类模型bagging,其中串行集成模型中XGboost模型评价指标最优,训练集R2为0.81,RMSE为0.44;测试集RMSE为0.48,MAE为0.34。②最优模型XGboost自变量重要性占比大于1%,依次为年龄(78%)、海拔(4.9%)、土层厚度(3.8%)以及密度(3.2%),其中年龄重要性远高于其他变量,纵向海拔高度影响大于空间位置上的横向坡度,造林密度影响程度低于土壤因素。③模型结果在广西其他地区同树种泛化测试精度R2为0.785,P值为2.2E-16,符合检验标准,说明该模型针对广西部分地区速生桉树种生产力预估结果较好,可以为林场造林收获预估提供依据。

【文章页数】:10 页

【部分图文】:

图1模型构建流程

图1模型构建流程

模型构建分为数据清洗与预处理、特征选择与数据集划分和训练模型构建与调优三步,具体流程如图1所示。采用统计软件R3.5.4调用相关包进行模型训练、验证与结果分析。Step1:数据清洗与预处理。数据预处理按顺序包括干扰数据清除、定性因子量化处理与数据标准化处理。广西壮族自治区速生桉....


图2理论可用性预训练与修正训练结果

图2理论可用性预训练与修正训练结果

预训练和修正训练结果得到图2所示。发现第5a蓄积量相较第4a增长量较小,整体不符合S型生长曲线,因此返回数据预处理阶段进行数据再处理。分析原因,该地区桉树主伐年龄为5a,在二类调查时对n<年龄<n+1的桉树年龄全部记录为(n+1)a,即第6a蓄积的实际年龄为5a零....


图3三种模型自变量重要性对比

图3三种模型自变量重要性对比

表5模型训练与测试结果Table5Summarystatisticsoffittingandvalidationofninemodels模型Model基学习器Baselearner训练数据集Trainingset测试数据集Testingse....


图4XGboost模型在泛化测试数据集上残差图

图4XGboost模型在泛化测试数据集上残差图

表6蓄积预估结果Table6Predictionstatisticsofvolume年龄Age/a最小值Min.最大值Max.平均值Mean标准差Standarddeviation17.8336.2120.836.3228.4176.77....



本文编号:3967998

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/mfmb/3967998.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户63191***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com