基于机器学习的参考作物蒸散量估算研究
发布时间:2022-01-20 09:45
参考作物蒸散量(Reference Evapotranspiration, ET0)的准确估算对区域水资源管理和分配、流域水量平衡以及气候变化等研究具有重要作用。新疆地处我国西北干旱地区,水资源供需矛盾尖锐,精确估算该地区的ET0有助于其科学合理地调配水资源,缓解水资源供需压力。FAO推荐的Penman-Monteith法是计算ET0的标准方法,但该方法需要多项气象因子,而新疆地区气象站点较少且分布不均,精确完备的气象数据在新疆大部分区域难以获取。因此,如何使用有限气象因子获取高精度的ET0在新疆地区备受关注。本文基于中国气象数据网提供的新疆地区1980—2019年的地面气候资料日值数据集,在日和月尺度下,通过对最高气温Tmax、最低气温Tmin、平均气温Tavg、风速U2、相对湿度RH和日照时数n共6项气象因子进行敏感性分析,形成不同的气象因子组合;然后使用SVM、RF、GBDT和ELM 4种机器学习算法,以FAO-56 PM计算值为标准值,对新疆地区的ET0进行了拟合建模;最后,从拟合精度、稳定性和计算代价3个方面对模型进行评价。研究表明:①在新疆地区,ET0对RH、Tmax和U2...
【文章来源】:地球信息科学学报. 2020,22(08)北大核心CSCD
【文章页数】:10 页
【部分图文】:
新疆区域41个气象站点分布情况
本文技术路线如图2所示,首先需做3个方面的准备:(1)通过对气象因子进行敏感性分析,形成不同的气象因子组合,作为输入参数;(2)使用FAO-56PM公式计算ET0,作为算法训练的标准值;(3)对数据集进行处理,分割为训练集和测试集。然后,使用训练集对SVM、RF、GBDT和ELM 4种机器学习算法进行训练,获得相应的模型。最后,本文将从精度、稳定性和计算代价3个方面对模型进行评价。3.2 气象因子敏感性分析
在日尺度上,SVM精度高于GBDT,而在月尺度,GBDT与SVM精度相当。这是由于GBDT是基于树的集成模型,其原理以解决离散的分类问题为目标,导致其在用于连续的回归问题时,与其他模型相比,对数据分布的连续性依赖较高。而本文所使用的月尺度数据是由日尺度数据平均得到,与日尺度数据相比,数据的特征分布被缩小,因此GBDT更容易学习到精度高的模型。GBDT在两种时间尺度上,精度都高于RF,这主要是因为GBDT在训练过程中,后一颗树会对前一颗树的较差结果进行权值校正,逐步提升拟合结果;而平均方法的RF,无法对精度较差的树进行校正,若精度较差的树的数量较多,模型最终精度将被降低。ELM算法得到的模型整体上精度比其他算法差,但对比其在测试集和训练集的精度,并没有过拟合现象。Wen等[2]曾在干旱区对比了SVM和ANN对日ET0的拟合效果,发现ANN模型精度低于SVM模型,与本文结果一致。因此,ELM模型较差的主要原因在于其是一种单隐藏层ANN模型,与其他模型相比,对干旱区域蒸散的复杂过程拟合效果较差。图4 日尺度和月尺度下机器学习模型的计算代价折线图
【参考文献】:
期刊论文
[1]基于神经网络算法的广东省典型代表站点ET0简化计算模型研究[J]. 赵文刚,马孝义,刘晓群,石林,宋雯. 灌溉排水学报. 2019(05)
[2]近56年西南地区四季参考作物蒸散量变化成因分析[J]. 刘悦,崔宁博,李果,罗万琦,廖功磊,王禄涛. 节水灌溉. 2018(12)
[3]蝙蝠算法优化极限学习机模拟参考作物蒸散量[J]. 吴立峰,鲁向晖,刘小强,张苏扬,刘明美,董建华. 排灌机械工程学报. 2018(09)
[4]基于ELM的西北旱区参考作物蒸散量预报模型[J]. 张皓杰,崔宁博,徐颖,钟丹,胡笑涛,龚道枝. 排灌机械工程学报. 2018(08)
[5]基于随机森林算法的参考作物蒸发蒸腾量模拟计算[J]. 王升,付智勇,陈洪松,丁亚丽,吴丽萍,王克林. 农业机械学报. 2017(03)
[6]基于极限学习机的参考作物蒸散量预测模型[J]. 冯禹,崔宁博,龚道枝,魏新平,王君勤. 农业工程学报. 2015(S1)
[7]随机森林算法基本思想及其在生态学中的应用——以云南松分布模拟为例[J]. 张雷,王琳琳,张旭东,刘世荣,孙鹏森,王同立. 生态学报. 2014(03)
本文编号:3598602
【文章来源】:地球信息科学学报. 2020,22(08)北大核心CSCD
【文章页数】:10 页
【部分图文】:
新疆区域41个气象站点分布情况
本文技术路线如图2所示,首先需做3个方面的准备:(1)通过对气象因子进行敏感性分析,形成不同的气象因子组合,作为输入参数;(2)使用FAO-56PM公式计算ET0,作为算法训练的标准值;(3)对数据集进行处理,分割为训练集和测试集。然后,使用训练集对SVM、RF、GBDT和ELM 4种机器学习算法进行训练,获得相应的模型。最后,本文将从精度、稳定性和计算代价3个方面对模型进行评价。3.2 气象因子敏感性分析
在日尺度上,SVM精度高于GBDT,而在月尺度,GBDT与SVM精度相当。这是由于GBDT是基于树的集成模型,其原理以解决离散的分类问题为目标,导致其在用于连续的回归问题时,与其他模型相比,对数据分布的连续性依赖较高。而本文所使用的月尺度数据是由日尺度数据平均得到,与日尺度数据相比,数据的特征分布被缩小,因此GBDT更容易学习到精度高的模型。GBDT在两种时间尺度上,精度都高于RF,这主要是因为GBDT在训练过程中,后一颗树会对前一颗树的较差结果进行权值校正,逐步提升拟合结果;而平均方法的RF,无法对精度较差的树进行校正,若精度较差的树的数量较多,模型最终精度将被降低。ELM算法得到的模型整体上精度比其他算法差,但对比其在测试集和训练集的精度,并没有过拟合现象。Wen等[2]曾在干旱区对比了SVM和ANN对日ET0的拟合效果,发现ANN模型精度低于SVM模型,与本文结果一致。因此,ELM模型较差的主要原因在于其是一种单隐藏层ANN模型,与其他模型相比,对干旱区域蒸散的复杂过程拟合效果较差。图4 日尺度和月尺度下机器学习模型的计算代价折线图
【参考文献】:
期刊论文
[1]基于神经网络算法的广东省典型代表站点ET0简化计算模型研究[J]. 赵文刚,马孝义,刘晓群,石林,宋雯. 灌溉排水学报. 2019(05)
[2]近56年西南地区四季参考作物蒸散量变化成因分析[J]. 刘悦,崔宁博,李果,罗万琦,廖功磊,王禄涛. 节水灌溉. 2018(12)
[3]蝙蝠算法优化极限学习机模拟参考作物蒸散量[J]. 吴立峰,鲁向晖,刘小强,张苏扬,刘明美,董建华. 排灌机械工程学报. 2018(09)
[4]基于ELM的西北旱区参考作物蒸散量预报模型[J]. 张皓杰,崔宁博,徐颖,钟丹,胡笑涛,龚道枝. 排灌机械工程学报. 2018(08)
[5]基于随机森林算法的参考作物蒸发蒸腾量模拟计算[J]. 王升,付智勇,陈洪松,丁亚丽,吴丽萍,王克林. 农业机械学报. 2017(03)
[6]基于极限学习机的参考作物蒸散量预测模型[J]. 冯禹,崔宁博,龚道枝,魏新平,王君勤. 农业工程学报. 2015(S1)
[7]随机森林算法基本思想及其在生态学中的应用——以云南松分布模拟为例[J]. 张雷,王琳琳,张旭东,刘世荣,孙鹏森,王同立. 生态学报. 2014(03)
本文编号:3598602
本文链接:https://www.wllwen.com/nykjlw/nyxlw/3598602.html