基于集成学习的O 3 浓度逐小时预测模型研究
发布时间:2021-11-21 07:30
对流层臭氧(O3)浓度不断增长已成为全球聚焦的环境问题之一。我国全方位飞速发展的同时,也面临着大范围O3污染的窘境。研究表明长时间暴露在高浓度O3环境中,会对人体健康、动植物生长乃至整个生态环境造成严重危害。然而O3污染成因复杂,治理困难,在此情况下建立及时准确的O3浓度预测模型就显得尤为重要。本文以上海市浦东新区监测站为例,围绕构建准确可靠的O3浓度小时预测模型为核心目标展开相关研究,研究内容主要包括以下几个方面:(1)选取20152016年与O3相关的历史多指标变量为研究数据。实验发现当邻近点被赋予最优权重时,KNN算法的预测精度能够得到大幅度提升,本文将优化的KNN算法用于填补原始数据中缺失比例较低的样本,可以使研究数据的整体质量得到最大限度的保障。(2)通过计算多指标与未来124h延时O3浓度之间的Pearson相关系数,探究多指标对不同延时O3
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
预测偏差与预测方差
成得到的机器学习方法:随机森林、GBDT 和 XGBoost 分别用于训练未来 1~24的 O3浓度回归预测模型,并使用 Stacking 将三种算法进行融合,以期实现预测精度的进一步提升。其中随机森林实质上是以 CART 为基学习器构建的 Baggin集成算法,而 GBDT 和 XGBoost 实质上是以 CART 为基学习器构建的 Boostin集成算法,为了更好地了解这三种算法的构造原理,及最后三种模型的融合过程下面从 Bagging、Boosting 和 Stacking 的集成思路展开介绍。2.2.1 Bagging装袋(Bagging)是 1996 年 Breiman[40]提出的集成学习方法,其主要思想是将多个独立的基学习器的预测结果进行整理得到最终结果,所有学习器的构造过程均是并行的。当预测目标为连续性数值型数据时,以多个预测结果的平均值作为最终结果,预测目标为离散型的数据时,通过投票将基学习器中预测结果最多的一类作为最后的预测结果。Bagging 实现原理如图 2-2 所示。
师范大学 2018 届硕士学位论文 第 2 章 研的是学习能力弱的算法,其预测精度仅仅优于随机猜测的概率。Boost代算法,通过给每个训练样本赋予权值,迭代地学习若干个学习器。训习器 时,对训练样本的权值重新替换, 学习器中预测错误的样本将较大的权值,反之,预测正确的样本将被给予较小的权值。将权值替换集用于训练之后的学习器 。由于权重不断被更新,学习器 将会学习器 预测错误的样本,从而通过不断弥补前一个弱分类器的不足来造一个强学习器。最终得到的强学习器 F 是根据每个基学习器的分类其赋予相应的权重,并通过加权融合得到最后的预测结果[44]。Boosting详见图 2-3。
【参考文献】:
期刊论文
[1]气象条件对沈阳市环境空气臭氧浓度影响研究[J]. 王闯,王帅,杨碧波,张丽辉,王磊,刘闽. 中国环境监测. 2015(03)
[2]长江三角洲地区城市臭氧污染特征与影响因素分析[J]. 易睿,王亚林,张殷俊,史宇,李名升. 环境科学学报. 2015(08)
[3]国内外空气质量模型研究进展[J]. 薛文博,王金南,杨金田,雷宇,汪艺梅,陈曦. 环境与可持续发展. 2013(03)
[4]基于广义线性模型的地表臭氧浓度的预测[J]. 张浩,蒋艳斌,孙巍,Ahmet Palazoglu. 清华大学学报(自然科学版). 2012(03)
[5]神经网络模型在O3浓度预测中的应用[J]. 沈路路,王聿绚,段雷. 环境科学. 2011(08)
[6]中国地区臭氧前体物对地面臭氧的影响[J]. 漏嗣佳,朱彬,廖宏. 大气科学学报. 2010(04)
[7]集合数值预报系统在上海市空气质量预测预报中的应用研究[J]. 王茜,伏晴艳,王自发,王体健,刘萍,陆涛,林陈渊,段玉森,黄嫣旻. 环境监控与预警. 2010(04)
[8]城市环境空气污染预报研究进展[J]. 任万辉,苏枞枞,赵宏德. 环境保护科学. 2010(03)
[9]天津臭氧浓度与气象因素的相关性及其预测方法[J]. 姚青,孙玫玲,刘爱霞. 生态环境学报. 2009(06)
[10]近地层O3污染对陆地生态系统的影响[J]. 寇太记,常会庆,张联合,徐晓峰,郭大勇,周文利,朱建国,苗艳芳. 生态环境学报. 2009(02)
博士论文
[1]集成学习中若干关键问题的研究[D]. 王清.复旦大学 2011
[2]北京大气臭氧浓度变化特征及其形成机制研究[D]. 安俊琳.南京信息工程大学 2007
硕士论文
[1]基于数值预报的空气质量预测模型的研究[D]. 姚文强.浙江理工大学 2017
[2]北京城区臭氧浓度变化规律及预测方法研究[D]. 张文方.北京林业大学 2010
[3]上海市近地层臭氧浓度时间序列混沌预报模式研究[D]. 张建磊.华东师范大学 2007
本文编号:3509065
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:75 页
【学位级别】:硕士
【部分图文】:
预测偏差与预测方差
成得到的机器学习方法:随机森林、GBDT 和 XGBoost 分别用于训练未来 1~24的 O3浓度回归预测模型,并使用 Stacking 将三种算法进行融合,以期实现预测精度的进一步提升。其中随机森林实质上是以 CART 为基学习器构建的 Baggin集成算法,而 GBDT 和 XGBoost 实质上是以 CART 为基学习器构建的 Boostin集成算法,为了更好地了解这三种算法的构造原理,及最后三种模型的融合过程下面从 Bagging、Boosting 和 Stacking 的集成思路展开介绍。2.2.1 Bagging装袋(Bagging)是 1996 年 Breiman[40]提出的集成学习方法,其主要思想是将多个独立的基学习器的预测结果进行整理得到最终结果,所有学习器的构造过程均是并行的。当预测目标为连续性数值型数据时,以多个预测结果的平均值作为最终结果,预测目标为离散型的数据时,通过投票将基学习器中预测结果最多的一类作为最后的预测结果。Bagging 实现原理如图 2-2 所示。
师范大学 2018 届硕士学位论文 第 2 章 研的是学习能力弱的算法,其预测精度仅仅优于随机猜测的概率。Boost代算法,通过给每个训练样本赋予权值,迭代地学习若干个学习器。训习器 时,对训练样本的权值重新替换, 学习器中预测错误的样本将较大的权值,反之,预测正确的样本将被给予较小的权值。将权值替换集用于训练之后的学习器 。由于权重不断被更新,学习器 将会学习器 预测错误的样本,从而通过不断弥补前一个弱分类器的不足来造一个强学习器。最终得到的强学习器 F 是根据每个基学习器的分类其赋予相应的权重,并通过加权融合得到最后的预测结果[44]。Boosting详见图 2-3。
【参考文献】:
期刊论文
[1]气象条件对沈阳市环境空气臭氧浓度影响研究[J]. 王闯,王帅,杨碧波,张丽辉,王磊,刘闽. 中国环境监测. 2015(03)
[2]长江三角洲地区城市臭氧污染特征与影响因素分析[J]. 易睿,王亚林,张殷俊,史宇,李名升. 环境科学学报. 2015(08)
[3]国内外空气质量模型研究进展[J]. 薛文博,王金南,杨金田,雷宇,汪艺梅,陈曦. 环境与可持续发展. 2013(03)
[4]基于广义线性模型的地表臭氧浓度的预测[J]. 张浩,蒋艳斌,孙巍,Ahmet Palazoglu. 清华大学学报(自然科学版). 2012(03)
[5]神经网络模型在O3浓度预测中的应用[J]. 沈路路,王聿绚,段雷. 环境科学. 2011(08)
[6]中国地区臭氧前体物对地面臭氧的影响[J]. 漏嗣佳,朱彬,廖宏. 大气科学学报. 2010(04)
[7]集合数值预报系统在上海市空气质量预测预报中的应用研究[J]. 王茜,伏晴艳,王自发,王体健,刘萍,陆涛,林陈渊,段玉森,黄嫣旻. 环境监控与预警. 2010(04)
[8]城市环境空气污染预报研究进展[J]. 任万辉,苏枞枞,赵宏德. 环境保护科学. 2010(03)
[9]天津臭氧浓度与气象因素的相关性及其预测方法[J]. 姚青,孙玫玲,刘爱霞. 生态环境学报. 2009(06)
[10]近地层O3污染对陆地生态系统的影响[J]. 寇太记,常会庆,张联合,徐晓峰,郭大勇,周文利,朱建国,苗艳芳. 生态环境学报. 2009(02)
博士论文
[1]集成学习中若干关键问题的研究[D]. 王清.复旦大学 2011
[2]北京大气臭氧浓度变化特征及其形成机制研究[D]. 安俊琳.南京信息工程大学 2007
硕士论文
[1]基于数值预报的空气质量预测模型的研究[D]. 姚文强.浙江理工大学 2017
[2]北京城区臭氧浓度变化规律及预测方法研究[D]. 张文方.北京林业大学 2010
[3]上海市近地层臭氧浓度时间序列混沌预报模式研究[D]. 张建磊.华东师范大学 2007
本文编号:3509065
本文链接:https://www.wllwen.com/kejilunwen/huanjinggongchenglunwen/3509065.html