基于集成学习的雾霾污染预测研究
发布时间:2022-01-01 17:24
近年来,我国多个城市雾霾天气频繁出现,空气质量大幅下降,同时也给日常出行造成了很多不便,世界卫生组织于2019年将空气污染列为威胁全球健康的十大问题之一。目前我国政府持续加大对环境污染的治理力度,而改善雾霾污染是环境污染治理过程中的重点方向之一。国内外学者对雾霾污染的预测做了大量的研究,但是还存在指标单一,特征不足等问题。本文选用了邢台市逐日的空气污染因素及气象因素数据集作为研究对象。首先分析了邢台市近年来雾霾变化情况,发现2014-2016年雾霾情况一直向好转变,在2017年出现了轻微的波动。利用最大信息系数做相关性分析后得出,PM2.5浓度与空气污染因子的相关性较强,与气象因素的相关性强度整体偏弱。在模型构建阶段,根据时间序列数据的变动特点对数据集进行合理的预处理后,分别说明了长短时记忆网络,极端梯度提升和支持向量回归模型的构建过程,重点说明了各模型调参的方式,然后利用集成学习(Stacking)方法,将上述三个模型作为基学习器,极端梯度提升模型作为元学习器进行融合并做出预测,并设置对比模型来判断融合后模型的优劣。结果表明,本文构建的融合模型表现较好,对邢台市雾霾污染的预测研究有重...
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
简单RNN结构图
兰州大学硕士学位论文基于集成学习的雾霾污染预测研究10向量x,在进入隐藏层之前需要乘以权重矩阵U,隐藏层s看上去是一个循环,其实是由上一时刻隐藏层的值s和当前时刻的输入x一起决定的,因此在每新接收一个输入都会进行这个一个循环,W是上一时刻隐藏层作为输入的权重矩阵,V是隐藏层到输出层的权重矩阵,o是输出层向量,将上图展开,循环神经网络可以分解成更详细的结构如下:图2.2拆分后详细图在t时刻,输入值为tx,隐藏层的值是ts,输出层的值是to,to和ts的计算方法如下:1(),(),tttttogVssfUxWs(2.15)式(2.15)中,g表示激活函数,V表示权重矩阵。隐藏层是一个循环层,U表示输入值的权重矩阵,f表示激活函数,W表示t1时刻隐藏层输出作为输入的权重矩阵。反复将ts的计算方式带入to,可以得到:112123123()()(())((()))((((...)))).tttttttttttttttogVsVfUxWsVfUxWfUxWsVfUxWfUxWfUxWsVfUxWfUxWfUxWfUx(2.16)从上式可以看出,RNN最终的输出值to与前面时刻的输入值tx、t1x、t2x、t3x...有关,说明RNN可以向前输入任意多个值。2.3.2循环神经网络算法缺点当序列的时间跨度较长时,RNN的学习效果并不是很好,因为长序列的梯度在传递过程中很可能会发生梯度爆炸或者梯度消失,为了解决RNN的缺点,提出了长短时记忆网络,该网络顺利解决了RNN的缺点,从而有着更加优越的性能。
兰州大学硕士学位论文基于集成学习的雾霾污染预测研究112.4长短时记忆网络基本原理1997年Hochreiter和Schmidhuber提出了长短时记忆网络(Longshorttermmemory),简写为LSTM,LSTM在时间序列预测,语音识别等领域有着广泛应用。长短期记忆网络由RNN发展而来,在长序列中有着很好的表现。长短时记忆网络解决RNN缺点的思路如下:RNN的结构中隐藏层只有一个状态h,LSTM的解决方法是在原来隐藏层的基础上再增加一个状态c,状态c用来保存长期的状态,那么就能解决RNN在长序列训练过程中的问题了。如下图所示:图2.3LSTM模型与RNN模型对比图上图中新增加的c称为单元状态(cellstate)。下图是隐藏层的详细结构:图2.4展开后详细图由图2.4可以发现,状态c在接收到新的记忆信息后进行传递,输出值h随着状态c的传递也在不断变化。上图中LSTM接收三个输入向量,并产生两个输出向量。其中x、h、c都是向量。LSTM网络的记忆功能由状态c控制,LSTM模型使用了三个不同的开关来调整状态c。图2.5中,开关(1)负责控制保存记忆,开关(2)控制是否把状
【参考文献】:
期刊论文
[1]基于Stacking的地面PM2.5浓度估算[J]. 赵滨,刘斌. 环境工程. 2020(02)
[2]基于XGBoost的雾霾预测方法[J]. 张永梅,陈惠妮,张奕. 计算机工程与设计. 2019(12)
[3]空气细颗粒物PM2.5对人体各系统危害的研究[J]. 索丹凤,曾三武. 医学信息. 2019(18)
[4]浅谈大气治理的实现路径[J]. 邱永辉,王建国,徐佳娟. 建材与装饰. 2019(21)
[5]改进PSO-GA-BP的PM2.5浓度预测[J]. 张旭,杜景林. 计算机工程与设计. 2019(06)
[6]中国城市雾霾的形成与治理:从分析框架到实践创新[J]. 刘遥,陈子韬,吴建南. 城市发展研究. 2019(05)
[7]基于LSTM的PM2.5浓度预测模型[J]. 段大高,赵振东,梁少虎,杨伟杰,韩忠明. 计算机测量与控制. 2019(03)
[8]雾霾所致肺部损伤机制及研究概况[J]. 任雪珠,阎锡新. 国际呼吸杂志. 2018 (08)
[9]雾霾污染、政府治理与经济高质量发展[J]. 陈诗一,陈登科. 经济研究. 2018(02)
[10]基于灰狼群智能最优化的神经网络PM2.5浓度预测[J]. 石峰,楼文高,张博. 计算机应用. 2017(10)
硕士论文
[1]邢台市经济转型的接替产业选择研究[D]. 谭鑫.河北经贸大学 2016
[2]长江三角洲地区大气污染物人为源排放特征研究[D]. 翟一然.南京大学 2012
[3]基于资源约束的邢台市产业转型研究[D]. 王瑞科.石家庄经济学院 2011
本文编号:3562493
【文章来源】:兰州大学甘肃省 211工程院校 985工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
简单RNN结构图
兰州大学硕士学位论文基于集成学习的雾霾污染预测研究10向量x,在进入隐藏层之前需要乘以权重矩阵U,隐藏层s看上去是一个循环,其实是由上一时刻隐藏层的值s和当前时刻的输入x一起决定的,因此在每新接收一个输入都会进行这个一个循环,W是上一时刻隐藏层作为输入的权重矩阵,V是隐藏层到输出层的权重矩阵,o是输出层向量,将上图展开,循环神经网络可以分解成更详细的结构如下:图2.2拆分后详细图在t时刻,输入值为tx,隐藏层的值是ts,输出层的值是to,to和ts的计算方法如下:1(),(),tttttogVssfUxWs(2.15)式(2.15)中,g表示激活函数,V表示权重矩阵。隐藏层是一个循环层,U表示输入值的权重矩阵,f表示激活函数,W表示t1时刻隐藏层输出作为输入的权重矩阵。反复将ts的计算方式带入to,可以得到:112123123()()(())((()))((((...)))).tttttttttttttttogVsVfUxWsVfUxWfUxWsVfUxWfUxWfUxWsVfUxWfUxWfUxWfUx(2.16)从上式可以看出,RNN最终的输出值to与前面时刻的输入值tx、t1x、t2x、t3x...有关,说明RNN可以向前输入任意多个值。2.3.2循环神经网络算法缺点当序列的时间跨度较长时,RNN的学习效果并不是很好,因为长序列的梯度在传递过程中很可能会发生梯度爆炸或者梯度消失,为了解决RNN的缺点,提出了长短时记忆网络,该网络顺利解决了RNN的缺点,从而有着更加优越的性能。
兰州大学硕士学位论文基于集成学习的雾霾污染预测研究112.4长短时记忆网络基本原理1997年Hochreiter和Schmidhuber提出了长短时记忆网络(Longshorttermmemory),简写为LSTM,LSTM在时间序列预测,语音识别等领域有着广泛应用。长短期记忆网络由RNN发展而来,在长序列中有着很好的表现。长短时记忆网络解决RNN缺点的思路如下:RNN的结构中隐藏层只有一个状态h,LSTM的解决方法是在原来隐藏层的基础上再增加一个状态c,状态c用来保存长期的状态,那么就能解决RNN在长序列训练过程中的问题了。如下图所示:图2.3LSTM模型与RNN模型对比图上图中新增加的c称为单元状态(cellstate)。下图是隐藏层的详细结构:图2.4展开后详细图由图2.4可以发现,状态c在接收到新的记忆信息后进行传递,输出值h随着状态c的传递也在不断变化。上图中LSTM接收三个输入向量,并产生两个输出向量。其中x、h、c都是向量。LSTM网络的记忆功能由状态c控制,LSTM模型使用了三个不同的开关来调整状态c。图2.5中,开关(1)负责控制保存记忆,开关(2)控制是否把状
【参考文献】:
期刊论文
[1]基于Stacking的地面PM2.5浓度估算[J]. 赵滨,刘斌. 环境工程. 2020(02)
[2]基于XGBoost的雾霾预测方法[J]. 张永梅,陈惠妮,张奕. 计算机工程与设计. 2019(12)
[3]空气细颗粒物PM2.5对人体各系统危害的研究[J]. 索丹凤,曾三武. 医学信息. 2019(18)
[4]浅谈大气治理的实现路径[J]. 邱永辉,王建国,徐佳娟. 建材与装饰. 2019(21)
[5]改进PSO-GA-BP的PM2.5浓度预测[J]. 张旭,杜景林. 计算机工程与设计. 2019(06)
[6]中国城市雾霾的形成与治理:从分析框架到实践创新[J]. 刘遥,陈子韬,吴建南. 城市发展研究. 2019(05)
[7]基于LSTM的PM2.5浓度预测模型[J]. 段大高,赵振东,梁少虎,杨伟杰,韩忠明. 计算机测量与控制. 2019(03)
[8]雾霾所致肺部损伤机制及研究概况[J]. 任雪珠,阎锡新. 国际呼吸杂志. 2018 (08)
[9]雾霾污染、政府治理与经济高质量发展[J]. 陈诗一,陈登科. 经济研究. 2018(02)
[10]基于灰狼群智能最优化的神经网络PM2.5浓度预测[J]. 石峰,楼文高,张博. 计算机应用. 2017(10)
硕士论文
[1]邢台市经济转型的接替产业选择研究[D]. 谭鑫.河北经贸大学 2016
[2]长江三角洲地区大气污染物人为源排放特征研究[D]. 翟一然.南京大学 2012
[3]基于资源约束的邢台市产业转型研究[D]. 王瑞科.石家庄经济学院 2011
本文编号:3562493
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3562493.html