基于支持向量回归机的PM2.5浓度预测模型分析与研究
本文关键词:基于支持向量回归机的PM2.5浓度预测模型分析与研究
【摘要】:近年来,雾霾天气越来越大范围和频繁的发生,其严重影响人们的身体健康和人们的正常生活,其中又以雾霾的主要产生原因即细微颗粒物PM2.5更是人们关心的热点话题;尤其在每年冬季中国大部分城市都会遇到雾霾高频发高峰期,在雾霾天气中PM2.5浓度很高,对人的身体造成危害会更加严重,其增加呼吸道感染的风险和加重心肺疾病、心脑血管病等症状;空气质量问题不仅给人类健康造成了严重影响,同时对人们的生活出行造成困恼。随着人们的生活质量不断提高,不仅对健康意识有所提高,也迅速提高了对空气质量的关心度。在空气质量状况日益严峻的情况下,只进行空气质量实时监测和发布往往满足不了人们的需求。对空气质量未来状态的变化趋向进行探究,展开空气质量监测、预报任务,对空气污染的防预治理和人们的健康、生活都有着重大现实意义。基于上述问题研究背景本文所研究就是针对空气质量的重要指标之一细微颗粒物PM2.5浓度建立预测模型;以便对这项影响到人们正常生活的污染物浓度做出精确预报,提供未来某段时间的细微颗粒物浓度信息。本文研究的主要内容为:首先,主要介绍了网页爬虫程序涉及的相关技和具体的程序实现过程,该程序能够自动获取一些实时公布的污染物浓度数据和气象数据;同时也介绍了程序具体编码实现中遇到的技术难题和解决方法。其次,探究影响细微颗粒物PM2.5浓度的关键因素,详细的分析了PM2.5与影响因素之间的相关性;同时又考虑到本文抓取是实时发布的时序序列数据,显然过去的污染物浓度和气象条件状态对未来PM2.5浓度变化会有滞后性影响,因此在本文中利用了自回归滞后模型相关理论分析了各个影响因素滞后性对PM2.5浓度变化影响,确定了各个因素的滞后期阶数,以便更好的选择输入特征向量,这为建立模型确定输入特征提供了有力基础。然后,系统性的阐述了本文所用的核心算法支持向量回归机相关知识及算法思想。支持向量机是一种较流行的分类技术,有着扎实的统计学理论基础,并在许多实际应用中展现了不错的实践效用。起初支持向量机的应用是应用在分类问题上,后来人们对其进一步拓展到回归应用问题中,也就出现了支持向量回归机,并在数据预测领域开辟了新的途径。最后,本文详细描述了建立预测模型的步骤,分析试验结果,并根据评价指标检验预测效果。本文在数据库中选取了自2015年7月1日至2015年12月28日成都市的PM2.5浓度、其他空气污染物浓度以及天气因素等历史每小时数据,经过相关性分析和滞后性分析之后,确定各个影响因素的滞后期阶数;再利用支持向量回归机算法建立单步预测模型,在模型调整合适的参数下,考虑到各因素的滞后阶数不同,模型输入向量个数会有所不同,从而对模型预测结果产生影响,因此对多种滞后期阶数的选择给模型带来效果差异进行分析与比较;试验结果表明在不考虑影响因素滞后性比考虑滞后性的预测效果要差,同时考虑的滞后阶数为2、3期时预测效果最好,而且滞后阶数越长预测效果也逐渐变差。在做单步预测时,考虑滞后阶数为二期时,模型评价指标MSE值为16.6,R2值为0.9667,MAPE值为0.0522;不考虑滞后性时,模型评价指标MSE值为23.41,R2值0.9533,MAPE值为0.0628。整体上利用支持向量回归机模型对PM2.5浓度的单步预测效果还是比较理想。之后,在基于单步预测的基础上,以最佳的滞后阶数建立了多步预测模型,并对多步预测的结果做了综合比较分析;由于在进行多步预测时,每步预测都需要上次预测的输出作为输入,所以在这种迭代的过程中,上一次的预测结果会影响在接下来时间点的预测结果,误差也就会逐步积累直到最后,预测效果逐步减弱。结果分析显示,利用支持向量回归机(SVR)建立预测模型能精确地预测未来时段的PM2.5浓度,并有着较高的推广能力。
【关键词】:PM2.5 网页爬虫 滞后性 SVR 预测
【学位授予单位】:西南财经大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:X51;TP18
【目录】:
- 摘要4-6
- Abstract6-10
- 1. 绪论10-18
- 1.1 研究背景和意义10-12
- 1.2 国内外研究现状12-16
- 1.2.1 细微颗粒物与气象条件关系研究12-13
- 1.2.2 空气质量预测研究现状13-16
- 1.3 本文研究内容16-17
- 1.4 论文结构安排17-18
- 2. 数据准备18-42
- 2.1 网页抓爬程序实现过程18-23
- 2.1.1 程序实现的技术18-22
- 2.1.2 程序实现的过程22-23
- 2.2 网页抓取过程遇到问题及解决方案23-27
- 2.2.1 乱码问题23-24
- 2.2.2 IP封锁问题24-27
- 2.3 数据存储表结构设计27-29
- 2.4 数据预处理29
- 2.5 数据相关分析29-38
- 2.5.1 相关理论30-31
- 2.5.2 相关性分析结果31-38
- 2.6 数据序列滞后期分析38-41
- 2.6.1 相关理论38-39
- 2.6.2 滞后期估计分析结果39-41
- 2.7 本章小结41-42
- 3. 支持向量机介绍42-49
- 3.1 统计学习理论42-43
- 3.2 支持向量机43-46
- 3.3 支持向量回归机46-48
- 3.4 本章小结48-49
- 4. 预测模型设计与实验分析49-58
- 4.1 试验数据49-50
- 4.2 试验评测指标50-51
- 4.3 试验环境和步骤51
- 4.4 单步预测51-54
- 4.4.1 参数和特征选择51-52
- 4.4.2 建立模型和试验结果分析52-54
- 4.5 多步预测54-56
- 4.6 本章小结56-58
- 5. 总结与展望58-60
- 5.1 总结58-59
- 5.2 展望59-60
- 参考文献60-64
- 致谢64-65
【相似文献】
中国期刊全文数据库 前10条
1 草威;;上班大冒险,节日大作战 PM2.5有多可怕?[J];职场;2012年01期
2 本刊编辑部;;环保部酝酿将PM2.5列入约束性指标加大环保投入[J];华北电力技术;2013年04期
3 钟和;;PM2.5:环境空气质量标准监测新对象[J];金秋;2012年05期
4 ;《环境空气质量标准》二次公开征求意见环境保护部拟制定PM2.5标准[J];油气田环境保护;2011年06期
5 李鸿雁;;聚焦PM2.5——部分防治措施加深关联汽车行业[J];商用汽车;2012年02期
6 张凌艳;;环境空气PM2.5的监测与分析[J];资源节约与环保;2013年10期
7 侯立安;;绿色建筑人居环境PM2.5的污染防控对策[J];中国建设信息;2013年15期
8 陈希;;从辩证唯物主义自然观看PM2.5的监测[J];经营管理者;2013年30期
9 刘志锋;李伟;;机动车PM2.5排放特性研究[J];汽车工业研究;2014年02期
10 王海滨;;不排放PM2.5 “气车”为何仍替代不了汽车?[J];环境与生活;2012年07期
中国重要会议论文全文数据库 前10条
1 刘宏斌;;PM2.5的危害与防治[A];第二十届海峡两岸及香港、澳门地区职业安全健康学术研讨会暨中国职业安全健康协会2012学术年会论文集[C];2012年
2 吴东仪;周岚;舒美;马新东;;北京市PM2.5浓度变化特征与体育锻炼[A];第二十三届全国高校田径科研论文报告会论文专辑[C];2013年
3 吴军平;;PM2.5排放与环保及健康的分析[A];中国水泥协会环保和资源综合利用专业委员会成立大会会议文集[C];2011年
4 田刚;;北京市大气环境PM_(2.5)有关问题探讨[A];2012北京园林绿化与宜居城市建设[C];2012年
5 张宝贵;曹建新;戴玮;孙丽华;;北京、北戴河pm2.5的统计特征以及与气象要素的关系[A];创新驱动发展 提高气象灾害防御能力——S16第二届城市气象论坛——灾害·环境·影响·应对[C];2013年
6 李恬;王宏;赵天良;;不同霾日判别标准对山东霾日特征的对比分析[A];第31届中国气象学会年会S6 大气成分与天气、气候变化[C];2014年
7 王京丽;张远航;邵敏;曾立民;;北京市PM2.5质量浓度与能见度关系初探[A];中国气象学会2005年年会论文集[C];2005年
8 柯小民;张丽丽;;有效减少PM2.5排放的凝聚型静电除尘技术的试验研究[A];中国硅酸盐学会环保学术年会论文集[C];2012年
9 柯小民;张丽丽;;有效减少PM2.5排放的凝聚型静电除尘技术的试验研究[A];第十四届中国电除尘学术会议论文集[C];2011年
10 饶晓琴;宗志平;张恒德;马学款;曹勇;;2013年1月我国中东部大范围霾的特征和成因分析[A];2014中国环境科学学会学术年会(第六章)[C];2014年
中国重要报纸全文数据库 前10条
1 谈水泉 刘伟;南昌市采纳政协建议发布PM2.5数据[N];人民政协报;2012年
2 牛寒婷;中国电影:如何远离文化PM2.5[N];中国艺术报;2013年
3 记者 王皓;治理PM2.5列入市人大今年三大议案[N];北京日报;2012年
4 记者 吴华国;汽车企业应为降低城镇PM2.5担当责任[N];经济参考报;2012年
5 本报记者 吴兆U啞√,
本文编号:743061
本文链接:https://www.wllwen.com/kejilunwen/huanjinggongchenglunwen/743061.html