基于Stacking融合模型的PM 2.5 浓度时空变化分析及预测
发布时间:2021-04-04 23:36
随着我国经济的发展,我国已经成为全球PM2.5污染最严重的地区之一。分析地区的PM2.5浓度时空变化和PM2.5浓度与气象因子的关系对治理PM2.5污染具有重要意义。同时对以往PM2.5数据的缺失值或者异常值进行预测补充和对未来PM2.5浓度进行预测也是治理PM2.5污染很重要的一步,对以往缺失或者异常值进行预测可以构建长时间高精度的PM2.5浓度数据集,而预测未来的PM2.5浓度则能为政府和民众提供PM2.5污染预警。本研究采用江西省2016-2018年小时级的历史气象数据和历史空气质量数据,分析了江西省PM2.5浓度的时空变化趋势以及PM2.5浓度与气象要素之间的联系并构建了基于机器学习的PM2.5浓度预测模型,旨在为江西省的空气污染管理和基础研究提供科学依据。论文主要开展的工作和取得的研究结果如下:...
【文章来源】:江西理工大学江西省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
技术路线图
第二章数据与方法8第二章数据与方法2.1研究区介绍江西省(24°29"–30°04",113°34"–118°28")位于我国东南区域,东邻浙江、福建,南连广东,西靠湖南,北毗湖北、安徽而共接长江,是推进共建“一带一路”、长江经济带发展的重要节点。江西省总面积16.71万平方公里,辖11个设区市,2019年常住人口为4666.1万。江西省的地貌条件复杂,以山区和丘陵地貌为代表。江西省气候属亚热带季风型气候,夏季潮湿,秋季干燥。年平均气温11.6–19.6°C,年降水量1637.9mm。江西省共有气象站91个,其中26个基准、基本气象站,65个一般站,气象站覆盖了江西各市县。江西省共有空气质量监测站60个,监测站主要分布在市中心和工业区。图2.1展示了江西省气象站点(红色点和五角星)和空气质量监测站点(蓝色点和五角星)位置。图2.1江西地区气象站点和空气质量站点地理分布(17个气象站,57个空气质量站的数据用于本研究)
第二章数据与方法10进行处理。本研究的数据质量控制过程如图2.2所示,主要包括:气象数据和空气质量数据的清洗,气象数据和空气质量数据基于时间的匹配,时间维度的提龋图2.2数据质量控制流程图(1)数据清洗其中气象数据清洗内容如下:1需求数据变量提取,根据所需数据变量对数据进行提取,提取出气温、气压、相对湿度等变量;2缺失值剔除,如果某一时刻的气象数据变量缺失,则将该时刻的所有气象数据去除;3异常值剔除,根据中国气象数据网发布的数据说明,对每个数据进行检查,如果某个数据值为999999则该时刻数据剔除;4逻辑错误值剔除,对每个变量进行正常值设定,如设定相对湿度的正常值为0-100,如果某时刻数据值不在正常值范围,则将该时刻的数据剔除。空气质量数据的数据清洗内容如下:1需求变量提取,提取出PM2.5浓度数值;2剔除缺失值,并剔除PM2.5浓度值小于0μg/m3和大于1000μg/m3的数据;3根据气象站点匹配空气质量站点情况,计算气象站对应空气质量站的PM2.5浓度值平均值。数据清洗结束后得到了各气象站点对应的PM2.5浓度数据表。(2)数据匹配根据站点和时间进行数据匹配。匹配步骤如下:根据气象站点和空气质量站点匹配情况,以气象站数据为基础,获取对应站点的PM2.5浓度平均值;基于时间进行匹配,匹配同一个小时气象数据和PM2.5数据。最终得到同一小时的含有气象要素的和PM2.5浓度数据的文件。
【参考文献】:
期刊论文
[1]多机器学习模型下逐小时PM2.5预测及对比分析[J]. 康俊锋,黄烈星,张春艳,曾昭亮,姚申君. 中国环境科学. 2020(05)
[2]基于LightGBM的血压检测方法研究[J]. 吴绍武,续育茹. 生物医学工程研究. 2019(03)
[3]基于Model-3/CMAQ和CAMx模式的台州市PM2.5数值模拟研究[J]. 汪辉,刘强,王昱,李颖,张定定,朱赟洁,洪盼盼. 环境与可持续发展. 2019(03)
[4]沈阳市PM2.5浓度ARIMA-SVM组合预测研究[J]. 宋国君,国潇丹,杨啸,刘帅. 中国环境科学. 2018(11)
[5]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[6]融机器学习与WRF大气模式的PM2.5预报方法[J]. 侯俊雄,李琦,朱亚杰,冯逍,林绍福. 测绘科学. 2018(02)
[7]结合WRF/Chem和PMF方法的邯郸市PM2.5源解析[J]. 魏哲,侯立泉,魏巍,岳亮,张城瑜,马思萌,赵乐,纪尚平,王丽涛. 环境科学与技术. 2017(11)
[8]2013—2015年中国PM2.5污染状况时空变化[J]. 李沈鑫,邹滨,刘兴权,方新. 环境科学研究. 2017(05)
[9]基于随机森林的PM2.5实时预报系统[J]. 侯俊雄,李琦,朱亚杰,冯逍,毛曦. 测绘科学. 2017(01)
[10]基于WRF-Chem模式的华东区域PM2.5预报及偏差原因[J]. 周广强,谢英,吴剑斌,余钟奇,常炉予,高伟. 中国环境科学. 2016(08)
硕士论文
[1]邯郸市PM2.5污染特征、变化及其模拟研究[D]. 纪尚平.河北工程大学 2019
[2]开封市机动车限行对PM2.5浓度影响的时空模拟[D]. 李霄阳.河南大学 2019
[3]基于LightGBM框架的上海市大气能见度预报订正研究[D]. 王志宇.华东师范大学 2019
[4]基于WRF-CMAQ/ISAM模型的京津冀及周边地区PM2.5来源解析研究[D]. 吴育杰.浙江大学 2019
本文编号:3118707
【文章来源】:江西理工大学江西省
【文章页数】:81 页
【学位级别】:硕士
【部分图文】:
技术路线图
第二章数据与方法8第二章数据与方法2.1研究区介绍江西省(24°29"–30°04",113°34"–118°28")位于我国东南区域,东邻浙江、福建,南连广东,西靠湖南,北毗湖北、安徽而共接长江,是推进共建“一带一路”、长江经济带发展的重要节点。江西省总面积16.71万平方公里,辖11个设区市,2019年常住人口为4666.1万。江西省的地貌条件复杂,以山区和丘陵地貌为代表。江西省气候属亚热带季风型气候,夏季潮湿,秋季干燥。年平均气温11.6–19.6°C,年降水量1637.9mm。江西省共有气象站91个,其中26个基准、基本气象站,65个一般站,气象站覆盖了江西各市县。江西省共有空气质量监测站60个,监测站主要分布在市中心和工业区。图2.1展示了江西省气象站点(红色点和五角星)和空气质量监测站点(蓝色点和五角星)位置。图2.1江西地区气象站点和空气质量站点地理分布(17个气象站,57个空气质量站的数据用于本研究)
第二章数据与方法10进行处理。本研究的数据质量控制过程如图2.2所示,主要包括:气象数据和空气质量数据的清洗,气象数据和空气质量数据基于时间的匹配,时间维度的提龋图2.2数据质量控制流程图(1)数据清洗其中气象数据清洗内容如下:1需求数据变量提取,根据所需数据变量对数据进行提取,提取出气温、气压、相对湿度等变量;2缺失值剔除,如果某一时刻的气象数据变量缺失,则将该时刻的所有气象数据去除;3异常值剔除,根据中国气象数据网发布的数据说明,对每个数据进行检查,如果某个数据值为999999则该时刻数据剔除;4逻辑错误值剔除,对每个变量进行正常值设定,如设定相对湿度的正常值为0-100,如果某时刻数据值不在正常值范围,则将该时刻的数据剔除。空气质量数据的数据清洗内容如下:1需求变量提取,提取出PM2.5浓度数值;2剔除缺失值,并剔除PM2.5浓度值小于0μg/m3和大于1000μg/m3的数据;3根据气象站点匹配空气质量站点情况,计算气象站对应空气质量站的PM2.5浓度值平均值。数据清洗结束后得到了各气象站点对应的PM2.5浓度数据表。(2)数据匹配根据站点和时间进行数据匹配。匹配步骤如下:根据气象站点和空气质量站点匹配情况,以气象站数据为基础,获取对应站点的PM2.5浓度平均值;基于时间进行匹配,匹配同一个小时气象数据和PM2.5数据。最终得到同一小时的含有气象要素的和PM2.5浓度数据的文件。
【参考文献】:
期刊论文
[1]多机器学习模型下逐小时PM2.5预测及对比分析[J]. 康俊锋,黄烈星,张春艳,曾昭亮,姚申君. 中国环境科学. 2020(05)
[2]基于LightGBM的血压检测方法研究[J]. 吴绍武,续育茹. 生物医学工程研究. 2019(03)
[3]基于Model-3/CMAQ和CAMx模式的台州市PM2.5数值模拟研究[J]. 汪辉,刘强,王昱,李颖,张定定,朱赟洁,洪盼盼. 环境与可持续发展. 2019(03)
[4]沈阳市PM2.5浓度ARIMA-SVM组合预测研究[J]. 宋国君,国潇丹,杨啸,刘帅. 中国环境科学. 2018(11)
[5]基于LightGBM算法的P2P项目信用评级模型的设计及应用[J]. 马晓君,沙靖岚,牛雪琪. 数量经济技术经济研究. 2018(05)
[6]融机器学习与WRF大气模式的PM2.5预报方法[J]. 侯俊雄,李琦,朱亚杰,冯逍,林绍福. 测绘科学. 2018(02)
[7]结合WRF/Chem和PMF方法的邯郸市PM2.5源解析[J]. 魏哲,侯立泉,魏巍,岳亮,张城瑜,马思萌,赵乐,纪尚平,王丽涛. 环境科学与技术. 2017(11)
[8]2013—2015年中国PM2.5污染状况时空变化[J]. 李沈鑫,邹滨,刘兴权,方新. 环境科学研究. 2017(05)
[9]基于随机森林的PM2.5实时预报系统[J]. 侯俊雄,李琦,朱亚杰,冯逍,毛曦. 测绘科学. 2017(01)
[10]基于WRF-Chem模式的华东区域PM2.5预报及偏差原因[J]. 周广强,谢英,吴剑斌,余钟奇,常炉予,高伟. 中国环境科学. 2016(08)
硕士论文
[1]邯郸市PM2.5污染特征、变化及其模拟研究[D]. 纪尚平.河北工程大学 2019
[2]开封市机动车限行对PM2.5浓度影响的时空模拟[D]. 李霄阳.河南大学 2019
[3]基于LightGBM框架的上海市大气能见度预报订正研究[D]. 王志宇.华东师范大学 2019
[4]基于WRF-CMAQ/ISAM模型的京津冀及周边地区PM2.5来源解析研究[D]. 吴育杰.浙江大学 2019
本文编号:3118707
本文链接:https://www.wllwen.com/shoufeilunwen/boshibiyelunwen/3118707.html