基于多源数据和XGBoost算法的上海市能见度预测模型研究
发布时间:2021-07-09 17:12
影响能见度的因子众多且作用机理复杂,对能见度的预测构成了重大挑战。进行能见度的精准预报,对于保障交通安全,提高人们出行质量有着重要的意义。上海作为超大型城市,也是我国最重要的交通枢纽之一,以上海为典型研究区域,研究针对能见度的精准预报体系对公共安全管理具有重要的现实指导意义。在能见度预测研究方面,目前广泛采用的数值预报模式忽略了预报因子与能见度之间的非线性关系,而使用机器学习算法对能见度预报的研究则大多仅依赖于实测数据,缺少对数值预报产品的挖掘,此外现有研究多关注能见度预测的精度,缺少对模型内部机制的探索和解释。针对目前研究的不足,本文开展基于多源数据和机器学习算法的能见度预测研究。论文主要研究内容和结论如下:1)基于多源数据和XGBoost的能见度预测模型构建。论文结合实测数据、WRF数值预报模式预报数据和EC-thin高空预报数据,应用XGBoost算法,创建并训练上海市11个站点未来24小时的能见度预测模型。结果表明:能见度预测模型预测精度整体较好,预测结果较WRF数值预报精度有明显提升,模型的决定系数约60.2%,逐级预报的准确率为81%。2)模型中影响能见度的各因子的重要性分...
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
研究步骤图
研究区域概况东濒东海,西接江苏、浙江两省,北接长江入海口,位置优越,交通便总体呈由东向西低微倾斜。在气候方面,上海属亚热带季风气候,日照充充沛。上海具有世界上首屈一指的城市体量,是全国的金融中心、经济部重要的交通枢纽,其港口是世界上最繁忙的港口之一。由于靠近海滨能见度过程的形成和发展同时受到陆地辐射与海面平流的影响,一天之内内各地能见度的变化较大,能见度预报的难度也有所增加。本次研究的为上海市 11 个地面观测站点的相关气象数据,11 个站点分别是宝山站、奉贤站、嘉定站、金山站、闵行站、南汇站、浦东站、青浦站、松江汇站,站点的具体分布如图 2-1。
通过对比分析欧洲细网格数值预报模式和我国气象中心的 T213 模式预报的温度格点数据,得出 EC-thin 预报模式在我国中东部地区具有预报优势[75],马超等通过对比分析欧洲细网格数值预报模式和我国 T639 数值预报模式预报的 500hPa形势场得出,48h 之内 EC-thin 预报模式的准确率略高于 T639[76]。前人的研究表明 EC-thin 预报模式在温度、降水、大风等气象预报上面有一定的优势,所以本文引入 EC-thin 预报模式的预报数据,以丰富模型的训练数据,增加预测精度。气象因子和能见度在时间上有着连续性,前一时刻的气象因子和能见度对后面某个时刻的能见度有着一定的影响,所以本文引入起报时间前 t 小时的实测数据,主要是温度、湿度、风速风向、能见度等作为训练特征。WRF 数据、EC-thin 数据和实测数据在存储格式上存在时间节点的差异,本文按照WRF数据的起报时间和预报时间,将 EC-thin 数据和实测数据进行组合,生成组合数据集。具体组成如图 3-1 所示。
【参考文献】:
期刊论文
[1]2000—2016年基于WRF模式的0.05°×0.05°黑河流域近地表大气驱动数据[J]. 潘小多,马瀚青. 高原气象. 2019(01)
[2]基于XGBoost方法的葡萄酒品质预测[J]. 孙逸菲,袁德成,王建龙,白杨. 沈阳化工大学学报. 2018(04)
[3]工程土方计量空间插值方法对比分析研究[J]. 刘洋,袁会林,周小录. 科技资讯. 2018(33)
[4]基于异质集成学习方法的房价预测[J]. 何睿婷. 通讯世界. 2018(10)
[5]成都市冬季相对湿度和颗粒物浓度对大气能见度的影响[J]. 张迎春,王文勇. 环保科技. 2018(05)
[6]数值预报解释应用现状与展望[J]. 辛洪德. 科技经济导刊. 2018(28)
[7]环境空气质量预报方法简介[J]. 张灿,王静,简高武,张君. 环境与可持续发展. 2018(05)
[8]基于视频的雾天能见度实时监测方法研究[J]. 邱新法,叶栋水,曾燕,叶秀枝,石一凡. 安全与环境学报. 2018(04)
[9]基于MLP神经网络的机场能见度预测模型[J]. 朱国梁. 科技创新与应用. 2018(18)
[10]一种基于多元回归的能见度检测方法[J]. 唐绍恩,李骞,顾大权,敬金瑞. 信息技术与网络安全. 2018(03)
博士论文
[1]耦合分布式水文模拟及降雨集合预报的水库实时优化调度[D]. 王福兴.大连理工大学 2012
硕士论文
[1]基于随机森林算法和多源数据的人口空间分布模型研究[D]. 邓顺强.华东师范大学 2018
[2]气象数据分析系统的设计与预报应用[D]. 周乐安.杭州电子科技大学 2016
[3]结合文本倾向性分析的股评可信度计算研究[D]. 丘桥云.哈尔滨工业大学 2014
[4]大庆市PM10污染预测的研究[D]. 王顶.西南交通大学 2011
本文编号:3274146
【文章来源】:华东师范大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
研究步骤图
研究区域概况东濒东海,西接江苏、浙江两省,北接长江入海口,位置优越,交通便总体呈由东向西低微倾斜。在气候方面,上海属亚热带季风气候,日照充充沛。上海具有世界上首屈一指的城市体量,是全国的金融中心、经济部重要的交通枢纽,其港口是世界上最繁忙的港口之一。由于靠近海滨能见度过程的形成和发展同时受到陆地辐射与海面平流的影响,一天之内内各地能见度的变化较大,能见度预报的难度也有所增加。本次研究的为上海市 11 个地面观测站点的相关气象数据,11 个站点分别是宝山站、奉贤站、嘉定站、金山站、闵行站、南汇站、浦东站、青浦站、松江汇站,站点的具体分布如图 2-1。
通过对比分析欧洲细网格数值预报模式和我国气象中心的 T213 模式预报的温度格点数据,得出 EC-thin 预报模式在我国中东部地区具有预报优势[75],马超等通过对比分析欧洲细网格数值预报模式和我国 T639 数值预报模式预报的 500hPa形势场得出,48h 之内 EC-thin 预报模式的准确率略高于 T639[76]。前人的研究表明 EC-thin 预报模式在温度、降水、大风等气象预报上面有一定的优势,所以本文引入 EC-thin 预报模式的预报数据,以丰富模型的训练数据,增加预测精度。气象因子和能见度在时间上有着连续性,前一时刻的气象因子和能见度对后面某个时刻的能见度有着一定的影响,所以本文引入起报时间前 t 小时的实测数据,主要是温度、湿度、风速风向、能见度等作为训练特征。WRF 数据、EC-thin 数据和实测数据在存储格式上存在时间节点的差异,本文按照WRF数据的起报时间和预报时间,将 EC-thin 数据和实测数据进行组合,生成组合数据集。具体组成如图 3-1 所示。
【参考文献】:
期刊论文
[1]2000—2016年基于WRF模式的0.05°×0.05°黑河流域近地表大气驱动数据[J]. 潘小多,马瀚青. 高原气象. 2019(01)
[2]基于XGBoost方法的葡萄酒品质预测[J]. 孙逸菲,袁德成,王建龙,白杨. 沈阳化工大学学报. 2018(04)
[3]工程土方计量空间插值方法对比分析研究[J]. 刘洋,袁会林,周小录. 科技资讯. 2018(33)
[4]基于异质集成学习方法的房价预测[J]. 何睿婷. 通讯世界. 2018(10)
[5]成都市冬季相对湿度和颗粒物浓度对大气能见度的影响[J]. 张迎春,王文勇. 环保科技. 2018(05)
[6]数值预报解释应用现状与展望[J]. 辛洪德. 科技经济导刊. 2018(28)
[7]环境空气质量预报方法简介[J]. 张灿,王静,简高武,张君. 环境与可持续发展. 2018(05)
[8]基于视频的雾天能见度实时监测方法研究[J]. 邱新法,叶栋水,曾燕,叶秀枝,石一凡. 安全与环境学报. 2018(04)
[9]基于MLP神经网络的机场能见度预测模型[J]. 朱国梁. 科技创新与应用. 2018(18)
[10]一种基于多元回归的能见度检测方法[J]. 唐绍恩,李骞,顾大权,敬金瑞. 信息技术与网络安全. 2018(03)
博士论文
[1]耦合分布式水文模拟及降雨集合预报的水库实时优化调度[D]. 王福兴.大连理工大学 2012
硕士论文
[1]基于随机森林算法和多源数据的人口空间分布模型研究[D]. 邓顺强.华东师范大学 2018
[2]气象数据分析系统的设计与预报应用[D]. 周乐安.杭州电子科技大学 2016
[3]结合文本倾向性分析的股评可信度计算研究[D]. 丘桥云.哈尔滨工业大学 2014
[4]大庆市PM10污染预测的研究[D]. 王顶.西南交通大学 2011
本文编号:3274146
本文链接:https://www.wllwen.com/projectlw/qxxlw/3274146.html