基于LSTM神经网络的机场能见度预测
发布时间:2021-07-22 15:47
能见度对人们日常生活有巨大影响。例如,短期的低能见度预测精度对高速公路交通和飞机飞行非常重要。尤其是飞行活动,低能见度会给飞机飞行带来视程障碍,危及飞行安全。在本文中,我们尝试通过机器学习方法预测能见度,尤其是低能见度情况。我们首先通过数据的统计特征和相关性分析等方法,分析北京气象观测站54511的能见度数据,为后续的模型拟合提供先验信息。此外,我们还通过空间上的最邻近插补以填补缺失数据。在实验中,我们通过长短期记忆模型(Long Short-Term Memory Mod-el,LSTM)来预测能见度。通过调整损失函数和神经网络结构,我们将更好的优化模型,使得预测结果更加适用于实践应用,即,更加关注低能见度部分的数据预测精度。我们分别通过回归和分类方法预测能见度。对于回归模型,我们构建了加权的损失函数,以提升低能见度数据预测精度。以平均绝对误差为评估标准,我们发现长短期记忆回归模型预测结果优于常用的随机森林方法与多层感知机模型。此外,我们发现在长短期记忆模型解决时间序列预测问题时,系统性的“时间滞后”现象将会出现,这主要是由于训练集中数据量的不足导致模型的系统误差。对于分类模型,我们...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
图2:北京站能见度分布??
Time?lag??图3:北京站能见度自相关性??北京站的能见度自相关性计算结果如图3所示。当相差的时间步增加??时,时间序列的自相关性呈现明显的下降趋势。这个发现符合我们正常的认??知:距离越远的事件对当前状态的影响越小。从图3我们可以看到,在时间??步相差3小时以内时,能见度时间序列的自相关性在0.8以上。而当时间步相??差达到12小时后,能见度的自相关性迅速下降到0.4左右。在这之后,自相??关性下降速度减缓,在24小时时降为0.3。从图中可以发现,当能见度数据??间隔达到24小时以上,相互间的影响较小,几乎不相关联。因此,我们将选??择过去24小时的气象数据作为输入构建模型。??§2.3缺失数据填补??由于观测仪器的故障和其他要素的干扰,现实数据中总是存在某些缺??失。北京站各观测要素的缺失率在表2中展示。其
?山东大学硕士学位论文???第三章模型与评估??§3.1长短期记忆模型??长短期记忆模型是一种特殊的循环神经网络模型。正如我们所知,循环??神经网络模型通常仅对短期的信息较为敏感,很少运用长期的信息,难以处??理信息间的长期依赖。这是由于在传统循环神经网络的计算过程中会出现梯??度消失现象,而长短期记忆模型则有效避免了这个问题。长短期记忆模型??于1997年被提出,并在之后得到多次改进[20卜在长短期记忆模型中,循环??神经网络的单个神经元被单元结构取代,每个单元含有3个“门”状态:输??入门、输出门和遗忘门。在每个单元中,输入门选择性地将新信息记录到当??前的单元状态,而遗忘门决定丢弃哪些信息。之后,输出门将处理后的信息??部分输出到其他单元。长短期记忆模型的具体结构如图4。??
【参考文献】:
期刊论文
[1]高速公路雾天能见度预测方法[J]. 龙科军,李超群,毛学军,胡玉婷. 公路. 2017(03)
[2]相对湿度和PM2.5浓度对大气能见度的影响研究:基于小时资料的多站对比分析[J]. 樊高峰,马浩,张小伟,刘樱. 气象学报. 2016(06)
[3]石家庄地区能见度变化特征及其与相对湿度和颗粒物浓度的关系[J]. 王晓敏,韩军彩,陈静,钤伟妙,岳艳霞. 干旱气象. 2016(04)
[4]天津大气能见度与相对湿度和PM10及PM2.5的关系[J]. 宋明,韩素芹,张敏,姚青,朱彬. 气象与环境学报. 2013(02)
[5]重采样方法与机器学习[J]. 毕华,梁洪力,王珏. 计算机学报. 2009(05)
本文编号:3297437
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:43 页
【学位级别】:硕士
【部分图文】:
图2:北京站能见度分布??
Time?lag??图3:北京站能见度自相关性??北京站的能见度自相关性计算结果如图3所示。当相差的时间步增加??时,时间序列的自相关性呈现明显的下降趋势。这个发现符合我们正常的认??知:距离越远的事件对当前状态的影响越小。从图3我们可以看到,在时间??步相差3小时以内时,能见度时间序列的自相关性在0.8以上。而当时间步相??差达到12小时后,能见度的自相关性迅速下降到0.4左右。在这之后,自相??关性下降速度减缓,在24小时时降为0.3。从图中可以发现,当能见度数据??间隔达到24小时以上,相互间的影响较小,几乎不相关联。因此,我们将选??择过去24小时的气象数据作为输入构建模型。??§2.3缺失数据填补??由于观测仪器的故障和其他要素的干扰,现实数据中总是存在某些缺??失。北京站各观测要素的缺失率在表2中展示。其
?山东大学硕士学位论文???第三章模型与评估??§3.1长短期记忆模型??长短期记忆模型是一种特殊的循环神经网络模型。正如我们所知,循环??神经网络模型通常仅对短期的信息较为敏感,很少运用长期的信息,难以处??理信息间的长期依赖。这是由于在传统循环神经网络的计算过程中会出现梯??度消失现象,而长短期记忆模型则有效避免了这个问题。长短期记忆模型??于1997年被提出,并在之后得到多次改进[20卜在长短期记忆模型中,循环??神经网络的单个神经元被单元结构取代,每个单元含有3个“门”状态:输??入门、输出门和遗忘门。在每个单元中,输入门选择性地将新信息记录到当??前的单元状态,而遗忘门决定丢弃哪些信息。之后,输出门将处理后的信息??部分输出到其他单元。长短期记忆模型的具体结构如图4。??
【参考文献】:
期刊论文
[1]高速公路雾天能见度预测方法[J]. 龙科军,李超群,毛学军,胡玉婷. 公路. 2017(03)
[2]相对湿度和PM2.5浓度对大气能见度的影响研究:基于小时资料的多站对比分析[J]. 樊高峰,马浩,张小伟,刘樱. 气象学报. 2016(06)
[3]石家庄地区能见度变化特征及其与相对湿度和颗粒物浓度的关系[J]. 王晓敏,韩军彩,陈静,钤伟妙,岳艳霞. 干旱气象. 2016(04)
[4]天津大气能见度与相对湿度和PM10及PM2.5的关系[J]. 宋明,韩素芹,张敏,姚青,朱彬. 气象与环境学报. 2013(02)
[5]重采样方法与机器学习[J]. 毕华,梁洪力,王珏. 计算机学报. 2009(05)
本文编号:3297437
本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/3297437.html