基于层次聚类的LSTM神经网络模型在江苏省降水量预测中的应用
发布时间:2021-09-17 06:34
大气降水是地表淡水的主要来源之一,许多地区的降水存在年际分配不均的状况,常常造成各地的旱涝灾害,因此探明降水的时空变化规律,对农业生产以及居民生活都具有重要的意义。本文给出通过运用聚类分析、主成分分析和基于LSTM的神经网络三种方法综合建立的预测模型,并对江苏省内62个气象观测站点的降水量时间序列进行了预测,预测效率和精度综合表现较好。文章的重点在于如何将62个时间序列数据简化分析,在提高分析效率的同时保证预测精度,同时可以达到使用个人计算机便可高效的预测这62个站点降水量的目的。本文第一步利用聚类分析将62个站点的降水序列分成若干个局部特征相似的子类,第二步利用基于主成分分析的序列压缩法求出每个子类的主导序列,第三步利用基于LSTM的神经网络时间序列预测模型对每个子类的主导序列分别进行预测,并反算出每一子类中各气象站点降水量的预测值,最后通过计算标准化均方误差NMSE值对建立的预测模型的精度进行评估。基于江苏省62个气象观测站点1961年至2019年的年降水量数据,利用R语言和Python语言对降水量时间序列数据进行降水量预测,以期为合理分配水资源和防范气象灾害,减少经济损失提供一定...
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图1?DTW距离计算方式表示??其次,这种扭曲必须满足一定要求,一是每个点都要被用到,不可跳过,并??
每个矩阵元素(i,y)代表着点仏和q对齐。而这里的对齐顺??序是通过DP算法寻找一条通过此网格中若干格点的路径,此时路径通过的格点??即为计算时序列对齐的点。??0?S?10?1fl?20?29?30??????—??*?M?|?i?I?1?JfT'?J??(?m?^???/?.??====^^^-=;??S?j==i^:====z!:??y?8??乙—_??/???-i-+-zz—??l?x?.?.?L?M?INI?trl??1?i?n??图2规整路径的例子??将这条路径定义为规整路径(Warping?Path),用M/表示,W的第fc个元素定??义为wk?=?(ij)k,定义了序列Q和C的映射。所以有:??州=Wpvv2,…,…Wk?rrm;c(m,n)?<m?+?n?—?1。??路径的选择需要满足以下几个约束:??1)边界条件:=?和wfc?=?(m,n),简单地说,这要求所选择的路径必须??要从左下角出发,到右上角结束;??2)连续性:如果=?那么路径的下一个点wk?=?(a,;b)需要满足(a?—??a')Sl和即不能跨过某点去匹配,只能与自己相邻的点对齐,??这样保证了序列Q和C中的每个坐标均出现在州中;??3)单调性:如果Wfc—i?=?(a?,那么路径的下一个点需要满足0?S??(a-£〇和这便限制了?14/中的点必须是随时间单调进行的,来??保证图2中的虚线不会相交。??根据连续性和单调性的约束,每个格点的路径便只有三个方向,即若路径己??经通过了格点ay),那么通过的下一个格点只可能是下列三种情况之一(如图3??所示):??11??
?山东大学硕士学位论文???(i?+?ltj),?(i,j?+?1),?(i?+?l,j?+?l)〇??s??图3格点路径方向的三种情况??同时,满足以上三条约束条件的路径有指数个,而这里仅对满足以下规整代??价最小的路径感兴趣[1?]:??DTWdQ,C)?=?min{VELiWk/4°?(3-1)??其中,分母中的主要是用来对不同长度的规整路径做补偿,因为不同路径的长??短不同,而较长的路径有较多的“点对”,便会有较多的距离去累加,所以就用总??距离除以K来得到单位路径的距离。??实际上,DTW就是通过把时间序列进行延伸和缩短,得到时间序列之间距??离最短即最相似的那个规整,这个最短的距离即为时间序列之间最合适的距离度??量,也就是要选择一个路径,使最后得到的总距离最小,而这条路径能够通过DP??算法得到。这里需要明确一个累加距离(Cumulative?Distances)的定义[1]:??y(ij')?=?d^c))?+?min?{]/〇_?1,)?-?l),y(i?-?1)),?(3.2)??其中累积距离yay)为当前格点距离day),即点仏与9之间的欧式距离与可以到??达该点的最近邻元素累积距离之和。从(〇,〇)点开始匹配序列Q和c之后,每到一??个点,之前计算的所有点的距离都会累加,当到达终点(n,m)时,这个累积距离??即为最后的总距离,也就是序列Q和C的相似度。本文将使用R语言中dtw包里??的dist函数求解DTW距离。??3.3基于Calinsky?Criterion的聚类个数的确定??CalinskyCriterion[21],即?Calinsky?准则,全称为?Calinski-
【参考文献】:
期刊论文
[1]不同模型在南宁市年降水量预测中的应用比较[J]. 杜懿,麻荣永,赵立亚. 人民珠江. 2018(04)
[2]基于ARMA模型的丹东市降雨时间序列分析[J]. 金冶. 水利规划与设计. 2017(05)
[3]基于RBF神经网络的降雨量预测[J]. 罗伟,马红丽,高海燕,杨艳,陶荣东. 内蒙古水利. 2014(06)
[4]基于小波分析的ARMA-GARCH模型在降水预报中的应用[J]. 王喜华,卢文喜,初海波,陈社明. 节水灌溉. 2011(05)
[5]基于小波消噪的平稳时间序列分析方法在降雨量预测中的应用[J]. 崔磊,迟道才,曲霞. 中国农村水利水电. 2010(09)
[6]基于时间序列分析的降雨量动态预测[J]. 徐文霞,林俊宏,廖飞佳,李国东. 安徽农业科学. 2009(36)
[7]降水量的BP人工神经网络预测模型及其应用[J]. 牛文全,李靖. 西北农林科技大学学报(自然科学版). 2001(04)
[8]神经网络BP模型用于月降水预报的研究[J]. 严绍瑾,彭永清,郭光. 热带气象学报. 1995(03)
[9]降水时间序列的聚类分析和预测[J]. 王永县,詹一辉,张少. 系统工程理论与实践. 1994(11)
本文编号:3398161
【文章来源】:山东大学山东省 211工程院校 985工程院校 教育部直属院校
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
图1?DTW距离计算方式表示??其次,这种扭曲必须满足一定要求,一是每个点都要被用到,不可跳过,并??
每个矩阵元素(i,y)代表着点仏和q对齐。而这里的对齐顺??序是通过DP算法寻找一条通过此网格中若干格点的路径,此时路径通过的格点??即为计算时序列对齐的点。??0?S?10?1fl?20?29?30??????—??*?M?|?i?I?1?JfT'?J??(?m?^???/?.??====^^^-=;??S?j==i^:====z!:??y?8??乙—_??/???-i-+-zz—??l?x?.?.?L?M?INI?trl??1?i?n??图2规整路径的例子??将这条路径定义为规整路径(Warping?Path),用M/表示,W的第fc个元素定??义为wk?=?(ij)k,定义了序列Q和C的映射。所以有:??州=Wpvv2,…,…Wk?rrm;c(m,n)?<m?+?n?—?1。??路径的选择需要满足以下几个约束:??1)边界条件:=?和wfc?=?(m,n),简单地说,这要求所选择的路径必须??要从左下角出发,到右上角结束;??2)连续性:如果=?那么路径的下一个点wk?=?(a,;b)需要满足(a?—??a')Sl和即不能跨过某点去匹配,只能与自己相邻的点对齐,??这样保证了序列Q和C中的每个坐标均出现在州中;??3)单调性:如果Wfc—i?=?(a?,那么路径的下一个点需要满足0?S??(a-£〇和这便限制了?14/中的点必须是随时间单调进行的,来??保证图2中的虚线不会相交。??根据连续性和单调性的约束,每个格点的路径便只有三个方向,即若路径己??经通过了格点ay),那么通过的下一个格点只可能是下列三种情况之一(如图3??所示):??11??
?山东大学硕士学位论文???(i?+?ltj),?(i,j?+?1),?(i?+?l,j?+?l)〇??s??图3格点路径方向的三种情况??同时,满足以上三条约束条件的路径有指数个,而这里仅对满足以下规整代??价最小的路径感兴趣[1?]:??DTWdQ,C)?=?min{VELiWk/4°?(3-1)??其中,分母中的主要是用来对不同长度的规整路径做补偿,因为不同路径的长??短不同,而较长的路径有较多的“点对”,便会有较多的距离去累加,所以就用总??距离除以K来得到单位路径的距离。??实际上,DTW就是通过把时间序列进行延伸和缩短,得到时间序列之间距??离最短即最相似的那个规整,这个最短的距离即为时间序列之间最合适的距离度??量,也就是要选择一个路径,使最后得到的总距离最小,而这条路径能够通过DP??算法得到。这里需要明确一个累加距离(Cumulative?Distances)的定义[1]:??y(ij')?=?d^c))?+?min?{]/〇_?1,)?-?l),y(i?-?1)),?(3.2)??其中累积距离yay)为当前格点距离day),即点仏与9之间的欧式距离与可以到??达该点的最近邻元素累积距离之和。从(〇,〇)点开始匹配序列Q和c之后,每到一??个点,之前计算的所有点的距离都会累加,当到达终点(n,m)时,这个累积距离??即为最后的总距离,也就是序列Q和C的相似度。本文将使用R语言中dtw包里??的dist函数求解DTW距离。??3.3基于Calinsky?Criterion的聚类个数的确定??CalinskyCriterion[21],即?Calinsky?准则,全称为?Calinski-
【参考文献】:
期刊论文
[1]不同模型在南宁市年降水量预测中的应用比较[J]. 杜懿,麻荣永,赵立亚. 人民珠江. 2018(04)
[2]基于ARMA模型的丹东市降雨时间序列分析[J]. 金冶. 水利规划与设计. 2017(05)
[3]基于RBF神经网络的降雨量预测[J]. 罗伟,马红丽,高海燕,杨艳,陶荣东. 内蒙古水利. 2014(06)
[4]基于小波分析的ARMA-GARCH模型在降水预报中的应用[J]. 王喜华,卢文喜,初海波,陈社明. 节水灌溉. 2011(05)
[5]基于小波消噪的平稳时间序列分析方法在降雨量预测中的应用[J]. 崔磊,迟道才,曲霞. 中国农村水利水电. 2010(09)
[6]基于时间序列分析的降雨量动态预测[J]. 徐文霞,林俊宏,廖飞佳,李国东. 安徽农业科学. 2009(36)
[7]降水量的BP人工神经网络预测模型及其应用[J]. 牛文全,李靖. 西北农林科技大学学报(自然科学版). 2001(04)
[8]神经网络BP模型用于月降水预报的研究[J]. 严绍瑾,彭永清,郭光. 热带气象学报. 1995(03)
[9]降水时间序列的聚类分析和预测[J]. 王永县,詹一辉,张少. 系统工程理论与实践. 1994(11)
本文编号:3398161
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/3398161.html