单纯ARIMA模型和ARIMA-GRNN组合模型在猩红热月发病率中的预测效果比较
发布时间:2020-08-26 09:28
【摘要】:摘要目的整理某市1985年~2008年猩红热月发病率资料,探讨单纯求和自回归滑动平均(ARIMA)模型和求和自回归滑动平均模型与广义回归神经网络(ARIMA-GRNN)组合模型在1985年~2008年猩红热月发病率的拟合与预测研究中的应用。方法收集1985年~2008年猩红热月发病率和1985年~2006年每月气象因素资料。用秩相关对猩红热月发病率与气象因素间进行单因素分析。对1985年~2008年猩红热月发病率资料进行统计分析,选取合适时间段资料用于模型的拟合。先对资料建立ARIMA模型,然后将猩红热月发病率的ARIMA模型拟合值作为GRNN网络的输入,猩红热月发病率的实际值作为网络的输出来训练网络。最后比较单纯ARIMA模型和ARIMA-GRNN组合模型的效果。结果猩红热月发病率可能与平均气温、平均相对湿度和最低气温有统计学关联。由于时间序列分析具有以时间变量综合代替各影响因素的优点,不需要知道影响结局变量的相关因素,所以在后期建模时没有考虑气象因素对猩红热发病率的影响。1985年~2008年猩红热月发病率资料经过初步分析,最后选取1990年~2008年猩红热月发病率为建模数据。经Cox-Stuarts趋势检验,提示1990年~2008年猩红热月发病率没有上升或者下降的趋势,同时白噪声检验也提示1990年~2008年猩红热月发病率不是白噪声序列而是蕴含一定量的信息。SPSS19.0提供的Expert Modeler建模器提示ARIMA(0 , 0 , 2)×(1 , 0 , 1)12模型为最优模型,模型表达式为(1 - 0.974 B~(12))X_t= 0.15 +(1 + 0.366 B + 0.363 B~2 )(1 - 0.863B~(12) )ε_t。该模型残差通过白噪声检验,Box-Ljung Q统计量为15.857(P=0.322)。光滑因子从0.001开始取值,每次增加一个单位量0.001到0.02,分别对待估点进行预测,计算待估点预测值与实际值误差序列的误差均方根(RMSE)值,最后光滑因子确定为0.007,此时待估点的RMSE值达到最小为0.04356。单纯ARIMA模型和ARIMA-GRNN组合模型的平均误差率(MER)分别为35.5%、31.2%;决定系数(R~2)分别为0.703、0.761。结论单纯ARIMA模型和ARIMA-GRNN组合模型均可以用于1990年~2008年猩红热月发病率的拟合与预测的研究中,而ARIMA-GRNN组合模型的效果要优于单纯ARIMA模型。
【学位授予单位】:安徽医科大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:R181.3
【图文】:
神经元个数为训练样本数。第三层为线性输出层,其权函数是规范化点积权函数,计算网络的输出。广义回归神经网络是一种新颖有效的前馈式神经网络模型,通常用来实现函数逼近,其结构如图2。广义回归神经网络的初始化就是对训练样本的学习过程,学习样本确定,则图 2 广义回归神经网络结构Fig 2 Structure schedule of general regression neural network
22图 3 1985~2008 年猩红热月发病率时序图Fig 3 The sequence chart of the monthly incidence of scarlet fever from 1985 to2008
图 4 不同年份猩红热月发病率时序图Fig 4 The sequence chart of the monthly incidence of scarlet fever grouped by year3.1.2 猩红热月发病率与各气象因素的相关性分析在全球气候普遍变暖的情况下,气象因素与疾病的关系愈来愈受到人们关注。本研究收集 1985 年~2006 年各月降水量、平均气压、平均气温、平均相对湿度和最低气温等气象因素,各气象因素的时序图见图 5~图 9。本研究为了探讨猩红热月发病率与降水量、气压、平均气温、相对湿度和最低气温间的统计学关联,为以后的猩红热发病率与气象因素的研究提供线索,对猩红热月发病率与降水量、平均气压、平均气温、平均相对湿度和最低气温等气象因素进行单因素分析。对各气象因素进行正态性检验,正态性检验结果提示各气象因素来自偏态分布总体,所以用 Spearman 秩相关衡量猩红热与各气象因素间的相关性,Spearman 秩相关分析结果见表 4,同时用中位数、最小值和最大值对各气象因素进行统计描述,结果
本文编号:2805000
【学位授予单位】:安徽医科大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:R181.3
【图文】:
神经元个数为训练样本数。第三层为线性输出层,其权函数是规范化点积权函数,计算网络的输出。广义回归神经网络是一种新颖有效的前馈式神经网络模型,通常用来实现函数逼近,其结构如图2。广义回归神经网络的初始化就是对训练样本的学习过程,学习样本确定,则图 2 广义回归神经网络结构Fig 2 Structure schedule of general regression neural network
22图 3 1985~2008 年猩红热月发病率时序图Fig 3 The sequence chart of the monthly incidence of scarlet fever from 1985 to2008
图 4 不同年份猩红热月发病率时序图Fig 4 The sequence chart of the monthly incidence of scarlet fever grouped by year3.1.2 猩红热月发病率与各气象因素的相关性分析在全球气候普遍变暖的情况下,气象因素与疾病的关系愈来愈受到人们关注。本研究收集 1985 年~2006 年各月降水量、平均气压、平均气温、平均相对湿度和最低气温等气象因素,各气象因素的时序图见图 5~图 9。本研究为了探讨猩红热月发病率与降水量、气压、平均气温、相对湿度和最低气温间的统计学关联,为以后的猩红热发病率与气象因素的研究提供线索,对猩红热月发病率与降水量、平均气压、平均气温、平均相对湿度和最低气温等气象因素进行单因素分析。对各气象因素进行正态性检验,正态性检验结果提示各气象因素来自偏态分布总体,所以用 Spearman 秩相关衡量猩红热与各气象因素间的相关性,Spearman 秩相关分析结果见表 4,同时用中位数、最小值和最大值对各气象因素进行统计描述,结果
【引证文献】
相关博士学位论文 前1条
1 余志刚;我国粮食宏观调控的计量分析与政策选择[D];吉林大学;2012年
相关硕士学位论文 前1条
1 赵妍;ARIMA模型和控制图法在猪肺疫预测预警中的应用研究[D];东北农业大学;2013年
本文编号:2805000
本文链接:https://www.wllwen.com/yixuelunwen/liuxingb/2805000.html