时间序列分析总复习
本文选题:时间序列 切入点:分析
1
王茂林
王茂林
一、选择题 1.已知 2000-2006 年某银行的年末存款余额,要计算各年平均存款余额,该平均数是:( b ) a. 几何序时平均数;
b.“首末折半法”序时平均数; c. 时期数列的平均数; d.时点数列的平均数。 2 2.某地区粮食增长量 1990—1995 年为 12 万吨,1996—2000 年也为 12 万吨。那么,1990—2000 年期间,该地区粮食环比增长速度( d ) a.逐年上升 b.逐年下降 c.保持不变 d.不能做结论 3 3.某商业集团 2000—2001 年各季度销售资料如下: 2000 年 2001 年 1 2 3 4 1 2 3 4 1.零售额(百万) 2.季初库存额(百万) 3.流通费用额(百万) 4.商品流转次数(次/季) 40 20 3.8 1.95 42 21 3.2 19.5 38 22 2.8 1.6544 24 3.21.848 25 3.0 1.8850 26 3.1 2.0440 23 3.1 1.6360 28 4.0 2.03上表资料中,是总量时期数列的有( d ) a. 1、2、3 b. 1、3、4 c. 2、4 d. 1、3 4 4.利用上题资料计算零售额移动平均数(简单,4 项移动平均),2001 年第二季度移动平均数为(a ) a. 47.5 b. 46.5 c. 49.5 d. 48.4 二、判断题 1 1.连续 12 个月逐期增长量之和等于年距增长量。 2 2.计算固定资产投资额的年平均发展速度应采用几何平均法。 3 3.用移动平均法分析企业季度销售额时间序列的长期趋势时,一般应取 4 项进行移动平均。 4.计算平均发展速度的水平法只适合时点指标时间序列。 5 5.某公司连续四个季度销售收入增长率分别为 9%、12%、20%和 18%,其环比增长速度为 0.14%。 正确答案:(1)错;(2)错;(3)对;(4)错;(5)错。 三、计算题: 1.某企业 2000 年 8 月几次员工数变动登记如下表: 8 月 1 日 8 月 11 日 8 月 16 日 8 月 31 日1 210 1 240 1 300 1 270 试计算该企业 8 月份平均员工数。 解:该题是现象发生变动时登记一次的时点序列求序时平均数,假设员工人数用 y 来表示,则: 1 1 2 2 n1 2y y ... yy=...nnf f ff f f+ + ++ + +
21210 10 1240 5 1300 15 1270311260( )× + × + × +=≈ 人 该企业 8 月份平均员工数为 1260 人。 2. 某地区“十五”期间年末居民存款余额如下表: ( 单位:百万)
年份 2000 2001 2002 2003 2004 2005 存 款 余额 7 034 9 110 11 545 14 746 21 519 29 662 试计算该地区“十五”期间居民年平均存款余额。 解:居民存款余额为时点序列,本题是间隔相等的时点序列,运用“首末折半法”计算序时平均数。 1 n2 n-1y yy ... y2 2=n-1y+ + + +
7034 296629110 11545 14746 215192 25+ + + + +=
=15053.60(百万) 该地区“十五”期间居民年平均存款余额为 15053.6 百万。 3.某企业 2007 年产品库存量资料如下:
单位:件 日期 库存量 日期 库存量 日期 库存量 1 月 1 日 1 月 31 日 2 月 28 日 3 月 31 日 63 60 88 46 4 月 30 日5 月 31 日6 月 30 日7 月 31 日8 月 31 日50 55 70 48 49 9 月 30 日 10 月 31 日 11 月 30 日 12 月 31 日 60 68 54 58 试计算第一季度、第二季度、上半年、下半年和全年的平均库存量。 解:产品库存量是时点序列,本题是间隔相等的时点序列,运用“首末折半法”计算平均库存量。
计算公式:1 n2 n-1...2 2x=n-1x xx x + + + + 第一季度平均库存量:163 4660 882 2x = 67.53+ + += 0(件) 第二季度平均库存量:246 7050 552 2x = 54.33+ + += 3(件) 上半年平均库存量:163 7060 88 46 50 552 2= 60.96y+ + + + + += 2(件)
3下半年平均库存:270 5848 49 60 68 542 2= 57.176y+ + + + + += (件) 全年的平均库存量: 63 5860 ... 542 2= 59.046y+ + + += (件) 4.某企业 2000~2005 年底工人数和管理人员数资料如下:
单位:人 年份 工 人数 管 理 人 员数 年份 工人数 管理人员数 2000 2001 2002 1 000 1 202 1 120 40 43 50 2003200420051 2301 2851 41552 60 64 试计算 1991~2005 年该企业管理人员数占工人数的平均比重。 解:本题是计算相对数序时平均数。 计算公式:ayb=
y :管理人员占工人数的比重; a :管理人员数; b :工人数。
(人) 4 . 51526460 52 50 4324012 21 21=+ + + + +=−+ + + +=−naa aaann餖 (人) 9 . 12085214151285 1230 1120 12022100012 21 21=+ + + + +=−+ + + +=−nbb bbbnn餖 ayb= = % 25 . 49 . 12084 . 51≈ 2001-2005 年企业管理人员占工人数的平均比重为 4.25% 5 5.某地区 2000~2005 年社会消费品零售总额资料如下:
单位:亿元 2000 2001 2002 2003 2004 2005 社 会 消 费品 零售总额 8 255 9 383 10 985 12 238 16 059 19 710 要求:计算全期平均增长量、平均发展速度和平均增长速度,并列表计算(1)逐期增长量和累积增长
4量;(2)定基发展速度和环比发展速度;(3)定基增长速度和环比增长速度;(4)增长 1%的绝对值。 解:
单位:亿元 年度 2000 2001 2002 2003 2004 2005 社会消费品零售额(iy ) 8255 9383 10985 12238 16059 19710 逐期增长量(1 i iy y−− ) — 1128 1602 1253 3821 3651 累积增长量(0 iy y − ) _ 1128 2730 3983 7804 11455 定基发展速度(0/iy y )(%) _ 113.66 133.07 148.25 194.54 238.76 环比发展速度(1/i iy y−)(%) _ 113.66 117.07 111.41 131.22 122.73 定基增长速度(0/ 1iy y − )(%) _ 13.66 33.07 48.25 94.54 38.76 环 比 增 长 速 度(1/ 1i iy y−− )(%) _ 13.66 17.07 11.41 31.22 22.73 增 长 1 % 的 增 长 量(1 iy−/100) _ 82.55 93.83 109.85 122.38 160.59 平均增长量= 114555=2291(亿元) 平均发展速度=5019710119.01%8255nnyy= = 平均增长速度=119.01%-100%=19.01% 6.某地区 2006 年末人口数为 2000 万人,假定以后每年以 9‰的速度增长,又知该地区 2006 年 GDP为 1240 亿元。要求到 2010 年人均 GDP 达到 9500 元,试问该地区 2010 年的 GDP 应达到多少?2007 年到2009 年 GDP 的年均增长速度应达到多少? 解:2004 年末该地区人口:32000 (1 0.009) × + =2054.49(万人) 2005 年末该地区人口:42000 (1 0.009) × + =2072.98(万人) 2005 年该地区的平均人口为:(2054.49+2072.98)/2=2063.76(万人) 所以,该地区 2005 年的 GDP:9500×2063.76=19605625(万元) 2002-2004 年该地区 GDP 的年均增长速度: % 13 . 12 1213 . 0 112405625 . 19604= = − 所以,要使 2005 年的人均 GDP 达到 9500 元,2002-2005 年 GDP 的年均增长速度应达到 12.13%。 7.某企业 1993~2007 年产品产量资料如表:
5要求:(1)进行三项中心化移动平均修匀。(2)根据修匀后的数据用最小二乘法配合直线趋势方程,并据以计算各年的趋势值。(3)预测 2009 年该企业的产品产量。
单位:件 年份 产量 年份 产量 年份 产量 1993 1994 1995 1996 1997 344 416 435 440 450 1998 1999 2000 2001 2002 468 486 496 522 580 2003 2004 2005 2006 2007 580 569 548 580 629 解:(1) 三项中心化移动平均修匀: 年份 1993 1994 1995 1996 1997 数据 三项移动平均 344 — 416 398.33 435 430.33 440 441.67 450 452.67 年份 1998 1999 2000 2001 2002 数据 三项移动平均 468 468 486 483.33 496 501.33 522 532.67 580 367.33 年份 2003 2004 2005 2006 2007 数据 三项移动平均 580 576.3 569 565.67 548 565.67 580 585.67 629 - (2)直线趋势方程:i it y2 1ˆ ˆˆ β β + = 将修匀后的数据代入最小二乘法求参数的公式:,可得: 88 . 1318279 . 44596 42 . 471229113181997 . 6370 9113142 . 47122ˆ22=−=⋅ −× ⋅ −= β 93 . 392139188 . 131397 . 6370ˆ1= ⋅ − = β it y 88 . 13 93 . 392 + = 最小二乘法计算表 年份 时间变量 t i 产量 y i t i2 t i y i 1994 1 398.33 1 398.33 1985 2 430.33 4 860.66 1996 3 441.67 9 1325.01 1997 4 452.67 16 1810.68 1998 5 468 25 2340 1999 6 483.33 36 2899.98
62000 7 501.33 49 3509.31 2001 8 532.67 64 4261.36 2002 9 367.33 81 3305.97 2003 10 576.3 100 5763 2004 11 565.67 121 6222.37 2005 12 567.67 144 6812.04 2006 13 585.67 169 7613.71 合 计 91 6370.97 819 47122.42 ③根据方程计算各年的趋势值,得到如下数据:
(3)根据配合的方程,对2009 年企业的产品产量进行预测。 2002 年时, t =15,所以预测值为: 13 . 601 15 88 . 13 93 . 392 = × + = y(件) 8 8.某市集市 2004-2007 年各月猪肉销售量( 单位:万公斤) 如下表:
1 月 2 月 3 月 4 月 5 月 6 月 7 月 8 月 9 月 10 月 11 月 12 月 2004 2005 2006 2007 40 43 40 55 50 52 64 72 41 45 58 62 39415660454867705365748668798498738695108506476874860687843 45 56 63 38 41 52 58 试分别用同期平均法和移动平均剔除法计算季节指数。 解:(1)用同期平均法中的比率平均法计算季节指数
第一、计算各周期月平均数:
12i ijj 11y y12 疱== ,得: 1y = 49,2y = 55.75,3y = 65.83,4y = 74.75
第二、计算各指标值的季节比率和季节比率的平均数:
季节比率:ijiyy
季节比率平均数:4ijji 1iy14 yS疱== ( ) 计算季节比率和季节比率平均数(最后一行是季节比率平均数,其余是季节比率),结果如下: 年份 趋势值 1994 406.81 1995 420.69 1996 434.57 1997 448.45 1998 462.33 年份 趋势值 1999 476.21 2000 490.09 2001 503.97 2002 517.85 2003 531.73 年份 趋势值 2004 545.61 2005 559.49 2006 573.37 2007 587.25
7 月年 1 2 3 4 5 6 7 8 9 10 11 12 1998 0.82 1.02 0.84 0.8 0.92 1.08 1.39 1.49 1.02 0.98 0.88 0.781999 0.77 0.93 0.81 0.74 0.86 1.17 1.42 1.54 1.15 1.08 0.81 0.742000 0.61 0.97 0.88 0.85 1.02 1.12 1.28 1.44 1.15 1.03 0.85 0.792001 0.74 0.96 0.83 0.8 0.94 1.15 1.31 1.44 1.16 1.04 0.84 0.78js 0.73 0.97 0.84 0.80 0.93 1.13 1.35 1.48 1.12 1.03 0.84 0.77 第三,计算季节指数:
j12j112SjS=疱* =
首先计算jS 之和:12j1Sj=疱=12
所以,各时期的季节比率等于其季节指数。 (2)用移动平均剔除法计算季节指数 年月 猪肉销售量 中心化移动平均数 季节比率 季节比率的平均数 2004.1234567891011122005.12345640 50 41 39 45 53 68 73 50 48 43 38 43 52 45 41 48 65 49.1349.3349.5849.8350.0450.6751.6352.6353.7554.8355.4255.631.3841.481.0080.9630.8590.750.8330.9880.8370.7480.8661.169
1.36 1.47 1.08 1 0.81 0.73 0.76 1.01 0.87 0.82 0.95 1.15
8年月 猪肉销售量 中心化移动平均数 季节比率 季节比率的平均数 7891011122006.1234567891011122007.123479 86 64 60 45 41 40 64 58 56 67 74 84 95 76 68 56 52 55 72 62 60 55.635657.0458.2159.6360.7961.3861.9662.8363.6764.4665.3866.4667.4267.9268.2568.5469.1770.2571.3872.3873.251.421.5361.1221.0310.7550.6740.6521.0330.9230.881.0391.1321.2641.4091.1190.9960.8170.7520.7831.0090.8570.81912jS =疱 567891070 86 98 108 87 78 73.96 74.5
0.9461.154 由于 12jS =疱,所以,季节指数等于季节平均数。 9.某地区 1998 年到 2007 年的 GDP 如下表,请选择最适合的 α 值,并用一次指数平滑模型预测 1992年~2001 年的 GDP( 单位:亿元) 。 解:本 题取平滑初始值0S (1) 为 1998、1999和 2000 年 GDP 的算术0S (1) = 平 均 数 ,275.67。按照均方根误差最小的原则选取 α 的值。具体过程略,最后选定 0.99 α = ,预测值如下所示: 年份 1998 1999 2000 2001 2002年份 GDP 年份 GDP 1998 1999 2000 2001 2002 216 266 345 450 577 2003 2004 2005 2006 2007 679 748 816 895 1 036
9GDP 216 266 345 450 577预测值 275.67 344.31 448.94 575.72年份 2003 2004 2005 2006 2007GDP 679 748 816 895 1036预测值 677.97 747.3 815.31 894.2 1034.58 一、随机过程(Stochastic Process) 定义 设(Ω,F,P)是概率空间,T 是给定的参数集,如果对于任意 t∈T,都有一定义在(Ω,F ,P)上的随机变量 X(t,ω)与之对应,则称随机变量 族{X(t,ω),t∈T}为随机过程。简记为{X(t,),t∈T}或{X t ,t∈T }或 X T 离散参数的随机过程也称为随机序列或(随机)时间序列。 上述定义可简单理解成: 随机过程是一簇随机变量{X t ,t∈T},其中 T 表示时间 t 的变动范围,对每个固定的时刻 t 而言,X t 是一普通的随机变量,这些随机变量的全体就构成一个随机过程。 当 t={0,±1,±2,…}时,即时刻 t 只取整数时,随机过程{X t ,t∈T}可写成如下形式,{X t ,t=0,±1,±2,…}。此类随机过程 X t 是离散时间 t 的随机函数,称它为随机序列或时间序列。 对于一个连续时间的随机过程的等间隔采样序列,即{X t ,t=0,±1,±2,…}就是一个离散随机序列。 二、时间序列的概率分布和数值特征 1、时间序列的概率分布 一个时间序列便是一个无限维的随机向量。一个无限维随机向量 X=(…,X-1,X0,X1,…)/的概率分布应当用一个无限维概率分布描述。根据柯尔莫哥夫定理,一个时间序列的概率分布可以用它有限维分布簇来描述。根据柯尔莫哥夫定理,一个时间序列的概率分布可以用它有限维分布簇来描述。 时间序列所有的一维分布是:…,F-1(·),F0(·),F1(·),… 所有二维分布是:Fij(·,·), i,j=0,±1,±2,…,(i≠j) 一个时间序列的所有有限维分布簇的全体,称为该序列的有限维分布簇。 2、时间序列的均值函数 一个时间序列的均值函数是指: ( )t t tEX XdF X μ∞−∞= = 痱 其中 EXt 表示在 t 固定时对随机变量 Xt 的求均值,,它只一维分布簇中的分布函数 Ft(·)有关。 3、时间序列的协方差函数与自相关函数
10与随机变量之间的协方差相似,时间序列的 协方差函数定义为: ( )( ),( , ) ( )( ) ( , )t t s st s s t st s E X XX Y dF X Yγ μ μμ μ∞ ∞−∞ −∞= − −= − −痱 痱 其中 Ft,s(X,Y)为(Xt,Xs)的二维联合分布。 类似可以定义时间序列的 自相关函数,即: ( , ) ( , )/ ( , ) ( , ) t s t s t t s s ρ γ γ γ = 时间序列的自协方差函数有以下性质: (1) 对称性: ( , ) ( , ) t s s t γ γ = (2) 非负定性:对任意正整数 m 和任意 m 个整数 k 1 , k 2, 。。。 k m ,方阵 ( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )1 1 1 2 1 m2 1 2 2 2 mm 1 m 2 m mk ,k k ,k k ,kk ,k k ,k k ,kk ,k k ,k k ,kmγ γ γγ γ γγ γ γ痖 瘗痍 瘊痍 瘊Γ =痍 瘊痍 瘊痍 瘊痣 瘥餖餖餖 餖 餖 餖餖 为对称非负定矩阵。 时间序列的自相关函数同样也具有上述性质且 有ρ(t,t)=1 。 三、平稳随机过程 平稳时间序列是时间序列分析中一类重要而特殊的随机序列,时间序列分析的主要内容是关于平稳时间序列的统计分析。 (一)两种不同的平稳性定义: 1、 严平稳:如果对于时间 t 的任意 n 个值1 2, , ,nt t t 餖 和任意实数 ε ,随机过程tX 的 n 维分布满足关系式: ( ) ( )1 2 1 2 1 2 1 2, , ; , , , , ; , ,n n n n n nF x x x t t t F x x x t t t ε ε ε = + + + 餖 餖 餖 餖 则称tX 为严平稳过程。 2、宽平稳:若随机过程 { } ,tX t T ∈ 的均值(一阶矩)和协方差存在,且满足 (1) [ ]tE X a t T = ∀ ∈ (2) [ ][ ] ( ) ,t k tE X a X a k t t k T γ+− − = ∀ + ∈ 则称 { } ,tX t T ∈ 为宽平稳随机过程。通常说的平稳是指宽平稳。
11二者的联系: (Ⅰ)严 ≠> 宽:因为宽平稳要求期望和协方差存在,而严平稳要求概率分布存在,而不能断言一、二阶矩存在。 (Ⅱ)宽 ≠> 严,这是不言而喻的。 (Ⅲ)严平稳+二阶矩存在 疝 宽平稳。但反过来一般不成立。 (Ⅳ)对于正态过程来说,有:严平稳 ⇔ 宽平稳 (二)平稳时间序列自协方差函数和自相关函数 为了叙述方便,常假定平稳时间序列tX 的均值为零,即 [ ] 0tE X = 。 用以下记号表示平稳序列tX 的自协方差函数,即 [ ][ ] ( ) 0k t k t k t t tt t kE X EX X EX EXEX Xγ+ ++= − − ==当 时 相应地,tX 的自相关函数用以下记号 0 k kρ γ γ = 平稳序列tX 的自协方差函数列和自相关函数列具有以下性质: (1) 对称性: ,k k k kγ γ ρ ρ− −= = ; (2) 非负定性:对于任意正整数 m, 0 1 m-11 0 m-2m-1 m-2 0mγ γ γγ γ γγ γ γ痖 瘗痍 瘊痍 瘊Γ =痍 瘊痍 瘊痣 瘥餖餖餖餖餖 餖餖,1 m-11 m-2m-1 m-2111mRρ ρρ ρρ ρ痖 瘗痍 瘊痍 瘊=痍 瘊痍 瘊痣 瘥餖餖餖餖餖 餖餖 为非负定对称方阵; (3) 0 ,1k kγ γ ρ ≤ ≤ 。 (三)平稳序列的样本统计量 (1) 样本均值 时间序列无法获得多重实现,多数时间序列仅包含一次实现,对于一个平稳序列用时间均值代替总体均值。即 11nttX Xn==疱
12 上式的估计是无偏的。 (2) 样本自协方差函数 ( )( )11ˆn kk t t ktX X X Xnγ−+== − −疱 ( )( )11ˆn kk t t ktX X X Xn kγ−+== − −−疱 第一式是有偏估计,第二式是无偏估计,但有效性不如第一式。 其它概率性质和偏自相关函数的定义将在以后章节介绍。 四、几类特殊的随机过程(序列): 1、纯随机过程:随机过程如果是由一个不相关的随机变量的序列构成的,则称其为纯随机过程。 2、白噪声序列(White noise):如果时间序列tX 满足以下性质: (1) [ ] 0tE X = (2) [ ]2, t s t sE X X σ δ = 式中,当 t≠s 时,, ,0, 1t s t tδ δ = = 。称此序列为白噪声序列,简称白噪声。 白噪声是一种最简单的平稳序列。 (3)独立同分布序列:如果时间序列 { } ,tX t T ∈ 中的随机变量 X t ,t=0,±1,±2,…,为相互独立的随机变量,而且 X t 具有相同的分布,称这样的时间序列 { } ,tX t T ∈ 为独立同分布序列。 独立同分布序列是一种最简单的严平稳序列。 一般说,白噪声序列与独立同分布序列是不同的两种序列,当白噪声序列为正态序列时,它也是独立同分布序列,此时称之为正态白噪声序列。 (4)独立增量随机过程:对于任意正整数 n,任意 ( )1 21,2, , ,i nt T i n t t t ∈ = < < < 餖 餖 ,随机变量2 1 3 2 1, ,n nt t t t t tX X X X X X−− − − 餖 相互独立。简单地讲,就是任意两相邻时刻上的随机变量之差(增量)是相互独立的。 (5)二阶矩过程:若随机过程 { } ,tX t T ∈ 对每个 , t T ∈tX 的均值和方差存在,则称之为二阶矩过程。 (6)正态过程:若 { } ,tX t T ∈ 的有限维分布都是正态分布,则称 { } ,tX t T ∈ 为正态随机过程。
13 主要介绍三种单变量模型:自回归(AR)模型、移动平均(MA)模型和自回归移动平均(ARMA)模型。 第一节 自回归模型 一、一阶自回归模型 AR(1) 如果时间序列独立,就是说事物的后一时刻的行为主要与其前一时刻的行为毫无关系。这样的资料所揭示甲统计规律就是事物独立地随机变动,系统无记忆能力。如果情况不是这样,资料之间有一定的依存性。 后一时刻的行为主要与前一时刻的行为有关,而与其前一时刻以前的行为无直接关系,即已知 Xt-1;X t 主要与 X t-1 相关。用记忆性来说,就是最短的记忆,即一期记忆,也就是一阶动态性。描述这种关系的数学模型就是一阶自回归模型。即
1 1 t t tX X a
本文编号:1630502
本文链接:https://www.wllwen.com/wenshubaike/dxkc/1630502.html