Download as pdf or txt
Download as pdf or txt
You are on page 1of 88

本章结构

• 确定性因素分解
• 移动平均法
• X-11模型
• X-12-ARIMA模型
• 指数平滑法
确定性因素分解
因素分解方法是一种常用的确定性时间序列分析方法。该方法由英
国统计学家W.M.Persons于1919年在他的论文“商业环境的指标”中首
次使用。它的提出基于当代经济学家、统计学家对经济序列的长期观察
和分析,他们发现尽管不同的序列波动特征千变万化,但所有的序列波
动都可以归纳为受到如下四大因素的综合影响:

(1) 长期趋势因素(T ) (2)季节变动因素(S )


反映了经济现象在一个较长时间内 是经济现象受季节变动影响所形
的发展方向,它可以在一个相当长 成的一种长度和幅度固定的周期
的时间内表现为一种持续向上或持 波动。
续向下或平稳的趋势。

(3)循环波动(C ) (4) 不规则变动因素(I )


序列呈现出从低到高再从高到 不规则变动又称随机变动,它是受
低的反复循环波动。循环周期 各种偶然因素影响所形成的变动。
可长可短,不一定是固定的。
假定序列会受到这四个因素中的全部或部分因素的
影响,时间序列x可以表示为这四个因素的函数,即:

xt = f (Tt , St , Ct , I t )

较常用的模型有

加法模型为: xt = Tt + St + Ct + I t

乘法模型为: xt = Tt  St  Ct  I t

伪加法模型为: xt = Tt  ( St + Ct + I t − 1)

对数加法模型为: ln xt = ln Tt + ln St + ln Ct + ln I t
确定性时序分析的目的
克服其它因素的影响,单纯测度出某一个确定性因素
对序列的影响
推断出各种确定性因素彼此之间的相互作用关系及它
们对序列的综合影响

趋势分析
目的
有些时间序列具有非常显著的趋势,我们分析的目的就是
要找到序列中的这种趋势,并利用这种趋势对序列的发展作
出合理的预测
常用方法
趋势拟合法
平滑法
趋势拟合法
趋势拟合法就是把时间作为自变量,相应的序列观察值
作为因变量,建立序列值随时间变化的回归模型的方法

分类
线性拟合
非线性拟合

线性拟合
使用场合
长期趋势呈现出线形特征

模型结构

 xt = a + bt + I t

 E ( I t ) = 0,Var ( I t )
例 5.1 拟合澳大利亚政府1981—1990年每季
度的消费支出序列

图 5-1
线性拟合
• 模型
xt = a + bt + It ,t = 1,2 ,40

E(It ) = 0,Var(It ) = 
2

• 参数估计方法
• 最小二乘估计
• 参数估计值

aˆ = 8498.69, bˆ = 89.12
拟合效果图

图 5-2
非线性拟合
• 使用场合
• 长期趋势呈现出非线形特征

• 参数估计指导思想
• 能转换成线性模型的都转换成线性模型,用线性最小
二乘法进行参数估计
• 实在不能转换成线性的,就用迭代法进行参数估计
常用非线性模型

模型 变换 变换后模型 参数估计方法
Tt = a + bt + ct 2 t2 = t 2 Tt = a + bt + ct 2 线性最小二乘估计


Tt = ln Tt
Tt = ab t a = ln a  线性最小二乘估计
Tt = a + bt
b = ln b

Tt = a + bc t - - 迭代法
Tt = e a +bct - - 迭代法
1
Tt = - - 迭代法
a + bc t
例5.2 对上海证券交易所每月末上证指数序列
进行模型拟合

图 5-3
非线性拟合

• 模型
Tt = a + bt + ct 2
• 变换
t2 = t 2
• 参数估计方法
• 线性最小二乘估计
• 拟合模型口径

Tt = 502 .2517 + 0.0952 t 2


拟合效果图

图 5-4
移动平均法
移动平均方法是一种常用的修匀方法。它
最早于1870年由法国数学家 De forest提出,19
世纪晚期已经广泛应用于商业和保险精算行业。
商人使用移动平均方法消除随机波动和季节性
影响,得到商品的价格变动趋势。精算师采用
移动平均方法来修匀死亡率,得到消除随机波
动的生命表。目前股市中普遍采用的5日均线、
10日均线、30日均线、60日均线等指标,实际
上都是移动平均估计值。
• 基本思想
• 假定在一个比较短的时间间隔里,序列值之间
的差异主要是由随机波动造成的。根据这种假
定,我们可以用一定时间间隔内的平均值作为
某一期的估计值

• 分类
• n期中心移动平均
• n期移动平均
n 期中心移动平均

1
 n ( xt − n −1 + xt − n −1+1 +  + xt +  + xt + n −1−1 + xt + n −1 ),n为奇数
~ 
xt =  2 2 2 2

1 (1 x + x 1
+  + xt +  + x n + x n ),n为偶数
 n 2 2 t −
n
t −
n
2
+1 t + −1
2
2 t+ 2
5


中 xt − 2 xt −1 xt xt +1 xt + 2




~ xt −2 + xt −1 + xt + xt +1 + xt + 2
均 xt =
5
n 期移动平均

~ 1
xt = ( xt + xt −1 +  + xt −n+1 )
n
5

期 xt − 4 xt − 3 xt − 2 xt −1 xt




~ xt −4 + xt −3 + xt −2 + xt −1 + xt
xt =
5
移动平均期数确定的原则

• 事件的发展有无周期性
• 以周期长度作为移动平均的间隔长度 ,以消
除周期效应的影响
• 对趋势平滑的要求
• 移动平均的期数越多,拟合趋势越平滑
• 对趋势反映近期变化敏感程度的要求
• 移动平均的期数越少,拟合趋势越敏感
移动平均预测

1
xˆT +l = ( xT +l −1 + xT +l −2 +  + xT +l −n )
n


xˆT +l −i , l  i
xT +l −i = 
xT + l −i , l  i

例5.3
•某一观察值序列最后4期的观察值为:
5,5.5,5.8,6.2
(1)使用4期移动平均法预测 xˆT +2 。
(2)求在二期预测值 xˆT +2中 xT 前面的系数等
于多少?
例5.3解
(1) xˆT +1 = 1 (xT + xT −1 + xT − 2 + xT −3 ) = 5 + 5.4 + 5.8 + 6.2 = 5.6
4 4
5.6 + 5 + 5.4 + 5.8
= ( xˆT +1 + xT + xT −1 + xT − 2 ) =
1
xˆT + 2 = 5.45
4 4
(2) xˆT + 2
= (xˆT +1 + xT + xT −1 + xT − 2 )
1
4
1 1 
=  (xT + xT −1 + xT − 2 + xT − 2 ) + xT + xT −1 + xT − 2 
4 4 
= (xT + xT −1 + xT − 2 ) + xT −3
5 1
16 16
5
在二期预测值中 x前面的系数等于T
16
简单移动平均能有效消除季节效应

例 5.4 对1981-1990年澳大利亚季节消费支出数
据序列(数据见表5-1)进行 M 24 ( xt ) 复合移动平
均,对比原序列和移动平均序列的周期性特征。

解:原序列为季节数据,有显著的季节特征每年为一个
周期,即周期长度为4期。对原序列先进行4期简单移动平
均 M 4 ( xt ) ,再对 M 4 ( xt ) 序列进行2期移动平均,得到复合移
动平均值(见表5-1)
时间 1981Q1 1981Q2 1981Q3 1981Q4 1982Q1 1982Q2 1982Q3 1982Q4 1983Q1 1983Q2
消费支出 8444 9215 8879 8990 8115 9457 8590 9294 8997 9574

8882 8799.75 8860.25 8788 8864 9084.5 9113.75 9229


8840.88 8830 8824.13 8826 8974.25 9099.13 9171.38 9282.75

时间 1983Q3 1983Q4 1984Q1 1984Q2 1984Q3 1984Q4 1985Q1 1985Q2 198SQ3 1985Q4
消费支出 9051 9724 9120 10143 9746 10074 9578 10817 10116 10779

9336.5 9367.25 9509.5 9683.25 9770.75 9885.25 10053.75 10146.25 10322.5 10403.25

9351.88 9438.38 9596.38 9727 9828 9969.5 10100 10234.88 10362.88 10459.38

时间 1986Q1 1986Q2 1986Q3 1986Q4 1987Q1 1987Q2 1987Q3 1987Q4 1988Q1 1988Q2
消费支出 9901 11266 10686 10961 10121 11333 10677 11325 10698 11624

10515.5 10658 10703.5 10758.5 10775.25 10773 10864 11008.25 11081 11174.75

10586.75 10680.75 10731 10766.88 10744.13 10818.5 10936.13 11044.63 11127.88 11183.25

时间 1988Q3 1988Q4 1989Q1 1989Q2 1989Q3 1989Q4 1990Q1 1990Q2 1990Q3 1990Q4
消费支出 11052 11393 10609 12077 11376 11777 11225 12231 11884 12109

11191.75 11169.5 11182.75 11363.75 11459.75 11613.75 11652.25 1177915 11862.25


表1
11180.63 11226.13 11323.25 11411.75 11536.75 11633 11715.75 11820.75

表 5-1
M表示复合移动平均值 图 5-5
简单移动平均能有效提取序列的低阶趋势(一元
一次线性趋势或一元二次抛物线趋势)

例 5.5 使用5期简单中心移动平均对我国1949-2008年化
肥产量序列(数据见表5-2)进行拟合。

图 5-6
时间 化肥产量 移动平均 时间 化肥产量 移动平均 时间 化肥产量 移动平均
1949 0.6 1969 174.9 137.5 1989 1802.5 1706.2
1950 1.5 1970 243.5 110.9 1990 1879.7 1740.2
1951 2.8 2.76 1971 299.4 309.42 1991 1979.5 1933.18
1952 3.9 3.98 1972 370.1 358.88 1992 2047.9 2027.24
1953 5 5.26 1973 459.2 415.12 1993 1956.3 2160.92
1954 6.7 6.92 1974 422.2 460.12 1994 2272.8 2326.82
1955 7.9 9.16 1975 524.7 530.86 1995 2548.1 2481.44
1956 11.1 12.04 1976 524.4 612.88 1996 2809 2692.18
1957 15.1 16.02 1977 723.8 741.52 1997 2821 2887.82
1958 19.4 22.54 1978 869.3 883 1998 3010 3015.4
1959 26.6 26.26 1979 1065.4 1025.92 1999 3251 3130.2
1960 40.5 32.52 1980 1232.1 1136.78 2000 3186 3324.2
1961 29.7 41.6 1981 1239 1238.7 2001 3383 3498.462
1962 46.4 56.44 1982 1278.1 1317.66 2002 3791 3809.222
1963 64.8 82.86 1983 1378.9 1335.68 2003 3881.31 4207.602
1964 100.8 125.1 1984 1460.2 1367.02 2004 4804.8 4600.022
1965 172.6 148.64 1985 1322.2 1445.84 2005 5177.9 5006.822
1966 240.9 157.86 1986 1395.7 1518.1 2006 5345.1 5433.1
1967 164.1 172.125 1987 1672.2
表 21532.575 2007 5825
1968 110.9 171.9667 1988 1740.2 1602.7 2008 6012.7

表 5-2
M表示5次移动平均值 图 5-7
简单移动平均比值还能有效提取季节效应

例 5.6 以北京市1995-2000年每月平均气温序列为例,介绍
季节效应分析的基本思想和具体操作步骤(数据见表5-3)

1995 1996 1997 1998 1999 2000


1 -0.7 -2.2 -3.8 -3.9 -1.6 -6.4
2 2.1 -0.4 1.3 2.4 2.2 -1.5
3 7.7 6.2 8.7 7.6 4.8 8.1
4 14.7 14.3 14.5 15 14.4 14.6
5 19.8 21.6 20 19.9 19.5 20.4
6 24.3 25.4 24.6 23.6 25.4 26.7
7 25.9 25.5 28.2 26.5 28.1 29.6
8 25.4 23.9 26.6 25.1 25.6 25.7
9 19 20.7 18.6 22.2 20.9 21.8
10 14.5 12.8 14 14.8 13 12.6
11 7.7 4.2 5.4 4 5.9 3
12 -0.4 0.9 -1.5 0.1 -0.6 -0.6
表 5-3
首先我们对原始数据来做时序图

图 5-8
通过时序图发现,北京市1995-2000年每月的平均
气温有非常明显的年度周期性规律,但每年相同月份
的平均气温又不会完全相同。因此,可以认为气温的
波动主要受两个因素的影响:一个是季节效应;一个
是随机波动。

假如没有季节效应的影响,北京市的气温应该始
终在某个均值附近随机波动,季节效应的存在使得气
温会在不同年份的相同月份呈现出相似的性质。为了
得到量化的季节信息,需要构造季节偏差和季节指数
的概念。
所谓季节偏差,就是用简单移动平均方法计
算的各期序列移动平均值和年度均值之间的差值,
主要应用于加法模型的季节特征描述,此时序列
可以表示为:

x j = x j + Sd j + I j
所谓季节指数,就是各期序列移动平均值和
年度均值之间的相对数,主要应用于乘法模型的
季节性特征描述,此时序列可以表示为

xj = xjS j + I j
季节偏差和季节指数数据时序图:

图 5-9 图 5-10
从图5-9我们可以看出, 7月份的季节偏差最大,
这说明7月份是北京最热的月份;1月份的季节偏差最
小,这说明1月份是北京最冷的月份。

同样的我们也可以观察图5-10,发现7月份的季节
指数最大,这说明7月份是北京最热的月份;1月份的
季节指数最小,这说明1月份是北京最冷的月份。
简单中心移动平均具有很多优良属性,这使得
它成为实务中最常用的一种移动平均方法,但是它
也有不足之处。在提取趋势信息的时候,它能很好
地提取一次函数和二次函数的信息,但是对于二次
以上曲线,它对趋势信息提取不充分。
例 5.7 使用5期简单中心移动平均对一元三次
函数 xt = t 3 , (t  0) 进行拟合,并考察拟合误差项
的性质。
t x m t x m t x m
1 1 18 5832 5940 35 42875 43085
2 8 19 6859 6973 36 46656 46872
3 27 45 20 8000 8120 37 50653 50875
4 64 88 21 9261 9387 38 54872 55100
5 125 155 22 10648 10780 39 59319 59553
6 216 252 23 12167 12305 40 64000 64240
7 343 385 24 13824 13968 41 68921 69167
8 512 560 25 15625 15775 42 74088 74340
9 729 783 26 17576 17732 43 79507 79765
10 1000 1060 27 19683 19845 44 85184 85448
11 1331 1397 28 21952 22120 45 91125 91395
12 1728 1800 29 24389 24563 46 97336 97612
13 2197 2275 30 27000 27180 47 103823 104105
14 2744 2828 31 29791 29977 48 110592 110880
15 3375 3465 32 32768 32960 49 117649
16 4096 4192 33 35937 36135 50 125000
17 4913 5015 34 39304 39508
表 5-4
图 5-11
进一步考察拟合误差 y = x − m

图 5-12

误差序列依然残存显著的趋势信息,如图5-12所示。这
说明简单移动平均对高阶多项式函数趋势信息的提取不够
精确了。于是新的方法需要引入,如Henderson加权移动平
均。
Henderson是20世纪早期的保险精算统计学家他最
初提出Henderson加权移动平均是为了解决生命表的修
匀问题。所谓 Henderson加权移动平均,是指在满足一
定关系条件下,对移动平均系数做了调整后的一种广义
的移动平均。对于5期加权移动平均其表达式如下:

Henderson加权移动平均
zt = −0.0734 xt −2 + 0.2937 xt −1 + 0.5594 xt + 0.2937 xt +1 − 0.0734 xt +2

因为中心移动平均会损失信息,为了弥补这一不
足,Musgrave给出了非对称移动平均。对于5期加权移
动平均其表达式如下:

wt = −0.1836 xt − 2 + 0.3671xt −1 + 0.8164 xt


分别使用Henderson 5期加权移动平均和Musgrave 5期
非对称移动平均,对数据进行拟合,得到拟合效果图如下

图 5-13

Henderson 5期加权移动平均和Musgrave 5期非对称移动


都能够很好的拟合原序列。
y1 = x − z

y2 = x − w

图 5-14
X-11季节调整模型
X-11模型是第二次世界大战以后,美国国情普查局委托统计学
家进行的基于计算机自动计算的时间序列因素分解模型。这个模
型之所以叫季节调整模型,是因为国家经济序列通常具有明显的季
节波动,季节性会掩盖经济发展趋势,妨碍人们对其作出正确判断。
因此,在进行国家经济发展观察和研究时,首先需要进行因素分解,
然后剔除季节波动的影响,得到国家经济发展变量的趋势特征,这
就是季节调整模型的构造起因。
1954年,第一个基于计算机计算的时间序列因素分解程序的测
试版本问世,随后经过10多年的发展,计算方法不断完善,陆续推出
新的测试版本X-1,X2,…,X-10. 1965年,美国国情普查局发布了比较
完整的测试版本X-11。该版本由统计学家Young、Musgrave等共
同研发,它采用简单移动平均, Henderson加权移动平均,
Musgrave非对称移动平均这三种不同的移动平均方法,通过三个
阶段的因素分解,实现了计算机程序化操作、拟合效果良好的时间
序列季节调整程序。此后, X-11季节调整模型成为全球统计机构
和商业机构进行因素分解时最常使用的标准方法。
X-11季节调整模型基于简单移动平均,Henderson
加权移动平均和 Musgrave非对称移动平均这三种方法,
使用多次移动平均反复迭代进行确定性因素分解。
对给定的数据,首先,我们来绘制时间序列图,
并根据时序图所显示的特征进而选择适当的确定性因
素模型。通常来说,如果趋势、季节、交易日和随机
波动这四种因素相互独立时,就使用加法模型;趋势、
季节、交易日和随机波动这四种因素相互关联时或部
分相互关联时,就使用乘法模型、对数模型和伪加法
模型中的一种,而实际问题中又以乘法模型使用的最
为普遍。
例 5.8 对1993-2000年中国社会消费品零售总额序列,
基于X-11季节调整模型,进行确定性因素分解。

月份 1993年 1994年 1995年 1996年 1997年 1998年 1999年 2000年


1月 977.5 1192.2 1602.2 1909.1 2288.5 2549.5 2662.1 2774.7
2月 892.5 1162.7 1491.5 1911.2 2213.5 2306.4 2538.4 2805
3月 942.3 1167.5 1533.3 1860.1 2130.9 2279.7 2403.1 2627
4月 941.3 1170.4 1548.7 1854.8 2100.5 2252.7 2356.8 2572
5月 962.2 1213.7 1585.4 1898.3 2108.2 2265.2 2364 2637
6月 1005.7 1281.1 1639.7 1966 2164.7 2326 2428.8 2645
7月 963.8 1251.5 1623.6 1888.7 2102.5 2286.1 2380.3 2597
8月 959.8 1286 1637.1 1916.4 2104.4 2314.6 2410.9 2636
9月 1023.3 1396.2 1756 2083.5 2239.6 2443.1 2604.3 2854
10月 1051.1 1444.1 1818 2148.3 2348 2536 2743.9 3029
11月 1102 1553.8 1935.2 2290.1 2454.9 2652.2 2781.5 3108
12月 1415.5 1932.2 2389.5 2848.6 2881.7 3131.4 3405.7 3680
表 5-5
每年的振幅随着水平的提高而递增,所以采用乘
法模型 xt = Tt StIt 较为合适。

图 5-15
打开序列窗口—点击‘Pro’-‘Seasonal Adjustment’—‘Census X-12’
交易日、节假日设定 离群值设定 诊断,主要用于季节
因素的稳定性分析等
季节调整选择设定

乘法模型
加法模型
ARIMA选择
伪加法模型

对数加法模型

图 5-16
季节分量滤子,可以选
择X-1,X-3,X-5,X-9,X-
11等
保存调整后的分量序列名
最终的季节调整后序列

最终的季节因子
最终的不规则因子
最终的趋势循环因子

季节交易日混合因子

假日交易日混合因子
图 5-17
图 5-18
对于本例做如上图的选择,点击确定后,得到季节调整
模型的拟合值。此时会输出4个序列和一个报表
-sf:最终的季节因子。季节指数图

图 5-19

中国社会消费品零售总额具有显著的季节变动特征:每
年春夏季节4-8月是淡季(6月稍有回弹),冬季是销售旺季。
-tc:最终的趋势循环因子。趋势拟合图

图 5-20

序列呈现出显著的递增趋势,这表明1993-2000年我国
消费品零售总额持续增加,消费品发展势头良好。
-ir:最终的不规则因子。随机波动序列图

图 5-21
-sa:最终的季节调整后序列。季节调整后的序列图

图 5-22
X-12- ARIMA模型
X-12- ARIMA模型是基于X-11模型而产生的。在研发出X-11模型5
年之后,Box和 Jenkins提出了基于序列内部相关性进行序列拟合和预测的
ARIMA模型。

1975年,加拿大统计局在 Dagum的支持下开发了X-11-ARIMA模型。
它是在建立X-11模型之前,首先通过建立ARIMA模型对序列进行向前
和向后预测,扩充数据,以保证在使用简单中心移动平均和 Henderson加
权移动平均的过程中数据的完整性,不会出现前k期和最后k期数据拟合
值缺失的情况,这弥补了中心移动平均方法的缺陷,同时也可以取代
Musgrave非对称移动平均的缺失值补齐工作。
1998年,美国普查局在 Findley,Monsell等人的共同努力下开发了X-
12-ARIMA模型,X-12-ARIMA模型主要是在X-11-ARIMA模型的基础上
加强了对序列的预处理。它可以用回归模型的方式,检测月度长度、季
度长度、固定季节因素、工作日因素,交易日因素、闰年因素、特殊节
假目等多种因素对序列的影响,并检测该影响的显著性与稳定性。这进
一步提高了季节调整模型的准确性和解释性。
X-12-ARIMA模型的操作主要由如下三个步骤构成

第一步:根据序列的特点,考察序列值是否会受到某些确定
性异常值的影响。比如月度数据会不会受到该月天数的影
响?(有的月份31天,有的月份30天,有的月份28天,有的月份29
天) 年度数据会不会受到某些年是闰年的影响?(闰年会比非
闰年多一天)旅游数据会不会受到某段时间假期多某段时间
假期少的影响?(五一黄金周,十一黄金周等)股票交易数据
会不会受到交易日的影响。
如果序列有可能受到这些因素的显著影响,则将这些因素作
为自变量,序列作为因变量,建立回归模型。如果回归模型显著
成立,则说明该影响因素对序列有显著稳定的影响,回归方程起
到了提取特殊因素影响,调整序列的作用。如果回归方程不显
著,则说明该影响因素不需要进行特殊对待,不需要对序列进行
特殊的预处理。
第二步:对回归残差序列(如果回归方程显著)或原序列(如
果回归方程不显著)拟合ARIMA模型

第三步:构建X-11模型。依然进行3阶段10步选代运算。
但是期间系统会使用第二步拟合出来的 ARIMA模型自动向前
或向后做序列预测,根据需要扩充数据得到更准确的因素分解
结果。

这三个步骤中的第一步和第二步统称为 regARIMA过程,
所以X-12-ARIMA模型也称为 regARIMA与X-11的组合模型。
例 5.9 对1993-2000年中国社会消费品零售总额
序列基于X-12-ARIMA季节调整模型,进行确定性因
素分解(数据见表5-5)。

1.对序列进行异常值调整
考虑到该序列是月度数据,我们想考察一下每月不同
的长度(有的月份31天,有的月份30天,有的月份28天,有
的月份29天)对序列值是否造成显著的影响。
以月度长度为自变量(用LOM表示) ,中国社会消费
品零售总额序列( X t)为因变量构造回归模型
xt = 60.97LOM t
选择显著性水平为0.05.模型拟合结果显示参数
显著性检验P值等于0.8197,远远大于0.05,所以该方程
不能显著成立,也就是说,每月的不同长度不是中国社
会消费品零售总额序列的显著异常影响因素。

进一步考虑每年年末都有特别高的季节指数,让
人不禁怀疑这是否是由于我国的春节所造成的异常
影响。假设每年春节前15天和后15天为春节效应的
有效影响期,通过计算这段时间落入每个月的天数,再
将其除以该月总天数,可以得到春节影响因子序列。
比如1993年春节在1月23日,那么春节有效影响期
在1月8日一2月6日,那么1993年1月将有24天处于春节
影响期(1月8日-1月31日).1993年1月份的春节影响因子
即为24/31,2月份有6天处于春节影响期(2月1日一2月6
日), 1993年2月份的春节影响因子即为6/28.而3-12月都
没有受到春节因素的影响所以春节影响因子为0,即
1993年各月的春节影响因子序列值如下

1993年 1月 2月 3-12月
INDEX 24/31 6/28 0
将春节影响因子作为自变量记为Index,与中国社
会消费品零售总额序列 X t 建立回归模型:
xt = 116.8INDEX t
选择显著性水平为0.05.模型拟合结果显示参数显著性
检验P值等于0.4201,远远大于0.05的显著性水平,该方程不
能显著成立,所以,以我们这种方式将春节前后半个月作为
春节因素考察,春节效应不是中国社会消费品零售总额序
列的显著异常影响因素。

需要补充说明的是,把节日前后多长时间视为节日效
应有时会直接影响节日效应是否显著异常,这需要研究人
员根据经验和节日具体的政策、习俗等因素自行确定和检
验,本例对春节效应的确定并不一定科学,只是提供一个操
作案例。
2 .构建ARIMA模型
本例中,因为所有的异常影响因素回归模型均不
显著,所以直接使用原序列构建ARIMA模型(如果有
回归模型显著,就使用回归残差序列构建ARIMA模
型)。

(1)在上一节例题中已经对此数据做过时序图,
并发现此序列有明显的季节效应。因为数据是月度
序列,所以我们首先考虑数据的一阶12步差分,并
将差分后的数据记为y。

y = (1 − B )xt
12
(2)对数据y做平稳性检验(ADF检验)

Null Hypothesis: D(Y) Exogenous: Constant,


has a unit root Linear Trend
T-Statistic Prob.

ADF test -16.5528 0


statistic
Test critical values 1% level -4.073859

5% level -3.465548
10% level -3.159372
表 5-6
序列Y的一阶差分D(Y)是平稳的,所以可以对
D(Y)建立ARMA模型。
(3)ARMA(p,q)模型的建立

图 5-23
从图5-23发现,序列y的一阶差分,显示1阶自相关系数截尾
和1阶偏自相关系数截尾属性,所以尝试对差分序列拟合AR(1)
模型,MA(1)模型和ARMA(1,1)模型。

对于AR(1)模型,MA(1)模型和ARMA(1,1)模型,首先选择
含有截距项的形式对模型进行估计,发现如果选择显著性水平
为0.05的话,三个模型的截距项都不能都过显著性检验。于是
对AR(1)模型,MA(1)模型和ARMA(1,1)模型选择不含有截距项
的模型进行估计,估计结果为
模型 变量 P值 SC值 AIC值
AR(1) AR(1) 0 10.95 10.92
MA(1) MA(1) 0 11 10.97
ARMA(1,1) AR(1) 0.0113 10.99 10.94
MA(1) 0.4625
表 5-7
最后选择AR(1)模型,相应的我们得到参数
的估计值为-0.55,于是最终的模型为:

1
(1 − B )(1 − B )xt =
12
t
1 + 0.55B

该模型在X-12-ARIMA模型中为ARIMA(1,1,0)(0,1,0)12
3. 拟合X-11模型
原序列可以拟合ARIMA(1,1,0)(0,1,0)12 模型,这意味
着季节和趋势相互独立,所以采用X-11加法模型。经过
X-11模型3阶段10步的迭代运算,最后得到X-12-ARIMA
季节效应、趋势效应和随机波动影响的因素分解结果,
并可考虑序列的拟合效果。

具体的Eviews操作为:打开序列窗口—点击‘Pro’-
选择‘Seasonal Adjustment’—选择‘Census X-12’得到
如下界面
乘法模型

加法模型

伪加法模型

对数加法模型 季节分量滤子

保存调整后的分量序列名
最终的季节调整后序列

最终的季节因子
最终的不规则因子
最终的趋势循环因子

季节交易日混合因子

假日交易日混合因子

图 5-24
对于本例,在季节调整选择设定选择加法模型,
在季节滤子选择Auto(X-12 defaul),在趋势滤子不做
选择(默认),在保存调整后的分量序列名中选择
最终的季节调整后序列、最终的季节因子、最终的
趋势循环因子和最终的不规则因子。然后点击
‘ARIMA Options’此时出现如下界面
此界面会出现4
回归因子
个选项框
数据转化

ARIMA说明

阶数的说明(p d q)
(P D Q)默认为
(0 1 1)(0 1 1)

从外部文件选
择ARIMA模型

图5-25
在‘ARIMA Options’选项中选择‘Specify in-lir’。然后在‘In-line
specification’选项框将默认值(0 1 1)(0 1 1)修改为(1 1 0)(0 1 0) 。

图5-26
X-12-ARIMA模型季节效应图

图 5-27

和X-11模型类似,从季节指数图可以看到,中国社会消费品
零售总额具有显著的季节变动特征:每年春夏季节4-8月是淡季(6
月稍有回弹),冬季是销售旺季。
X-12-ARIMA模型趋势效应图

图 5-28

和X-11模型类似,从上图可以看出,1993-2000年我国消费
品零售总额持续增加,消费品发展势头良好。
X-12-ARIMA模型随机波动效应图

图 5-29
X-12-ARIMA模型拟合效果图

图 5-30
与X-11模型不同的一个地方是,X-12-ARIMA模型不仅给出
拟合值、拟合效图,还给出模型拟合的检验统计量,为改进模型
和比较多个拟合模型优劣提供了基础。比如上面的拟合结果是
基于加法模型得到的,还可以基于乘法模型拟合一个 X-12-
ARIMA模型。这两个模型的拟合效果如表5-8给出:

检验统计量 X-12-ARIMA加法 X-12-ARIMA乘法模


模型 型

Logliklihood -452.2268 -452.2268


AIC 908.4536 908.6036
BIC 913.2912 913.2912

表 5-8
指数平滑法
基于因素分解的思想,进行确定性时间序列分析的
目的主要有两个。第一个是克服其它因素的干扰,单纯
测度出某个确定性因素,第二个目的,根据序列呈现的
确定性特征选择适当的方法对序列进行综合预测。
对于既无长期趋势,又无季节效应的水平平稳序列,
可以认为在一个比较短的时间间隔内,序列的取值是比较
稳定的,序列值之间的差异主要是由随机波动造成的。根
据这种假定,我们可以将最近一段时间内的平均值作为未
来几期的预测值,该方法称为简单移动平均预测法,假定
最后一期的观察值为x,那么使用简单移动平均模型向前
预测L期,各期的预测值为
xt + xt − 1 +  + xt − n + 1
xˆt +1 =
n
xˆt +1 + xt +  + xt − n + 2
xˆt + 2 =
n
 
xˆt +l −1 +  + xˆt +1 + xt +  + xt − n +l
xˆt +1 =
n
简单移动平均法实际上就是将一个简单的加权平均数
作为某一期序列值的估计值.以n期移动平均为例,
xt + xt − 1 +  + xt − n + 1
xˆt + 1 =
n
相当于用近n期的加权平均数作为未来一期序列水平的估
计值,它们的权重都取为1/n.实际上也就是假定无 论时间远
近,这n期的现察值 xt ,xt −1 , ,xt − n +,1 对第t+1期预测值的影响都
是一样的.但在实际生活中,会发现对大多数随机事件面言,
一般都是近期的结果对现在的影响会大些,远期的结果对
现在的影响会小些.为了更好地反映这种时间所起的影响
作用,需要考虑时间间隔对事件发展的影响,各期权重随时
间间隔的增大而呈指数衰减,这就是1961年Bown和Meyers
提出的指数平滑法的构造思想。
简单指数平滑预测模型

基本公式

xˆt = xt + (1 −  )xt −1 + (1 −  ) xt − 2 + 


2

等价公式

xˆt = xt + (1 −  )xˆt −1


简单指数平滑面临一个确定初始值xˆ1
的问题,最简单的方法是指定 xˆ1 = x 1 。平滑
系数  的值最初由研究人员根据经验给出.
一般对于变化缓慢的序列,常取较小的值;
相反,对于变化迅速的序列,常取较大的 
值,经验 值介于0.05至0.3之间,修匀效果
比较好。
简单指数平滑预测
一期预测值
xˆT + 1 = x T + (1 −  )x T −1 + (1 −  )2 x T − 2 + 
二期预测值
xˆT + 2 = xˆT +1 + (1 −  )xT + (1 −  )2 xT −1 + 
= xˆT + 1 + (1 −  )xˆT + 1 = xˆT +1
l期预测值
xˆT + l = xˆT + 1 , l  2

使用简单指数平滑法预测任意l期的预测值都
为常数。
例 5.10 对某一观察值序列 xt 使用
指数平滑法进行预测。
已知 xT = 10 ,xˆT −1 = 10.5 ,平滑系数 = 0.25
(1) 求二期预测值 xˆT + 2 。
(2) 求在二期预测值 xˆT + 2 中 xT 前面的系
数等于多少?
(1)因为简单指数平滑法预测任意l期的预测值都
为常数,所以

xˆT +1 = xˆT = 0.25xT + 0.75xˆT −1 = 10.3


xˆT + 2 = xˆT +1 = 10.3
(2)
xˆT + 2 = xˆT +1 = xT + (1 −  )xT −1 + 
所以使用简单指数平滑法二期预测值中 xT 前
面的系数就等于平滑系数  = 0.25
例 5.11 根据1950-2008年的观察值序列,指定平
滑系数a=0.2,采用指数平滑法预测2009-2013年我国
邮路及农村投递线路每年新增里程数

年份 新增里程 年份 新增里程 年份 新增里程 年份 新增里程


1950 15.71 1965 42.81 1980 -7.52 1995 8.54
1951 24.43 1966 18.78 1981 -7.69 1996 24.51
1952 18.23 1967 -0.75 1982 1.61 1997 28.91
1953 22.5 1968 -1.08 1983 4.46 1998 44.94
1954 12.53 1969 5.09 1984 10.97 1999 11.16
1955 9.94 1970 26.39 1985 15.15 2000 11.08
1956 7.19 1971 31.09 1986 6 2001 15.75
1957 41.13 1972 19.78 1987 -0.9 2002 -0.31
1958 79.03 1973 2.56 1988 -3.22 2003 20.99
1959 119.32 1974 12.95 1989 -8.54 2004 6.5
1960 -12.1 1975 15.54 1990 6.76 2005 10.45
1961 -89.71 1976 3.97 1991 -0.83 2006 -3.51
1962 -52.26 1977 2.42 1992 4.67 2007 23.42
1963 20.01 1978 0.31 1993 11.68 2008 17.99
1964 19.92 1979 -5.1 1994 0.82
根据简单指数平滑公式
xˆt = xt + (1 −  )xt −1 + (1 −  ) xt − 2 + 
2

且a=0.2,容易得到2009-2013年我国邮路及农村投递线路
每年新增里程数恒为13.2282公里,95%的置信区间恒为
(-45.7146, 72.171).

此外还可以给出1951-2008年数据的预测值。拟合
与预测效果如图5-31所示。
图 5-31

W:指数平滑得到的预测值 X:真实值
根据该序列自相关图和偏自相关图的属性,选择自回归模型
AR(2) 来拟合数据,通过建立AR(2)模型给出序列1952-2013年的
预测值。

Z: AR(2)模型得到的预测值 图 5-32 X:真实值


两种方法得到的不同预测值与真实值进行比较,
拟合效果如下图

图 5-33

Z: AR(2)模型得到的预测值 X:真实值 W:指数平滑得到的预测值


和ARMA方法相比,显然指数平滑法更简便,不
需要借助自相关图和偏自相关图的属性识别模型,可
以直接对序列进行平滑拟合与预测。但是,指数平滑
法也有它的缺陷与不足。首先,简单指数平滑法拟合
与预测的精度不及ARMA模型高,其次简单指数平滑
法预测任意l期的预测值都为常数。最后,对于含有
长期趋势或季节效应的数据,此时简单指数平滑法将
不在适用了。需要引入新的方法,如Holt两参数指数
平滑法,Holt-Winters三参数指数平滑法。

You might also like