Professional Documents
Culture Documents
第4章 非平稳时间序列的随机分析(慕课)
第4章 非平稳时间序列的随机分析(慕课)
平稳时间序列来讲,我们有一套比较成熟的分
析理论方法。但是,在实际问题中我们碰到的
时间序列数据大多是非平稳序列。由于非平稳
序列的发展极不稳定,很难直接找到其变化发
展规律。因此,非平稳时间序列分析方法与平
稳时间序列会有很大的不同。
为了找到分析非平稳时间序列的理论与方
法,我们有必要了解非平稳序列的结构。下面
我们将介绍一个时间序列是怎样构成的,这方
面的工作是由Wold和Cramer给出的。
第一节 时间序列的分解
一、 Wold分解定理
1938年,Wold 在他的博士论文中研究了平
稳时间序列分解定理,他将平稳序列分解为两个
不相关的平稳序列之和,其中一个为确定性的,
另一个为随机性的,这种研究思路对于非平稳时
间序列也有借鉴意义。
Wold分解定理:对于任何离散平稳过程 xt
它都可以分解为两个不相关的平稳序列之和,其
中一个为确定性的,另一个为随机性的,记作
xt Vt t
式中, Vt 为确定性序列,t 为随机性序列,且
t j t j
满足: j 0
(1) 0 1, j
2
j 0
(2) t WN (0, 2 )
(3) cov(Vt , s ) 0, t s
这里我们解释一下什么是确定性序列,什么
是随机序列。
设 yt 是任一序列,将序列 yt 关于滞后 q 期
之前的序列 yt q , yt q1 , 进行回归,即
yt 0 1 yt q 2 yt q1 vt
式中, vt 为残差序列。如果我们基于历史信息:
yt q , yt q1 , 预测 yt 的值,则 vt 可以理解为预测
误差,记 Var ( vt ) 2
v ( q ) 2
,显然有 v (q) Var ( yt ) ,
且滞后期 q 越大,意味着预测的步长越长,预测
的误差就越大,即 v2 (q) 越大。
2
所以 v (q) 的大小可以衡量历史信息对现
时值 yt 的预测精度, v2 (q) 越小说明预测精度
越高, v2 (q) 越大说明预测精度越差。
2
(1)如果 q v (q) 0 ,说明序列发展的规律
lim
性强,历史数据可以很好地预测将来,这时称序
列 yt 是确定性序列。
2
(2)如果 q v (q) Var( yt ) ,说明序列发展的
lim
随机性强,历史信息对现值估计效果差,这时称
序列 yt 是随机序列。
例如,对于平稳的ARMA(p,q) 模型:
( B)
xt t
( B)
t , t T -------确定性平稳序列
( B)
t , t T -------随机平稳序列
( B)
二、 Cramer分解定理
1961年,Cramer证明了如下结论:
任何一个时间序列 xt 都可以分解为由多项式
决定的确定性趋势成分与平稳的零均值误差成分之
和。即 d
xt t t j t j ( B)at
j 0
反映 { xt } 受到的确定性的影响。
t ( B)at
反映的是 { xt } 受到的随机影响。
对于一个随机时间序列来说,只要其确定性
的影响和随机影响这两方面中有一方面不稳定,
就会导致时间序列非平稳。
Cramer分解定理是现代时间序列分析理论
的灵魂,它表明任何一个序列的波动都可以视为
同时受到了确定性影响和随机性影响的作用。平
稳序列要求这两方面的影响都是稳定的,而非平
稳序列产生的机理就在于它所受到的影响至少有
一方面是不稳定的。
Cramer分解定理为我们研究非平稳时间序列
奠定了理论基础。
第二节 差分运算
对于随机非平稳序列来说,我们难以直接找
到其变化发展规律,主要是因为非平稳序列通常
都具有某种不稳定的趋势。所以,分析非平稳序
列的第一步是采取有效的手段提取其趋势使序列
变为平稳序列,然后利用平稳序列分析方法来处
理。提取序列趋势的工具主要是差分运算。
一、差分运算的作用
为什么差分运算是提取序列趋势的有效工具
呢?因为非平稳时间序列通常会受到某些确定性
或不确定性因素的影响,导致时间序列各期值存
在时间上强的自相关性,从而导致序列有长记忆
性。而非平稳时间序列的趋势(包括确定性趋势
和随机性趋势)也是由序列的强自相关性所导致
的。
注意到时间序列 xt 的 d 阶差分为:
d
d xt ( 1)i C di xt i
i 0
将上式改写为:
d
xt ( 1)i 1 C di xt i d xt
i 1
这个式子可以看成是 xt 关于 xt 1 , xt 2 , , xt d 的一
个 d 阶自回归过程,其中 d xt 度量了自回归过程产
生的随机误差的大小。
所以,差分运算正是通过自回归的方式提取
了序列的确定性信息。
实际上,时间序列中的差分运算类似于函数的
求导运算,如果一个时间序列的确定性趋势是时间
的 d 次多项式,则 d 阶差分后的序列的确定性趋势
就一定是常数,将不会再蕴含时间趋势,从而实现
序列的平稳化。
d
j t k , ( k 为常数)
d j
j 0
而由Cramer分解定理知,方差齐性非平稳序
列都可以分解为如下形式:
d
xt t t j t j ( B)at
j 0
则对序列 xt 做一阶差分
xt b t
就提取了序列中的确定性趋势信息。
若 xt a bt ct 2 t ,则对 xt 做二阶差分
2 xt 2c 2 t
即可提取序列中的确定性趋势信息。
一般地,如非平稳时间序列的确定性趋势可以
表示为一个关于时间变量的 d 次多项式形式,即
d
E( xt ) j t j
j 0
则 d 阶差分序列的确定性趋势为:
d
E xt j t k (k为某一常数)
d d j
j 0
即d 阶差分序列的确定性趋势中不在蕴含时间趋势
成分。
二、差分方式的选择
(一)如果时间序列 xt 的确定性趋势是时
间的线性函数,即
E( xt ) 0 1t
则其差分序列的确定性趋势为:
E(xt ) 1
由此可以看出,差分序列中的时间趋势消失。实现
了序列的平稳化。
例如,下图是 1964-1999 年中国纱年产量时序图
600
500
400
300
200
100
0
1965 1970 1975 1980 1985 1990 1995
从图中不难发现序列蕴含一个线性的递增趋势,对序
列做一阶差分运算,差分后的序列时序图为:
60
40
20
-20
-40
1965 1970 1975 1980 1985 1990 1995
从时序图中我们发现,差分后的时间序列呈现非常平
稳的随机波动,这说明一阶差分运算非常成功地提取了原
序列中的线性趋势。
(二)如果时间序列 xt 的确定性趋势是非
线性趋势,通常低阶差分(2阶或3阶)就可以提
取非线性趋势。
例如,若序列的确定性趋势是时间的3次函
数,即 E( xt ) 0 1t 2t 2 3t 3
则它的 3 阶差分序列的确定性趋势为:
E( 3 xt ) 6 3
由此可以看出,3阶差分序列中的时间趋势消
失。即通过3阶差分就可以提取原序列中蕴含的 3
次趋势。
我们看一个实际中有非线性趋势的时间序列的
例子,下图是1990-2012年我国私人汽车拥有量序列
的时序图: 9000
8000
7000
6000
5000
4000
3000
2000
1000
0
90 92 94 96 98 00 02 04 06 08 10 12
从序列时序图可以看出,序列有明显的非线性
上升趋势。对序列做 1 阶差分, 1 阶差分后的序列
时序图为:
1600
1200
800
400
0
90 92 94 96 98 00 02 04 06 08 10 12
D(X)
从一阶差分后序列时序图来看,序列还有
非线性时间趋势,我们对序列再做差分运算,2
阶差分序列时序图为:
500
400
300
200
100
-100
90 92 94 96 98 00 02 04 06 08 10 12
D(X,2)
二阶差分后序列时序图显示序列仍然有缓慢
上升的趋势,下面我们对序列再做差分运算, 3阶
差分序列时序图为:
400
300
200
100
-100
-200
-300
90 92 94 96 98 00 02 04 06 08 10 12
D(X,3)
从时序图可以看出,直到 3 阶差分原序列中蕴
含的长期趋势才被较为充分地提取, 3阶差分后的
序列不再呈现确定性趋势。
(三)如果时间序列的确定性趋势里蕴含固定
的时间周期成分,这种序列则需要对序列进行步长
为周期长度的差分运算来实现序列的平稳化。
例如,假设一个非平稳时间序列 zt 是由一个
季节随机游走过程 yt 和一个非季节随机游走过程
xt 两部分组成,即
xt 0 xt 1 ut
yt 0 yt 4 vt
zt xt yt wt
由于等式右侧的每一项都是平稳过程,所以 4 zt
也是平稳过程。这样我们通过一阶差分提取了时间
序列的线性趋势,利用4 步季节差分提取了时间序
列中的季节信息。
这里需要说明的是:在利用差分运算将非平稳
序列转化为平稳时间序列的过程中需要注意两点:
第一,要防止过差分。所谓过差分是指利用差
分运算已充分提取序列趋势后,继续对序列进行差
分运算。过差分会使序列的方差变大,导致有效信
息的无谓浪费,从而使得参数估计的精度下降。
例如,假定非平稳序列为:
xt c xt 1 t ,
c为常数, t iid (0, 2
)
则 xt 的 1 阶差分为:
xt c t
显然,一阶差分后的序列是平稳序列,这说
明 1 阶差分运算有效提取了 xt 中的非平稳确定性
信息。
但是,如果我们对 xt 1阶差分序列再做差分运算,例
如,我们对 xt 做 2 阶差分和 3 阶差分,则
2 xt t t 1
3 xt t 2 t 1 t 2
虽然2阶和3阶差分序列也都是平稳序列,也能够将原
序列中的非平稳趋势充分提取,但是我们考察它们的方差
发现:
Var (xt ) 2
Var ( 2 xt ) 2 2
Var ( 3 xt ) 6 2
可见,随着差分阶数的增加,序列的方差越来越大。
这就是过度差分造成的结果。
第二,当序列含有可以线性化的趋势时,我们可以先通
过适当的函数变换,将非线性趋势转化为线性形式,然后再
通过对变换后的序列做差分运算提取序列的线性趋势,这样
可以减少差分的阶数。
例如,若序列 xt 含有指数趋势,即
xt aebt t (a,b为常数, t 为白噪声)
则,对序列 xt 取对数可线性化:
ln xt ln a bt t
8000
7000
6000
5000
4000
3000
2000
1000
0
90 92 94 96 98 00 02 04 06 08 10 12
序列时序图与指数函数图形非常相似,我们可以考虑
先对序列做对数变换,变换后序列的时序图如下:
10
4
90 92 94 96 98 00 02 04 06 08 10 12
LOG(X)
变换后的序列有明显的线性递增趋势,再对序列做一
阶差分运算,差分后的序列时序图为:
.28
.26
.24
.22
.20
.18
.16
.14
90 92 94 96 98 00 02 04 06 08 10 12
D(LOG(X))
差分后的时间序列呈现平稳的随机波动,这说明一阶
差分运算非常成功地提取了对数序列中的线性趋势。
第三节 ARIMA模型
前面介绍利用差分运算将非平稳序列转化为平
稳序列的方法。
其中, t 是一个白噪声序列
( B ) 1 1 B p B p
( B ) 1 1 B q B q
上述两个算子多项式的根均在单位圆外。
具有上述结构的模型称为求和自回归移动平均
模型, 记为ARIMA(p,d,q).
即差分后的序列是原序列的若干序列值的加权和,
且可以拟合ARMA模型,所以称此模型为求和自回归移
动平均模型( ARIMA )。
求和的意义也可理解为: ARIMA过程可以表示为
ARMA过程的和。例如ARIMA(1,1,1). :
(1 B )(1 B ) x t (1 B ) t
记
Wt (1 B ) xt
则 Wt 为ARMA过程,而原序列 xt 可表示为
t t
W ( x
i 1
i
i 1
i xi 1 ) xt x 0
若 x0 0 ,则有
t
x t Wi
i 1
特别地:当 d = 0 时,ARIMA(p,d,q) 模型即为
平稳时间序列分析中所介绍的ARMA(p,q) 模型。
当 p = 0 时, ARIMA(0,d,q) 模型可以简记为
IMA(d,q) 模型,称为求和移动平均模型,模型形
式是:
d xt ( B ) t
当 q = 0 时,ARIMA(p,d,0) 模型可以简记为
ARI (p,d) 模型,称为求和自回归模型,模型形式
是:
( B ) d x t t
这些都是ARIMA模型的特定形式。
二、ARIMA模型的性质
(一)平稳性
若 { xt } 服从 ARIMA(p,d,q)模型:
( B )(1 B ) d x t ( B ) t
记 ( B ) ( B )(1 B ) d
,称 ( B ) 为广义自回归子,
ARIMA(p,d,q)模型的平稳性是由广义自回归算子
方程的根决定的,即由下列算子方程:
( B )(1 B ) d 0
的根决定。该算子方程共有p+d个根,其中 p 个在
单位圆外,d 个在单位圆上。
(1)当 d 0 时,ARIMA(p,d,q)模型是平稳
的。模型的可逆性只与模型移动平均部分的算子方
程的根有关,只要算子方程 ( B ) 0 的根在单位
圆外,模型就是可逆的。
(2)当 d 0 时,算子方程有单位根,原序
列非平稳。
(二)方差齐性
(1)当 d 0 时,ARIMA(p,d,q)模型是平
稳。所以序列方差具有齐性。
(2)当 d 0 时,原序列非平稳。方差是非
齐性的, d 阶差分后序列为平稳序列,差分后序列
具有方差齐性。
三、ARIMA模型建模步骤
获
得
平稳性 Y 白噪声 Y 分
观
检验 检验 析
察
结
值 N N 束
序
列 拟合
差分
ARMA
运算
模型
【案例分析】建立1952-1988年中国农业实
际国民收入指数时间序列模型 。
1. 获取序列数据,判断序列的平稳性
利用EViews画出时间序列的时序图
320
280
240
200
160
120
80
1955 1960 1965 1970 1975 1980 1985
中国农业实际国民收入指数时序图
从时序图可以看出,该序列有明显的上升趋
势,是典型的非平稳序列。
2. 利用差分运算将原序列平稳化。对原序列
进行 1 阶差分运算,差分后的时序图如下:
30
20
10
-10
-20
-30
1955 1960 1965 1970 1975 1980 1985
D(X)
中国农业实际国民收入指数1阶差分序列时序图
时序图显示,一阶差分序列在均值附近平稳波
动,显示序列有一定的平稳性。
为进一步判断序列的平稳性,再考察 1 阶差分
序列的自相关图。
自相关图显示,差分后序列的样本自相关
系数 ˆ 1 0.535 是峰值,其余各阶的样本自相
关系数均在 2 倍标准差之内,说明差分后序列
有很强的短期相关性,所以,可以初步认为差
分后的序列是平稳的。
3. 对平稳的 1 阶差分序列进行白噪声检验。利
用 EViews 计算出 Q 统计量的值如下:
在检验的显著性水平取0.05的条件下,由于延迟
6阶的Q检验统计量的P值为0.01,小于0.05,所以,1
阶差分序列不能视为白噪声序列,即1阶差分序列里
蕴含有自相关信息。
4. 对平稳非白噪声的1阶差分序列拟合ARMA
模型。利用EViews 计算出序列的样本自相关和偏
自相关系数值,进行模型识别。
1阶差分序列的自相关图显示,序列的自相关系数
有1阶截尾的特征,偏自相关图显示偏自相关形系数不
截尾。所以,可以考虑用MA(1)模型拟合 1 阶差分序
列,对原序列拟合的模型就是ARIMA(0,1,1)模型。
利用极大似然估计,我们可以得到模型的估
计结果为:
ARIMA(0,1,1)模型残差序列的自相关和偏自相关图
从残差的自相关图可以看出,残差序列没有明
显异与0的样本自相关系数值,样本自相关系数都
在 2 倍标准差之内,延迟各阶的拟合检验统计量的
P值都大于0.05,可以认为残差序列是白噪声序列。
其次,我们再来检验模型中系数的显著性。
利用EViews 计算,我们可以得到模型中两个参数
的 t 检验结果如下:
从系数的检验结果可以看出,模型中的两个参
数的 t 检验统计量相应的P值均小于0.05,说明模型
中的系数均显著。
由此可知,用ARIMA(0,1,1)模型拟合1952-1988
年中国农业实际国民收入指数时间序列是有效的。
四、 ARIMA模型预测
ARIMA模型的预测与ARMA模型预测方法是
相似的,其预测原理也是最小均方误差准则。
(一)最小均方误差预测原理
ARIMA(p,d,q)模型的一般表示方法为:
( B )(1 B ) d x t ( B ) t
和ARIMA一样,我们也可以将 xt 表示为随机扰动
项的线性函数,即
xt t 1 t 1 2 t 2
( B ) t
式中扰动项前的系数 1 , 2 , 的值可以由如下
等式通过待定系数方法确定:
( B )(1 B ) d ( B ) ( B )
那么,这时 xt l 真实值可表示为:
xt l ( t l 1 t l 1 l 1 t 1 ) ( l t l 1 t 1 )
由于 t l , t l 1 , , t 1 的值不可获得,所以 xt l 的
预测值只能表示为:
xˆ t ( l ) C 0 t C1 t 1 C 2 t 2
下面我们利用最小均方误差准则来确定 xt+l 的
预测值表达式中 C 0 , C1 , C 2 , 的值。
(1)计算预测误差 et ( l )
预测误差=真实值-预测值
et ( l ) xt l xˆ t ( l )
( t l 1 t l 1 l 1 t 1 ) ( l t l 1 t 1 )
(C 0 t C1 t 1 C 2 t 2 )
( t l 1 t l 1 l 1 t 1 ) ( l C0 ) t ( l 1 C1 ) t 1
注意到 t 是白噪声序列,所以,预测误差
的方差为:
Var[et ( l )] Var[ x t l xˆ t ( l )]
(1 12 l21 ) 2 ( l i Ci ) 2 2
i 1
(2)利用最小均方误差准则确定 C 0 , C1 , C 2 ,
要使均方误差最小,当且仅当
l i C i 0, i 0,1, 2,
即在 C i l i , i 0,1, 2, 的条件下预测的均方误
差最小。
于是,在均方误差最小原则下xt 的向前 l 期
预测值为:
xˆ t ( l ) l t l 1 t 1 l 2 t 2
向前 l 期预测误差为:
et ( l ) t l 1 t l 1 l 1 t 1
向前 l 期预测误差的方差为:
Var[et ( l )] (1 12 l21 ) 2
(二)条件期望预测
与ARMA模型一样,我们也可以利用条件期望
来对ARIMA模型进行预测。
xt+l 关于 xt , xt-1 , …的条件期望为
E ( xt l xt , xt 1 ,)
E t l 1t l 1 l 1t 1 lt l 1t 1 xt , xt 1 ,
lt l 1t 1 l 2t 2
这恰好是最小均方误差预测值。这说明,最
小均方误差预测与条件期望预测是等价的,即 xt
的向前 l 期预测值也可表示为:
xˆ t l E ( xt l xt , xt 1 ,)
【例】已知ARIMA(1,1,1)模型为
(1 0.8 B )(1 B ) x t (1 0.6 B ) t
解 (1)利用条件期望计算预测值
原模型的等价形式为:
xˆ t (1) E ( xt 1 xt , xt 1 , )
1.8 xt 0.8 xt 1 0.6 t 5.46
xˆ t (2) E ( xt 2 xt , xt 1 , )
1.8 xˆ t (1) 0.8 xt 5.59
xˆ t (3) E ( xt 3 xt , xt 1 , )
将 xt 表示为: xt ( B ) t ,代人ARIMA(1,1,1)
模型得:(1 0.8 B )(1 B ) ( B ) t (1 0.6 B ) t ,于是可
得如下等式:
(1 0.8 B )(1 B ) ( B ) (1 0.6 B )
利用待定系数方法可以计算出:
1 1.8 0.6 1.2
2 1.8 1 0.8 1.36
故,预测方差为:
Var[et (3)] (1 12 22 ) 2 4.2896
于是,可得到 xt 3 的95%置信区间为:
xˆ (3) 1.96
t Var (et (3)) , xˆt (3) 1.96 Var (et (3))
计算得到的95%置信区间是 (1.63, 9.75) 。
五、 疏系数模型
如果该模型中有部分自相关系数 j ,1 j p
或部分移动平均系数 k ,1 k q 为零,即原模型
中有部分系数缺省了,那么该模型称为疏系数模型。
如果只是自相关部分有缺省系数,那么该疏
系数模型可以简记为如下形式:
ARIMA(( p1 , , p m ), d , q )
其中, p1 , , pm 为非零自相关系数的阶数。
如果只是移动平均部分有缺省系数,那么该疏
系数模型可以简记为如下形式:
ARIMA( p , d ,(q1 , , q n ))
其中,q1 , , qn 为非零移动平均系数的阶数。
如果自相关和移动平均部分都有缺省,模型可
以简记为
ARIMA(( p1 , , p m ), d ,(q1 , , q n ))
其中, p1 , , pm 为非零自相关系数的阶数,q1 , , qn
为非零移动平均系数的阶数。
这里需要注意的是:当我们能够判别一个模
型是疏系数模型时,就意味着在建模时,模型中
需要估计的未知参数个数就会变少,从可以增大
样本的自由度,提高模型中参数估计的精度,进
而能够提高模型使用的有效性。
下面我们看一个疏系数模型的例子:假定疏系数模型
的形式为:
xt 4 xt 4 t , 4 1, t iid (0, 2 )
此模型可以看成是缺省了系数 0 , 1 , 2 , 3 的AR(4)模型,
疏系数模型的形式为:
ARI ((4), 0)
称此模型为季度自回归模型。
Yule-Walker方程为:
k 4 k 4 , k1
利用Yule-Walker方程容易得到:
4k , k 1, 2, ,
4k
0, 其余。
-2
-4
-6
25 50 75 100 125 150 175 200
从时序图我们看到,时间序列中蕴含有季节因素信息。
下图是由季度自回归模型:xt 0.8 xt 4 t 生成的时间
序列的样本自相关和偏自相关函数图。
从图中我们可以看到,样本自相关系数在周期 4 的整
数倍延迟阶数上呈指数函数衰减,表现为拖尾的特征,在
周期 4 的非整数倍延迟阶数上都基本在2倍标准差以内。从
样本偏自相关系数来看,除了延迟4阶样本偏自相关系数显
著非零外,其余延迟各阶样本偏自相关系数都基本在2倍标
准差以内,表现为4阶之后截尾特征。
【案例分析】对1917年-1975年美国23岁妇女每万人
生育率序列建模。
1. 绘制时间序列的时序图
利用EViews绘制序列时序图如下:
280
240
200
160
120
80
20 25 30 35 40 45 50 55 60 65 70 75
时序图显示序列有长期趋势,是非平稳序列。
2.差分平稳化
对原序列作1阶差分提取趋势信息,差分后的序列时
序图如下:
50
40
30
20
10
-10
-20
-30
20 25 30 35 40 45 50 55 60 65 70 75
D(X)
差分后的序列时序图显示长期趋势提取较为充分,序
列较为平稳,下面再考察一下序列的自相关图,进一步确
定一下序列的平稳性。
自相关图显示,延迟5阶之后,自相关系数基本都在
零值附近波动,可以认为序列具有短期相关性,即可以认
为1阶差分后的序列是平稳的。
3. 模型识别与估计
(1)模型的识别
考虑到差分后序列样本偏自相关系数只有延迟1阶和4
阶显著非零。故考虑对差分后序列拟合疏系数模型AR(1,4)。
综合考虑前面的差分运算,故我们可以尝试对原序列拟合
疏系数模型: ARIMA((1,4),1,0)。
(2)模型的估计
运用条件最小二乘估计,利用EViews计算,可以得到
未知参数的估计结果如下:
从拟合模型残差的自相关图可以看出,残差序列没有
明显异与0的自相关系数值,延迟各阶的拟合检验统计量的
P值都大于0.05,可以认为残差序列是白噪声序列,即模型
整体拟合是有效的。
(2)拟合模型系数的显著性检验
从拟合模型系数的检验结果可以看出,模型中的两个参
数均显著,这说明用此模型拟合1917年-1975年美国23岁妇
女每万人生育率序列是有效的。
这里需要说明的是:由于我们这里是使用样本
自相关函数和样本偏自相关函数对模型进行识别,
但样本相关函数与理论相关函数是有差异的,所以
我们在模型识别时应该尽可能考虑多种模型,通过
反复尝试和删减不显著的参数寻找合适的模型。
六、季节模型
在实际问题中,某些时间序列可能会存在某种
周期性变化,这中周期性变化过程通常是由季节
性变化或其他一些固有因素引起的。例如,某些地
区空调的月度销量可能会受到天气气候的影响而
呈现季节性变化。这类序列称为季节性序列。经济
领域中,季节性时间序列是较为常见的。下面我们
将介绍两种季节模型:简单季节模型和乘积季节模
型。
(一)简单季节模型(加法模型)
简单季节模型是指序列中的季节效应和其它效
应之间是加法关系,即
X t S t Tt I t
利用低阶差分提取序列的趋势信息,利用季
节差分提取序列的趋势信息,即通过低阶差分和
季节差分可将原序列转化为平稳序列。ARIMA模
型结构形式如下:
( B )
d
D X t t
( B )
其中 D X t (1 B D ) X t , d xt (1 B )d X t
( B ) 1 1 B 2 B 2 q B q
( B ) 1 1 B 2 B 2 pB p
【例】拟合1962—1991年德国工人季度失业率序列
1. 绘制时间序列的时序图
利用EViews绘制序列的时序图,直观地观察一下序列
的变化趋势。
12
10
0
64 66 68 70 72 74 76 78 80 82 84 86 88 90
时序图显示,该序列既含有长期趋势,又含有以季度
为周期的季节效应。
2. 差分平稳化
先对原序列作1阶差分提取趋势信息,再作步长为 4 的
季节差分消除季节效应的影响,差分后的时序图如下:
2. 0
1. 5
1. 0
0. 5
0. 0
-0.5
-1.0
-1.5
65 70 75 80 85 90
yt (1 B 4 )(1 B ) xt
从时序图可以看出,差分后的序列 yt 无显著的趋势
和周期,随机波动较平稳。
对差分后的序列做白噪声检验,检验结果如下:
在检验的显著性水平取0.05的条件下,由于延迟6阶的Q
检验统计量的P值小于0.05,所以,差分后的序列不能视为白
噪声序列,即差分后序列里蕴含有自相关信息,需对差分后
序列进一步拟合ARMA模型。
3.模型识别与拟合
(1)模型的识别
自相关图显示,差分后的序列仍含有一定的季节效
应,自相关系数具有拖尾特征。偏自相关图显示,除了
延迟1阶和4阶的偏自相关系数显著非零外,其它延迟阶
数的偏自相关系数基本都在2倍标准差内波动,可以尝试
拟合疏系数模型AR(1,4)。
(2)模型的拟合
利用条件最小二乘估计,可以得到模型中未知参数
的估计值,EViews估计结果如下:
综合考虑前面的差分信息,对德国工人季度失业率序
列拟合的模型为:
1
4
(1 B )(1 B ) x t
4 t
1 0.4507 B 0.2816 B
4. 模型检验
(1)拟合模型的残差序列的白噪声检验
从拟合模型残差的自相关图可以看出,残差序列没有
明显异与0的自相关系数值,延迟各阶的检验统计量的P值
都大于0.05,可以认为残差序列是白噪声序列,即模型整体
拟合是有效的。
(2)拟合模型参数的显著性检验
从拟合模型系数的检验结果可以看出,模型中的两个
参数均显著。这说明用此模型拟合1962-1991年德国工人季
度失业率序列是有效的。
(二)乘积季节模型
前面介绍的简单季节模型只需要通过简单的差分运算
和季节差分运算就可以将序列平稳化,并且平稳化后的序
列可以拟合ARMA模型。而在实际中我们会碰到更复杂的
情况,序列的季节效应、长期趋势效应和随机波动之间存
在复杂地交互影响,简单的季节模型不能充分地提取其中
的相关关系,这时需要采用乘积季节模型。
乘积季节模型的构造原理如下:
yt DS d xt
然后我们考察差分后的序列的自相关性。若差分后的
序列 yt 还蕴含有短期相关性和短期的季节效应的相关性,
则我们可以用低价ARMA(p,q)模型提取序列的短期相关
性,使用以周期步长S为单位的ARMA(P,Q)模型提取季节
效应的短期相关性。
由于短期相关性和季节效应之间具有乘积关系,所以,
可以将差分后的序列拟合成ARMA(p,q)模型和ARMA(P,Q)
模型的乘积形式,最终原序列乘积季节模型的完整结构可采
取如下表达式:
M P ( B ) p ( B ) DS d xt N Q ( B ) q ( B ) t
其中, d xt (1 B )d xt , DS xt (1 B S ) D xt
p ( B ) 1 1 B 2 B 2 p B p
q ( B ) 1 1 B 2 B 2 q B q
M P ( B ) 1 m1 B S m2 B 2 S m P B PS
N Q ( B ) 1 n1 B S n2 B 2 S nQ B QS
该乘积季节模型通常简记为: ARIMA( p, d , q ) ( P , D , Q ) S
【例】(1, 1, 1) (1, 1, 1)12 阶月度SARIMA模型表达为:
序列 12 X t 具有平稳性的条件是:
1 1, 1 1
序列 12 X t 具有可逆性的条件是:
1 1, 1 1
EViews估计命令:
12 X t (1 1 B )(1 1 B12 ) t
EViews估计命令:
D (X,1,12) MA(1) SMA(12)
将上述模型变形为:
12 X t (1 1 B 1 B12 1 1 B13 ) t
t 1 t 1 1 t 12 1 1 t 13
这是一个疏系数模型。
EViews估计命令:
D (X,1,12) MA(1) MA(12) MA(13)
进一步将模型变形为:
此模型可用于预测。
注意:
(1)用对数的季节时间序列数据建模时通常D不会大
于1,P和Q不会大于3。
(2)乘积季节模型参数的估计、检验与前面介绍的估
计、检验方法相同。利用乘积季节模型预测也与上面介绍
的预测方法类似。
【例】拟合1948—1981年美国女性月度失业率序列
1. 绘制时间序列的时序图
利用EViews绘制序列的时序图,直观地观察一下序列
的变化趋势。
3500
3000
2500
2000
1500
1000
500
0
1950 1955 1960 1965 1970 1975 1980
时序图显示序列有长期递增趋势和以年为周期的季节效应。
2. 差分平稳化
对原序列作1阶差分和步长为12的季节差分,差分后
的时序图如下:
500
400
300
200
100
0
-100
-200
-300
-400
1950 1955 1960 1965 1970 1975 1980
D(X,1,12)
差分后的序列时序图显示,序列在0附近波动,随机波
动较平稳。
差分序列的自相关和偏自相关图
差分后序列的自相关图显示延迟1阶、2阶的自相关
系数大于2倍标准差,这说明差分后的序列还具有短期相
关性,而延迟12阶的自相关系数显著大于2倍标准差,说
明序列中蕴含非常显著的季节效应。
从差分后序列的偏自相关图我们也可以得出同样的
结论。
3.模型的识别与拟合
(1)模型的识别
从差分后序列的自相关图来看,12 阶以内的自相关
系数和偏自相关系数均不截尾,所以,我们可以考虑使用
ARMA(1,1)模型提取差分后序列的短期相关信息。
再考虑季节自相关特征,从差分后序列的自相关图来
看,延迟12阶自相关系数显著非零,但延迟24阶、36阶自
相关系数落入 2 倍标准差范围。而差分后序列的偏自相关
图显示,延迟12 阶、 24 阶、36 阶的偏自相关系数都显著
非零。所以,可以认为季节自相关系数截尾偏自相关系数
拖尾。这时可以尝试用以12步为周期的ARMA(0,1)12模型
提取差分后序列的季节自相关信息。
综合前面的差分信息,对于美国女性月度失业率序列
我们可以考虑拟合乘积季节模型ARIMA(1,1,1) ×(0,1,1)12:
综合考虑前面的差分信息,对美国女性月度失业率序
列拟合的模型为:
1 0.565173 B
12 xt (1 0.827297 B12 ) t
1 0.682895 B
4. 模型检验
(1)拟合模型残差序列的白噪声检验
从拟合模型残差的自相关图可以看出,残差序列没有
明显异与0的自相关系数值,延迟各阶的拟合检验统计量的
P值都大于0.05,可以认为残差序列是白噪声序列,即模型
整体拟合是有效的。
(2)拟合模型参数的显著性检验
从拟合模型系数的检验结果可以看出,模型中的参数
均显著,这说明用乘积季节模型拟合1948—1981年美国女
性月度失业率序列是有效的。
第四节 残差自回归模型
前面介绍的ARIMA模型虽然可以对非平稳
时间序列建模,但ARIMA模型中使用的差分平
稳化方法也有一些缺点,主要有一下两个缺点:
(1)差分运算会损失序列的有效信息;
(2) ARIMA模型实际经济意义不强,往往
很难对模型进行直观解释。
如果序列有一种稳定的确定性趋势时,我们
可以不用差分平稳化方法,而是利用回归的方法
先提取序列的确定性趋势,原序列剔除确定性趋
势后的残差序列是一个平稳序列,然后再对残差
序列建立ARMA模型。如果我们能够用AR模型
拟合残差序列,此时所建立的模型就称为残差自
回归 (Auto-Regressive)模型。
一、残差自回归模型构造
当序列有确定性趋势或季节效应时,可以首先
通过确定性因素分解方法提取序列中主要的确定性
信息,建立如下回归模型:
xt Tt S t t
(1)若残差序列的自相关性不显著,则说
明确定性回归模型:
xt Tt S t t
对序列信息的提取是充分的,可以停止分析。
(2)若残差序列的自相关性显著,则说明
确定性回归模型:
xt Tt S t t
对序列信息的提取不充分,可以考虑对残差序列
拟合自回归模型,进一步提取相关信息:
t 1 t 1 p t p at
这样我们就可以构造如下模型:
xt Tt S t t
t 1 t 1 p t p at
E ( a t ) 0, Var ( a t ) 2
, Cov ( at , at i ) 0, i 1
由于在模型中是使用自回归形式拟合残差序
列,所以称此模型为残差自回归模型(Auto-
Regressive model)。
在实践中,对确定性趋势效应的拟合常用如
下两种方法:
(1)自变量为时间 t 的幂函数
Tt 0 1 t k t k t
(2)自变量为序列的历史观察值
Tt 0 1 xt 1 k xt k t
第二种方法与差分原理类似。
对季节效应的常用拟合方法也有两种:
(1)给定季节指数
S t S t
这里 St 是某个已知的季节指数。
(2)建立季节自回归模型
S t 0 1 xt m p xt pm
这里 m 是固定的周期。
二、残差的自相关性检验
残差自回归模型的建立依赖与对残差序列的
自相关性检验,若残差序列有自相关性,我们就
需要建立残差自回归模型,否则就不需要建立残
差自回归模型。
检验残差序列的自相关性有两种方法:
(1)Durbin-Waston 检验
(2)Durbin h 检验
三、Durbin-Waston 检验原理
t t 1 vt
其中, vt 是白噪声序列。
原假设:残差序列不存在 1 阶自相关性,即
H 0 : Cov ( t , t 1 ) 0 H0 : 0
备择假设:残差序列存在 1 阶自相关性,即
H 1 : Cov ( t , t 1 ) 0 H0 : 0
DW统计量为:
n
t t 1
( ) 2
DW t 2
n
t
2
t 1
将DW统计量展开得:
n n n
t t 1 2 t t 1
2
2
DW t 2 t 2
n
t 2
t
2
t 1
当样本容量 n 充分大时,有
n n n
t t 1 t
2
t 2
2
2
t 2 t 1
于是 n
t t 1
DW 2 1 t 2n
t 1
2
t
根据自相关系数的定义有
n
t t 1
t 2
n
t
2
t 1
所以
DW 2(1 )
Durbin – Watson在给
定的显著性水平下,
′(不包括常数项)给出了用于
检验的上、下临界值 和 。其检验规则如下:
(1)若 DW 值在(0, dL)之间,拒绝原假设
H0,认为残差序列存在一阶正自相关性。
f ( DW )
显 相 显 相 显
著 关 著 关 著
正 性 不 性 负
相 待 相 待 相
关 定 关 定 关
0 dL dU 2 4 dU 4 d L 4 DW
五、 Durbin h检验
前面我们介绍了检验回归残差序列自相关性
的DW检验,但是, DW检验统计量有一定的缺
陷:当回归因子包含滞后因变量时,残差序列的
DW 统计量是一个有偏统计量。在这种场合下使
用 DW 统计量容易产生残差序列正自相关性不显
著的误判。
为了克服DW检验的有偏性, Durbin在1970
年提出了DW 统计量的两个修正统计量: Durbin
t 统计量和Durbin h 统计量,这两个统计量渐近
等价。下面我们介绍 Durbin h 的基本原理。
Durbin h
t t 1 at
H0 : 0
H1 : 0
Durbin h检验统计量为:
n DW n
Dh (1 )
1 nˆ
2
2 1 nˆ 2
其中,n为观测值序列长度, ˆ 为滞后因变量系数
2
的最小二乘估计的方差。
H0 : 0
Durbin h
Z 2
|Dh | Z 2
|Dh | Z 2
【例】使用Auto-Regressive模型分析1952年-1988年中
国农业实际国民收入指数序列。
1. 绘制时间序列的时序图
利用EViews绘制序列的时序图,直观地观察一下序列
的变化趋势。 320
280
240
200
160
120
80
1955 1960 1965 1970 1975 1980 1985
时序图显示该序列有显著的线性递增趋势,但没有季
节效应。
考虑建立如下结构的Auto-Regressive 模型:
xt Tt t , t 1, 2, 3,
t 1 t 1 p t p at
E ( a t ) 0, Var ( a t ) 2
, Cov (at , at i ) 0, i 1
2. 拟合时间序列的确定性趋势
对趋势 Tt 分别尝试构造如下两个确定性趋势模型:
(1)将趋势变量 Tt 设定为时间 t 的线性函数,即
x t 0 1t , t 1, 2,
利用极大似然估计,得到序列趋势的拟合模型为:
即 xt 66.1491 4.5158t , t 1, 2, 3,
利用DW检验残差序列的自相关性
由于
DW=0.1378 (0, d L )
说明残差序列存在显著的正自相关性。我们需要对残
差再次拟合,以提取残差中的自相关性。
利用EViews计算残差序列的自相关、偏自相关系数,
得到相关图图如下:
残差序列的相关图显示自相关系数具有拖尾特征,偏
自相关系数显示2阶截尾。所以对回归模型的残差序列可
以考虑拟合 AR(2) 模型。
最终将原序列模型设定为:
x t 0 1t t ,
t 1 t 1 2 t 2 at ,
E ( a t ) 0, Var ( a t ) 2
, Cov (at , at i ) 0, i 1
然后,使用极大似然估计,联合求解模型中的所有未知
参数,利用EViews软件得到模型的估计结果如下:
DW=1.936479 ,显示残差序列不再具有相关性,最
终残差自回归模型的拟合结果为:
xt 26.4 6.23t t
t 1.43 t 1 0.526 t 2 at
其中,{at } 为零均值白噪声序列。
(2)将趋势变量 Tt 设定为一阶自回归形式,即
Tt 0 1 xt 1
利用极大似然估计,得到序列趋势的拟合模型为:
即 xt 1.0365 xt 1 t
由于回归因子是一个延迟因变量,所以这里不能用
DW统计量检验残差序列的自相关性,需要利用Durbin h
统计量检验残差序列的自相关性。
DW n
Dh (1 )
2 1 nˆ 2
1.06 37
(1 ) 2
2.863
2 1 37 0.009
残差序列的相关图显示自相关系数具有拖尾特征,偏
自相关系数有1阶截尾特征。所以对回归模型的残差序列
可以考虑拟合AR(1)模型。
最终将原序列模型设定为:
x t 1 x t 1 t ,
t 1 t 1 at ,
E ( a t ) 0, Var ( a t ) 2
, Cov (at , at i ) 0, i 1
然后,使用极大似然估计,联合求解模型中的所有未知
参数,利用EViews软件得到模型的估计结果如下:
DW=1.843513 ,显示残差序列不再具有相关性,最
终残差自回归模型的拟合结果为:
xt 1.033 xt 1 t
t 0.473 t 1 at
其中,{at } 为零均值白噪声序列。
从SC准则来看,第二个模型的 SC=7.0747,要小于
第一个模型的 SC=7.143值,即第二个模型要优于第一个
模型,但第一个模型更易于做经济解释。
第五节 异方差的性质
一、异方差的影响
前面我们介绍了使用ARIMA模型拟合非平稳
序列的方法,其中对拟合模型的一个假定是残差
序列为零均值白噪声序列,即要求残差序列 { t }
满足如下三个条件:
1. 零均值: E ( t ) 0
2. 纯随机: Cov ( t , t i ) 0, i 1
3. 方差齐性: Var ( t )
2
如果方差齐性假定不成立,则称序列存在异
方差,此时随机误差项的方差不再是常数,而是
随时间变化而变化,即
Var ( t ) h( t )
在这三个假定中,零均值假定最容易实现,
只需要对序列进行中心化处理就可以保证该假定
成立,所以这个假定通常无需检验。
纯随机性假定是我们前面重点检验的对象,
以保证我们所建立的模型对序列中蕴含的自相关
信息能够充分提取。
前面我们介绍的 Q 统计量、 DW 统计量等
就是适用于不同场合的自相关检验统计量。
只有第三个假定:方差齐性假定,在之前没有进
行检验。在缺省检验的情况下,我们实际上是默认残
差序列满足这个条件。
但这个假定实际上并不一定总是满足的。忽视异
方差的存在会导致残差的方差被严重低估,继而参数
显著性检验容易犯纳伪错误,使得参数的显著性检验
失去意义,最终导致模型的拟合精度受影响。
所以为提高模型的拟合精度,需要对残差序列进
行方差齐性检验,并对有异方差序列进行处理。
二、异方差直观诊断
判断残差序列是否存在异方差,我们可以通
过残差的时序图或残差平方时序图来直观判断。
1. 残差图
若残差序列是方差齐性的,则它应该在一个
边界与均值几乎相等的空间随机波动。否则,就
可以认为残差序列呈现异方差性。
t
t
同方差情形 递增型异方差
t t
t t
递减型异方差 综合型异方差
2. 残差平方图
由于残差序列的方差实际上就是它平方的期
望,即
Var ( t ) E ( t2 )
若残差序列是方差齐性的,则意味着
E ( t2 ) 2
即 t2 应该在某个常数值 2 附近随机波动,它不
应该具有任何明显的趋势,否则就可以认为残差
序列存在异方差性。
【例】直观考察 2010年6月21日至2014年1月
16日人民币兑美元汇率序列的方差齐性。
序列的时序图显示序列是非平稳的。见下图:
690
680
R
670
660
650
640
630
620
610
600
100 200 300 400 500 600 700 800
对原序列进行 1 阶差分,差分后残差序列显
示是平稳序列。如下图所示:
3
D(R)
2
-1
-2
-3
100 200 300 400 500 600 700 800
从残差序列时序图来看,残差序列的波动在某
些时段大,而在另外时段小,呈现异方差特征。
差分后残差序列平方图如下:
9
8
D(R)^2
7
6
5
4
3
2
1
0
100 200 300 400 500 600 700 800
残差序列平方时序图同样显示残差序列存在
异方差。
第六节 方差齐性变换
当残差序列存在异方差时,我们需要对它进
行进一步处理,处理的思路有两种:
1. 若异方差函数具体形式已知,考虑进行方
差齐性变换。
2. 若异方差函数的具体形式未知,虑拟拟合
条件异方差模型。
假设序列显示出显著的异方差性,且方差
与序列均值 E ( xt ) t 之间具有某种函数关系(这
种情况在金融时间序列中较为常见),即
Var ( xt ) t2 h( t )
其中:h( ) 是某个已知函数。
这种情况下,我们可以尝试寻找一个转换函
数 g ( ) ,使得经转换后的序列 g ( xt ) 满足方差齐
性,即
Var[ g ( xt )] 2
那么,我们然后确定转换函数呢?寻找转换
函数的思路如下:
将转换函数 g ( xt ) 在 t 附近作一阶泰勒展开:
g ( x t ) g ( t ) ( x t t ) g ( t )
则转换函数序列 g ( xt ) 的方差近似等于
Var[ g ( xt )] Var[ g ( t ) ( xt t ) g ( t )]
[ g ( t )]2Var ( xt )
[ g ( t )]2 h( t )
显然,要使 Var[ g ( xt )] 等于常数,则要求转
换函数导数的平方 [ g ( t )]2 与 h( t ) 具有倒函数
关系,即
1
g ( t )
h( t )
在实践中,许多金融时间序列(例如风险资
产的价格)都呈现异方差的性质,且方差描述的
是风险,而风险通常是与收益水平(序列均值)
成正比的。此时,最简单的假定为:
t t
则
1 1
g ( t )
h( t ) t
g ( t ) log( t )
这意味着,对满足这样简单假定的异方差序
列,可以通过对数变换有效地实现方差齐性。
第七节 条件异方差模型
前面我们介绍了方差齐性变换, 方差齐性
变换处理异方差的方法只适合于残差序列异方差
函数形式已知的情况,但在实际问题中,有些残
差序列的异方差表现为复杂形式,通常不能通过
简单的对数变换转化为同方差,这时就需要其他
处理异方差的方法。这里我们将介绍利用条件异
方差模型来处理异方差的方法。
一、ARCH模型
(一)波动集群效应
计量经济学模型中的异方差通常属于递增型
异方差,即随机误差项方差的变化随解释变量的
增大而增大。但利率,汇率,股票收益率等时间
序列中存在的异方差却不是递增型异方差。例如,
汇率序列常常表现为随机游走模型形式:
xt xt 1 t
其中 t 为白噪声过程。
下图是1995-2000年日元兑美元汇率序列时序图:
160
JPY (1995-2000)
140
120
100
80
200 400 600 800 1000 1200 1400
日元兑美元汇率序列JPY(1995-2000)
时序图显示序列是一个类似于随机游走的非平稳序
列。对序列进行1阶差分,差分后的序列时序图如下:
6
4 D(JPY) (1995-2000)
-2
-4
-6
-8
200 400 600 800 1000 1200 1400
日元兑美元汇率差分序列(收益)D(JPY)
差分后的时序图显示序列均值平稳,但序列的波动
幅度在不同时段有大小不一的现象,呈现出异方差性。
下图是差分平方序列时序图:
60
50
DJPY^2
40
30
20
10
0
200 400 600 800 1000 1200 1400
D(JPY)的平方 (1995-2000)
从时序图我们也能看出,不同时段差分平方具有显著
性的差异,同样说明残差序列存在异方差性。
仔细观察序列的波动性,我们会发现,虽然
在整个观察期内序列的方差基本齐性,但在不同
时段,序列的波动却表示出明显的差异。即方差
在一定时段中比较小,而在另一时段中比较大。
表现出“波动集聚”(volatility clustering)特征。
这种现象称为“波动集聚效应”。产生这种现象
的
原因很可能是邻近各期的方差之间具有一定的相
关性造成的。
Engle 1982年提出了一种描述现期方差与前期
的“波动”关系的模型,称为自回归条件异方差模型
( Autoregressive Conditional Heteroskedasticity
Model)(简称ARCH模型)。它是用一个确定的
函数来刻画异方差的演变过程。
(二)ARCH模型的结构
当我们拿到一个观测值时间序列后,完整的
分析是应该考察序列水平和波动两方面的情况。
通常会首先提取序列的水平方面的相关信息,然
后分析残差序列中蕴含的波动相关信息。只有将
这两方面的信息综合考虑才能得到序列比较完整
和精确的分析结果。所以,ARCH模型的完整结
构为:
xt f ( t , xt 1 , xt 2 ,) t
t ht et
q
ht 0 j t2 j
j 1
i .i .d
其中, ht Var ( t t 1 ) E ( t 1 ) , et ~ N (0,1) ,
2
t
t 1 ( t 1 , t 2 ,) 。模型中的系数满足:
(1) 0 , 1 , 2 , , q 0
(2) 1 2 q 1
具有这种结构形式的条件方差模型称为 q 阶自回归条
件异方差模型,简记为ARCH(q)。
其中
E ( xt t 1 ) f ( t , xt 1 , xt 2 ,)
是对序列的平均水平拟合的模型,称为均值方程。
q
ht Var ( t t 1 ) 0 j t2 j
j 1
是对序列的波动(方差)拟合的模型,称为方差方程。
条件(1) 0 , 1 , 2 , , q 0 是为了保证模型的
设定是合理的。
条件(2) 1 2 q 1 是为了保证 t2 的
平稳性。
下图是由ARCH(1)模型:
i . i .d
t ht et , et ~ N (0,1), ht 0.1 0.8 t21
生成的序列的时序图。
3
-1
-2
-3
25 50 75 100 125 150 175 200
EPSILON
从时序图可以看出,序列的波动范围基本上是在2倍
标准差范围之内,但波动幅度的大小呈现集聚的特征。
(三)ARCH效应检验
要拟合ARCH模型,首先要进行ARCH效应检验。
检验思路是:对于一个有异方差的时间序列,若其方差
有集群效应,那么其残差序列的平方就具有自相关性。
所以,我们可以通过检验残差平方序列是否具有自相关性
来检验模型是否具有的ARCH效应。
检验ARCH效应的方法有两种:一种是基于残差平方
序列的相关图检验(Q检验),另一种是ARCH LM 检
验。
1. Q 检验的基本原理
(1)检验假设
Q检验的原假设是:残差平方序列是纯随机序
列,即残差序列不存在ARCH效果。
备择假设是:残差平方序列存在自相关性,即
残差序列存在ARCH效果。
用 k 表示残差平方序列的延迟 k 阶自相关系
数,则检验假设可表达为:
H 0 : 1 2 q 0
H 1 : 1 , 2 , , q 不全为零
这里, k 按如下的计算公式来计算:
T
( t2 ˆ 2 )( t2i ˆ 2 )
k t k 1
T
t
( 2
t 1
ˆ 2 2
)
1 T
式中,T 为观察序列的长度,ˆ 2 t2 .
T t 1
(2)按如下公式计算 Q 统计量值:
q
i2
Q T (T 2)
i 1 T i
T 为样本容量,q 为设定的滞后阶数。
在原假设成立的条件下,
q
ˆ i2 渐近 2
Q T (T 2) ~ (q 1)
i 1 T i
(3)检验规则
给定显著性水平 ,当 Q 2
(q 1) 时,拒绝 1
原假设 H0 ,认为残差序列存在ARCH效应。否则,
则不能拒绝 H0 。
2. ARCH LM 检验
ARCH LM 检验又称为拉格朗日乘数检验,它
的基本原理是:
(1)使用自回归模型拟合残差平方序列,即
构建如下辅助多元回归模型:
t2 0 1 t21 2 t22 q t2q et
通过检验多元回归模型中的回归系数 1 , 2 , , q
是否全为零来判断残差平方序列是否有自相关性。
若 1 , 2 , , q 全为零,则意味着残差平方序
列不存在显著的相关性,否则,就认为残差平方
序列存在显著的相关性。
H 0 : 1 2 q 0
(残差序列不存在ARCH效果)
H 1 : 1 , 2 , , q 不全为零
(残差序列存在ARCH效果)
(2)检验统计量:
LM TR 2
(3)检验规则
给定显著性水平 ,当 LM 2
(q ) 时,拒绝
1
(1)建立时间序列的计量模型,提取确定性
趋势,对估计的残差检验ARCH效果;
(2)识别ARCH模型的阶数,估计模型;
(3)检验ARCH模型,根据情况修改模型。
【案例分析】 分析拟合1995.1.2-2001.12.31沪市每日
股票价格收盘指数序列。
1. 绘制时序图
2000
1600
1200
800
400
1995 1996 1997 1998 1999 2000 2001
SP
为了减少舍入误差,在估计时,对序列 { spt } 进行自
然对数处理,即对序列 {ln( spt )} 进行分析建模,序列
{ln( spt )} 的时序图如下:
8.0
7.6
7.2
6.8
6.4
6.0
1995 1996 1997 1998 1999 2000 2001
LNSP
2. 均值方程的拟合
运用最小二乘法,利用EViews软件得到估计结果如下:
均值方程为:
从估计结果来看,系数通过了显著性检验,R 2 0.997
反映出拟合的程度很好。
3. ARCH效应检验
均值回归方程的残差图如下:
.3
.2
.1
.0
-.1
-.2
1995 1996 1997 1998 1999 2000 2001
RESID
残差图显示,序列的波动在一些时段内(2000年)
比较小,而在其它的一些时段内(1996年)非常大,表
现出波动集聚的特征,这说明残差序列可能具有条件异
方差性。下面进一步对残差序列进行ARCH检验。
(1)ARCH效应的Q检验
计算残差平方序列的自相关(AC)和偏自相关(PAC)
系数,结果如下:
由于残差平方序列的自相关系数显著非零,而且Q统
计量非常显著,可以得出结论:均值方程的残差序列存
在ARCH效应。
(2)ARCH效应的 LM 检验
从残差平方序列的偏自相关函数图来看,我们可以考
虑选择滞后阶数 p=4 时的ARCH LM 检验,检验结果如下:
均值方程为:
此时,再检验ARCH(4)模型的残差序列可以发现不再存
在ARCH效果,即该模型对序列的拟合是有效的。
二、 GARCH模型
(一)ARCH(q) 模型的缺点
前面我们介绍的 ARCH 模型在实际使用时存
在一些缺点,主要有以下几个方面:
1. ARCH 模型看起来更像一个移动平均模
型,而不像自回归模型。它是用残差平方序列的
q 阶移动平均来拟合当期条件异方差值,而移动
平均模型的自相关系数有q阶截尾的特征,所以,
ARCH 模型实际上只适合于异方差函数短期自相
关过程,不能反映实际数据中的长期记忆性质。
2. 在实际问题中,特别是在金融领域,使用
的数据通常是日数据 ,这时条件方差会依赖于较
长时期的残差平方序列值,此时会要求模型中残
差平方的滞后期 q 很大。当 q 较大时,模型中需
要估计的参数就会很多,会增加参数估计的难
度,从而影响 ARCH 模型的拟合精确。
3. 为了保证条件方差为正,要求模型中的参
数均大于0。当参数过多时,用实际数据估计出的
模型参数往往不能满足这一要求,从而使得模型
不具实用性。
为了解决这些问题,Bollerslov(波罗索勒夫)
在 1985 年提出了广义自回归条件异方差模型,即
GARCH模型,用来拟合条件异方差。
(二)GARCH模型的定义
GARCH模型的结构如下:
xt f ( t , xt 1 , xt 2 ,) t
t ht et
p q
ht i ht i j t2 j
i 1 j 1
i .i .d
式中,ht Var ( t t 1 ) E ( t2 t 1 ) , et ~ N (0,1) ,
t 1 ( t 1 , t 2 ,) ,模型简记为GARCH(p,q)。
模型中的系数要求满足下列条件:
(1) 0, i 0, j 0
(2) 1 p 1 q 1
显然,p=0时的GARCH(p,q)模型就是ARCH(q)
模型,即ARCH是GARCH模型的一个特例。
实际中最为常见的GARCH模型是GARCH(1,1)
模型,GARCH(1,1) 模型可以转化为无穷阶的
ARCH模型,这是因为,由GARCH(1,1)模型:
ht 1 ht 1 1 t21
可得
(1 1 B )ht 1 t21
1
ht t21
1 1 B 1 1 B
1 (1 1 B 12 B 2 ) t21
1 1 B
ht 1 t21 11 t2 2 112 t2 3
1 1
上述模型即为无穷阶的ARCH模型,这就意味
着, GARCH(1,1) 模型可以很好地拟合具有长记忆
性的异方差函数。
【案例分析】 估计1995.1.2-2001.12.31沪市每日股票
价格收盘指数的GARCH (1,1)模型。
前面的分析我们可以看到,股票价格指数对数序列
的回归方程的残差序列具有ARCH效应,需要通过高阶
ARCH模型拟合,现在,我们考虑用GARCH (1,1)模型
来消除残差序列的ARCH效应。拟合的模型如下:
均值方程:
从估计结果来看,系数通过了显著性检验,R 2 0.997
反映出用GARCH (1,1)模型拟合原序列效果很好。
此时,再检验GARCH (1,1) 模型的残差序列可以
发现残差序列不再存在ARCH效果。
三、AR-GARCH模型
对残差序列 t 拟合GARCH模型有一个基本要求:
t 为零均值,纯随机、同方差序列。有时回归函数
xt f ( t , xt 1 , xt 2 ,)
不能充分提取原序列中的相关信息,残差序列可能具
有自相关性,而不是纯随机的。这时需要对 t 先拟合
自回归模型,再考虑自回归残差序列 {v t }的方差齐性,
如果 {v t }异方差,则对它拟合GARCH模型。这样构造
的模型称为AR(m)-GARCH(p,q)模型。模型的具体结构
如下:
xt f ( t , xt 1 , xt 2 ,) t
m
t k t k vt
k 1
v t ht et
p q
ht i ht i j v t2 j
i 1 j 1
(一)非对称GARCH模型
在 GARCH(或ARCH)模型中,当期条件方差被表
示为前期扰动平方的函数,这就意味着正的扰动和负的扰
动对波动率有相同的影响,这与实际情况往往不符。大量
实践表明,投资人对获益和亏损的反映是不对称的。出现
获益情况时,通常投资人反映比较慢,出现亏损时,投资
人的反映比较快。这种现象称为“杠杆效应”。反映这种
现
象的模型就是非对称 GARCH 模型。非对称GARCH 模型
主要有指数GARCH 模型和门限GARCH 模型。
1. 指数GARCH模型(EGARCH)
Nelson于1991年提出了指数GARCH模型,该
模型的结构如下:
yt f ( t , yt 1 , yt 2 ,) t
t ht et
p q
ln( ht ) i ln( ht i ) j g (et )
i 1 j 1
g ( et ) et [ et E et ]
由此可见,正、负扰动对条件方差的影响是不
同的。在实际中,说明好消息(et 0 )和坏消息
( et 0 )对条件方差有不同的影响。同时,指数
GARCH模型对也放宽了对模型参数非负的约束。
2. 门限 GARCH 模型(TGARCH)
一阶TGARCH 模型中的条件方差被设定为如
下形式:
p q
ht i ht i j t2 j t21d t 1
i 1 j 1
其中 d t 1 是一个虚拟变量:
1, t 1 0 (坏消息)
d t 1
0, t 1 0 (好消息)
模型的具体结构如下:
yt f ( t , yt 1 , yt 2 ,) t
t ht et
p q
ht i ht i j t2 j t21d t 1
i 1 j 1
在金融时间序列分析中,由于风险资产的收益率的
大小与投资者承担的风险(方差)存在一定关系,一般来
说,风险越大,预期的收益就越高。所以在对收益率序列
建模时,可以把代表风险的方差作为一个因素引入模型,
这就是 GARCH-M 模型。该模型是由恩格尔(Engle)、
利林(Lilien)、和罗宾(Robins)1987首先引入的。
ARCH-M模型的结构如下:
xt f ( t , xt 1 , xt 2 ,) g ( ht ) t
t ht et
p q
ht i ht i j t2 j
i 1 j 1
其中g ht 是条件方差的函数,通常的形式有:
g ht ht , ht , ln ht
平稳时间序列的样本自相关函数表现为指数衰减,数
据表现为短期记忆的特征。非平稳时间序列的样本自相关函
数通常表现为缓慢的线性衰减,数据表现为长期记忆的特征。
若一个时间序列(如水文学中的时间序列)的样本自相关函
数衰减速度介于指数函数和线性函数之间,如幂函数形式,
说明该时间序列具有较弱的非平稳性,这时可考虑对原序列
进行分数阶差分将其平稳化。
金融中的风险资产价格序列也常常有这种表现,其运动
过程表现为分数布朗运动而非几何布朗运动。
一、分数差分的概念
d X t (1 B )d X t
其中:
( j d )
(1 B )
d d
Bj
j 0 ( j 1) ( d )
d (d 1) 2 d (d 1)(d 2) 3
1 dB B B
2! 3!
即
d d (d 1) d (d 1)(d 2)
X t X t dX t 1 X t 2 X t 3
2! 3!
二、分整差分噪声序列
定义:如果随机序列 X t 满足差分方程:
(1 B )d X t t t ~ i .i .d (0, 2 )
式中 | d | 1 / 2 ,(保证差分方程有唯一平稳解),则称
Xt 为分整差分噪声序列(fractional differenced noise,
FDN)。
因此,模型 (1 B )d X t t 表示的是一个长记忆模型。
3. d ≥0.5时,过程Xt是非平稳的,但其“非平稳性比单位
根过程要低”。
4.当 -0.5 <d <0.5时, Xt 的自相关函数为
d (1 d ) ( k 1 d )
k , k 1, 2,
(1 d )(2 d ) ( k d )
当k→∞时, Xt 的自相关函数:
( d )! 2 d 1
k k ck 2 d 1 (k )
(d 1)!
Xt 自相关函数双曲线式地衰减到 0自相关函数的衰减
速度依赖于差分的阶数 d。
5. 当-0.5 <d < 0.5时, Xt 的偏自相关函数为
d
kk , k 1, 2,
(k d )
三、分整差分噪声平稳序列
若 (1 B )d X t 是一个平稳序列,服从一个ARMA(p,q)
模型,则称 Xt 是一个ARFIMA(p,d,q)过程。其一般形式为:
( B )(1 B ) d ( X t ) ( B ) t
四、分整阶数 d 的求法
1. 赫斯特(Hurst)指数
Hurst 指数是水文学家赫斯特于1951年提出来的. 英国
水文专家 H. E. Hurst (1900-1978) 在研究尼罗河水库水流量
和贮存能力的关系时,发现用有偏的随机游走(分形布朗运
动) 能够更好地描述水库的长期存贮能力,并在此基础上提
出了用重标极差 (R/S) 分析方法来建立赫斯特指数 ( H ) , 作
为判断时间序列数据遵从对称的随机游走还是有偏的随机
游走过程的指标 .
(1)当 H = 0.5 时,表示时间序列可以用随机游走
来描述(白噪声);
Hurst指数与ARFIMA模型的阶数有确定关系:
H d 0.5
由此,可借助于估计Hurst指数的方法初步估计分维数。
2. 赫斯特(Hurst)指数的计算
记 xi , i 1, 2, , n 为一时间序列,其均值为:
1 n
x xi
n i 1
记 x ( i , n) 为累积离差 ,则有
i
x ( i , n) ( x t x )
t 1
定义极差为:
R( n) max x ( i , n) min x ( i , n)
1 i n 1 i n
序列 xi , i 1, 2, , n 的标准差为:
1 n
S ( n) (
n i 1 i
x x ) 2
根据统计学的结果,如果一个序列是随机
游动,累积离差的极差应该和时间(这里即为
观测数 n)的平方根成正比增加,即
1
F ( n) n 2
但在实际问题中,一般的情况是:
R( n)
F ( n) nH
S ( n)
这里 H 即为 Hurst 指数。对上式两边取对数得:
R( n )
ln ln H ln( n)
S ( n)
然后利用最小二乘法回归求解。
1
F ( n) n 2
实际中的做法是:将时间序列分成 M1个长度
为 T1 的等长度子区间,计算每个子区间的重标极
差 F(n) ,设第 i 个子区间的重标极差为 F( i, T1)
S (T1 ) 1 T1
T1 i 1 i
( x x ) 2
M1
1
然后用 F (T1 ) F ( i , T1 ) 作为F( T1) 的估计值。
M 1 i 1
重复以上的做法,再将时间序列分成 M2个长
度为 T2 的等长度子区间,得到
R(T2 ) max x( i , T2 ) min x( i , T2 )
F ( i , T2 ) 1 i n 1 i n
S (T2 ) 1 T2
T2 i 1 i
( x x ) 2
M2
1
F (T2 )
M2
F (i , T )
i 1
2
F (Ti ), i 1, 2, , n
ln F ( n) ln H ln( n)
(1)聚合序列方差法
此序列的样本方差估计量为:
2
1 [T m ]
1 [T m ]
(m)
Var ( x )
T m
(x (m) 2
k ) x (m)
k
k 1 T m k 1
可以证明:当 m 充分大时,有
( x(m ) ) 2m 2 H 2
Var 0
其中, 02 为常数,据上式可得:
( x ( m ) ) C (2 H 2) ln m
ln Var 0
可以证明:当 m 充分大时,有
[T m ]
1
x(m )
T m k 1 k
x (m)
2
1 m H 1
ln I ( ) C (1 2 H ) ln( )
可得到 H 的估计值。
五、分数布朗运动(Fractional Brownian Motion)
定义1 设 0 H 1,Hurst参数为H的分数布朗
运动为一个连续的高斯过程 { BH ( t ), t 0},s, t 0,
满足: B (0) 0, E[ B ( t )] 0,
H H
Cov ( BH ( t ), BH ( s )) E[ BH ( t ) BH ( s )]
1 2H
t s ts
2H 2H
2
当 H=0.5 时,分数布朗运动 { BH ( t ), t 0} 即为
标准布朗运动 { B( t ), t 0}.
定义2 指数为H( 0 H 1)的分数布朗运动是
定义在某概率空间上的随机过程 { BH ( t ), t 0} ,使得
(1)以概率1,BH ( t ) 连续,且 BH (0) 0.
(2)对任意 t 0, h 0,
BH ( t h) BH ( t ) N (0, h2 H )
以上两种定义是等价的。
因为,Cov ( BH ( t ), BH ( s ))
1
D BH ( t ) D BH ( s ) D BH ( t ) BH ( s )
2
1 2H
t s 2 H ( t s )2 H
2
定义3 设 0 H 1 ,称随机过程 { BH ( t ), t 0}
为 Hurst 参数为 H 的分数布朗运动,如果 t 0,
有:
1 0 H
1
H
1
t H
1
BH (t )
1
[(t s) (s) ]dB(s) (t s) dB(s)
2 2
0
2
(H )
2
(4)当 H 1 时,分数布朗运动不是Markov过程
2
因为, E BH ( h) BH ( t h) BH ( t )
E[ BH ( h) BH ( t h)] E[ BH ( t ) BH ( h)]
1 2H 1 2H
h ( t h) t t h2 H ( t h)2 H
2H 2H
2 2
1
( t h)2 H 2t 2 H ( t h)2 H
2
于是,分数布朗运动的增量的相关函数为:
0 h t th
Cov ( BH ( h) BH (0), BH ( t h) BH ( t ))
( t , h)
Var ( BH ( h) BH (0)) Var ( BH ( t h) BH ( t ))
E BH ( h) BH ( t h) BH ( t )
Var ( BH ( h)) Var ( BH ( t h) BH ( t ))
1
( t h)2 H 2t 2 H ( t h)2 H
2
h2 H
特别地,h = t 时,有
Cov ( BH ( t ), BH (2t ) BH ( t ))
(t , t )
Var ( BH ( t )) Var ( BH (2t ) BH ( t ))
2 2 H 1 1
(4)自相似性(分形的特性)
BH (at ) a H BH ( t )
1 1
(5)可以证明: H d 或 dH
2 2
即序列经过 d 阶差分可以成为白噪声序列。
当 0.5 H 1 时,0 d 0.5 ,表明序列具有长记忆性。
(6)赫斯特指数 H 与分形维数 D0 之间的关系
D0 2 H
(7)标准的分数布朗运动是连续的高斯过程
BH ( t )
1
(1 ) 0
t
[( t s ) ( s ) ]dBs ( t s ) dBs
0
1
x
其中,B ( t ) 是标准布朗运动, H , ( ) x e dx .
2 0