第4章非平稳时间序列的随机分析（慕课）

前面我们介绍了平稳时间序列分析，对于
平稳时间序列来讲，我们有一套比较成熟的分
析理论方法。但是，在实际问题中我们碰到的
时间序列数据大多是非平稳序列。由于非平稳
序列的发展极不稳定，很难直接找到其变化发
展规律。因此，非平稳时间序列分析方法与平
稳时间序列会有很大的不同。
为了找到分析非平稳时间序列的理论与方
法，我们有必要了解非平稳序列的结构。下面
我们将介绍一个时间序列是怎样构成的，这方
面的工作是由Wold和Cramer给出的。
第一节时间序列的分解
一、 Wold分解定理
1938年，Wold 在他的博士论文中研究了平
稳时间序列分解定理，他将平稳序列分解为两个
不相关的平稳序列之和，其中一个为确定性的，
另一个为随机性的，这种研究思路对于非平稳时
间序列也有借鉴意义。
Wold分解定理：对于任何离散平稳过程  xt 
它都可以分解为两个不相关的平稳序列之和，其
中一个为确定性的，另一个为随机性的，记作
xt  Vt  t
式中， Vt  为确定性序列，t  为随机性序列，且

t   j t  j
满足： j 0

（1） 0  1,  j 
 2
j 0
（2）  t  WN (0, 2 )
（3） cov(Vt ,  s )  0, t  s
这里我们解释一下什么是确定性序列，什么
是随机序列。
设 yt 是任一序列，将序列 yt 关于滞后 q 期
之前的序列 yt q , yt q1 , 进行回归，即
yt  0  1 yt q  2 yt q1    vt
式中， vt 为残差序列。如果我们基于历史信息：
yt q , yt q1 , 预测 yt 的值，则 vt 可以理解为预测
误差，记 Var ( vt )   2
v ( q )  2
，显然有 v (q)  Var ( yt ) ，
且滞后期 q 越大，意味着预测的步长越长，预测
的误差就越大，即  v2 (q) 越大。
 2
所以 v (q) 的大小可以衡量历史信息对现
时值 yt 的预测精度，  v2 (q) 越小说明预测精度
越高， v2 (q) 越大说明预测精度越差。
 2
（1）如果 q v (q)  0 ，说明序列发展的规律
lim
性强，历史数据可以很好地预测将来，这时称序
列  yt  是确定性序列。
 2
（2）如果 q v (q)  Var( yt ) ，说明序列发展的
lim
随机性强，历史信息对现值估计效果差，这时称
序列  yt  是随机序列。
例如，对于平稳的ARMA(p,q) 模型：
( B)
xt    t
( B)
t  , t  T -------确定性平稳序列
 ( B) 
  t , t  T  -------随机平稳序列
 ( B) 
二、 Cramer分解定理
1961年，Cramer证明了如下结论：
任何一个时间序列  xt  都可以分解为由多项式
决定的确定性趋势成分与平稳的零均值误差成分之
和。即 d
xt  t   t    j t j  ( B)at
j 0
式中， d   ；1 ,  2 ,, d 为常数系数； {at }为一个

零均值白噪声序列，( B) 为算子多项式。
d
E( xt )    j t j
j 0
反映 { xt } 受到的确定性的影响。
 t  ( B)at
反映的是 { xt } 受到的随机影响。
对于一个随机时间序列来说，只要其确定性
的影响和随机影响这两方面中有一方面不稳定，
就会导致时间序列非平稳。
Cramer分解定理是现代时间序列分析理论
的灵魂，它表明任何一个序列的波动都可以视为
同时受到了确定性影响和随机性影响的作用。平
稳序列要求这两方面的影响都是稳定的，而非平
稳序列产生的机理就在于它所受到的影响至少有
一方面是不稳定的。
Cramer分解定理为我们研究非平稳时间序列
奠定了理论基础。
第二节差分运算
对于随机非平稳序列来说，我们难以直接找
到其变化发展规律，主要是因为非平稳序列通常
都具有某种不稳定的趋势。所以，分析非平稳序
列的第一步是采取有效的手段提取其趋势使序列
变为平稳序列，然后利用平稳序列分析方法来处
理。提取序列趋势的工具主要是差分运算。
一、差分运算的作用
为什么差分运算是提取序列趋势的有效工具
呢？因为非平稳时间序列通常会受到某些确定性
或不确定性因素的影响，导致时间序列各期值存
在时间上强的自相关性，从而导致序列有长记忆
性。而非平稳时间序列的趋势（包括确定性趋势
和随机性趋势）也是由序列的强自相关性所导致
的。
注意到时间序列 xt 的 d 阶差分为：
d
 d xt   ( 1)i C di xt i
i 0
将上式改写为：
d
xt   ( 1)i 1 C di xt i   d xt
i 1
这个式子可以看成是 xt 关于 xt 1 , xt  2 , , xt  d 的一
个 d 阶自回归过程，其中  d xt 度量了自回归过程产
生的随机误差的大小。
所以，差分运算正是通过自回归的方式提取
了序列的确定性信息。
实际上，时间序列中的差分运算类似于函数的
求导运算，如果一个时间序列的确定性趋势是时间
的 d 次多项式，则 d 阶差分后的序列的确定性趋势
就一定是常数，将不会再蕴含时间趋势，从而实现
序列的平稳化。
 d 
    j t   k , （ k 为常数）
d j
 j 0 
而由Cramer分解定理知，方差齐性非平稳序
列都可以分解为如下形式：
d
xt  t   t    j t j  ( B)at
j 0
式中，d   ； 1 ,  2 ,, d 为常数系数；{at } 为一个

零均值白噪声序列，( B)为算子多项式。
由此可以看出，根据Cramer分解定理，理论
上，任何一个序列，都可以利用适当阶数的差分提
取其确定性信息。也就是说，从理论上讲，任何一
个非平稳序列，通过适当阶差分都可以转化为平稳
序列。
差分运算EViews命令：
一阶差分： xt  (1  B) xt ，EViews命令：d(x)
n阶差分：  n xt  (1  B)n xt ，EViews命令：d(x,n)
k步差分：  k xt  (1  Bk ) xt ， EViews命令：d(x,0,k)
n次1阶差分和1次k步差分：
 nk xt  (1  B)n (1  Bk ) xt EViews命令：d(x,n,k)
例如，若
xt  a  bt   t
则对序列 xt 做一阶差分
xt  b   t
就提取了序列中的确定性趋势信息。
若 xt  a  bt  ct 2   t ，则对 xt 做二阶差分
 2 xt  2c   2 t
即可提取序列中的确定性趋势信息。
一般地，如非平稳时间序列的确定性趋势可以
表示为一个关于时间变量的 d 次多项式形式，即
d
E( xt )    j t j
j 0
则 d 阶差分序列的确定性趋势为：
 d 
E   xt       j t   k （k为某一常数）
d d j
 j 0 
即d 阶差分序列的确定性趋势中不在蕴含时间趋势
成分。
二、差分方式的选择
（一）如果时间序列  xt  的确定性趋势是时
间的线性函数，即
E( xt )   0  1t
则其差分序列的确定性趋势为：
E(xt )  1
由此可以看出，差分序列中的时间趋势消失。实现
了序列的平稳化。
例如，下图是 1964－1999 年中国纱年产量时序图
600
500
400
300
200
100
0
1965 1970 1975 1980 1985 1990 1995
从图中不难发现序列蕴含一个线性的递增趋势，对序
列做一阶差分运算，差分后的序列时序图为：
60
40
20
-20
-40
1965 1970 1975 1980 1985 1990 1995
从时序图中我们发现，差分后的时间序列呈现非常平
稳的随机波动，这说明一阶差分运算非常成功地提取了原
序列中的线性趋势。
（二）如果时间序列  xt  的确定性趋势是非
线性趋势，通常低阶差分（2阶或3阶）就可以提
取非线性趋势。
例如，若序列的确定性趋势是时间的3次函
数，即 E( xt )  0  1t   2t 2   3t 3
则它的 3 阶差分序列的确定性趋势为：
E( 3 xt )  6 3
由此可以看出，3阶差分序列中的时间趋势消
失。即通过3阶差分就可以提取原序列中蕴含的 3
次趋势。
我们看一个实际中有非线性趋势的时间序列的
例子，下图是1990-2012年我国私人汽车拥有量序列
的时序图： 9000
8000
7000
6000
5000
4000
3000
2000
1000
0
90 92 94 96 98 00 02 04 06 08 10 12
从序列时序图可以看出，序列有明显的非线性
上升趋势。对序列做 1 阶差分， 1 阶差分后的序列
时序图为：
1600
1200
800
400
0
90 92 94 96 98 00 02 04 06 08 10 12
D(X)
从一阶差分后序列时序图来看，序列还有
非线性时间趋势，我们对序列再做差分运算，2
阶差分序列时序图为：
500
400
300
200
100
-100
90 92 94 96 98 00 02 04 06 08 10 12
D(X,2)
二阶差分后序列时序图显示序列仍然有缓慢
上升的趋势，下面我们对序列再做差分运算， 3阶
差分序列时序图为：
400
300
200
100
-100
-200
-300
90 92 94 96 98 00 02 04 06 08 10 12
D(X,3)
从时序图可以看出，直到 3 阶差分原序列中蕴
含的长期趋势才被较为充分地提取， 3阶差分后的
序列不再呈现确定性趋势。
（三）如果时间序列的确定性趋势里蕴含固定
的时间周期成分，这种序列则需要对序列进行步长
为周期长度的差分运算来实现序列的平稳化。
例如，假设一个非平稳时间序列 zt  是由一个
季节随机游走过程  yt  和一个非季节随机游走过程
 xt  两部分组成，即
xt  0  xt 1  ut
yt  0  yt 4  vt
zt  xt  yt  wt
其中， 0 , 0 是常数，ut , vt , wt 是不相关的白噪声序列。

对 zt 做步长为4 的季节差分和一阶差分各一
次，得：4 zt  4 ( xt  yt  wt )
 (4 xt  4 yt  4 wt )
 (4 xt  0  vt  4 wt )
 4 xt  0  vt  4 wt
 4ut  vt  4 wt
由于等式右侧的每一项都是平稳过程，所以 4 zt
也是平稳过程。这样我们通过一阶差分提取了时间
序列的线性趋势，利用4 步季节差分提取了时间序
列中的季节信息。
这里需要说明的是：在利用差分运算将非平稳
序列转化为平稳时间序列的过程中需要注意两点：
第一，要防止过差分。所谓过差分是指利用差
分运算已充分提取序列趋势后，继续对序列进行差
分运算。过差分会使序列的方差变大，导致有效信
息的无谓浪费，从而使得参数估计的精度下降。
例如，假定非平稳序列为：
xt  c  xt 1   t , 
c为常数， t  iid (0,  2
)
则 xt 的 1 阶差分为：
xt  c   t
显然，一阶差分后的序列是平稳序列，这说
明 1 阶差分运算有效提取了 xt 中的非平稳确定性
信息。
但是，如果我们对 xt 1阶差分序列再做差分运算，例
如，我们对 xt 做 2 阶差分和 3 阶差分，则
 2 xt   t   t 1
 3 xt   t  2 t 1   t  2
虽然2阶和3阶差分序列也都是平稳序列，也能够将原
序列中的非平稳趋势充分提取，但是我们考察它们的方差
发现：
Var (xt )   2
Var ( 2 xt )  2 2
Var ( 3 xt )  6 2
可见，随着差分阶数的增加，序列的方差越来越大。
这就是过度差分造成的结果。
第二，当序列含有可以线性化的趋势时，我们可以先通
过适当的函数变换，将非线性趋势转化为线性形式，然后再
通过对变换后的序列做差分运算提取序列的线性趋势，这样
可以减少差分的阶数。
例如，若序列 xt 含有指数趋势，即
xt  aebt  t （a,b为常数， t 为白噪声）
则，对序列 xt 取对数可线性化：
ln xt  ln a  bt   t
再对序列 ln xt  做一阶差分运算即可提取序列中的时间

趋势：
 ln xt  b   t
例如下图是1990-2012年我国私人汽车拥有量序列的
时序图：
9000
8000
7000
6000
5000
4000
3000
2000
1000
0
90 92 94 96 98 00 02 04 06 08 10 12
序列时序图与指数函数图形非常相似，我们可以考虑
先对序列做对数变换，变换后序列的时序图如下：
10
4
90 92 94 96 98 00 02 04 06 08 10 12
LOG(X)
变换后的序列有明显的线性递增趋势，再对序列做一
阶差分运算，差分后的序列时序图为：
.28
.26
.24
.22
.20
.18
.16
.14
90 92 94 96 98 00 02 04 06 08 10 12
D(LOG(X))
差分后的时间序列呈现平稳的随机波动，这说明一阶
差分运算非常成功地提取了对数序列中的线性趋势。
第三节 ARIMA模型
前面介绍利用差分运算将非平稳序列转化为平
稳序列的方法。
若序列  xt  可以通过d 阶差分转化为平稳时

间序列，即  yt    d xt  是一个平稳时间序列，
且可以拟合一个平稳可逆ARMA(p,q)模型，则意
味着序列  xt  可以拟合如下形式的模型：
 ( B )  d x t   ( B ) t
其中， t  是一个白噪声序列
( B )  1  1 B     p B p
( B )  1   1 B     q B q
上述两个算子多项式的根均在单位圆外。
具有上述结构的模型称为求和自回归移动平均
模型，记为ARIMA(p,d,q).
这里，d 指差分的阶数，p 指的是差分序列拟

合的 ARMA 模型的自回归的阶数， q 指的是差分
序列拟合的 ARMA 模型的移动平均的阶数。
由于 d
 d xt  (1  B )d xt   (
i 0
 1) i
C i
d x t i
即差分后的序列是原序列的若干序列值的加权和，
且可以拟合ARMA模型，所以称此模型为求和自回归移
动平均模型（ ARIMA ）。
求和的意义也可理解为： ARIMA过程可以表示为
ARMA过程的和。例如ARIMA(1,1,1). ：
(1   B )(1  B ) x t  (1   B ) t
记
Wt  (1  B ) xt
则 Wt 为ARMA过程，而原序列 xt 可表示为
t t
W   ( x
i 1
i
i 1
i  xi 1 )  xt  x 0
若 x0  0 ，则有
t
x t   Wi
i 1
特别地：当 d = 0 时，ARIMA(p,d,q) 模型即为
平稳时间序列分析中所介绍的ARMA(p,q) 模型。
当 p = 0 时， ARIMA(0,d,q) 模型可以简记为
IMA(d,q) 模型，称为求和移动平均模型，模型形
式是：
 d xt   ( B ) t
当 q = 0 时，ARIMA(p,d,0) 模型可以简记为
ARI (p,d) 模型，称为求和自回归模型，模型形式
是：
 ( B ) d x t   t
当 d=1，p=q=0时， ARIMA(0,1,0) 模型即为

随机游走模型，模型形式是：
xt  xt 1   t
这些都是ARIMA模型的特定形式。
二、ARIMA模型的性质
（一）平稳性
若 { xt } 服从 ARIMA(p,d,q)模型：
( B )(1  B ) d x t  ( B ) t
记  ( B )   ( B )(1  B ) d
，称  ( B ) 为广义自回归子，
ARIMA(p,d,q)模型的平稳性是由广义自回归算子
方程的根决定的，即由下列算子方程：
( B )(1  B ) d  0
的根决定。该算子方程共有p+d个根，其中 p 个在
单位圆外，d 个在单位圆上。
（1）当 d  0 时，ARIMA(p,d,q)模型是平稳
的。模型的可逆性只与模型移动平均部分的算子方
程的根有关，只要算子方程 ( B )  0 的根在单位
圆外，模型就是可逆的。
（2）当 d  0 时，算子方程有单位根，原序
列非平稳。
（二）方差齐性
（1）当 d  0 时，ARIMA(p,d,q)模型是平
稳。所以序列方差具有齐性。
（2）当 d  0 时，原序列非平稳。方差是非
齐性的， d 阶差分后序列为平稳序列，差分后序列
具有方差齐性。
三、ARIMA模型建模步骤
获
得
平稳性 Y 白噪声 Y 分
观
检验检验析
察
结
值 N N 束
序
列拟合
差分
ARMA
运算
模型
【案例分析】建立1952-1988年中国农业实
际国民收入指数时间序列模型。
1. 获取序列数据，判断序列的平稳性
利用EViews画出时间序列的时序图
320
280
240
200
160
120
80
1955 1960 1965 1970 1975 1980 1985
中国农业实际国民收入指数时序图
从时序图可以看出，该序列有明显的上升趋
势，是典型的非平稳序列。
2. 利用差分运算将原序列平稳化。对原序列
进行 1 阶差分运算，差分后的时序图如下：
30
20
10
-10
-20
-30
1955 1960 1965 1970 1975 1980 1985
D(X)
中国农业实际国民收入指数1阶差分序列时序图
时序图显示，一阶差分序列在均值附近平稳波
动，显示序列有一定的平稳性。
为进一步判断序列的平稳性，再考察 1 阶差分
序列的自相关图。
自相关图显示，差分后序列的样本自相关
系数 ˆ 1  0.535 是峰值，其余各阶的样本自相
关系数均在 2 倍标准差之内，说明差分后序列
有很强的短期相关性，所以，可以初步认为差
分后的序列是平稳的。
3. 对平稳的 1 阶差分序列进行白噪声检验。利
用 EViews 计算出 Q 统计量的值如下：
在检验的显著性水平取0.05的条件下，由于延迟
6阶的Q检验统计量的P值为0.01，小于0.05，所以，1
阶差分序列不能视为白噪声序列，即1阶差分序列里
蕴含有自相关信息。
4. 对平稳非白噪声的1阶差分序列拟合ARMA
模型。利用EViews 计算出序列的样本自相关和偏
自相关系数值，进行模型识别。
1阶差分序列的自相关图显示，序列的自相关系数
有1阶截尾的特征，偏自相关图显示偏自相关形系数不
截尾。所以，可以考虑用MA(1)模型拟合 1 阶差分序
列，对原序列拟合的模型就是ARIMA(0,1,1)模型。
利用极大似然估计，我们可以得到模型的估
计结果为：
(1  B ) xt  5.016  (1  0.708 B )  t , Var ( t )  56.484

5. 对ARIMA(0,1,1)模型拟合效果的检验
首先检验模型的整体拟合效果，即检验
ARIMA(0,1,1)模型的残差序列是否是白噪声序
列，利用 EViews 计算出序列的样本自相关和偏
自相关系数值及Q 统计量的值如下：
ARIMA(0,1,1)模型残差序列的自相关和偏自相关图
从残差的自相关图可以看出，残差序列没有明
显异与0的样本自相关系数值，样本自相关系数都
在 2 倍标准差之内，延迟各阶的拟合检验统计量的
P值都大于0.05，可以认为残差序列是白噪声序列。
其次，我们再来检验模型中系数的显著性。
利用EViews 计算，我们可以得到模型中两个参数
的 t 检验结果如下：
从系数的检验结果可以看出，模型中的两个参
数的 t 检验统计量相应的P值均小于0.05，说明模型
中的系数均显著。
由此可知，用ARIMA(0,1,1)模型拟合1952-1988
年中国农业实际国民收入指数时间序列是有效的。
四、 ARIMA模型预测
ARIMA模型的预测与ARMA模型预测方法是
相似的，其预测原理也是最小均方误差准则。
（一）最小均方误差预测原理
ARIMA(p,d,q)模型的一般表示方法为：
( B )(1  B ) d x t  ( B ) t
和ARIMA一样，我们也可以将 xt 表示为随机扰动
项的线性函数，即
xt   t   1 t 1   2 t  2  
  ( B ) t
式中扰动项前的系数  1 , 2 , 的值可以由如下
等式通过待定系数方法确定：
( B )(1  B ) d  ( B )  ( B )
那么，这时 xt  l 真实值可表示为：
xt  l  ( t  l   1 t  l  1     l  1 t  1 )  ( l  t   l  1 t  1  )
由于  t  l ,  t  l 1 , ,  t  1 的值不可获得，所以 xt  l 的
预测值只能表示为：
xˆ t ( l )  C 0 t  C1 t 1  C 2 t  2  
下面我们利用最小均方误差准则来确定 xt+l 的
预测值表达式中 C 0 , C1 , C 2 , 的值。
（1）计算预测误差 et ( l )
预测误差=真实值-预测值
et ( l )  xt  l  xˆ t ( l )
 ( t  l   1 t  l 1     l 1 t  1 )  ( l  t   l  1 t 1  )
 (C 0 t  C1 t 1  C 2 t  2  )
 ( t  l   1 t  l 1     l 1 t  1 )  ( l  C0 ) t  ( l  1  C1 ) t 1  
注意到  t 是白噪声序列，所以，预测误差
的方差为：
Var[et ( l )]  Var[ x t  l  xˆ t ( l )]

 (1   12     l21 ) 2   ( l  i  Ci ) 2 2
i 1
（2）利用最小均方误差准则确定 C 0 , C1 , C 2 ,
要使均方误差最小，当且仅当
 l  i  C i  0, i  0,1, 2, 
即在 C i   l  i , i  0,1, 2,  的条件下预测的均方误
差最小。
于是，在均方误差最小原则下xt 的向前 l 期
预测值为：
xˆ t ( l )   l  t   l 1 t 1   l  2 t  2  
向前 l 期预测误差为：
et ( l )   t  l   1 t  l 1     l 1 t  1
向前 l 期预测误差的方差为：
Var[et ( l )]  (1   12     l21 ) 2
（二）条件期望预测
与ARMA模型一样，我们也可以利用条件期望
来对ARIMA模型进行预测。
xt+l 关于 xt , xt-1 , …的条件期望为
E ( xt  l xt , xt 1 ,)
 E t l 1t l 1 l 1t 1 lt l 1t 1  xt , xt 1 ,
lt l 1t 1 l 2t 2 
这恰好是最小均方误差预测值。这说明，最
小均方误差预测与条件期望预测是等价的，即 xt
的向前 l 期预测值也可表示为：
xˆ t  l  E ( xt  l xt , xt 1 ,)
【例】已知ARIMA(1,1,1)模型为
(1  0.8 B )(1  B ) x t  (1  0.6 B )  t
其中，是正态白噪声序列，且 xt 1  4.5, xt  5.3,

 t  0.8,  2  1, 求 xt  3 的95％的置信区间。
解（1）利用条件期望计算预测值
原模型的等价形式为：
(1  1.8 B  0.8 B 2 ) x t  (1  0.6 B )  t
xt  1.8 xt 1  0.8 xt  2   t  0.6 t 1

于是，利用条件期望预测可以计算预测值为
xˆ t (1)  E ( xt 1 xt , xt 1 , )
 1.8 xt  0.8 xt 1  0.6 t  5.46
xˆ t (2)  E ( xt  2 xt , xt 1 , )
 1.8 xˆ t (1)  0.8 xt  5.59
xˆ t (3)  E ( xt  3 xt , xt 1 , )
 1.8 xˆ t (2)  0.8 xˆ t (1)  5.69

（2）计算预测方差
将 xt 表示为： xt   ( B ) t ，代人ARIMA(1,1,1)
模型得：(1  0.8 B )(1  B ) ( B ) t  (1  0.6 B ) t ，于是可
得如下等式：
(1  0.8 B )(1  B ) ( B )  (1  0.6 B )
利用待定系数方法可以计算出：
 1  1.8  0.6  1.2

 2  1.8 1  0.8  1.36
故，预测方差为：
Var[et (3)]  (1   12   22 ) 2  4.2896
于是，可得到 xt  3 的95％置信区间为：
 xˆ (3)  1.96
t Var (et (3)) , xˆt (3)  1.96 Var (et (3)) 
计算得到的95％置信区间是 (1.63, 9.75) 。
五、疏系数模型
ARIMA(p,d,q) 模型是指 d 阶差分后自相关最

高阶数为 p，移动平均最高阶数为q的模型，通常
它包含有 p+q 个独立的未知系数：
 1 , ,  p ,  1 , ,  q
如果该模型中有部分自相关系数  j ,1  j  p
或部分移动平均系数  k ,1  k  q 为零，即原模型
中有部分系数缺省了，那么该模型称为疏系数模型。
如果只是自相关部分有缺省系数，那么该疏
系数模型可以简记为如下形式：
ARIMA(( p1 , , p m ), d , q )
其中， p1 , , pm 为非零自相关系数的阶数。
如果只是移动平均部分有缺省系数，那么该疏
系数模型可以简记为如下形式：
ARIMA( p , d ,(q1 ,  , q n ))
其中，q1 , , qn 为非零移动平均系数的阶数。
如果自相关和移动平均部分都有缺省，模型可
以简记为
ARIMA(( p1 , , p m ), d ,(q1 , , q n ))
其中， p1 , , pm 为非零自相关系数的阶数，q1 , , qn
为非零移动平均系数的阶数。
这里需要注意的是：当我们能够判别一个模
型是疏系数模型时，就意味着在建模时，模型中
需要估计的未知参数个数就会变少，从可以增大
样本的自由度，提高模型中参数估计的精度，进
而能够提高模型使用的有效性。
下面我们看一个疏系数模型的例子：假定疏系数模型
的形式为：
xt   4 xt  4   t ,  4  1,  t  iid (0, 2 )
此模型可以看成是缺省了系数  0 ,  1 ,  2 ,  3 的AR(4)模型，
疏系数模型的形式为：
ARI ((4), 0)
称此模型为季度自回归模型。
Yule-Walker方程为：
 k   4  k 4 , k1
利用Yule-Walker方程容易得到：
 4k , k  1, 2,  ,
4k 
 0, 其余。
即步长为 4 的季节模型的自相关函数在周期 4 的整数倍延

迟阶数上呈指数函数衰减的拖尾特征，在周期 4 的非整数
倍延迟阶数上为零。
容易求出季度自回归模型的偏自相关函数为：
 4 , k  4,
 kk 
 0, k  4.
即只有延迟4阶偏自相关系数非零，其余延迟各阶偏自相关
系数都等于零。偏自相关系数4阶后表现为截尾特征。
下图是由季度自回归模型：xt  0.8 xt  4   t 生成的序
列时序图，其中  t 是标准正态白噪声。
6
-2
-4
-6
25 50 75 100 125 150 175 200
从时序图我们看到，时间序列中蕴含有季节因素信息。
下图是由季度自回归模型：xt  0.8 xt  4   t 生成的时间
序列的样本自相关和偏自相关函数图。
从图中我们可以看到，样本自相关系数在周期 4 的整
数倍延迟阶数上呈指数函数衰减，表现为拖尾的特征，在
周期 4 的非整数倍延迟阶数上都基本在2倍标准差以内。从
样本偏自相关系数来看，除了延迟4阶样本偏自相关系数显
著非零外，其余延迟各阶样本偏自相关系数都基本在2倍标
准差以内，表现为4阶之后截尾特征。
【案例分析】对1917年－1975年美国23岁妇女每万人
生育率序列建模。
1. 绘制时间序列的时序图
利用EViews绘制序列时序图如下：
280
240
200
160
120
80
20 25 30 35 40 45 50 55 60 65 70 75
时序图显示序列有长期趋势，是非平稳序列。
2.差分平稳化
对原序列作1阶差分提取趋势信息，差分后的序列时
序图如下：
50
40
30
20
10
-10
-20
-30
20 25 30 35 40 45 50 55 60 65 70 75
D(X)
差分后的序列时序图显示长期趋势提取较为充分，序
列较为平稳，下面再考察一下序列的自相关图，进一步确
定一下序列的平稳性。
自相关图显示，延迟5阶之后，自相关系数基本都在
零值附近波动，可以认为序列具有短期相关性，即可以认
为1阶差分后的序列是平稳的。
3. 模型识别与估计
（1）模型的识别
考虑到差分后序列样本偏自相关系数只有延迟1阶和4
阶显著非零。故考虑对差分后序列拟合疏系数模型AR(1,4)。
综合考虑前面的差分运算，故我们可以尝试对原序列拟合
疏系数模型： ARIMA((1,4),1,0)。
（2）模型的估计
运用条件最小二乘估计，利用EViews计算，可以得到
未知参数的估计结果如下：
于是，我们得到 1917 年－1975 年美国23岁妇女每万人

生育率序列的拟合模型为：
1
(1  B ) xt  
4 t
1  0.332499 B  0.330774 B
4. 模型的检验
（1）拟合模型的残差序列的白噪声检验
从拟合模型残差的自相关图可以看出，残差序列没有
明显异与0的自相关系数值，延迟各阶的拟合检验统计量的
P值都大于0.05，可以认为残差序列是白噪声序列，即模型
整体拟合是有效的。
（2）拟合模型系数的显著性检验
从拟合模型系数的检验结果可以看出，模型中的两个参
数均显著，这说明用此模型拟合1917年－1975年美国23岁妇
女每万人生育率序列是有效的。
这里需要说明的是：由于我们这里是使用样本
自相关函数和样本偏自相关函数对模型进行识别，
但样本相关函数与理论相关函数是有差异的，所以
我们在模型识别时应该尽可能考虑多种模型，通过
反复尝试和删减不显著的参数寻找合适的模型。
六、季节模型
在实际问题中，某些时间序列可能会存在某种
周期性变化，这中周期性变化过程通常是由季节
性变化或其他一些固有因素引起的。例如，某些地
区空调的月度销量可能会受到天气气候的影响而
呈现季节性变化。这类序列称为季节性序列。经济
领域中，季节性时间序列是较为常见的。下面我们
将介绍两种季节模型：简单季节模型和乘积季节模
型。
（一）简单季节模型（加法模型）
简单季节模型是指序列中的季节效应和其它效
应之间是加法关系，即
X t  S t  Tt  I t
其中， St 表示季节因素，Tt 表示趋势，It 表示随

机因素。
平稳化方法：
利用低阶差分提取序列的趋势信息，利用季
节差分提取序列的趋势信息，即通过低阶差分和
季节差分可将原序列转化为平稳序列。ARIMA模
型结构形式如下：
( B )
d
 D X t  t
( B )
其中  D X t  (1  B D ) X t ,  d xt  (1  B )d X t
( B )  1   1 B   2 B 2     q B q
 ( B )  1   1 B   2 B 2     pB p
【例】拟合1962—1991年德国工人季度失业率序列
利用EViews绘制序列的时序图，直观地观察一下序列
的变化趋势。
12
10
0
64 66 68 70 72 74 76 78 80 82 84 86 88 90
时序图显示，该序列既含有长期趋势，又含有以季度
为周期的季节效应。
2. 差分平稳化
先对原序列作1阶差分提取趋势信息，再作步长为 4 的
季节差分消除季节效应的影响，差分后的时序图如下：
2. 0
1. 5
1. 0
0. 5
0. 0
-0.5
-1.0
-1.5
65 70 75 80 85 90
yt  (1  B 4 )(1  B ) xt
从时序图可以看出，差分后的序列 yt 无显著的趋势
和周期，随机波动较平稳。
对差分后的序列做白噪声检验，检验结果如下：
在检验的显著性水平取0.05的条件下，由于延迟6阶的Q
检验统计量的P值小于0.05，所以，差分后的序列不能视为白
噪声序列，即差分后序列里蕴含有自相关信息，需对差分后
序列进一步拟合ARMA模型。
3.模型识别与拟合
自相关图显示，差分后的序列仍含有一定的季节效
应，自相关系数具有拖尾特征。偏自相关图显示，除了
延迟1阶和4阶的偏自相关系数显著非零外，其它延迟阶
数的偏自相关系数基本都在2倍标准差内波动，可以尝试
拟合疏系数模型AR(1,4)。
（2）模型的拟合
利用条件最小二乘估计，可以得到模型中未知参数
的估计值，EViews估计结果如下：
综合考虑前面的差分信息，对德国工人季度失业率序
列拟合的模型为：
1
4
(1  B )(1  B ) x t  
4 t
1  0.4507 B  0.2816 B
4. 模型检验
（1）拟合模型的残差序列的白噪声检验
明显异与0的自相关系数值，延迟各阶的检验统计量的P值
都大于0.05，可以认为残差序列是白噪声序列，即模型整体
拟合是有效的。
（2）拟合模型参数的显著性检验
从拟合模型系数的检验结果可以看出，模型中的两个
参数均显著。这说明用此模型拟合1962-1991年德国工人季
度失业率序列是有效的。
（二）乘积季节模型
前面介绍的简单季节模型只需要通过简单的差分运算
和季节差分运算就可以将序列平稳化，并且平稳化后的序
列可以拟合ARMA模型。而在实际中我们会碰到更复杂的
情况，序列的季节效应、长期趋势效应和随机波动之间存
在复杂地交互影响，简单的季节模型不能充分地提取其中
的相关关系，这时需要采用乘积季节模型。
乘积季节模型的构造原理如下：
若序列 xt 可以通过 d 阶差分和周期步长为 S 的 D 阶

季节差分转化为平稳序列，那么，我们首先对原序列进行
差分平稳化，差分后的平稳序列为：
yt   DS  d xt
然后我们考察差分后的序列的自相关性。若差分后的
序列 yt 还蕴含有短期相关性和短期的季节效应的相关性，
则我们可以用低价ARMA(p,q)模型提取序列的短期相关
性，使用以周期步长S为单位的ARMA(P,Q)模型提取季节
效应的短期相关性。
由于短期相关性和季节效应之间具有乘积关系，所以，
可以将差分后的序列拟合成ARMA(p,q)模型和ARMA(P,Q)
模型的乘积形式，最终原序列乘积季节模型的完整结构可采
取如下表达式：
M P ( B ) p ( B ) DS  d xt  N Q ( B ) q ( B ) t
其中，  d xt  (1  B )d xt ,  DS xt  (1  B S ) D xt
 p ( B )  1  1 B   2 B 2     p B p
 q ( B )  1  1 B   2 B 2     q B q
M P ( B )  1  m1 B S  m2 B 2 S    m P B PS
N Q ( B )  1  n1 B S  n2 B 2 S    nQ B QS
该乘积季节模型通常简记为： ARIMA( p, d , q )  ( P , D , Q ) S
【例】(1, 1, 1)  (1, 1, 1)12 阶月度SARIMA模型表达为：
(1  1 B )(1   1 B12 ) 12 X t  (1  1 B )(1   1 B12 ) t
序列  12 X t 具有平稳性的条件是：
1  1, 1  1
序列  12 X t 具有可逆性的条件是：
1  1, 1  1
EViews估计命令：
D (X,1,12) AR(1) SAR(12) MA(1) SMA(12)

【例】(0, 1, 1)  (0, 1, 1)12 阶月度SARIMA模型表达为：
 12 X t  (1  1 B )(1   1 B12 ) t
D (X,1,12) MA(1) SMA(12)
将上述模型变形为：
 12 X t  (1  1 B   1 B12  1  1 B13 ) t
  t  1 t 1   1 t 12  1  1 t 13
这是一个疏系数模型。
D (X,1,12) MA(1) MA(12) MA(13)
进一步将模型变形为：
X t  X t 1  X t 12  X t 13   t  1 t 1   1 t 12  1  1 t 13
此模型可用于预测。
注意：
（1）用对数的季节时间序列数据建模时通常D不会大
于1，P和Q不会大于3。
（2）乘积季节模型参数的估计、检验与前面介绍的估
计、检验方法相同。利用乘积季节模型预测也与上面介绍
的预测方法类似。
【例】拟合1948—1981年美国女性月度失业率序列
的变化趋势。
3500
3000
2500
2000
1500
1000
500
0
1950 1955 1960 1965 1970 1975 1980
时序图显示序列有长期递增趋势和以年为周期的季节效应。
2. 差分平稳化
对原序列作1阶差分和步长为12的季节差分，差分后
的时序图如下：
500
400
300
200
100
0
-100
-200
-300
-400
1950 1955 1960 1965 1970 1975 1980
D(X,1,12)
 ( xt  xt 12 )  (1  B )(1  B12 ) xt
差分后的序列时序图显示，序列在0附近波动，随机波
动较平稳。
差分序列的自相关和偏自相关图
差分后序列的自相关图显示延迟1阶、2阶的自相关
系数大于2倍标准差，这说明差分后的序列还具有短期相
关性，而延迟12阶的自相关系数显著大于2倍标准差，说
明序列中蕴含非常显著的季节效应。
从差分后序列的偏自相关图我们也可以得出同样的
结论。
3.模型的识别与拟合
从差分后序列的自相关图来看，12 阶以内的自相关
系数和偏自相关系数均不截尾，所以，我们可以考虑使用
ARMA(1,1)模型提取差分后序列的短期相关信息。
再考虑季节自相关特征，从差分后序列的自相关图来
看，延迟12阶自相关系数显著非零，但延迟24阶、36阶自
相关系数落入 2 倍标准差范围。而差分后序列的偏自相关
图显示，延迟12 阶、 24 阶、36 阶的偏自相关系数都显著
非零。所以，可以认为季节自相关系数截尾偏自相关系数
拖尾。这时可以尝试用以12步为周期的ARMA(0,1)12模型
提取差分后序列的季节自相关信息。
综合前面的差分信息，对于美国女性月度失业率序列
我们可以考虑拟合乘积季节模型ARIMA(1,1,1) ×(0,1,1)12：
(1  1 B ) 12 xt  (1  1 B )(1  n1 B12 ) t

（2）模型的拟合
利用条件最小二乘估计，可以得到模型中未知参
数的估计值，Eviews估计结果如下：
综合考虑前面的差分信息，对美国女性月度失业率序
列拟合的模型为：
1  0.565173 B
 12 xt  (1  0.827297 B12 ) t
1  0.682895 B
4. 模型检验
（1）拟合模型残差序列的白噪声检验
明显异与0的自相关系数值，延迟各阶的拟合检验统计量的
P值都大于0.05，可以认为残差序列是白噪声序列，即模型
整体拟合是有效的。
（2）拟合模型参数的显著性检验
从拟合模型系数的检验结果可以看出，模型中的参数
均显著，这说明用乘积季节模型拟合1948—1981年美国女
性月度失业率序列是有效的。
第四节残差自回归模型
前面介绍的ARIMA模型虽然可以对非平稳
时间序列建模，但ARIMA模型中使用的差分平
稳化方法也有一些缺点，主要有一下两个缺点：
（1）差分运算会损失序列的有效信息；
（2） ARIMA模型实际经济意义不强，往往
很难对模型进行直观解释。
如果序列有一种稳定的确定性趋势时，我们
可以不用差分平稳化方法，而是利用回归的方法
先提取序列的确定性趋势，原序列剔除确定性趋
势后的残差序列是一个平稳序列，然后再对残差
序列建立ARMA模型。如果我们能够用AR模型
拟合残差序列，此时所建立的模型就称为残差自
回归 (Auto-Regressive)模型。
一、残差自回归模型构造
当序列有确定性趋势或季节效应时，可以首先
通过确定性因素分解方法提取序列中主要的确定性
信息，建立如下回归模型：
xt  Tt  S t   t
其中，Tt 是确定性时间趋势，St 是季节效应。  t 是

残差序列。
为了考察模型的有效性，可以检验模型的残
差序列是否有自相关性。
（1）若残差序列的自相关性不显著，则说
明确定性回归模型：
xt  Tt  S t   t
对序列信息的提取是充分的，可以停止分析。
（2）若残差序列的自相关性显著，则说明
确定性回归模型：
xt  Tt  S t   t
对序列信息的提取不充分，可以考虑对残差序列
拟合自回归模型，进一步提取相关信息：
 t   1 t 1     p t  p  at
这样我们就可以构造如下模型：
 xt  Tt  S t   t

 t  1 t 1     p t  p  at

 E ( a t )  0, Var ( a t )   2
, Cov ( at , at  i )  0, i  1
由于在模型中是使用自回归形式拟合残差序
列，所以称此模型为残差自回归模型（Auto-
Regressive model）。
在实践中，对确定性趋势效应的拟合常用如
下两种方法：
（1）自变量为时间 t 的幂函数
Tt   0   1  t     k  t k   t
（2）自变量为序列的历史观察值
Tt   0   1  xt 1     k  xt k   t
第二种方法与差分原理类似。
对季节效应的常用拟合方法也有两种：
（1）给定季节指数
S t  S t
这里 St 是某个已知的季节指数。
（2）建立季节自回归模型
S t   0   1  xt m     p  xt  pm
这里 m 是固定的周期。
二、残差的自相关性检验
残差自回归模型的建立依赖与对残差序列的
自相关性检验，若残差序列有自相关性，我们就
需要建立残差自回归模型，否则就不需要建立残
差自回归模型。
检验残差序列的自相关性有两种方法：
（1）Durbin-Waston 检验
（2）Durbin h 检验
三、Durbin-Waston 检验原理
Durbin - Watson 检验是由 J. Durbin 和

G.S.Watson于 1950 年在考虑多元回归模型的
残差独立性时提出的一种自相关性检验方法。
其检验原理如下：
考虑残差序列是 AR(1) 形式：
 t   t 1  vt
其中， vt 是白噪声序列。
原假设：残差序列不存在 1 阶自相关性，即
H 0 : Cov ( t ,  t 1 )  0  H0 :   0
备择假设：残差序列存在 1 阶自相关性，即
H 1 : Cov ( t ,  t 1 )  0  H0 :   0
DW统计量为：
n
 t t 1
(   ) 2
DW  t 2
n
 t
 2
t 1
将DW统计量展开得：
n n n
 t  t 1  2  t  t 1
 2
  2
DW  t 2 t 2
n
t 2
 t
 2
t 1
当样本容量 n 充分大时，有
n n n
 t  t 1  t
 2
t 2
  2
  2
t 2 t 1
于是  n

   t  t 1 
DW  2  1  t  2n 
 


t 1
 2
t 

根据自相关系数的定义有
n
  t t 1
 t 2
n
 t
 2
t 1
所以
DW  2(1   )
因为  的取值范围是 [-1, 1]，所以 DW 统计

量的取值范围是 [0, 4]。
四、DW检验的判别规则
Durbin – Watson在给
定的显著性水平下，
′(不包括常数项）给出了用于
检验的上、下临界值和。其检验规则如下：
（1）若 DW 值在（0, dL）之间，拒绝原假设
H0，认为残差序列存在一阶正自相关性。
（2）若 DW 值在（4 - dL, dL）之间，拒绝原假

设H0，认为残差序列存在一阶负自相关性。
（3）若 DW 值在（ dU , 4 - dU ）之间，接受原

假设H0，认为残差序列不存在一阶自相关性。
（4）若 DW 值在（ dL , dU ）或（4 – dU , 4 - dL）

之间，则检验没有结论，即不能判别残差序列是否
存在一阶自相关性。
DW检验的判别规则可用如下示意图表示：
f ( DW )
显相显相显
著关著关著
正性不性负
相待相待相
关定关定关
0 dL dU 2 4  dU 4  d L 4 DW
五、 Durbin h检验
前面我们介绍了检验回归残差序列自相关性
的DW检验，但是， DW检验统计量有一定的缺
陷：当回归因子包含滞后因变量时，残差序列的
DW 统计量是一个有偏统计量。在这种场合下使
用 DW 统计量容易产生残差序列正自相关性不显
著的误判。
为了克服DW检验的有偏性， Durbin在1970
年提出了DW 统计量的两个修正统计量： Durbin
t 统计量和Durbin h 统计量，这两个统计量渐近
等价。下面我们介绍 Durbin h 的基本原理。
Durbin h
 t   t 1  at
H0 :   0
H1 :   0
Durbin h检验统计量为：
n DW n
Dh    (1  )
1  nˆ 
2
2 1  nˆ 2
其中，n为观测值序列长度， ˆ  为滞后因变量系数
2
的最小二乘估计的方差。
H0 :   0
Durbin h
Z 2
|Dh |  Z 2
|Dh |  Z 2
【例】使用Auto-Regressive模型分析1952年－1988年中
国农业实际国民收入指数序列。
的变化趋势。 320
280
240
200
160
120
80
1955 1960 1965 1970 1975 1980 1985
时序图显示该序列有显著的线性递增趋势，但没有季
节效应。
考虑建立如下结构的Auto-Regressive 模型：
 xt  Tt   t , t  1, 2, 3, 

 t  1 t 1     p t  p  at

 E ( a t )  0, Var ( a t )   2
, Cov (at , at i )  0, i  1
2. 拟合时间序列的确定性趋势
对趋势 Tt 分别尝试构造如下两个确定性趋势模型：
（1）将趋势变量 Tt 设定为时间 t 的线性函数，即
x t   0   1t , t  1, 2, 
利用极大似然估计，得到序列趋势的拟合模型为：
即 xt  66.1491  4.5158t , t  1, 2, 3, 
利用DW检验残差序列的自相关性
在 0.05 显著性水平下，n =37，查 DW 上、下临界值

表得：
d L  1.42, dU  1.53
由于
DW=0.1378  (0, d L )
说明残差序列存在显著的正自相关性。我们需要对残
差再次拟合，以提取残差中的自相关性。
利用EViews计算残差序列的自相关、偏自相关系数，
得到相关图图如下：
残差序列的相关图显示自相关系数具有拖尾特征，偏
自相关系数显示2阶截尾。所以对回归模型的残差序列可
以考虑拟合 AR(2) 模型。
最终将原序列模型设定为：
 x t   0   1t   t ,

 t   1 t 1   2 t  2  at ,

 E ( a t )  0, Var ( a t )   2
, Cov (at , at i )  0, i  1
然后，使用极大似然估计，联合求解模型中的所有未知
参数，利用EViews软件得到模型的估计结果如下：
DW=1.936479 ，显示残差序列不再具有相关性，最
终残差自回归模型的拟合结果为：
 xt  26.4  6.23t   t

  t  1.43 t 1  0.526 t  2  at
其中，{at } 为零均值白噪声序列。
（2）将趋势变量 Tt 设定为一阶自回归形式，即
Tt   0   1  xt 1
利用极大似然估计，得到序列趋势的拟合模型为：
即 xt  1.0365 xt 1   t
由于回归因子是一个延迟因变量，所以这里不能用
DW统计量检验残差序列的自相关性，需要利用Durbin h
统计量检验残差序列的自相关性。
DW n
Dh  (1  )
2 1  nˆ 2
1.06 37
 (1  ) 2
 2.863
2 1  37  0.009
Z 0.025  1.96 ，因为 Dh  Z 0.025 ,

在0.05显著性水平下，
所以，残差序列存在显著的自相关性。
利用EViews计算残差序列的自相关、偏自相关系数，
得到相关图图如下：
残差序列的相关图显示自相关系数具有拖尾特征，偏
自相关系数有1阶截尾特征。所以对回归模型的残差序列
可以考虑拟合AR(1)模型。
最终将原序列模型设定为：
 x t   1 x t 1   t ,

 t   1 t 1  at ,

 E ( a t )  0, Var ( a t )   2
, Cov (at , at i )  0, i  1
然后，使用极大似然估计，联合求解模型中的所有未知
参数，利用EViews软件得到模型的估计结果如下：
DW=1.843513 ，显示残差序列不再具有相关性，最
终残差自回归模型的拟合结果为：
 xt  1.033 xt 1   t

  t  0.473 t 1  at
其中，{at } 为零均值白噪声序列。
从SC准则来看，第二个模型的 SC=7.0747，要小于
第一个模型的 SC=7.143值，即第二个模型要优于第一个
模型，但第一个模型更易于做经济解释。
第五节异方差的性质
一、异方差的影响
前面我们介绍了使用ARIMA模型拟合非平稳
序列的方法，其中对拟合模型的一个假定是残差
序列为零均值白噪声序列，即要求残差序列 { t }
满足如下三个条件：
1. 零均值： E ( t )  0
2. 纯随机： Cov ( t ,  t  i )  0, i  1
3. 方差齐性： Var ( t )   
2
如果方差齐性假定不成立，则称序列存在异
方差，此时随机误差项的方差不再是常数，而是
随时间变化而变化，即
Var ( t )  h( t )
在这三个假定中，零均值假定最容易实现，
只需要对序列进行中心化处理就可以保证该假定
成立，所以这个假定通常无需检验。
纯随机性假定是我们前面重点检验的对象，
以保证我们所建立的模型对序列中蕴含的自相关
信息能够充分提取。
前面我们介绍的 Q 统计量、 DW 统计量等
就是适用于不同场合的自相关检验统计量。
只有第三个假定：方差齐性假定，在之前没有进
行检验。在缺省检验的情况下，我们实际上是默认残
差序列满足这个条件。
但这个假定实际上并不一定总是满足的。忽视异
方差的存在会导致残差的方差被严重低估，继而参数
显著性检验容易犯纳伪错误，使得参数的显著性检验
失去意义，最终导致模型的拟合精度受影响。
所以为提高模型的拟合精度，需要对残差序列进
行方差齐性检验，并对有异方差序列进行处理。
二、异方差直观诊断
判断残差序列是否存在异方差，我们可以通
过残差的时序图或残差平方时序图来直观判断。
1. 残差图
若残差序列是方差齐性的，则它应该在一个
边界与均值几乎相等的空间随机波动。否则，就
可以认为残差序列呈现异方差性。
t
  
       
     

t
同方差情形递增型异方差
t t
 
              
          
       
t t
递减型异方差综合型异方差
2. 残差平方图
由于残差序列的方差实际上就是它平方的期
望，即
Var ( t )  E ( t2 )
若残差序列是方差齐性的，则意味着
E ( t2 )   2
即  t2 应该在某个常数值  2 附近随机波动，它不
应该具有任何明显的趋势，否则就可以认为残差
序列存在异方差性。
【例】直观考察 2010年6月21日至2014年1月
16日人民币兑美元汇率序列的方差齐性。
序列的时序图显示序列是非平稳的。见下图：
690
680
R
670
660
650
640
630
620
610
600
100 200 300 400 500 600 700 800
对原序列进行 1 阶差分，差分后残差序列显
示是平稳序列。如下图所示：
3
D(R)
2
-1
-2
-3
100 200 300 400 500 600 700 800
从残差序列时序图来看，残差序列的波动在某
些时段大，而在另外时段小，呈现异方差特征。
差分后残差序列平方图如下：
9
8
D(R)^2
7
6
5
4
3
2
1
0
100 200 300 400 500 600 700 800
残差序列平方时序图同样显示残差序列存在
异方差。
第六节方差齐性变换
当残差序列存在异方差时，我们需要对它进
行进一步处理，处理的思路有两种：
1. 若异方差函数具体形式已知，考虑进行方
差齐性变换。
2. 若异方差函数的具体形式未知，虑拟拟合
条件异方差模型。
假设序列显示出显著的异方差性，且方差
与序列均值 E ( xt )   t 之间具有某种函数关系（这
种情况在金融时间序列中较为常见），即
Var ( xt )   t2  h(  t )
其中：h( ) 是某个已知函数。
这种情况下，我们可以尝试寻找一个转换函
数 g ( ) ，使得经转换后的序列 g ( xt ) 满足方差齐
性，即
Var[ g ( xt )]   2
那么，我们然后确定转换函数呢？寻找转换
函数的思路如下：
将转换函数 g ( xt ) 在 t 附近作一阶泰勒展开：
g ( x t )  g (  t )  ( x t   t ) g (  t )
则转换函数序列 g ( xt ) 的方差近似等于
Var[ g ( xt )]  Var[ g (  t )  ( xt   t ) g (  t )]
 [ g (  t )]2Var ( xt )
 [ g (  t )]2 h(  t )
显然，要使 Var[ g ( xt )] 等于常数，则要求转
换函数导数的平方 [ g ( t )]2 与 h(  t ) 具有倒函数
关系，即
1
g (  t ) 
h(  t )
在实践中，许多金融时间序列（例如风险资
产的价格）都呈现异方差的性质，且方差描述的
是风险，而风险通常是与收益水平（序列均值）
成正比的。此时，最简单的假定为：
 t  t
则
1 1
g (  t )  
h(  t ) t
 g (  t )  log(  t )
这意味着，对满足这样简单假定的异方差序
列，可以通过对数变换有效地实现方差齐性。
第七节条件异方差模型
前面我们介绍了方差齐性变换，方差齐性
变换处理异方差的方法只适合于残差序列异方差
函数形式已知的情况，但在实际问题中，有些残
差序列的异方差表现为复杂形式，通常不能通过
简单的对数变换转化为同方差，这时就需要其他
处理异方差的方法。这里我们将介绍利用条件异
方差模型来处理异方差的方法。
一、ARCH模型
（一）波动集群效应
计量经济学模型中的异方差通常属于递增型
异方差，即随机误差项方差的变化随解释变量的
增大而增大。但利率，汇率，股票收益率等时间
序列中存在的异方差却不是递增型异方差。例如，
汇率序列常常表现为随机游走模型形式：
xt  xt 1   t
其中  t 为白噪声过程。
下图是1995-2000年日元兑美元汇率序列时序图：
160
JPY (1995-2000)
140
120
100
80
200 400 600 800 1000 1200 1400
日元兑美元汇率序列JPY(1995-2000)
时序图显示序列是一个类似于随机游走的非平稳序
列。对序列进行1阶差分，差分后的序列时序图如下：
6
4 D(JPY) (1995-2000)
-2
-4
-6
-8
200 400 600 800 1000 1200 1400
日元兑美元汇率差分序列（收益）D(JPY)
差分后的时序图显示序列均值平稳，但序列的波动
幅度在不同时段有大小不一的现象，呈现出异方差性。
下图是差分平方序列时序图：
60
50
DJPY^2
40
30
20
10
0
200 400 600 800 1000 1200 1400
D(JPY)的平方 (1995-2000)
从时序图我们也能看出，不同时段差分平方具有显著
性的差异，同样说明残差序列存在异方差性。
仔细观察序列的波动性，我们会发现，虽然
在整个观察期内序列的方差基本齐性，但在不同
时段，序列的波动却表示出明显的差异。即方差
在一定时段中比较小，而在另一时段中比较大。
表现出“波动集聚”（volatility clustering）特征。
这种现象称为“波动集聚效应”。产生这种现象
的
原因很可能是邻近各期的方差之间具有一定的相
关性造成的。
Engle 1982年提出了一种描述现期方差与前期
的“波动”关系的模型，称为自回归条件异方差模型
（ Autoregressive Conditional Heteroskedasticity
Model）（简称ARCH模型）。它是用一个确定的
函数来刻画异方差的演变过程。
（二）ARCH模型的结构
当我们拿到一个观测值时间序列后，完整的
分析是应该考察序列水平和波动两方面的情况。
通常会首先提取序列的水平方面的相关信息，然
后分析残差序列中蕴含的波动相关信息。只有将
这两方面的信息综合考虑才能得到序列比较完整
和精确的分析结果。所以，ARCH模型的完整结
构为：
xt  f ( t , xt 1 , xt  2 ,)   t
 t  ht et
q
ht   0    j  t2 j
j 1
i .i .d
其中， ht  Var ( t  t 1 )  E (  t 1 ) ， et ~ N (0,1) ，
2
t
 t 1   ( t 1 ,  t  2 ,) 。模型中的系数满足：
(1)  0 ,  1 ,  2 , ,  q  0
(2)  1   2     q  1
具有这种结构形式的条件方差模型称为 q 阶自回归条
件异方差模型，简记为ARCH(q)。
其中
E ( xt  t 1 )  f ( t , xt 1 , xt  2 ,)
是对序列的平均水平拟合的模型，称为均值方程。
q
ht  Var ( t  t 1 )   0    j  t2 j
j 1
是对序列的波动（方差）拟合的模型，称为方差方程。
条件（1） 0 ,  1 ,  2 , ,  q  0 是为了保证模型的
设定是合理的。
条件（2）  1   2     q  1 是为了保证  t2 的
平稳性。
下图是由ARCH(1)模型：
i . i .d
 t  ht et , et ~ N (0,1), ht  0.1  0.8 t21
生成的序列的时序图。
3
-1
-2
-3
25 50 75 100 125 150 175 200
EPSILON
从时序图可以看出，序列的波动范围基本上是在2倍
标准差范围之内，但波动幅度的大小呈现集聚的特征。
（三）ARCH效应检验
要拟合ARCH模型，首先要进行ARCH效应检验。
检验思路是：对于一个有异方差的时间序列，若其方差
有集群效应，那么其残差序列的平方就具有自相关性。
所以，我们可以通过检验残差平方序列是否具有自相关性
来检验模型是否具有的ARCH效应。
检验ARCH效应的方法有两种：一种是基于残差平方
序列的相关图检验（Q检验），另一种是ARCH LM 检
验。
1. Q 检验的基本原理
（1）检验假设
Q检验的原假设是：残差平方序列是纯随机序
列，即残差序列不存在ARCH效果。
备择假设是：残差平方序列存在自相关性，即
残差序列存在ARCH效果。
用  k 表示残差平方序列的延迟 k 阶自相关系
数，则检验假设可表达为：
H 0 : 1   2     q  0
H 1 : 1 ,  2 ,  ,  q 不全为零
这里，  k 按如下的计算公式来计算：
T
 ( t2  ˆ 2 )( t2i  ˆ 2 )
k  t  k 1
T
 t
( 2
t 1
 ˆ 2 2
)
1 T
式中，T 为观察序列的长度，ˆ 2    t2 .
T t 1
（2）按如下公式计算 Q 统计量值：
q
 i2
Q  T (T  2)
i 1 T  i
T 为样本容量，q 为设定的滞后阶数。
在原假设成立的条件下，
q
ˆ i2 渐近 2
Q  T (T  2) ~  (q  1)
i 1 T  i
（3）检验规则

给定显著性水平，当 Q   2

(q  1) 时，拒绝 1
原假设 H0 ，认为残差序列存在ARCH效应。否则，
则不能拒绝 H0 。
2. ARCH LM 检验
ARCH LM 检验又称为拉格朗日乘数检验，它
的基本原理是：
（1）使用自回归模型拟合残差平方序列，即
构建如下辅助多元回归模型：
 t2   0   1 t21   2 t22     q t2q  et
通过检验多元回归模型中的回归系数  1 ,  2 , ,  q
是否全为零来判断残差平方序列是否有自相关性。
若  1 ,  2 , ,  q 全为零，则意味着残差平方序
列不存在显著的相关性，否则，就认为残差平方
序列存在显著的相关性。
所以， ARCH LM 的检验假设为：
H 0 : 1   2     q  0
（残差序列不存在ARCH效果）
H 1 :  1 ,  2 ,  ,  q 不全为零
（残差序列存在ARCH效果）
（2）检验统计量：
LM  TR 2
式中，T 为回归式的样本容量，R2 为辅助回归方程

的拟合优度，在零假设成立的条件下
近似
LM ~  2 (q )
（3）检验规则

给定显著性水平，当 LM   2

(q ) 时，拒绝
1
原假设 H0 ，认为残差序列存在 ARCH 效应。否

则，不能拒绝 H0 。
（四）ARCH模型的建模步骤
（1）建立时间序列的计量模型，提取确定性
趋势，对估计的残差检验ARCH效果；
（2）识别ARCH模型的阶数，估计模型；
（3）检验ARCH模型，根据情况修改模型。
【案例分析】分析拟合1995.1.2-2001.12.31沪市每日
股票价格收盘指数序列。
1. 绘制时序图
记沪市股票价格收盘指数序列为 { spt } ，序列的时序

图如下： 2400
2000
1600
1200
800
400
1995 1996 1997 1998 1999 2000 2001
SP
为了减少舍入误差，在估计时，对序列 { spt } 进行自
然对数处理，即对序列 {ln( spt )} 进行分析建模，序列
{ln( spt )} 的时序图如下：
8.0
7.6
7.2
6.8
6.4
6.0
1995 1996 1997 1998 1999 2000 2001
LNSP
2. 均值方程的拟合
序列 {ln( spt )} 的时序图显示，指数的对数序列表现为

带漂移的随机游走过程，可以考虑用随机游走模型来拟合
序列的均值方程，即将均值方程设定为：
ln( spt )     ln( spt 1 )   t
运用最小二乘法，利用EViews软件得到估计结果如下：
均值方程为：
ln( spt )  0.0173  0.9976 ln( spt 1)  t
从估计结果来看，系数通过了显著性检验，R 2  0.997
反映出拟合的程度很好。
3. ARCH效应检验
均值回归方程的残差图如下：
.3
.2
.1
.0
-.1
-.2
1995 1996 1997 1998 1999 2000 2001
RESID
残差图显示，序列的波动在一些时段内（2000年）
比较小，而在其它的一些时段内（1996年）非常大，表
现出波动集聚的特征，这说明残差序列可能具有条件异
方差性。下面进一步对残差序列进行ARCH检验。
（1）ARCH效应的Q检验
计算残差平方序列的自相关（AC）和偏自相关（PAC）
系数，结果如下：
由于残差平方序列的自相关系数显著非零，而且Q统
计量非常显著，可以得出结论：均值方程的残差序列存
在ARCH效应。
（2）ARCH效应的 LM 检验
从残差平方序列的偏自相关函数图来看，我们可以考
虑选择滞后阶数 p=4 时的ARCH LM 检验，检验结果如下：
此处LM 检验的 P 值为0，拒绝原假设，说明均值方

程的残差序列存在ARCH效应。
4. 拟合ARCH模型
从残差平方序列的自相关函数和偏自相关函数来看，
残差序列存在4阶ARCH效应，因此，我们利用ARCH(4)
模型重新拟合原序列， EViews得到估计结果如下：
最终我们得到原序列的ARCH(4)模型拟合结果为：
均值方程为：
ln( spt )  0.022667  1.003086 ln( spt 1)  t

z  ( 3.908) (1223.6)
方差方程为：
ht  0.0001  0.396 t21  0.122 t2 2  0.185 t2 3  0.386 t2 4

z  (16) (13.7) (4.8) ( 6.95) (20.33)
R 2 =0.997, AIC  5.19, SC  5.17
此时，再检验ARCH(4)模型的残差序列可以发现不再存
在ARCH效果，即该模型对序列的拟合是有效的。
二、 GARCH模型
（一）ARCH(q) 模型的缺点
前面我们介绍的 ARCH 模型在实际使用时存
在一些缺点，主要有以下几个方面：
1. ARCH 模型看起来更像一个移动平均模
型，而不像自回归模型。它是用残差平方序列的
q 阶移动平均来拟合当期条件异方差值，而移动
平均模型的自相关系数有q阶截尾的特征，所以，
ARCH 模型实际上只适合于异方差函数短期自相
关过程，不能反映实际数据中的长期记忆性质。
2. 在实际问题中，特别是在金融领域，使用
的数据通常是日数据，这时条件方差会依赖于较
长时期的残差平方序列值，此时会要求模型中残
差平方的滞后期 q 很大。当 q 较大时，模型中需
要估计的参数就会很多，会增加参数估计的难
度，从而影响 ARCH 模型的拟合精确。
3. 为了保证条件方差为正，要求模型中的参
数均大于0。当参数过多时，用实际数据估计出的
模型参数往往不能满足这一要求，从而使得模型
不具实用性。
为了解决这些问题，Bollerslov（波罗索勒夫）
在 1985 年提出了广义自回归条件异方差模型，即
GARCH模型，用来拟合条件异方差。
（二）GARCH模型的定义
GARCH模型的结构如下：
xt  f ( t , xt 1 , xt  2 ,)   t
 t  ht et
p q
ht      i ht  i    j  t2 j
i 1 j 1
i .i .d
式中，ht  Var ( t  t 1 )  E ( t2  t 1 ) ， et ~ N (0,1) ，
 t 1   ( t 1 ,  t  2 ,) ，模型简记为GARCH(p,q)。
模型中的系数要求满足下列条件：
(1)   0, i  0,  j  0
(2) 1     p  1    q  1
显然，p=0时的GARCH(p,q)模型就是ARCH(q)
模型，即ARCH是GARCH模型的一个特例。
实际中最为常见的GARCH模型是GARCH(1,1)
模型，GARCH(1,1) 模型可以转化为无穷阶的
ARCH模型，这是因为，由GARCH(1,1)模型：
ht    1 ht 1  1 t21
可得
(1  1 B )ht    1 t21
 1
ht    t21
1  1 B 1  1 B

  1 (1  1 B  12 B 2  ) t21
1  1 B

ht   1 t21  11 t2 2  112 t2 3  
1  1
上述模型即为无穷阶的ARCH模型，这就意味
着， GARCH(1,1) 模型可以很好地拟合具有长记忆
性的异方差函数。
【案例分析】估计1995.1.2-2001.12.31沪市每日股票
价格收盘指数的GARCH (1,1)模型。
前面的分析我们可以看到，股票价格指数对数序列
的回归方程的残差序列具有ARCH效应，需要通过高阶
ARCH模型拟合，现在，我们考虑用GARCH (1,1)模型
来消除残差序列的ARCH效应。拟合的模型如下：
均值方程：
ln( spt )  0.028567  0.9961966 ln( spt 1)  t

z  (6.803) (1690.161)
方差方程：
ht  0.00000284  0.106225 t21  0.904646ht 1
z  (4.605) (15.616) (230.14 8)
R 2 =0.997, AIC  5.19, SC  5.18
从估计结果来看，系数通过了显著性检验，R 2  0.997
反映出用GARCH (1,1)模型拟合原序列效果很好。
此时，再检验GARCH (1,1) 模型的残差序列可以
发现残差序列不再存在ARCH效果。
三、AR-GARCH模型
对残差序列  t 拟合GARCH模型有一个基本要求：
 t 为零均值，纯随机、同方差序列。有时回归函数
xt  f ( t , xt 1 , xt  2 ,)
不能充分提取原序列中的相关信息，残差序列可能具
有自相关性，而不是纯随机的。这时需要对  t 先拟合
自回归模型，再考虑自回归残差序列 {v t }的方差齐性，
如果 {v t }异方差，则对它拟合GARCH模型。这样构造
的模型称为AR(m)-GARCH(p,q)模型。模型的具体结构
如下：
xt  f ( t , xt 1 , xt  2 ,)   t
m
 t    k  t  k  vt
k 1
v t  ht et
p q
ht      i ht  i    j v t2 j
i 1 j 1
其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的拟合

i .i .d
模型，et ~ N (0,1) 。
四、GARCH模型的衍生模型
（一）非对称GARCH模型
在 GARCH（或ARCH）模型中，当期条件方差被表
示为前期扰动平方的函数，这就意味着正的扰动和负的扰
动对波动率有相同的影响，这与实际情况往往不符。大量
实践表明，投资人对获益和亏损的反映是不对称的。出现
获益情况时，通常投资人反映比较慢，出现亏损时，投资
人的反映比较快。这种现象称为“杠杆效应”。反映这种
现
象的模型就是非对称 GARCH 模型。非对称GARCH 模型
主要有指数GARCH 模型和门限GARCH 模型。
1. 指数GARCH模型（EGARCH）
Nelson于1991年提出了指数GARCH模型，该
模型的结构如下：
yt  f ( t , yt 1 , yt  2 ,)   t
 t  ht et
p q
ln( ht )      i ln( ht  i )    j g (et )
i 1 j 1
g ( et )   et   [ et  E et ]
其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的

i .i .d
拟模型，et ~ N (0,1) 。
模型中引入了加权扰动函数 g (et )，注意到
g ( et )   et   [ et  E et ]
 (   )et   E et , et  0

 (   )et   E et , et  0
式中 E[ g (et )]  0, et  N (0,1), E et  2 /  .
由此可见，正、负扰动对条件方差的影响是不
同的。在实际中，说明好消息（et  0 ）和坏消息
（ et  0 ）对条件方差有不同的影响。同时，指数
GARCH模型对也放宽了对模型参数非负的约束。
2. 门限 GARCH 模型（TGARCH）
一阶TGARCH 模型中的条件方差被设定为如
下形式：
p q
ht      i ht  i    j  t2 j   t21d t 1
i 1 j 1
其中 d t 1 是一个虚拟变量:
 1,  t 1  0 （坏消息）
d t 1 
 0,  t 1  0 （好消息）
模型的具体结构如下：
yt  f ( t , yt 1 , yt  2 ,)   t
 t  ht et
p q
ht      i ht  i    j  t2 j   t21d t 1
i 1 j 1
其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的拟合

i .i .d
模型，et ~ N (0,1) 。
模型中的  t21d t 1 项称为非对称效应项，或称为

TGARCH项。正、负扰动对条件方差的影响是不同的。
体现了实际问题中存在的“杠杆效应”。
（二）依均值GARCH模型（GARCH-M）
在金融时间序列分析中，由于风险资产的收益率的
大小与投资者承担的风险（方差）存在一定关系，一般来
说，风险越大，预期的收益就越高。所以在对收益率序列
建模时，可以把代表风险的方差作为一个因素引入模型，
这就是 GARCH-M 模型。该模型是由恩格尔（Engle)、
利林（Lilien）、和罗宾（Robins）1987首先引入的。
ARCH-M模型的结构如下：
xt  f ( t , xt 1 , xt  2 ,)   g ( ht )   t
 t  ht et
p q
ht      i ht  i    j  t2 j
i 1 j 1
其中g  ht  是条件方差的函数，通常的形式有：
g  ht   ht , ht , ln ht
条件方差 ht 也可以是 ARCH 或 EGARCH

形式, 这时的模型分别称为ARCH-M, EGARCH-
M模型。
GARCH-M 模型通常应用于资产的预期收益
与预期风险密切相关的金融领域。
附录：ARFIMA模型
平稳时间序列的样本自相关函数表现为指数衰减，数
据表现为短期记忆的特征。非平稳时间序列的样本自相关函
数通常表现为缓慢的线性衰减，数据表现为长期记忆的特征。
若一个时间序列（如水文学中的时间序列）的样本自相关函
数衰减速度介于指数函数和线性函数之间，如幂函数形式，
说明该时间序列具有较弱的非平稳性，这时可考虑对原序列
进行分数阶差分将其平稳化。
金融中的风险资产价格序列也常常有这种表现，其运动
过程表现为分数布朗运动而非几何布朗运动。
一、分数差分的概念
定义：对于 d > -1 ，定义序列  X t  的 d 阶差分为
 d X t  (1  B )d X t
其中：

( j  d )
  (1  B )  
d d
Bj
j  0  ( j  1) (  d )
d (d  1) 2 d (d  1)(d  2) 3
 1  dB  B  B 
2! 3!
即
d d (d  1) d (d  1)(d  2)
 X t  X t  dX t 1  X t 2  X t 3  
2! 3!
二、分整差分噪声序列
定义：如果随机序列  X t  满足差分方程：
(1  B )d X t   t  t ~ i .i .d (0,  2 )
式中 | d | 1 / 2 ，（保证差分方程有唯一平稳解），则称
Xt 为分整差分噪声序列（fractional differenced noise，
FDN）。
当 d=0 时,过程 Xt 即为白噪声，当 d=1 时,过程 Xt 即为

随机游动（布朗运动的离散形式），当 d 是分数时，过程
Xt 被称为分数次白噪声，它是分数布朗运动的离散形式。
1. d <0.5时，过程 Xt 是弱平稳的，有无穷阶MA表示；

( j  d )
X t  (1  B )  t  
d
B j t
j  0  ( j  1) ( d )
因此，模型 (1  B )d X t   t 表示的是一个长记忆模型。
2. d >-0.5 时，过程 Xt 是可逆的，有无穷阶AR表示；
3. d ≥0.5时，过程Xt是非平稳的，但其“非平稳性比单位
根过程要低”。
4.当 -0.5 <d <0.5时， Xt 的自相关函数为
d (1  d ) ( k  1  d )
k  , k  1, 2, 
(1  d )(2  d )  ( k  d )
当k→∞时， Xt 的自相关函数:
(  d )! 2 d 1
k  k  ck 2 d 1 (k   )
(d  1)!
Xt 自相关函数双曲线式地衰减到 0自相关函数的衰减
速度依赖于差分的阶数 d。
5. 当-0.5 <d < 0.5时， Xt 的偏自相关函数为
d
 kk  , k  1, 2, 
(k  d )
三、分整差分噪声平稳序列
若 (1  B )d X t 是一个平稳序列，服从一个ARMA(p,q)
模型，则称 Xt 是一个ARFIMA(p,d,q)过程。其一般形式为：
( B )(1  B ) d ( X t   )  ( B ) t
四、分整阶数 d 的求法
1. 赫斯特（Hurst）指数
Hurst 指数是水文学家赫斯特于1951年提出来的. 英国
水文专家 H. E. Hurst (1900-1978) 在研究尼罗河水库水流量
和贮存能力的关系时，发现用有偏的随机游走(分形布朗运
动) 能够更好地描述水库的长期存贮能力，并在此基础上提
出了用重标极差 (R/S) 分析方法来建立赫斯特指数 ( H ) , 作
为判断时间序列数据遵从对称的随机游走还是有偏的随机
游走过程的指标 .
（1）当 H = 0.5 时，表示时间序列可以用随机游走
来描述（白噪声）；
（2）当 0.5 <H ≤1, 表示黑噪声（持续性），表明时

间序列存在长期记忆性；
（3）当 0≤ H < 0.5, 表示粉红噪声（反持续性），表

明时间序列是均值回复过程。
Hurst指数与ARFIMA模型的阶数有确定关系：
H  d  0.5
由此，可借助于估计Hurst指数的方法初步估计分维数。
2. 赫斯特（Hurst）指数的计算
记  xi  , i  1, 2, , n 为一时间序列，其均值为：
1 n
x   xi
n i 1
记 x ( i , n) 为累积离差，则有
i
x ( i , n)   ( x t  x )
t 1
定义极差为：
R( n)  max x ( i , n)  min x ( i , n)
1 i  n 1 i  n
序列  xi  , i  1, 2, , n 的标准差为：
1 n
S ( n)   (
n i 1 i
x  x ) 2
重标极差 F(n) 定义为：

R( n)
F ( n) 
S ( n)
根据统计学的结果，如果一个序列是随机
游动，累积离差的极差应该和时间（这里即为
观测数 n）的平方根成正比增加，即
1
F ( n)   n 2
但在实际问题中，一般的情况是：
R( n)
F ( n)    nH
S ( n)
这里 H 即为 Hurst 指数。对上式两边取对数得：
 R( n ) 
ln    ln   H ln( n)
 S ( n) 
然后利用最小二乘法回归求解。
1
F ( n)   n 2
实际中的做法是：将时间序列分成 M1个长度
为 T1 的等长度子区间，计算每个子区间的重标极
差 F(n) ,设第 i 个子区间的重标极差为 F( i, T1)
R(T1 ) max x( i , T1 )  min x( i , T1 )

F ( i , T1 )   1 i  n 1 i  n
S (T1 ) 1 T1

T1 i 1 i
( x  x ) 2
M1
1
然后用 F (T1 )   F ( i , T1 ) 作为F( T1) 的估计值。
M 1 i 1
重复以上的做法，再将时间序列分成 M2个长
度为 T2 的等长度子区间，得到
R(T2 ) max x( i , T2 )  min x( i , T2 )
F ( i , T2 )   1 i  n 1 i  n
S (T2 ) 1 T2

T2 i 1 i
( x  x ) 2
M2
1
F (T2 ) 
M2
 F (i , T )
i 1
2
依次照此做下去，得到 F(n) 的估计值序列：
F (Ti ), i  1, 2, , n
最后用样本序列  F (Ti ), Ti  , i  1, 2, , n 对下列模型：
ln  F ( n)   ln   H ln( n)
回归，即可得到 Hurst 指数的估计值。

3. 赫斯特（Hurst）指数的其它计算方法：
（1）聚合序列方差法
将时间序列  xi  , i  1, 2, , T 分成样本容量为 m 的

T
[ ] 个子样本，在每个子样内求均值，即对固定的 m
m
值，可得到一个聚合序列（样本均值序列）：
1 km
T
x (m)
k  
m i  ( k 1) m 1
xi , k  1, 2, ,[ ]
m
此序列的样本方差估计量为：
2
 1 [T m ]
 1 [T m ]

(m)
Var ( x ) 
T m
 (x (m) 2
k )  x (m)
k 
k 1 T m k 1 
可以证明：当 m 充分大时，有
 ( x(m ) )   2m 2 H 2
Var 0
其中， 02 为常数，据上式可得：
 ( x ( m ) )  C  (2 H  2) ln m
ln Var 0
取不同的 m 值对上式回归可得到 H 的估计值。此

T
方法要求 m  T 以保证 [ ] 较大。
m
（2）聚合序列绝对值法
聚合序列的构造方法同（1），不同的是改
方法不是计算聚合序列的方差，而是计算聚合序
列的绝对值的和，即
1 [T m ] ( m )
x(m )  
T m k 1
xk
可以证明：当 m 充分大时，有
[T m ]
1
x(m )  
T m k 1 k
x (m)
  2
1 m H 1
其中， 12 为常数， H  1, 据上式可得：

ln x ( m )  C1  ( H  1) ln m
取不同的 m 值对上式回归可得到 H 的估计值。
（3）周期图方法
对时间序列  xi  , i  1, 2, , T 计算：

1 T
I ( ) 
2 T
 t
x
t 1
e it
其中，  为频率，可以证明： I ( ) 是序列  xt 

谱密度 f ( ) 的渐近无偏估计。利用回归式：
ln I ( )  C  (1  2 H ) ln( )
可得到 H 的估计值。
五、分数布朗运动（Fractional Brownian Motion）
定义1 设 0  H  1，Hurst参数为H的分数布朗
运动为一个连续的高斯过程 { BH ( t ), t  0}，s, t  0,
满足： B (0)  0, E[ B ( t )]  0,
H H
Cov ( BH ( t ), BH ( s ))  E[ BH ( t ) BH ( s )]
1  2H
t  s  ts 
2H 2H

2 
当 H=0.5 时，分数布朗运动 { BH ( t ), t  0} 即为
标准布朗运动 { B( t ), t  0}.
定义2 指数为H（ 0  H  1）的分数布朗运动是
定义在某概率空间上的随机过程 { BH ( t ), t  0} ，使得
（1）以概率1，BH ( t ) 连续，且 BH (0)  0.
（2）对任意 t  0, h  0,
BH ( t  h)  BH ( t )  N (0, h2 H )
以上两种定义是等价的。
因为，Cov ( BH ( t ), BH ( s ))
1
  D  BH ( t )   D  BH ( s )   D  BH ( t )  BH ( s ) 
2
1 2H
  t  s 2 H  ( t  s )2 H 
2
定义3 设 0  H  1 ，称随机过程 { BH ( t ), t  0}
为 Hurst 参数为 H 的分数布朗运动，如果 t  0,
有：
1  0 H
1
H
1
t H
1

BH (t ) 
1 
[(t  s)  (s) ]dB(s)   (t  s) dB(s)
2 2
0
2

(H  )
2
其中： ( ) 是  函数，B( s ) 为布朗运动。式中的随

机积分为 Ito 随机积分。
由分数布朗运动的定义知：
（1）分数布朗运动的增量是平稳的；
（2）分数布朗运动的增量不是独立的，而标准布
朗运动的增量是独立的。
（3） BH ( t )  N (0, t 2 H ), Var ( BH ( t ))  t 2 H
（4）当 H  1 时，分数布朗运动不是Markov过程
2
因为， E  BH ( h)  BH ( t  h)  BH ( t )  
 E[ BH ( h) BH ( t  h)]  E[ BH ( t ) BH ( h)]
1 2H 1 2H
  h  ( t  h)  t    t  h2 H  ( t  h)2 H 
2H 2H
2 2
1
 ( t  h)2 H  2t 2 H  ( t  h)2 H 
2
于是，分数布朗运动的增量的相关函数为：
0 h t th
Cov ( BH ( h)  BH (0), BH ( t  h)  BH ( t ))
 ( t , h) 
Var ( BH ( h)  BH (0)) Var ( BH ( t  h)  BH ( t ))
E  BH ( h)  BH ( t  h)  BH ( t )  

Var ( BH ( h)) Var ( BH ( t  h)  BH ( t ))
1
( t  h)2 H  2t 2 H  ( t  h)2 H 
 2
h2 H
特别地，h = t 时，有
Cov ( BH ( t ), BH (2t )  BH ( t ))
 (t , t ) 
Var ( BH ( t )) Var ( BH (2t )  BH ( t ))
 2 2 H 1  1
（4）自相似性（分形的特性）
BH (at )  a H BH ( t )
1 1
（5）可以证明： H  d  或 dH
2 2
即序列经过 d 阶差分可以成为白噪声序列。
当 0.5  H  1 时，0  d  0.5 ，表明序列具有长记忆性。
（6）赫斯特指数 H 与分形维数 D0 之间的关系
D0  2  H
（7）标准的分数布朗运动是连续的高斯过程
BH ( t ) 
1
(1   )  0

 
t
[( t  s )  (  s ) ]dBs   ( t  s ) dBs
0 
1 

 x
其中，B ( t ) 是标准布朗运动，  H  ,  ( )  x e dx .
2 0

第4章 非平稳时间序列的随机分析（慕课）

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第4章 非平稳时间序列的随机分析（慕课）

Uploaded by

Copyright:

Available Formats

前面我们介绍了平稳时间序列分析，对于

式中， d   ；1 ,  2 ,, d 为常数系数； {at }为一个

式中，d   ； 1 ,  2 ,, d 为常数系数；{at } 为一个

其中， 0 , 0 是常数，ut , vt , wt 是不相关的白噪声序列。

再对序列 ln xt  做一阶差分运算即可提取序列中的时间

若序列  xt  可以通过d 阶差分转化为平稳时

这里，d 指差分的阶数，p 指的是差分序列拟

当 d=1，p=q=0时， ARIMA(0,1,0) 模型即为

(1  B ) xt  5.016  (1  0.708 B )  t , Var ( t )  56.484

其中， 是正态白噪声序列，且 xt 1  4.5, xt  5.3,

(1  1.8 B  0.8 B 2 ) x t  (1  0.6 B )  t

xt  1.8 xt 1  0.8 xt  2   t  0.6 t 1

 1.8 xˆ t (2)  0.8 xˆ t (1)  5.69

ARIMA(p,d,q) 模型是指 d 阶差分后自相关最

即步长为 4 的季节模型的自相关函数在周期 4 的整数倍延

于是，我们得到 1917 年－1975 年美国23岁妇女每万人

其中， St 表示季节因素，Tt 表示趋势，It 表示随

若序列 xt 可以通过 d 阶差分和周期步长为 S 的 D 阶

(1  1 B )(1   1 B12 ) 12 X t  (1  1 B )(1   1 B12 ) t

D (X,1,12) AR(1) SAR(12) MA(1) SMA(12)

X t  X t 1  X t 12  X t 13   t  1 t 1   1 t 12  1  1 t 13

 ( xt  xt 12 )  (1  B )(1  B12 ) xt

(1  1 B ) 12 xt  (1  1 B )(1  n1 B12 ) t

其中，Tt 是确定性时间趋势，St 是季节效应。  t 是

Durbin - Watson 检验是由 J. Durbin 和

考虑残差序列是 AR(1) 形式：

因为  的取值范围是 [-1, 1]，所以 DW 统计

（2）若 DW 值在（4 - dL, dL）之间，拒绝原假

（3）若 DW 值在（ dU , 4 - dU ）之间，接受原

（4）若 DW 值在（ dL , dU ）或（4 – dU , 4 - dL）

在 0.05 显著性水平下，n =37，查 DW 上、下临界值

Z 0.025  1.96 ，因为 Dh  Z 0.025 ,

所以， ARCH LM 的检验假设为：

式中，T 为回归式的样本容量，R2 为辅助回归方程

原假设 H0 ，认为残差序列存在 ARCH 效应。 否

记沪市股票价格收盘指数序列为 { spt } ，序列的时序

序列 {ln( spt )} 的时序图显示，指数的对数序列表现为

ln( spt )     ln( spt 1 )   t

ln( spt )  0.0173  0.9976 ln( spt 1)  t

此处LM 检验的 P 值为0，拒绝原假设，说明均值方

ln( spt )  0.022667  1.003086 ln( spt 1)  t

ht  0.0001  0.396 t21  0.122 t2 2  0.185 t2 3  0.386 t2 4

R 2 =0.997, AIC  5.19, SC  5.17

ln( spt )  0.028567  0.9961966 ln( spt 1)  t

其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的拟合

其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的

其中， xt  f ( t , xt 1 , xt  2 ,)   t 是序列确定性信息的拟合

模型中的  t21d t 1 项称为非对称效应项，或称为

条件方差 ht 也可以是 ARCH 或 EGARCH

定义：对于 d > -1 ，定义序列  X t  的 d 阶差分为

当 d=0 时,过程 Xt 即为白噪声，当 d=1 时,过程 Xt 即为

2. d >-0.5 时，过程 Xt 是可逆的，有无穷阶AR表示；

（2）当 0.5 <H ≤1, 表示黑噪声（持续性），表明时

（3）当 0≤ H < 0.5, 表示粉红噪声（反持续性）， 表

重标极差 F(n) 定义为：

R(T1 ) max x( i , T1 )  min x( i , T1 )

依次照此做下去，得到 F(n) 的估计值序列：

最后用样本序列  F (Ti ), Ti  , i  1, 2, , n 对下列模型：

回归，即可得到 Hurst 指数的估计值。

将时间序列  xi  , i  1, 2, , T 分成样本容量为 m 的

取不同的 m 值对上式回归可得到 H 的估计值。此

其中， 12 为常数， H  1, 据上式可得：

对时间序列  xi  , i  1, 2, , T 计算：

其中，  为频率，可以证明： I ( ) 是序列  xt 

第4章非平稳时间序列的随机分析（慕课）

第4章非平稳时间序列的随机分析（慕课）

其中，是正态白噪声序列，且 xt 1  4.5, xt  5.3,

原假设 H0 ，认为残差序列存在 ARCH 效应。否

（3）当 0≤ H < 0.5, 表示粉红噪声（反持续性），表