第05章-吴-动态模型1:ARDL - ARIMA Model

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 57

高级计量经济学

第05章 动态模型1:ARDL_ARIMA Model

吴浩存
经济与金融学院
2022年3月
本课件仅供本课程学生内部学习之用,
请勿外传或上载网络!
1
第六章 动态模型:ARIMA Model

2
为何要学习ARIMA?
⚫ 在经典的回归模型中,主要是通过回归分析来建立不同变量之间的
函数关系(因果关系),以考察事物之间的联系。
⚫ 本章节要讨论如何利用时间序列数据本身建立模型,以研究事物发
展只身的规律,并据此对事物未来的发展做出预测。
⚫ 研究时间序列数据的意义:在现实中,往往需要研究某个事物其随
时间发展变化的规律。这就需要通过研究该事物过去发展的历史记
录,以得到其自身发展的规律。在现实中很多问题,如利率波动、
收益率变化、反映股市行情的各种指数等通常都可以表达为时间序
列数据。
⚫ 通过研究这些数据,发现这些经济变量的变化规律(对于某些变量
来说,影响其发展变化的因素太多,或者是主要影响变量的数据难
以收集,以至于难以建立回归模型来发现其变化发展 规律,此时
,时间序列分析模型就显现其优势——因为这类模型不需要建立因
果关系模型,仅需要其变量本身的数据就可以建模),这样的一种
建模方式就属于时间序列分析的研究范畴。时间序列分析中,
ARIMA模型是最典型最常用的一种模型。
3
ARIMA的含义

⚫ ARIMA包含3个部分,即AR、I、MA。AR表示auto
regression,即自回归模型;I表表⽰integration,即单
整阶数,时间序列模型必须是平稳性序列才能建立
计量模型,ARIMA模型作为时间序列模型也不例外
,因此,先要对时间序列进行单位根检验,如果是
非平稳序列,就要通过差分来转化为平稳序列,经
过⼏几次差分转化为平稳序列,就称为几阶单整;
MA表示moving average,即移动平均模型。可见,
ARIMA模型实际上是AR模型和MA模型的组合。

4
ARIMA模型与ARMA模型的区别
⚫ ARMA模型是针对平稳时间序列建立的模
型。ARIMA模型是针对非平稳时间序列建
模。换句话说,非平稳时间序列要建立
ARMA模型,首先需要经过差分转化为平
稳时间序列,然后建立ARMA模型。

5
本章要点
⚫ ARDL模型的概念、优点、结构与构造
⚫ ARIMA类模型的概念
⚫ AR模型稳定性的条件,AR模型和MA模型的相互
转化
⚫ AR模型、MA模型、ARMA模型自相关函数、偏
自相关函数的特点
⚫ 信息准则的基本原理

6
第一节

ARDL模型的概念和构造

7
ARDL模型的概念
⚫ ARDL(autoregressive distributed lag)称为
自回归分布滞后模型。
⚫ 计量软件Microfit,可用来对ARDL模型进行方
便的估计.

⚫ ARDL模型的优点
可以用ARDL模型来检验变量之间的长期关系。

8
ARDL模型的的结构
一个典型的 ARDL( p, q1, q2 ,.....qk ) 模型的结构如下:
k
 ( L, P) yt =   i ( L, qi ) xit +  wt + ut
i =1

⚫ 其中  ( L, P) = 1 − 1 L − 2 L2 − .... −  p Lp
 i ( L, qi ) = 1 −  i1 L −  i 2 L2 − ... −  iq Lq
i
i

p 表示 yt 滞后的阶数,qi 表示第i个自变量 xit 滞


后的阶数,i = 1, 2,......k 。L是滞后算子(lag
operator),它可用下式定义:Lyt = yt −1,wt
是s行、1列的确定向量

9
ARDL建模的基本方法
ARDL建模的方法包括两个阶段:
⚫ 第一阶段,建立与该ARDL模型相对应的误差修
正模型(ECM),并计算出ECM模型中的F统计量
。以此判断变量间是否存在长期稳定的关系。

⚫ 第二阶段,运用ARDL模型,估计变量之间长期
关系的系数。

10
实例-ARDL模型在金融数据中的应用
⚫ 研究对象
美国非耐用消费品支出LC与真实可支配收入LY,通
胀率DP之间的关系 (课堂讨论:什么关系?)

⚫ 数据
1960年1季度到1994年1季度的季度数据

11
⚫ 首先,我们调用Microfit软件读入该数据文件。
对原始数据进行取对数作差分的处理。
⚫ 对应于ARDL(4,4,4)中变量LC,LY和DP的误差
修正模型(ECM)如下:
4 4 4
DLCt = a0 +  bi DLCt −i +  di DLYt −i +  ei DPI t −i
i =1 i =1 i =1

+ 1LCt −1 +  2 LYt −1 +  3 PI t −1 + ut

⚫ 原假设:变量间不存在稳定的长期关系,即:
H 0 : 1 =  2 =  3 = 0
⚫ 择备假设:H1 : 1  0 或  2  0 或  3  0

12
⚫ 计算F统计量,检验三者之间是否具有长期关系

图 4-1 假设检验的结果
13
⚫ 用Microfit软件中的ARDL选项来估计变量间
的长期系数以及相应的误差修正模型ECM

图4-2 ARDL(1,2,0)估计结果 14
图4-3 ARDL(2,2,3)估计结果
15
图4-4 AIC准则选定的误差修正模型结果
16
图4-5 预测结果
17
第二节

ARIMA模型的概念和构造

18
关于ARIMA模型
⚫ ARIMA模型全称为差分自回归移动平均模型。是由博
克思和詹金斯于70年代初提出的一著名时间序列预测
方法,博克思-詹金斯法。其中ARIMA(p,d,q)称为
差分自回归移动平均模型,AR是自回归,p为自回归
项;MA为移动平均,q为移动平均项数,d为时间序列
成为平稳时所做的差分次数。
⚫ ARIMA模型的基本思想是:将预测对象随时间推移而
形成的数据序列视为一个随机序列,用一定的数学模
型来近似描述这个序列。这个模型一旦被识别后就可
以从时间序列的过去值及现在值来预测未来值。

19
ARIMA模型的概念
⚫ 所谓ARIMA模型,是指将非平稳时间序列转化
为平稳时间序列,然后将因变量仅对它的滞后
值以及随机误差项的现值和滞后值进行回归所
建立的模型。
⚫ ARIMA模型根据原序列是否平稳以及回归中所
含部分的不同,包括移动平均过程(MA)、自
回归过程(AR)、自回归移动平均过程(
ARMA)以及ARIMA过程。

20
移动平均过程
一个q阶的移动平均(MA)过程可用下式表示:
Yt=u+ t+ 1 t-1+ 2 t-2+...+ q t-q
⚫ 其中u为常数项, t 为白噪音过程
⚫ 引入滞后算子L,原式可以写成:
q
Yt=u+  iLi t+ t
i=1

或者 Yt=u+ (L) t
⚫ 其中  (L)=1+ 1L+ 2L + ... +  qL
2 q

21
MA(q)过程的特征
⚫ 1、 E(Yt)=u
⚫ 2、 var(Yt) = +  +  + +  
2 2 2
2
(1 1 2 ... q )
⚫ 3、自协方差
①当k>q时  k =0

②当k<q时 k =( k +  1 k+1 +  2 k+2 + ... +  q q-k ) 2

对于任意的,MA(q)是平稳的。

22
自回归过程
一个p阶自回归(AR)过程可以用下式表示:
Yt=c+1Yt-1+ 2Yt-2+...+ pYt-p+vt
⚫ 其中, vt 为白噪音过程
⚫ 引入滞后算子,则原式可写成
p
Yt=c+   iLi Yt+vt
i=1

或者  (L)Yt=c+vt
其中  (L)=1- 1L- 2L -...- pL
2 p

23
AR(p)过程平稳的条件

如果特征方程:

1-1Z- 2Z2 -...- pZp = 0


的根全部落在单位圆之外,则该AR(p)过程是
平稳的。

24
AR(p)过程的特征
E(Yt)=c+1E(Yt-1)+ 2E(Yt-2)+...+  pE(Yt-p)+E(vt)
⚫ E(vt) =0, Yt、Yt-1、Yt-2、...Yt-p 的无条
件期望是相等的,若设为u,则得到 :
c
u=
1 − ( 1 +  2 + ... +  p)

25
⚫ 再看方差和协方差

Yt-u=1(Yt-1-u)+ 2(Yt-2-u)+...+ p(Yt-p-u)+vt

 0=1 1+ 2 2+...+ p p+ 2


 1=1 0+ 2 1+...+ p p-1
……
 p=1 p-1+ 2 p-2+...+ p 0
⚫ 将上述p+1个方程联立,得到所谓的Yule-
Walker方程组,共p+1个方程,p+1个未知数,
得出AR(p)过程的方差及各级协方差。

26
自回归移动平均(ARMA)过程
将MA(q)过程与AR(p) 过程合并,我们就可以得
到一个ARMA(p,q)过程,其形式如下:
Yt=c+1Yt-1+ 2Yt-2+...+ pYt-p+ 1 t-1+ 2 t-2+...+ q t-q+ t
⚫ 其中  t 为白噪音过程。
⚫ 若引入滞后算子,可以写成
 (L)Yt=c+ (L) t

⚫ 其中  (L)=1- 1L- 2L2


-...- pLp

 (L)=1+ 1L+ 2L2 + ... +  qLq

27
ARMA过程平稳性的条件
ARMA过程的平稳性取决于它的自回归部分。
⚫ 当满足条件:

1-1Z- 2Z -...- pZ = 0
2 p

特征方程的根全部落在单位圆以外时,
ARMA(p,q)是一个平稳过程。

28
ARMA(p, q)过程的特征
c
E(Yt)=
⚫ 1、 1 − ( 1 +  2 + ... +  p)

⚫ 2、 对于ARMA(p, q)过程的方差和协方差,由
于其较复杂,我们不再涉及。

29
自回归单整移动平均过程
⚫ 如果序列 Yt经过 d 次差分得到平稳序列Wt,并
且用ARMA(p,q)过程对W t建立模型,即W t为一
个ARMA(p,q)过程,则我们称Y t为(p,d,q)阶自回
归单整移动平均过程,简称ARIMA(p,d,q)。
⚫ 引入滞后算子L, ARIMA(p,d,q)过程可表示为:

 (L) Yt=c+ (L) t


d

⚫ 其中, t 为白噪音过程,
 (L)=1-1L- 2L -...- pL
2 p

 (L)=1+ 1L+ 2L2 + ... +  qLq


30
AR、MA过程的相互转化
⚫ 结论一:对于一个平稳的AR(p)过程,它可以
转化为一个MA(∞)过程,可采用递归迭代法完
成转化。
⚫ 结论二:对于一个MA(q)过程, Yt=u+ (L) t
其中  (L)=1+ 1L+ 2L + ... +  qL
2 q

若其特征方程 1+  1Z+  2 Z2
+ ... +  qZq
=0
的根都落在单位圆外,则称该 MA(q)过程具有
可逆性,此时MA(q)过程可转化为AR(∞)。
⚫ 注意:平稳性和可逆性的概念在数学语言上是
完全等价的,所不同的是,前者是对AR过程
而言的,而后者是对MA过程而言的。

31
Box-Jenkins方法论
⚫ 建立回归模型时,应遵循节俭性(parsimony)的
原则 。
⚫ 博克斯和詹金斯(Box and Jenkins)提出了在节俭
性原则下建立ARIMA模型的系统方法论,即
Box-Jenkins方法论 。
Box-Jenkins方法论 的步骤:
⚫ 步骤1:模型识别
⚫ 步骤2:模型估计
⚫ 步骤3:模型的诊断检验
⚫ 步骤4:模型预测

32
ARIMA模型的识别
⚫ 在ARIMA模型的识别过程中,我们主要用到两个
工具:自相关函数(autocorrelation function,简
称ACF),偏自相关函数(partial
autocorrelation function,简称PACF)以及它们各
自的相关图(即ACF、PACF相对于滞后长度描图)

⚫ 我们首先介绍自相关函数和偏自相关函数的定义。

33
通过图形形状来判断P,d,q
⚫ ACF与PACF的理论模式

模型种类 ACF的典型模式 PACF的典型模式

AR(p) 指数衰减或衰减的正弦波或 显著的直至滞后q的尖柱


两者

MA(q) 显著的直至滞后q的尖柱 指数下降

ARMA(p,q) 指数衰减 指数衰减

34
自相关函数和偏自相关函数
(1)自相关函数
⚫ 对于一个序列 Yt来说,它的第j阶自相关系数(
记作  j)定义为它的j阶自协方差除以它的方差
,即  j =  j  ,
0 j
的取值范围是 [-1,1]。
⚫ 可以看到,  j (j=0,1,2...)可看作是关于j的函数,
因此我们也称之为自相关函数,通常记ACF(j)
(2)偏自相关函数
⚫ 偏自相关系数度量了消除中间滞后项影响后两
滞后变量之间的相关关系。偏自相关函数记为
PACF(j) 。

35
(3)自相关函数和偏自相关函数的联系
 *
1 = 1
 2= ( 2- 1) (1 −  1)
* 2 2

⚫ 2阶以上的偏自相关函数计算公式较为复杂,这
里不再给出。

36
MA、AR、ARMA过程自相关函数及偏
自相关函数的特点
⑴MA(q)过程的自相关函数
1 j=0

ACF(j) = ( j +  1 j+1 +  2 j+2 + ... +  q q-j) (1 +  12 +  2 2 + ... +  q 2 ) 1≤j≤q
0
 j>q
⚫ j>q时,ACF(j)=0,此现象为截尾,是MA(q)过程的一
个特征
⚫ 如下图:

37
图4-6 MA(2)过程 yt =0.5u t-1 − 0.3u t −2 + u t

38
⑵ AR(p)过程的偏自相关函数
⚫ j  p 时,偏自相关函数的取值不为0
⚫ j>q 时,偏自相关函数的取值为0
⚫ AR(p)过程的偏自相关函数p阶截尾
⚫ 如下图:

39
图4-7 AR(1)过程 y t =0.5y t-1 + u t
40
图4-8 AR(1)过程 yt =yt-1 + u t
41
⑶AR(p)过程的自相关函数以及MA(q)过程的偏
自相关函数
⚫ 平稳的AR(p)过程可以转化为一个MA(∞)过
程,则AR(p)过程的自相关函数是拖尾的
⚫ 一个可逆的MA(q)过程可转化为一个AR(∞)
过程,因此其偏自相关函数是拖尾的。

42
⑷ARMA(p,q)过程的自相关函数和偏自相关函数
⚫ ARMA过程的自相关函数和偏自相关函数都是拖尾的

图4-9 ARMA(1,1)过程 yt =0.5yt-1 + 0.5u t-1 + u t


43
★利用自相关函数、偏自相关函数
对ARIMA模型进行识别
⚫ 对ARIMA(p,d,q)过程进行识别,我们首先要确定
的是该过程是否是平稳的,如果不是,通过几次
差分可以得到平稳序列,即首先我们需要确定d
的值。对此,我们可以用前面一章提到的ADF检
验,也可以通过自相关函数来判断。如果d次差
分后的序列其自相关函数很快下降为0,则说明
差分后的序列是平稳的,反之则不平稳。

44
⚫ 在确定d的值后,接下来我们利用自相关函数、
偏自相关函数以及它们的图形来确定p, q的值。
一般而言,可遵循如下的经验准则:

⚫ (1)如果某序列的自相关函数是截尾的,即过了某
一滞后项数(设为q)后,自相关函数值变得不显
著,接近于0,并且偏自相关函数是拖尾的,则
我们可以把该序列设为MA(q)过程。

45
⚫ (2)如果某序列的偏自相关函数是截尾的,即过了
某一滞后项数(设为p)后,偏自相关函数值变得
不显著,接近于0,并且自相关函数是拖尾的,
则我们可以把该序列设为AR(P)过程。

⚫ (3)如果某序列的自相关函数、偏自相关函数都是
拖尾的,则可以把该序列设为ARMA(p,q)过程。
而关于p, q的值需要不断地从低阶试探,但一般
而言,ARMA(1,1)过程在文献中是最常见的。

46
ARIMA模型的估计
⚫ 矩估计 这种方法就是利用样本自协方差函数和
样本自相关函数,对模型的参数作估计。
⚫ 极大似然估计 它又包括无条件极大似然估计、
条件极大似然估计、精确似然估计等方法。
⚫ 非线性估计 它主要是利用了迭代搜索的思想。
⚫ 最小二乘估计 对于不包含MA部分的ARIMA模型
(即AR模型),我们可以利用普通最小二乘法对
参数进行估计。

47
ARIMA模型的诊断
⚫ 在对模型参数进行估计后,下一步我们要对所估
计的模型是否很好的拟合了数据进行诊断。如果
模型很好的拟合了数据,那么残差应该是一个白
噪音过程,即不同时期的残差是不相关的。
⚫ 为检验残差是否各期不相关,我们可以求得残差
各阶的自相关系数 ̂ 1 、 2 ̂ 、…, ̂ m 然后对联合假设:

H0 : ˆ 1= ˆ 2= ...=̂ m =0 进行检验。如果不能拒绝原
假设,说明残差是各期不相关的;如果拒绝原假
设,则说明残差存在自相关,原模型没有很好的
拟合数据。

48
⚫ 在上述检验中,经常用到的一个检验统计量是
Box和Pierce提出的Q统计量,它的定义如下:
m
2 
Q=n  ˆ k,近似服从(大样本中) (m) 分布
2

k=1
⚫ 其中n为样本容量,m为滞后长度。
⚫ 需要注意的是,Box和Pierce提出的Q统计量具有
不佳的小样本性质,于是Ljung和Box(1978)提出
了一个具有更好小样本性质的统计量,称之为LB
统计量。 定义如下:
m
LB=n(n+2) ( ˆ 2 k (n-k))
k=1

服从分布  ,其中n为样本容量,m为滞后长
2
⚫ (m)
度。

49
⚫ 对ARIMA模型的诊断还有另一方面,即尽管现在
的模型能够很好的拟合数据,但我们想知道是否
还存在一个更好的模型,能够更好的拟合数据和
进行预测。
⚫ 一般的做法是在模型中增加滞后项(因为我们是
从低阶试起的),然后根据信息准则(information
criteria)来判断。

50
常用的信息准则有以下几个:
2k
⚫ Akaike 信息准则 AIC=log(ˆ ) +
2

T
k
Schwarz 信息准则 SC=log(ˆ ) + log T
2

T
2k
⚫ Hannan-Quinn 信息准则 HQIC=log(ˆ ) +2
log(log T)
T

⚫ 其中 ̂ 2 为残差平方, k=p+q+1 是所有


估计参数的个数,T为样本容量。

51
ARIMA模型的预测
⚫ 以平稳的AR(2)过程为例:

Yt=c+1Yt-1+ 2Yt-2+ut

⚫ 其中 ut 为零均值白噪音过程
⚫ 由模型的平稳性,我们有:
Yt+1=c+1Yt+ 2Yt-1+ut+1

……
Yt+2=c+1Yt+1+ 2Yt+ut+2

52
⚫ 在t时刻,预测 Yt+1的值:
ft,1=E(Yt+1 It) = c+ 1Yt-1+ 2Yt-2
⚫ 在t时刻,预测Yt+2的值:

ft,2=E(Yt+2 It) =c+  1E(Yt+1 It) + 2Yt=c+ 1ft,1+ 2Yt


同理:
ft,3=c+1ft,2+ 2ft,1
ft,4=c+1ft,3+ 2ft,2

⚫ 可以看到,在应用AR(2)模型进行预测时,除向前一步
预测是无条件预测外,其它的预测都要用到前期的预
测值。
⚫ 另外,我们不加证明的给出下面的结论:随着预测时
间的增大,AR过程的预测值将趋向于序列的均值。

53
下面我们再来看利用MA过程进行的预测。以一
个MA(2)过程为例:
我们可以求得:
ft,2=  +  2 t
ft,3= 
ft,4= 

可以看到,对于MA(2)过程,2期以后的预测值都
是常数项,即MA(2)过程仅有2期的记忆力。而如
果常数项为0的话,那么2期之后的预测都将为0。

54
利用ARMA过程进行预测
⚫ 利用ARMA过程进行预测的过程,实际上相当于对AR过
程和MA过程进行预测的结合,方法与分别利用AR过程和
MA过程进行预测是相同的,我们不再介绍。
⚫ 由于ARMA(p,q)过程中MA(q)过程仅有q期的记忆力,因
此利用ARMA(p, q)向前进行q期以外的预测,结果与利用
AR(p)过程预测的结果是一样的。随着预测期数的增加,
预测值将趋向于均值。
⚫ 因此,ARMA模型一般用于短期预测(即预测期数不大于
p+q太多)。而对于ARIMA模型,只需将平稳序列ARMA
过程的预测结果进行反向d次(差分次数)求和,就可以
得到原序列的预测值。

55
总结:ARIMA应用步骤
⚫ 步骤一:识别。找出适当的p、d、和q值。通过
相关图和偏相关图可以解决。
⚫ 步骤二:估计。估计模型周所含自回归和移动平
均项的参数。有时可以用最小二乘法,有时候需
要用非线性估计方法。(软件可以自动完成)
⚫ 步骤三:诊断(检验)。看计算出来的残差是不是
白噪音,是,则接受拟合;不是,则重新在做。
⚫ 步骤四:预测。短期更为可靠。

56
本章小节
⚫ 本章介绍了在处理金融时间序列数据时构造动态模型的方
法。首先第一节介绍ARDL模型的概念、优点及构造过程,
着重介绍了AEDL模型检验不同阶变量之间长期关系的方法
。在第二节中我们主要介绍了如何利用B-J建模方法建立
ARIMA模型,并介绍了ARIMA模型的一些特点。我们可以看
到,ARIMA模型可广泛的应用于时间序列数据,并在预测
方面有独特的优势。

You might also like