Download as pdf or txt
Download as pdf or txt
You are on page 1of 140

KINH TẾ LƯỢNG TRONG TÀI CHÍNH

(ECONOMETRICS FOR FINANCE)

PHẦN 2

PHÂN TÍCH CHUỖI THỜI GIAN


(TIME SERIES ANALYSIS)

1
NỘI DUNG PHẦN 2

q Chương 1: Lập mô hình và dự báo với chuỗi thời gian đơn biến
(Univariate time-series)

q Chương 2: Lập mô hình với chuỗi thời gian đa biến và phân tích mô
hình Véc-tơ tự hồi quy (Multiequation time-series and VAR analysis)

q Chương 3: Mô hình đồng liên kết và mối quan hệ dài hạn giữa các
biến (Cointegration and Error Correction models)

q Chương 4: Mô hình tính bất ổn của chuỗi thời gian (Modeling


Volatility)

q Chương 5: Các mô hình chuỗi thời gian phi tuyến (Non-linear time-
series models)

2
Chương 1

Lập mô hình và dự báo với chuỗi thời gian


đơn biến (Univariate time series)

Khoa Tài Chính – ĐHKT TPHCM 3


1.1 Giới thiệu chuỗi thời gian

• Chuỗi thời gian (time series) là chuỗi các dữ liệu quan sát
của một biến số ngẫu nhiên được thu thập theo thời gian.
• Thông thường chuỗi thời gian được quan sát và thu thập
với các khoảng thời gian bằng nhau và kết quả là ta có
chuỗi thời gian rời rạc (discrete-time time series).
• Nếu thời gian t là liên tục thay vì ngắt quãng, ta có chuỗi
thời gian liên tục (continuous-time time series).
• Có rất nhiều các ví dụ về tài chính trong thực tế là biểu
hiện của chuỗi thời gian: chỉ số lạm phát hàng tháng, chỉ số
cung tiền hàng tuần, chỉ số giá cả chứng khoán hàng ngày
v.v...

4
1.1 Giới thiệu chuỗi thời gian

• Ngày nay với sự tiến bộ của công nghệ và ứng dụng máy
tính chúng ta có thể cập nhật số liệu cho lãi suất theo từng
giờ thay vì theo ngày, và chỉ số giá cả chứng khoán theo
từng phút .

• Phân tích dữ liệu chuỗi dữ liệu đơn (single sequence of


data) được gọi là “phân tích chuỗi thời gian đơn biến”
(univariate time-series analysis).

• Khi phân tích một tập hợp các biến chuỗi thời gian khác
nhau trong cùng 1 thời kỳ quan sát thì được gọi là “phân
tích chuỗi thời gian đa biến” (multivariate time-series
analysis) hoặc đơn giản hơn là “multiple time-series
analysis”
5
1.2 Mô hình chuỗi thời gian đơn biến
Univariate Time Series Models
Trong loại mô hình này chúng ta sẽ cố gắng dự báo TSSL từ
thông tin của chính nó trong quá khứ.

6
1.2 Mô hình chuỗi thời gian đơn biến

• Mục đích của phân tích chuỗi thời gian đơn biến là đi tìm
sự phụ thuộc của biến Xt vào các giá trị của chính nó trong
qua khứ {Xt-1 , Xt-2 , ... Xt-n}

• Mô hình chuỗi thời gian tuyến tính là mô hình mà biến Xt


phụ thuộc tuyến tính vào các giá trị của chính nó trong quá
khứ.

• Để mô tả một cách hiệu quả sự phụ thuộc năng động


(dynamic dependence) của biến Xt , ta cần sử dụng ký hiệu
cho giá trị độ trễ (Lag or Backshift operator):
LXt = Xt-1 hay BXt = Xt-1
L2Xt = Xt-2 hay B2Xt = Xt-2

7
1.2 Mô hình chuỗi thời gian đơn biến
Non- Gausian distribution

Gausian distribution

8
1.2.1 Chuỗi thời gian đơn biến “dừng” và “không dừng”
Stationary and Nonstationary Time Series

Nonstationary

Trong phân tích chuỗi thời gian chúng ta không thể tự hạn chế
bằng cách chỉ phân tích những chuỗi thời gian có tính “dừng”.

Hầu hết các chuỗi thời gian trong thực tế đếu là “không dừng”.

Mô hình chuỗi thời gian “Nonstationary” có thể được biểu diễn


đơn giản như sau:
Yt = µt +et

với giá trị trung bình µt là hàm số theo thời gian t (có thể là
linear trend hay quadratic trend) và et là chuỗi thời gian dừng
“yếu” .
9
1.2.1 Chuỗi thời gian đơn biến “dừng” và “không dừng”
Stationary and Nonstationary Time Series

1
Nhận diện và xử lý chuỗi thời gian không dừng

• Sử dụng đồ thị ACF: nếu đồ thị ACF thoái hóa chậm thì đó
là dấu hiệu của “true unit root process” hay chuỗi thời gian
là không dừng.

• Kiểm định KPSS giúp xác định chuỗi thời gian thay đổi
theo xu hướng xác định (deterministic trend) hay ngẫu
nhiên (stochastic trend).

• Chuỗi thời gian không dừng có 2 loại:


ü Non-stationarity in mean
ü Non-stationarity in variance

1
NON-STATIONARITY IN MEAN

a. Deterministic trend

– Xử lý: Detrending (loại bỏ yếu tố xu hướng theo thời gian)


b. Stochastic trend (random walk with drift)

Stochastic trend = deterministic + stochastic


Pure Random walk là trường hợp đặc biệt của “stochastic trend”,
theo đó a0= 0 -> Không thể dự báo (forecast fuction is flat)
Ví dụ: Lý thuyết EMH:

– Xử lý: Differencing (loại bỏ yếu tố xu hướng có tính chất ngẫu


nhiên) 1
1
a. DETERMINISTIC TREND

TREND STATIONARY

• Nếu một chuỗi thời gian có xu hướng là xác định


(deterministic time trend), khi đó chúng ta sẽ chỉ đơn giản
là hồi quy Yt với hệ số chặn (intercept) và với biến thời
gian (time trend) (t=1,2,…,n).

• Sau đó lưu lại giá trị của phần dư (residuals). Lúc này các
giá trị phần dư sẽ là detrended series hay dừng theo xu
hướng (trend stationarity).

• Tuy nhiên nếu Yt thay đổi ngẫu nhiên (stochastic) chúng ta


sẽ không đạt được chuỗi dừng theo xu hướng (trend
stationarity).
1
a. DETERMINISTIC TREND

TREND STATIONARY

1
a. DETERMINISTIC TREND

• Trong kinh tế - tài chính, tất nhiều chuỗi thời gian thể hiện xu
hướng tăng theo cấp số nhân (exponential trend/growth). Các
biến tăng trưởng là hàm phi tuyến theo thời gian thay vì là
tuyến tính.
Yt = a 0+at 1+ at 2 2+ + a t k k + a t
a t ~ WN (0,o a2 ).

• Đối với những chuỗi thời gian loại này, chúng ta cần lấy
logarit:
ln(Yt) = a+ bt+ a t

• Vì vậy tỷ lệ tăng trưởng bình quân bây giờ sẽ là β:


E(D ln(Yt )) = b
1
b. STOCHASTIC TREND

• Nhớ lại mô hình AR(1) : Yt = c +f Yt−1 + at.

• Nếu |f| < 1, chuỗi thời gian là dừng

• Nếu f = 1, ví dụ
Yt = c + Yt−1 + at.

• Chuỗi không dừng, nhưng có phải là không có xu hướng (trend)


khi phương trình không có biến thời gian t?

1
b. STOCHASTIC TREND
• Thay thế đệ quy (recursive) giá trị độ trễ lag của Yt cho vế phải
của phương trình:

Yt = c + Yt-1 + at
= c + (c + Yt-2 + at-1 ) + at

t
= tc + Y0 + å ai
i=1

Deterministic trend
• Mô hình này còn được gọi là “random walk with drift”.
• Nếu c = 0, ta có “random walk”. 1
DETERMINISTIC so với STOCHASTIC TREND

• Nhìn bề ngoài thì cả 2 loại xu hướng này đều có biểu hiện là chuỗi thời gian
gia tăng theo thời gian nhưng bản chất bên trong thì hoàn toàn khác nhau.

• Để hiểu tại sao, giả định rằng chúng ta áp đặt một chính sách can thiệp vào
kỳ t, và kết quả là giá trị Yt gia tăng bởi vì giá trị nhiễu at cùng kỳ sẽ gia tăng
lớn tương ứng. Vấn đề là tác động của at sẽ như thế nào đến kỳ kếtiếp?

– Với chuỗi xu hướng là xác định (deterministic trend)


Yt+1 = c +b(t+1) + a.t+1
Giá trị nhiễu at sẽ không tác động đến Yt+1. Chính sách can thiệp trong kỳ t chỉ
có tác dụng trong kỳ đó.

– Với chuỗi xu hướng là ngẫu nhiên (stochastic trend),


Yt+1 = c + Yt + at+1 = c + (c + Yt−1 + at) + at+1.
Giá trị nhiễu at sẽ tác động đến Yt+1. thực tế là chính sách can thiệp trong kỳ t sẽ
có tác động lâu dài đến vĩnh viễn.
1
Tháo bỏ đặc tính xu hướng của chuỗi thời gian -
DETRENDING

• Đối với chuỗi thời gian có đặc tính dừng, những cú sốc sẽ
chỉ là tạm thời và chuỗi thời gian sẽ luôn quay về giá trị
trung bình của nó trong dài hạn.

• Chuỗi thời gian chứa đặc tính xu hướng (trending series) sẽ


không quay về giá trị trung bình trong dài hạn. Phương
pháp thông thường để loại bỏ xu hướng là “detrending” và
“differencing”.

2
Tháo bỏ đặc tính xu hướng của chuỗi thời gian –
1. DETRENDING

• Detrending được sử dụng để loại bỏ “deterministic trend”.

• Hồi quy Yt trên biến thời gian và lưu giữ giá trị của phần
dư và sau đó kiểm định xem phần dư có dừng hay không
(stationary)?

2
2. Lấy sai phân - DIFFERENCING
• Differencing (lấy sai phân) được sử dụng để loại bỏ
“stochastic trend”.

• Chuỗi thời gian có chứa nghiệm đơn vị (unit roots) có thể


chuyển sang đặc tính dừng (stationary) bằng cách lấy sai
phân (differencing).
Yt ~ I (d )
• Sai phân bậc d-th của mô hình ARIMA(p,d,q) là dừng
(stationary)..

Integrated of order d, I(d)


• ARIMA(p,d,q) Þ d unit roots
2
3. Lấy sai phân - DIFFERENCING

Y =Y + a
t t -1 t
Non-stationary

Y -Y = a
t t -1 t

DYt = at Stationary

2
2. Lấy sai phân - DIFFERENCING
• Differencing luôn dẫn đến bị mất quan sát.
• Differencing sẽ dẫn đến hệ quả là bạn đã vứt đi thông tin
quan trọn nếu có từ mối quan hệ dài hạn giữa các biến
• 1st regular difference: d=1
(1 - L)Y = Y - Y = DY
t t t -1 t

• 2nd regular difference: d=2

(1 - L) Y
2

t
= D Y = (1 - 2L + L )Y = Y - 2Y + Y
2

t
2

t t t -1 t -2

• Lưu ý: Yt - Yt - 2 không phải là sai phân bậc 2!!

2
Lấy sai phân - DIFFERENCING

Yt DYt D2Yt Yt-Yt-2


3 * * *
8 8-3=5 * *
5 5-8=-3 -3-5=-8 5-3=2
9 9-5=4 4-(-3)=7 9-8=1

2
Kiểm định KPSS

• Để có thể kiểm định là chuỗi thời gian có đặc tính


derministic trend hay stochastic trend, chúng ta nên sử
dụng kiểm định KPSS (Kwiatkowski, Phillips, Schmidt
and Shin) Test (1992).

H 0 :Yt ~ I (0) ® level (or trend) stationary


H1 :Yt ~ I (1) ® difference stationary

2
Kiểm định KPSS

• Nếu chúng ta không sử dụng kiểm định KPSS và nghĩ là


chuỗi có đặc tính Difference stationarity và lấy sai phân để
chuỗi thời gian có tính dừng.

• Trong khi thực tế là chuỗi thời gian có đặc tính Trend


stationarity và cần được detrending.

• Sửa sai: quay trở lại và “detrending” chuỗi thời gian thay
vì “differencing”.

2
NON-STATIONARITY IN VARIANCE

• Stationarity in mean Stationarity in variance


• Non-stationarity in mean Non-stationarity in variance

• Nếu mean function là phụ thuộc vào thời gian:


1. Phương sai, Var(Yt) phụ thuộc vào thời gian.
2. Var(Yt) sẽ thay đổi không có giới hạn biên khi t®¥.
3. Các hàm Autocovariance và Autocorrelation cũng phụ thuộc
vào thời gian.
4. Nếu t là lớn và ràng buộc vào Y0, khi đó rk » 1.

2
Stationary/Unit Root Testing
Một ví dụ điểm hình của chuỗi thời gian không dừng (nonstationary series) là
chuyển động theo phương trình random walk như sau:

Nếu phần dư e là stationary, yt có Unit root và “dừng” sau khi lấy sai phân, vì vậy
yt còn gọi là biến I(1). Tương tự biến dừng ở level được gọi là I(0).
EViews cung cấp rất nhiều các công cụ để kiệm định Unit Root:
§Augmented Dickey-Fuller (1979)
§Phillips-Perron (1988)
§GLS-detrended Dickey-Fuller (Elliot, Rothenberg, and Stock, 1996),
Kwiatkowski, Phillips, Schmidt, and Shin (KPSS, 1992),
§Elliott, Rothenberg, and Stock Point Optimal (ERS, 1996),
§Ng and Perron (NP, 2001)

2
Stationary/Unit Root Testing

Thực hiện Unit Root Tests trong Eviews


Bắt đầu bằng double click đối với biến chuỗi thời gian cần kiểm
định -> mở Series window -> chọn View/Unit Root Test…

3
Stationarity/Unit Root Testing
Thực hiện Unit Root Tests trong Eviews
Chọn 1 trong 6 phương pháp kiểm định sau: ADF, DFGLS, PP,
KPSS, ERS, and NP.
Kế đó ta cần chọn kiểm định Unit root ở mức “level” trước. Sau
đó nếu kết luận là có Unit Root ta cần lấy sai phân và tiếp tục
thự hiện kiểm định ở mức độ “first difference”. Và cứ tiếp tục
như vậy cho đến khi kết luận là không còn Unit Root.
Cuối cùng bạn phải khai báo nhân tố ngoại sinh, bao gồm:
constant hay constant và linear trend, hay không bao gồm cả
constant và linear trend (rất hạn chế sử dụng).

3
Stationarity/Unit Root Testing

Lưu ý: đối với KPSS Lagrange


Multiplier test:

3
VARIANCE STABILIZING TRANSFORMATION

• Chuỗi thời gian không dừng trong phương sai :


Var[Yt ] = c. f (µt)
với hằng số c >0 và f là một hàm số.

• Ta cần tìm hàm số T sao cho giá trị đã được chuyển đổi
của chuỗi thời gian T(Yt) sẽ có phương sai là hằng số

The Delta Method


3
VARIANCE STABILIZING TRANSFORMATION

• Thông thường để chuyển đổi, chúng ta dùng hàm mũ


như sau
Ytl -1
T (Yt)= (Box and Cox,1964)
l
l Transformation
-1 1/Yt
-0.5 1/(Yt)0.5
0 ln Yt
0.5 (Yt)0.5
1 Yt (no transformation)
3
VARIANCE STABILIZING TRANSFORMATION

• Phương pháp này chỉ áp dụng đối với các chuỗi thời gian dương
(positive series).

• Nếu chuỗi có giá trị âm, ta cộng mỗi quan sát một giá trị dương
sao cho tất cả các giá trị của chuỗi là dương.

• Phương pháp chuyển đổi nên được thực hiện trước khi thực hiện
các phân tích khác ví dụ như lấy sai phân (differencing).

• Phương pháp này không chỉ ổn định phương sai mà còn cải
thiện đặc tính phân phối chuẩn của chuỗi thời gian.

3
1.3 Phân tích chuỗi thời gian đơn biến
Univariate Time series analysis

– (1) purely random process

– (2) moving average (MA) process

– (3) autoregressive (AR) process

– (4) autoregressive movingaverage (ARMA) process

– (5) autoregressive integrated moving average (ARIMA)

process.

3
a. Tiến trình ngẫu nhiên thuần túy (purely random
process) hay “nhiễu trắng” (A White Noise Process)
• Tiến trình nhiễu trắng được định nghĩa như sau:
E( yt )= µ
Var(yt ) = s 2
if t=s
ìs 2
g t-s = í0 otherwise
î
• Do vậy hàm tự tương quan (autocorrelation function) sẽ có giá trị zero
ngoại trừ giá trị lớn nhất của nó là 1 khi s = 0.

• ts ~N(0,1/T) với T = kích cở mẫu

• Chúng ta có thể sử dụng định nghĩa này để kiểm định các hệ số tự tương
quan bằng cách xây dựng khoảng tin cậy (confidence interval)
1
• Ví dụ, nếu khoảng tin cậy là 95% hay giá trị tương ứng sẽ là ±.1.96
T .
Do vậy nếu hệ số tương quan ,t s , rơi bên ngoài vùng này với bất cứ giá
trị nào của s, thì khi đó ta sẽ loại bỏ giả thiết Null là giá trị của hệ số tương
quan tại mức trễ s bằng zero.
3
a. Tiến trình ngẫu nhiên thuần túy (purely random
process) hay “nhiễu trắng” (A White Noise Process)

Ví dụ về hàm tự tương quan ACF

• Câu hỏi
1.Giả dụ rằng một chuỗi thời gian với 100 quan sát được kiểm định cho thấy
các giá trị của hệ số tự tương quan (autocorrelation coefficients) của 5 độ trễ
đầu tiên là: 0.207, -0.013, 0.086, 0.005, -0.022.
2.Hãy kiểm định xem từng hệ số tự tương trên có ý nghĩa thống kê hay
không? Và kế đó sử dụng 2 kiểm định Box-Pierce và Ljung-Box để xem có
khả năng các hệ số tự tương quan này đồng thời bằng zero hay không?

• Giải pháp
1.Một giá trị hệ số tự tương quan sẽ có ý nghĩa thống kê (khác zero) nếu nó
nằm ngoài khoảng tin cậy (-0.196,+0.196) ứng với mức ý nghĩa 5% level, do
vậy ta thấy chỉ có hệ số tự tượng quan đầu tiên là có ý nghĩa thống kê.
2. Để trả lời câu hỏi thứ 2, ta tính Q=5.09 và Q*=5.26
Tra bảng phân phối Chi 2 và so sánh với giá trị c2(5)=11.1 ở mức ý nghĩa 5%
và ta kết luận rằng tất cả 5 hệ số tự tương quan đồng thời bằng zero.
3
Ví dụ về hàm tự tương quan ACF

3
b. Tiến trình bình quân trượt – MA (Moving Average Processes)

• Gọi ut (t=1,2,3,...) chuỗi các biến có phân phối đồng dạng và độc lập
(independently and identically distributed (iid) random variables) với
E(ut )=0 và Var(u t)=se2 , thì khi đó
yt = µ + ut + q1ut-1 + q2ut-2 + ... + qqut-q

là bình quân trượt bậc qth của mô hình MA(q).

• Thuộc tính của MA(q) như sau:


E(yt )=µ; Var(y t) = g 0 = (1+q12 + q 22 +...+q q2 )s2
Với các giá trị hiệp phương sai
ìï(qs + q s+1q1 + q s+2q 2 + ... + q qq q-s )s 2 for s = 1,2,...,q
gs =í
ïî0 for s > q

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Ví dụ về mô hình MA

1. Xem xét mô hình bình quân trượt bậc 2 - MA(2) sau:

với ut là white noise và có mean = 0 và variance = s .


2

(i) hãy tính mean và variance của Xt


(ii)Hãy tìm hàm tự tương quan ACF (autocorrelation
function) cho mô hình này (ví dụ: diễn đạt các hệ số tự tương
quan (autocorrelations), t1, t2, ... Như là hàm số của các thông
số hồi quy q1 and q2).
(iii) nếu q1 = -0.5 vàq2 = 0.25, vẽ đồ thị ACF của biếnXt.

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Ví dụ về mô hình MA

(i) Nếu E(ut)=0, thì khi đó E(ut-i)=0 " i.


Vì vậy

E(Xt) = E(ut + q1ut-1+ q2ut-2)= E(ut)+ q1E(ut-1)+ q2E(ut-2)=0

Var(Xt) = E[Xt-E(Xt)][Xt-E(Xt)]
Vì E(Xt) = 0, nên ta có
Var(Xt) = E[(Xt)(Xt)]
= E[(ut + q1ut-1+ q2ut-2)(ut + q1ut-1+ q2ut-2)]
= E[ u t2 + q 12 u t-1
2
+ q 22 u t-2
2
+cross-products]

Tuy nhiên ta có E[cross-products]=0 vì Cov(ut,ut-s)=0 với mọi s¹0.

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Ví dụ về mô hình MA (cont’d)

Vì vậy Var(X t) = g 0= E [ u t2 + q 12 u t-1


2
+ q 22 u t-2
2
]
= s 2 +q 12s 2 +q 22s 2
= (1+ q 1 + q 2 )s
2 2 2

(ii) Mô hình ACF của Xt.


g1 = E[Xt-E(Xt)][Xt-1-E(Xt-1)]
= E[Xt][Xt-1]
= E[(ut +q1ut-1+ q2ut-2)(ut-1 + q1ut-2+ q2ut-3)]
= E[( q 1 u t2-1 +q 1q 2u t-2
2
)]
= q 1 s 2 +q 1q 2s 2
= (q 1 +q 1q 2 )s 2

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Ví dụ về mô hình MA (cont’d)

g2 = E[Xt-E(Xt)][Xt-2-E(Xt-2)]
= E[Xt][Xt-2]
= E[(ut + q1ut-1+q2ut-2)(ut-2 +q1ut-3+q2ut-4)]
= E[( q 2 u t2-2 )]
= q2s
2

g3 = E[Xt-E(Xt)][Xt-3-E(Xt-3)]
= E[Xt][Xt-3]
= E[(ut +q1ut-1+q2ut-2)(ut-3 +q1ut-4+q2ut-5)]
=0

Vì vậy gs = 0 với mọi s > 2.

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Ví dụ về mô hình MA (cont’d)
Chúng ta đã tìm được các giá trị của tự hiệp phương sai (autocovariance),
bây giờ chúng ta có thể tính các giá trị tự tương quan tương ứng
(autocorrelations):
g
t 0 = g 0 =1
0
g (q 1 + q 1q2 )s 2
(q 1 + q 1q2 )
t1 = 1 = =
g0 (1+ q 1 + q 22 )s 2
2
(1+ q 1 + q 22 )
2

g (q 2)s 2 q2
t2 = =
2
=
g0 (1+q 12 + q 22 )s 2 (1+q 12 + q 22 )
g
t 3 =g 3 =0
0
g
t s = g s = 0" s > 2
0

(iii) Với q1 = -0.5 và q2 = 0.25, thay thế các giá trị này vào công thức đã
cho ở trên, ta có t1 = -0.476, t2 = 0.190.

4
b. Tiến trình bình quân trượt (Moving Average Processes)

Đồ thị ACF

Do vậy đồ thị ACF sẽ có dạng như sau:


1.2

0.8

0.6

0.4
acf

0.2

0
0 1 2 3 4 5 6
-0.2

-0.4

-0.6

4
c. Tiến trình Tự hồi quy (Autoregressive Processes)

• Mô hình tự hồi quy bậc p, AR(p) có thể được diễn đạt như sau:

• Hoặc ta có thể diễn đạt bằng cách sử dụng ký hiệu độ trễ “L” như sau:
Lyt = yt-1 Liyt = yt-i
p
y t = µ + å f i y t -i + u t
i=1

• Hay

hoặc f (L) yt = µ + ut với f( L) = 1 - (f1L + f2 L2 +...fp L.p)

4
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Điều kiện dừng của mô hình AR

• Điều kiện dừng của mô hình tổng quát AR(p) là các nghiệm của nó
phải nằm ngoài vòng tròn đơn vị :
1- f1z - f 2 z -...-f p z = 0
2 p

• Nếu mô hình AR(p) “dừng” thì nó sẽ có biểu hiện tương đương


MA(¥).

• Example 1: kiểm định xem mô hình yt = yt-1 + ut có thuộc tính “dừng”


hay không?
Mô hình có nghiệm đặc trưng (charcteristic root) là 1, nên mô hình
chuỗi thời gian có tiến trình nghiêm đơn vị (unit root process) vì vậy
chuỗi thời gian này là không dừng (non-stationary)

• Example 2: yt = 3yt-1 - 0.25yt-2 + 0.75yt-3 +ut có stationary?


Mô hình chuỗi thời gian này có nghiệm đặc trưng là 1, 2/3, và 2. Bởi
vì mô hình có một nghiệm nằm bên trong vòng tròn đơn vị nên chuỗi
thời gian này là không dừng (non-stationary).

4
c. Tiến trình Tự hồi quy (Autoregressive Processes)

Định đề phân rã Wold


(Wold’s Decomposition Theorem)
• Định đề này phát biểu rằng bất cứ chuỗi thời gian “dừng” (stationary
series) nào cũng đếu có thể được phân tách thành 2 tiến trình độc lập:
• (1) tiến trình thuần túy theo xu hướng thời gian (purely deterministic part)
hay tiến trình này là kết hợp tuyến tính của các giá trị của chính nó trong
quá khứ và
• (2) tiến trình thay đổi thuần túy ngẫu nhiên (purely stochastic part) hay
MA(¥).
Model y ~ AR(p) ó
MA¥
( )Model y ~ MA(q) ó
AR (¥)
• Với mô hình AR(p), yt = y (L)ut, bỏ qua giá trị hệ số chặn, định đề phân rã
Wold được thể hiện như sau:
f (L) y t = u t
với, y ( L) = (1- f1L - f2 L2 -...-fp Lp )-1
4
c. Tiến trình Tự hồi quy (Autoregressive Processes)

• Các giá trị Moments của tiến trình Tự Hồi Quy được diễn đạt như sau với
giá trị trung bình Mean được cho bởi:
f0
E( yt )=
1 - f1 - f2 - ... - f p

• Hàm Tự Hiệp Phương Sai (Autocovariances function) và hàm Tự Tương


Quan (Autocorrelation function - ACF) có được bằng cách giải hệ phương
trình Yule-Walker :
t1 = f1 + t1f2 + ... + t p-1f p
t 2 = t1f1 + f2 + ... + t p-2f p

t p = t p-1f1 + t p-2f2 + ... + f p

• Nếu mô hình AR model là stationary, thì hàm Tự tương quan ACF sẽ thoái
hóa theo cấp số nhân về zero.
5
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR

• Xem xét mô hình AR(1) đơn giản sau:

yt = µ+f1yt -1 + ut
(i) Hãy tính unconditional Mean của yt.

Bây giờ để đơn giản hóa ta cho µ=0.

(ii) Hãy tính unconditional Variance của yt.

(iii) Hãy rút ra hàm ACF (Autocorelation function ) cho yt.

5
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR

(i) Unconditional mean:


E(yt) = E(µ+f1yt-1)
=µ +f1E(yt-1)

Vì E(yt)= µ +f1 (µ +f1E(yt-2))


= µ +f1 µ +f12 E(yt-2))

E(yt) = µ +f1 µ +f12 E(yt-2))


= µ +f1 µ +f12 (µ +f1E(yt-3))
= µ +f1 µ +f12 µ +f13 E(yt-3)

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)

Và cứ tiếp tục thay thế như vậy cho đến vô tận:


E(yt) = µ (1+f1+f12 +...) + f1¥y0
Chừng nào mà mô hình còn Stationary, thì khi đó f1¥ = 0.
µ
Do vậy E(yt) = µ (1+f1+f12 +...) =
1-f 1

(ii) Tính toán Variance của yt: yt =f1yt -1 +ut

Từ định đề phân rã Wold:


yt (1 - f1 L)= ut
yt = (1 -f1L) -1ut
yt = (1 + f1 L + f1 2L +...)u
2
t

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)

Chừng nào mà s f1 < 1 , thì phương trình trên sẽ hội tụ.


yt = ut +fu1 t-1 +f21u t-2 +...
Var(yt) = E[yt-E(yt)][yt-E(yt)]
Tuy nhiên ta có E(yt) = 0, vì ta đã giả định µ = 0.
Var(yt) = E[(yt)(yt)]
( )(
= E[ ut + f u1 t -1 + f 21u t - 2 +.. ut + f u1 t -1 + f 21u t - 2 +.. ) ]
= E[(ut 2 +f21u t -12 +f41u t -2 2 + ... + cross - products)]
2 2 2 4 2
= E[ t +f1 ut -1 +f1ut -2 +...)]
(u
= s2u +f2s 1 +uf s +
2 4 2
1 ...u
= s2u(1+f2 +1f4+ ...)
1

= su
2

(1-f21)

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)
(iii) Bây giờ để tính ACF, trước hết ta phải tính các giá trị “Autocovariances”:
g1 = Cov(yt, yt-1) = E[yt-E(yt)][yt-1-E(yt-1)]
Bởi vì giá trị a0 đã được thiết lập = zero, E(yt) = 0 và E(yt-1) = 0, vì vậy
g1 = E[ytyt-1]
g1 = E[(u t + f1u t-1 + f12u t-2 + ...)(u t -1 + f1u t -2 + f1 u t-3 + ...) ]
2

f
= E[ 1 t-1 u
2
+ f 1
3
u 2
t-2 + ... + cross - products]

= f1s + f1 s + f 1 s + ...
2 3 2 5 2

f1s 2
=
(1- f 12 )

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)

Giá trị tự tương quan bậc 2 (second autocorrelation coefficient) là,


g2 = Cov(yt, yt-2) = E[yt-E(yt)][yt-2-E(yt-2)]
Tương tự ta có:
g2 = E[ytyt-2]
= E[(ut + f1ut -1 + f12ut - 2 + ...)(u t-2 + f1u t-3 + f12u t-4 + ...)]
= E[ f 1 u t -2 + f 1 u t-3 + ... + cross - products]
2 2 4 2

= f12 s 2 + f 14 s 2 + ...
= f1 s (1+ f1 + f1 + ...)
2 2 2 4

f12s 2
=
(1- f 12 )

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)
• Lập lại các bước trên cho g3:
f13s 2
g3 =
(1-f 12 )
Và tổng quát cho độ trễ s, giá trị Autocovariance sẽ là:

f1s s 2
gs =
(1- f 12 )
Hàm ACF bây giờ có thể đạt được bằng cách chia các giá trị của
Covariances bằng giá trị phương sai:

5
c. Tiến trình Tự hồi quy (Autoregressive Processes)

Ví dụ về mô hình AR (cont’d)
g0
t0 = =1
g0
æ ö æ 2 2 ö
ç f1s 2 ÷ ç f1 s ÷
ç ÷ ç 2 ÷
ç (1- f1 ) ÷ f
2
ç (1- )
1 ÷
g1 è ø g2 è ø
t1 = g = = f1 t2 = =
g 0 æç
= f 12
æç o 2 ö o 2 ö÷
0
÷
ç 2 ÷
ç 2 ÷
ç (1- f 1 ÷
) ç (1- f )
1 ÷
è ø è ø

t3 = f13

ts = f 1s

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Hàm Tự Tương Quan Từng Phần – PACF


(Partial Autocorrelation Function, ký hiệu tkk)

• Hàm PACF đo lường mức độ tương quan giữa quan sát ở độ trễ k và quan sát
hiện tại, sau khi đã loại bỏ những tác động trung gian của các quan sát ở giữa
(intermediate lags hay lags < k).

• Vì vậy tkk đo lường mối tương quan giữa yt và yt-k sau khi loại bỏ những tác
động của yt-k+1 , yt-k+2 , …, yt-1 .

• Tại lag 1, ta luôn có mô hình ACF = mô hình PACF

• Tại lag 2, t22 = (t2-t1 2) / (1-t1 )2

• Từ lags 3+, công thức sẽ trở nên ngày càng phức tạp.

5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)

Hàm Tự Tương Quan Từng Phần – APCF


(Partial Autocorrelation Function, ký hiệu tkk) (cont’d)
• Mô hình PACF rất hữu ích khi chúng ta cần tìm sự khác biệt giữa tiến trình
AR và tiến trình ARMA.

• Trong trường hợp mô hình AR(p), có mối tương quan trực tiếp giữa yt và yt-s
chỉ khi s£ p.

• Vì vậy so với mô hình AR(p), mô hình PACF về mặt lý thuyết sẽ bằng Zero
sau lag p.

• Trong trường hợp mô hình MA(q), thì mô hình này có thể được viết tương tư
như là AR(¥), vì vậy sẽ có mối tương quan trực tiếp giữa yt và tất cả các giá
trị của chính nó trước đó.

• Đối với mô hình MA(q), mô hình PACF về mặt lý thuyết sẽ thoái hóa giảm
dần .
6
d. Tiến trình ARMA

• Bằng cách kết hợp cả hai mô hình AR(p) và MA(q), chúng ta sẽ có mô


hình ARMA(p,q): f (L) yt = µ + q (L)ut

với f( L) = 1 - f1L - f2 L2 -...-fp Lp

và q(L) =1+qL +q L2 +...+q Lq


1 2 q

hoặc yt = µ + f1 yt -1 + f2 yt -2 + ... + f p yt - p + q1ut -1 + q 2ut -2 + ... + q qu t

với E(u ) = 0; E(u 2 ) = s 2 ; E(u u ) = 0, t ¹ s


t t t s

6
d. Tiến trình ARMA

Điều kiện khả năng nghịch đảo (The Invertibility Condition)

• Tương tự như điều kiện về tính dừng (stationarity condition), phần tiến
trình MA(q) của mô hình ARMA với phương trình q(z)=0 sẽ cần có
nghiệm > 1 (theo giá trị tuyệt đối).

• Giá trị trung bình (mean) của chuỗi ARMA được tính như sau:
µ
E (yt ) =
1 - f1 - f2 -...-fp

• Hàm ACF của tiến trình ARMA sẽ thể hiện sự kết hợp mô hình AR và
phần của mô hình MA, tuy nhiên cho lags > q, hàm ACF sẽ giống như mô
hình AR(p) riêng biệt.

6
d. Tiến trình ARMA

Thay đổi của hàm ACF và PACF ứng với tiến trình AR và MA
Tiến trình tự tương quan – AR (autoregressive process) có các thuộc tính sau:
• Đồ thị ACF có các hệ số thoái hóa dần
• Số lượng các thanh bị “nhô lên” vượt mức ý nghĩa (spikes) của PACF =
AR order
Tiến trình bình quân trượt - MA (moving average process) có các đặc tính sau:
• Số lượng các thanh nhô lên vượt mức ý nghĩa (spikes) của ACF = MA
order
• Đồ thị PACF có các hệ số thoái hóa dần
ACF PACF
AR(p) Đuôi thoái hóa dần theo cấp số nhân Đuôi bị triệt tiêu ngay sau độ trễ p
hoặc theo hình lượn sóng
MA(q) Đuôi bị triệt tiêu ngay sau độ trễ q Đuôi thoái hóa dần theo cấp số nhân
hoặc theo hình lượn sóng
ARMA(p,q) Đuôi thoái hóa dần ngay sau độ trễ (q-p) Đuôi thoái hóa dần ngay sau độ trễ (p-q)
6
d. Tiến trình ARMA

Một vài ví dụ của đồ thị ACF và PACF

ACF và PACF cho mô hình MA(1): yt = – 0.5ut-1 + ut

0.05

0
1 2 3 4 5 6 7 8 9 10
-0.05

-0.1

-0.15
acf and pacf

-0.2

-0.25

-0.3
acf
-0.35 pacf

-0.4

-0.45
Lag

6
d. Tiến trình ARMA
ACF và PACF cho mô hình MA(2):
yt = 0.5ut-1 - 0.25ut-2 + ut

0.3 acf
pacf
0.2

0.1
acf and pacf

0
1 2 3 4 5
-0.1

-0.2

-0.3

-0.4
Lags

6
d. Tiến trình ARMA

ACF và PACF cho mô hình AR(1) thoái hóa chậm dần:


yt = 0.9yt-1 +ut

0.9
acf
pacf
0.8

0.7

0.6
acf and pacf

0.5

0.4

0.3

0.2

0.1

0
1 2 3 4 5 6 7 8 9 10

-0.1
Lags

6
d. Tiến trình ARMA

ACF và PACF cho mô hình AR(1) thoái hóa nhanh


Model: yt = 0.5yt-1 + ut

0.6

0.5
acf
pacf
0.4
acf and pacf

0.3

0.2

0.1

0
1 2 3 4 5 6 7 8 9 10

-0.1
Lags

6
d. Tiến trình ARMA

ACF và PACF cho mô hình AR(1) thoái hóa nhanh với hệ số âm:
yt = -0.5yt-1 + ut

0.3

0.2

0.1

0
1 2 3 4 5 6 7 8 9 10
acf and pacf

-0.1

-0.2

-0.3

-0.4 acf

-0.5
pacf

-0.6
Lags

6
d. Tiến trình ARMA

ACF và PACF cho mô hình Non-stationary


(unit coefficient): yt = yt-1 + ut

0.9 acf
pacf
0.8

0.7

0.6
acf and pacf

0.5

0.4

0.3

0.2

0.1

0
1 2 3 4 5 6 7 8 9 10
Lags

6
d. Tiến trình ARMA

ACF và PACF cho mô hình ARMA(1,1):


yt = 0.5yt-1 + 0.5ut-1 + ut
0.8

0.6
acf
pacf
0.4
acf and pacf

0.2

0
1 2 3 4 5 6 7 8 9 10

-0.2

-0.4
Lags

7
d. Tiến trình ARMA

Xây dựng mô hình ARMA - phương pháp Box Jenkins

• Box và Jenkins (1970) đưa ra phương pháp ước lượng hệ thống dành cho
mô hình ARMA. Phương pháp tiếp cận này có 3 bước như sau:
1. Identification (nhận diện mô hình)
2. Estimation (ước lượng)
3. Model diagnostic checking (kiểm tra chẩn đoán mô hình)

Bước 1:
- Xác định bậc p, q cho mô hình ARMA(p,q).
- Sử dụng đồ thị ACF và PACF

7
d. Tiến trình ARMA

Xây dựng mô hình ARMA - phương pháp Box Jenkins


(cont’d)
Bước 2
- Ước lượng các thông số hồi quy (parameters)
-Tùy thuộc vào mô hình gốc ban đầu mà ta có thể sử dụng phương
pháp hồi quy Least Squares hay Maximum Likelihood

Bước 3:
- Kiểm tra chẩn đoán mô hình

Box và Jenkins đề xuất 2 phương pháp:


- theo hướng thận trọng: kiểm định “Deliberate Overfitting”
- theo hướng chẩn đoán phần dư (Residual Diagnostics)

7
qBox-Jenkins yêu cầu dữ liệu với ít nhất từ 40 cho đến 50 kỳ quan sát bằng nhau.
qDữ liệu cũng phải khắc phục các quan sát có giá trị ngoại biên hay các dữ liệu bị
mất.
q Dữ liệu cũng cần phải được xử lý đảm bảo tính ổn định bằng cách lấy log hay
nghịch đảo. Vũ Việt Quảng – Khoa Tài Chính – ĐHKT TPHCM 737
Box-Jenkins yêu cầu dữ liệu
với ít nhất từ 40 cho đến 50
kỳ quan sát bằng nhau.

Dữ liệu cũng phải khắc phục


các quan sát có giá trị ngoại
biên hay các dữ liệu bị mất.

Dữ liệu cũng cần phải được


xử lý đảm bảo tính ổn định
bằng cách lấy log hay nghịch
đảo.

7
d. Tiến trình ARMA

Một số phương pháp phát triển gần đây đối với mô hình ARMA

• Identification: bước thứ nhất theo đề xuất của Box Jenkins có


thể sẽ không đầy đủ nếu chỉ dựa vào đồ thị ACF.

• Mục tiêu bây giờ là lựa chọn số lượng các thông số hồi quy sao
cho tối thiểu hóa các “chỉ tiêu” giúp lựa chọn mô hình
(Information Criterion).

7
d. Tiến trình ARMA
Phương pháp sử dụng “nội dung thông tin” để giúp lựa chọn mô hình

• Nội dung thông tin giúp lựa chọn mô hình thay đổi tùy thuộc vào mức độ
trừng phạt khi một thông số không có liên quan được đưa thêm vào mô
hình.
• Có 3 chỉ tiêu phổ biến được sử dụng là:
Akaike’s (1974) information criterion (AIC), Schwarz’s (1978) Bayesian
information criterion (SBIC), and the Hannan-Quinn criterion (HQIC).
AIC = ln(s 2
) + 2k / T
k
SBIC = ln(sˆ 2 ) + ln T
T
2k
HQIC = ln(sˆ 2 ) + ln(ln(T ))
T
với k = p + q + 1, T = kích cỡ mẫu. Vì vậy chỉ tiêu SBIC sẽ trừng phạt nghiêm
khắc hơn chỉ tiêu AIC.
• Chỉ tiêu IC nào phù hợp hơn nếu các mô hình khác nhau về độ trễ?
– SBIC là có tính nhất quán nhất nhưng không hiệu quả (inefficient).
– AIC không nhất quán (consistent), và có khuynh hướng lựa chọn mô
hình “lớn hơn”.
7
d. Tiến trình ARMA - Ví dụ trong tài chính

Kiểm định lý thuyết UIP (Uncovered interest parity)

Kiểm định H0: a = 0; b1=0; b2=0

Kiểm định H0: a = 0; b=0

7
d. Tiến trình ARMA - Ví dụ trong tài chính

Uncovered interest parity test results (Ito, 1988)

7
e. Tiến trình ARIMA

• Mô hình ARIMA khác biệt với mô hình ARMA do sử dụng khái niệm
“liên kết – itegrated”. I là từ viết tắt của “integrated”.

• Tiến trình tự hồi quy được liên kết (integrated autoregressive process)
là một tiến trình có nghiệm đặc trưng nằm bên trong vòng tròn đơn vị.

• Khi cần thiết chúng ta sẽ lấy sai phân (difference) đối với các biến và
xây dựng mô hình ARMA trên những biến đã được lấy sai phân này.

• Và như vậy mô hình ARMA(p,q) được xây dựng trên những biến đã
được lấy sai phân d lần sẽ được gọi là mô hình ARIMA(p,d,q).

7
e. Tiến trình ARIMA

Mô hình dự báo sử dụng trọng số để mềm hóa cấp số nhân


(Exponential Smoothing)

• Đây là một phương pháp giúp mô hình hóa và dự báo đối với chuỗi thời gian.

• Trong phương pháp này chúng ta kỳ vọng quan sát gần nhất sẽ có mức độ
ảnh hưởng lớn nhất đối với kết quả dự báo trong tương lai. Do vậy chúng ta
sẽ sử dụng trọng số khác nhau như thế nào cho các quan sát trước đó?

• Phương trình ước lượng cho mô hình sẽ là


St = a yt +(1-a)St-1 (1)
với
a là hằng số mềm hóa (smoothing constant), với 0£a£1
yt giá trị thực tế ở hiện tại
St giá trị đã được làm mềm hóa ở hiện tại (current smoothed value)

8
e. Tiến trình ARIMA

Mô hình dự báo sử dụng trọng số để mềm hóa cấp số nhân


(Exponential Smoothing) (cont’d)
• Lấy độ trễ một kỳ cho cả 2 vế của phương trình (1):
St-1 = a yt-1 +(1-a)St-2 (2)

• Tiếp tục lấy độ trễ 2 vế một lần nữa:


St-2 = a yt-2 +(1-a)St-3 (3)

• Thay giá trị St-1 (2) vào (1):


St = a yt + (1-a)(a yt-1 + (1-a)St-2)
= a yt + (1-a)a yt-1 + (1-a)2 St-2 (4)

• Thay giá trị St-2 từ (3) vào (4)


St = a yt + (1-a)a yt-1 + (1-a)2 St-2
= a yt + (1-a)a yt-1 + (1-a)2(a yt-2 + (1-a)St-3)
= a yt + (1-a)a yt-1 + (1-a)2a yt-2 + (1-a)3 St-3
8
e. Tiến trình ARIMA

Mô hình dự báo sử dụng trọng số để mềm hóa cấp số nhân


(Exponential Smoothing) (cont’d)

• Với T lần thay thế liên tiếp ta có được kết quả như sau:
æ T ö
St = ç åa (1-a) yt -i ÷ + (1-a) S0
i T

è i =0 ø
vì a³0, nên tác động từ mỗi quan sát trong quá khứ sẽ giảm dần theo cấp
số nhân khi độ trễ của quan sát tăng dần.

• Các giá trị dự báo được thiết lập bởi phương trình:
ft+s = St với s = 1, 2, 3....
cho tất cả các giá trị tầm xa dự báo trong tương lai s = 1, 2, ...

• Kỹ thuật này được gọi là “mềm hóa dự báo đơn giản sử dụng trọng số theo
cấp số nhân) (simple exponential smoothing).

8
e. Tiến trình ARIMA
Mô hình mềm hóa dự báo sử dụng trọng số theo cấp số nhân
(Exponential Smoothing) (cont’d)
• Mô hình này không phát huy tác dụng nhiều đối với dữ liệu tài chính vì
những lý do sau:
– Không có nhiều “cấu trúc” trong dữ liệu để từ đó cần phải “mềm hóa”
– Mền hóa không áp dụng cho dữ liệu chuỗi thời gian có tính thay đổi theo
chu kỳ ngắn trong năm (seasonality).
– Phương pháp mềm hóa cũng chính là mô hình ARIMA(0,1,1) với hệ số
MA là (1-a) - (xem Granger & Newbold, p174)
– Giá trị dự báo không hội tụ về giá trị trung bình trong dài hạn khi s®¥

• Chúng ta có thể sửa đổi mô hình Single Exponential Smoothing bằng cách:
– Cho phép tác động từ thay đổi theo xu hướng (Holt’s method)
– Hoặc cho phép tác động từ thay đổi theo chu kỳ trong năm- seasonality
(Winter’s method).

• Những thuận lợi của mô hình Exponential Smoothing


– Rất dễ dàng trong sử dụng
– Dễ dàng cập nhật mô hình khi một số liệu mới công bố. 8
Thực hành xác định p, q cho mô hình ARMA(p,q)

8
Đồ thị ACF cho thấy hiện tượng tự tương quan (autocorrelations) có ý nghĩa
thống kê cho một loạt các giá trị độ trễ lags. Tuy nhiên đồ thị PACF xác nhận
rằng hiện tượng tự tương quan từ lags 2 trở lên chỉ đơn thuần là do sự phát tán
“tự tượng quan” của giá trị độ trễ 1

8
Sau khi sử dụng “Nonseasonal difference”, ví dụ hồi quy mô hình
ARIMA(0,1,0) với hằng số , đồ thị ACF có dạng sau:

8
Sau khi sử dụng “Nonseasonal difference”, ví dụ hồi quy mô hình
ARIMA(0,1,0) với hằng số , đồ thị PACF có dạng sau:

8
Lưu ý rằng: (a) Tự tương quan ở Lag1 có ý nghĩa thống kê và dương; (b) PACF chỉ có 2
thanh nhô lên và có ý nghĩa thống kê, trong khi đó ACF có 4 thanh có ý nghĩa. Do vậy
“differenced series” thể hiện dấu hiệu AR(2). Do vậy chúng ta thiết lập bổ sung mô
hình AR(2), ví dụ ARIMA(2,1,0) chúng ta có đồ thị ACF và PACF cho các phần dư như
sau:

8
Hiện tượng tự tương quan ở 2 giá trị lags quan trọng: Lags 1 và 2 đã bị loại bỏ hoàn
toàn, và do vậy không còn hiện tượng tự tương quan nào ở cấp độ Lags cao hơn:

8
9
ARIMA có thể hồi quy cho cả hai loại mô hình:
Standard ARIMA models. Ví dụ ARIMA(1, 1,1):

Structural models with ARMAdisturbances

Thay thế Xtβ bằng β0 (hằng số), Tacó:

Phương trình (1a) và (1b) là như nhau. Và điều này cũng đúng
cho mô hình ARIMA (p, d, q) tổng quát.
9
1.4 Dự báo trong kinh tế lượng
(Forecasting in Econometrics)
• Dự báo (Forecasting) = Tiên đoán (prediction)

• Dự báo cũng là một dạng kiểm định tính “đầy đủ hay phù hợp”
(adequacy) của mô hình, ví dụ:
- Dự báo TSSL trong tương lai của một cổ phiếu nào đó
- Dự báo giá cả bất động sản với các đặc điểm cho trước
- Dự báo mức độ rủi ro của một danh mục đầu tư cho những năm sắp
tới
- Dự báo tính bất ổn (volatility) trong TSSL của trái phiếu

• Chúng ta có thể phân biệt 2 phương pháp tiếp cận trong dự báo:
- Dự báo theo cấu trúc (Econometric or structural forecasting )
- Dự báo theo chuỗi thời gian (Time series forecasting)

• Tuy nhiên đôi khi rất khó phân loại 2 cách dự báo này, ví dụ VARs.
9
a. Dự báo trong phạm vi mẫu (In-Sample forercast) so với
dự báo ngoài phạm vi mẫu (Out-of-Sample forercast)

• Chúng ta mong đợi kết quả dự báo của mô hình phải tốt trong phạm vi mẫu
(in-sample).

• Ví dụ: có monthly FTSE returns trong 120 months: 1990M1 – 1999M12.

• A good test of the model since we have not used the information from
1999M1 onwards when we estimated the model parameters.

9
b. Dự báo như thế nào?

• Phương pháp dự báo Multi-step ahead so với Single-step ahead

• Phương pháp đệ quy (Recursive) so với phương pháp “cuốn


chiếu” (rolling windows)

• Để có thể hiểu được phương pháp dự báo chúng ta cần phải hiểu
khái niệm kỳ vọng có điều kiện (conditional expectations):
E(yt+1 | Wt )

• Chúng ta không thể dự báo cho dữ liệu tuân theo tiến trình “nhiễu
trắng” (a white noise process): E(ut+s | Wt ) = 0 " s > 0.

y 949
c. Các mô hình dự báo

• Mô hình cấu trúc (Structural models)


e.g. y = Xb + u
yt = b1 + b2x2t + + bkxkt + ut
Để có thể dự báo y, chúng ta cần tính giá trị kỳ vọng có điều kiện
(conditional expectation) của giá trị tương lai của chính nó:

E(y W )= E(b 1+ b x2 + + bx +u)


t t-1 2t k kt t

E(x2t ) = b1 + b2 E (x2t )+ + bk E (xkt )


E (yt ) = b1 + b 2 x2 + + b k xk

Tuy nhiên giá trị của y ? Chúng ta có thể sử dụng x 2 , vì vậy

= !!

9
c. Các mô hình dự báo (cont’d)

• Mô hình chuỗi thời gian (Time Series Models)


Giá trị hiện tại của một chuỗi thời gian, yt, được mô hình như là một
hàm số theo giá trị của chính nó trước đó trong quá khứ + giá trị hiện
tại của phần dư (error term) + (có thể) giá trị quá khứ trước đó của
phần dư.

• Các mô hình chuỗi thời gian bao gồm:


• Bình quân không có trọng số đơn giản (simple unweighted
averages)
• Bình quân có trọng số theo cấp số nhân (exponentially weighted
averages)
• Mô hình ARIMA
• Mô hình phi tuyến (Non-linear models). Ví dụ: threshold models,
GARCH, bilinear models, etc.
9
d. Dự báo với mô hình ARMA

Mô hình dự báo ARMA có dạng như sau:


p q
f t,s = µ+ åfi f t,s-i + åqj ut+s- j
i=1 j=1

Với ft,s = yt+s , s£ 0; ut+s = 0, s > 0


= ut+s , s £ 0

9
d. Dự báo với mô hình ARMA (cont)

• Mô hình MA(q) riêng biệt sẽ có “memory” tới độ trễ q.

ví dụ: chúng ta đã ước lượng mô hình MA(3) như sau:

yt = µ + q1ut-1 + q 2ut-2 + q 3ut-3 + ut


yt+1 = µ + q 1ut + q 2ut-1 + q 3ut-2 + ut+1
yt+2 = µ + q 1ut+1 + q 2ut + q 3ut-1 + ut+2
yt+3 = µ + q 1ut+2 + q 2ut+1 + q 3ut + ut+3

• Và bây giờ ở thời điểm t, chúng ta muốn dự báo với tầm xa


1,2,..., s kỳ sắp tới.

• Chúng ta đã biết yt , yt-1, ..., và tương ứng ut , ut-1

9
d. Dự báo với mô hình ARMA (cont’d)

ft, 1 = E(yt+1 | t ) = E(µ + q 1ut + q 2ut-1 + q 3ut-2 + ut+1)


= µ + q 1ut + q 2ut-1 + q 3ut-2

ft, 2 = E(yt+2 | t ) = E(µ + q 1ut+1 + q 2ut + q 3ut-1 + ut+2)


= µ + q 2ut + q 3ut-1

ft, 3 = E(yt+3 | t ) = E(µ + q 1ut+2 + q 2ut+1 + q 3ut + ut+3)


= µ + q 3ut

ft, 4 = E(yt+4 | t ) = µ

ft, s = E(yt+s | t ) = µ "s³4

9
e. Dự báo với mô hình AR

• Giả dụ chúng ta đã ước lượng mô hình AR(2) như sau:


yt = µ + f1yt-1 + f 2yt-2 + ut
yt+1 = µ + f 1yt + f 2yt-1 + ut+1
yt+2 = µ + f 1yt+1 + f 2yt + ut+2
yt+3 = µ + f 1yt+2 + f 2yt+1 + ut+3

ft, 1 = E(yt+1 | t ) = E(µ + f 1yt + f 2yt-1 + ut+1)


= µ + f 1E(yt) + f 2E(yt-1)
= µ + f 1yt + f 2yt-1

ft, 2 = E(yt+2 | t ) = E(µ + f 1yt+1 + f 2yt + ut+2)


= µ + f 1E(yt+1) + f 2E(yt)
= µ + f 1 ft, 1 + f 2yt

1
e. Dự báo với mô hình AR (cont’d)

ft, 3 = E(yt+3 | t ) = E(µ + f 1yt+2 + f 2yt+1 + ut+3)


= µ + f 1E(yt+2) + f 2E(yt+1)
= µ + f 1 ft, 2 + f 2 ft, 1

• Chúng ta có thể thấy ngay lập tức rằng:

ft, 4 = µ + f 1 ft, 3 + f 2 ft, 2 v.v.., vì vậy

ft, s = µ + f 1 ft, s-1 + f 2 ft, s-2

• Chúng ta có thể dễ dàng thiết lập mô hình ARMA(p,q) để dự báo theo


cùng một cách thức như trên

1
f. Làm sao chúng ta có thể kiểm định xem kết quả dự
báo có tốt hay không?

•Ví dụ, chúng ta dự báo rằng TTSL ngày mai của FTSE sẽ là 0.2, nhưng kết quả
thực tế xảy ra là -0.4. Vậy kết quả này có chính xác hay không?
•Định nghĩa ft,s là giá trị dự báo thực hiện ở thời điểm t cho s kỳ trong tương lai
(ví dụ dự báo cho thời điểm t+s), và yt+s là giá trị thực tế xảy ra của y tại thời điểm
t+s.

• Có một vài chỉ tiêu phổ biến giúp đánh giá kết quả dự báo của chuỗi thời gian
như sau: 1 N
MSE =
N
å ( yt+s - ft ,s )
2

t=1

N
MAE là (Mean Absolute Error) : MAE = 1 å yt +s - f t,s
N t=1

N
1 yt+s - ft,s
MAPE là “Mean absolute percentage error” MAPE=100´ å
N t =1 yt+s 1021
f. Làm sao chúng ta có thể kiểm định xem kết quả dự báo
có tốt hay không? (cont’d)

• Một chỉ tiêu khác là Theil’s U statistics (1966):

𝒚𝒕+𝒔− 𝒇𝒕,𝒔 𝟐
𝑻
𝒕= 𝑻 𝟏 𝒚𝒕+𝒔
𝑼=
𝒚𝒕+𝒔− 𝒇𝒃𝒕,𝒔 𝟐
𝑻
𝒕= 𝑻 𝟏 𝒚𝒕+𝒔

• Với fb là giá trị dự báo từ mô hình đơn giản (naive model)


• U<1 : mô hình dự báo tốt hơn mô hình giản đơn
• U<1 : mô hình dự báo kém hơn mô hình giản đơn

1
f. Làm sao chúng ta có thể kiểm định xem kết quả dự báo
có tốt hay không? (cont’d)

Một ví dụ về đánh giá kết quả dự báo


• Ta có kết quả dự báo và giá trị thực tế xảy ra như bên dưới. Hãy
tính toán các giá trị MSE, MAE và % dự báo chính xác dấu kỳ
vọng (percentage of correct sign predictions):

Steps Ahead Forecast Actual


1 0.20 -0.40
2 0.15 0.20
3 0.10 0.10
4 0.06 -0.10
5 0.04 -0.05

• MSE = 0.079, MAE = 0.180, % of correct sign predictions = 40

1
g. Những nhân tố nào thực sự có ảnh hưởng đến chất
lượng của mô hình dự báo?

• “signal” vs “noise”

• “data mining” issues

• simple vs complex models

• financial or economic theory

1
Các hạn chế của công tác dự báo: trường hợp nào là có
thể dự báo và trường hợp nào là không thể dự báo?
• Các thang đo đánh giá mang tính thống kê (Statistical evaluation
metrics) có thể không phù hợp.

• Tất cả các mô hình dự báo thống kê là đều mang đậm tính chất “nội
suy” (extrapolative)

• Các mô hình dự báo đều có khuynh hướng trượt theo điểm gãy cấu
trúc trước đó. are prone to break down around turning points

• Các chuỗi thời gian có điểm gãy cấu trúc hay cơ chế thay đổi
(structural changes or regime shifts) thì không thể dự báo.

• Mức độ chính xác của dự báo thường giảm dần khi tầm xa của dự báo
gia tăng.

• Dự báo không thể thay thế cho công việc “tiên đoán dựa vào định tính”
(jugdments) 1
Trở lại với câu hỏi cơ bản nhưng cũng quan trọng nhất: tại sao
chúng ta cần dự báo?
• Tại sao chúng ta lại không sử dụng các “chuyên gia” để thực hiện dự báo
theo định tính “(judgemental forecasts)?
• Dự báo theo định tính có các nhược điểm sau:
Các nhà tâm lý học đã chỉ ra rằng Dự báo theo định tính thường có
khuynh hương thiên lệch sau:
– Quá tự tin (over-confidence)
– Không nhất quá (inconsistency)
– Dựa quá nhiều vào những thông tin gần nhất (recency)
– Neo quá chặt vào một điểm mốc nào đó (anchoring)
– Ảo tưởng (illusory patterns)
– Nghĩ theo số đông “group-think”.

• Phương pháp tiếp cận tối ưu phổ biến (The Usually Optimal Approach)
Sử dụng các mô hình dự báo mang tính thống kê và những mô hình này
được xây dựng dựa vào các nền tảng lý thuyết tài chính vững chắc, bổ
sung thêm bằng các đánh giá tiên đoán theo cảm tính của các chuyên gia.
Và sau đó tập hợp tất cả lại và thông đạt kết quả. 1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

Chọn Forecast button


Hoặc
Proc/Forecast….

1
Thực hành dự báo ARMA trên EVIEWS 7.2
• Forecast name. khai báo “series name” hoặc sử dụng tên mặc định bởi EViews
•S.E. (optional). Nếu muốn lưu lại giá trị forecast standard errors, khai báo tên của
chuỗi dữ liệu forecast S.Es này.
• GARCH (optional). Chỉ sử dụng cho mô hình dự báo bởi ARCH.
• Forecasting method.
•Dynamic sẽ tính toán multi-step forecasts bắt đầu từ kỳ đầu tiên của “forecast
sample”. Chỉ áp dụng khi phương trình dự báo có biến trễ của biến độc lập như AR hay
ARMA.
• Static sử dụng giá trị thực tế thay vì giá trị dự báo để tính toán một chuỗi các giá trị
one-step ahead forecasts,
•Coef uncertainty in S.E. calc: trong quá trình tính toán “forecast standard Errors”
Eviews sẽ bỏ qua tính toán Coefficient uncertainty nếu bỏ lựa chọn này.
•Structural khi phương trình có cấu trúc ARMA, thì cả 2 phương pháp dynamic và
static đều tiến hành dự báo có sử dụng phần dư (residuals). Khi chọn Structural,
Eviews sẽ bỏ qua giá trị “forecasted residuals” và thực hiện dự báo chỉ sử dụng phần
cấu trúc của phương trình ARMA
• Sample range. Khai báo để EViews thực hiện “out-of-sample forecasts”.
•Output. Chọn kết quả của dự báo là đồ thị (graph) hay bằng số (numerical forecast
evaluation)
•Insert actuals for out-of-sample observations. Chọn ô này nếu muốn quan sát khác
biệt giữa giá trị dự báo và giá trị thực tế. Trong một số trường hợp vẫn phải sử dụng
Menu để xem sự khác biệt bằng đồ thị: Open as Group\View\Graph....
1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

1
Thực hành dự báo ARMA trên EVIEWS 7.2

Dynamic forecast

Static forecast

1
Thực hành ARIMA(1,1, 1) trên STATA - Ví dụ 1:
use "D:\UEH\ECONOMETRICS TEACHING\PART 2\ARIMA\Presentations\wpi1.dta", clear
. twoway (tsline ln_wpi)

1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA

use "D:\UEH\ECONOMETRICS TEACHING\PART 2\ARIMA\Presentations\wpi1.dta", clear


. tsset t
. reg ln_wpi t (Detrending series ln_wpi)
. predict resid, xb (lưu lại giá trị phần dư resid)
. dfuller resid, lags(0) (kiểm định Unit Roots bằng ADF test)
Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Statistics > Time-series > Tests > ADF unit root test ....

1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA

use "D:\UEH\ECONOMETRICS TEACHING\PART 2\ARIMA\Presentations\wpi1.dta", clear


. D.ac ln_wpi
. D.pac ln_wpi

Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics > Time-series graphs > Correlogram (ac)....

1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA

• arima wpi, arima(1,1,1)


• arima D.wpi, ar(1) ma(1)
• estat ic

1
Ví dụ 2: mô hình ARIMA với hiệu ứng mùa vụ - STATA

Vẽ đồ thị kết quả ước lượng mô hình ARMA sử dụng “log-differenced series”

Graphics > Time-series graphs > Line plots ...

1
Ví dụ 2: mô hình ARIMA với hiệu ứng mùa vụ - STATA
• ac D.ln_wpi, ylabels(-.4(.2).6)
• pac D.ln_wpi, ylabels(-.4(.2).6)

Bên cạnh mô hình AR, MA(1) và MA(4) cũng được sử dụng bổ sung
cho hiệu ứng mùa vụ theo quý (remaining quarterly effect).

1
Ví dụ 2: mô hình ARIMA bổ sung hiệu ứng mùa vụ - STATA

arima D.ln_wpi, ar(1) ma(1 4)

1
Ví dụ 3: mô hình SARIMA (seasonal ARIMA model) -STATA
use "d:\ueh\econometrics teaching\part 2\arima\presentations\air2.dta", clear
generate lnair = ln(air)
ac lnair
pac lnair

1
Ví dụ 3: mô hình SARIMA (seasonal ARIMA model)- STATA
arima lnair, arima(0,1,1) sarima(0,1,1,12) noconstant
arima DS12.lnair, ma(1) mma(1, 12) noconstant

Tùy chọn mar() và mma() có thể được lặp lại để kiểm soát các mẫu hình mùa vụ khác
nhau trong cùng 1 chuỗi thời gian, ví dụ:
arima DS4S12.sales, ar(1) mar(1, 4) mar(1, 12) ma(1) mma(1, 4) mma(1, 12)
1
Ví dụ 4: mô hình ARMAX models - STATA

Bên cạnh mô hình Arima, ta có thể sử dụng mô hình ARMAX mà theo đó mô hình
biến phụ thuộc là sự kết hợp các mối quan hệ tuyến tính của các biến độc lập, cũng
như các phần dư của mô hình.

. use "d:\ueh\econometrics teaching\part \arima\presentations\friedman2.dta", clear


. arima consump m2 if tin(, 1981q4), ar(1) ma(1)
Hoặc
. arima consump m2 if tin(, 1981q4), ar(1) ma(1) vce(robust)

1
Ví dụ 4: mô hình ARMAX models - STATA

1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA

•xb, chế độ mặc định, STATA sẽ tính toán giá trị dự báo cho biến phụ thuộc
hiện hành trong phương trình hồi quy (difference)
• y tính toán giá trị dự báo cho biến phụ thuộc gốc (level).
• stdp tính toán “standard error” của giá trị dự báo tuyến tính “xb”.
• mse tính toán giá trị MSE của giá trị dự báo.
• residuals tính toán giá trị phần dư.
• yresiduals tính toán giá trị phần dư theo biến phụ thuộc gốc

1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA
predict xb, xb
predict y, y
predict yr, yresiduals

Khi thực hiện dự báo, nếu muốn bỏ qua giá trị dự báo của phần dư
và chỉ sử dụng phần “cấu trúc” trong phương trình ARMA, chúng ta
sẽ sử dụng tùy chọn “structural” như sau:

. predict xbs, xb structural

. predict ys, y structural

1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting)

1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA

. use "d:\ueh\econometrics teaching\part 2\arima\presentations\friedman2.dta", clear


. tsset time
. keep if time<=tq(1981q4)
. arima consump m2 if tin(, 1978q1), ar(1) ma(1)

Để dự báo 1 kỳ tương lai (one-step-ahead forecasts), câu lệnh như


sau:
. predict chat, y
. predict chatdy, dynamic(tq(1978q1)) y

1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA

1
Ví dụ 5: dự báo bằng mô hình ARIMA – Dynamic forecast - STATA
. tsset time
. tsappend,add(8)
. arima consump L(1/4).consump
. predict double consumphat if tin(1970q1,), dynamic(tq(1998q1))y

1
Ví dụ 5: dự báo bằng mô hình ARIMA – Static forecast - STATA
Cú pháp
. use "d:\ueh\econometrics teaching\part 2\arima\presentations\usmacro1.dta", clear
. arima cpi, arima(1, 1, 1) nolog

1
Ví dụ 5: dự báo bằng mô hình ARIMA - Sử dụng biến sai phân
Cú pháp
. arima D.cpi, ar(1 4) nolog
. estimates store e42a

1
Ví dụ 5: dự báo bằng mô hình ARIMA – Static forecast - STATA
Vẽ đồ thị
. Predict dcpihat, xb
. twoway (tsline dcpihat)
Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics > Time-series Graphs > Line Plots....

1
Ví dụ 5: dự báo bằng mô hình ARIMA – vẽ đồ thị kết quả dự
báo của biến gốc và phần dư- STATA
. estimates restore e42a
. predict double cpihat, y (giá trị dự báo cho biến CPI)
. predict double cpieps, yresiduals (giá trị dự báo cho phần dư biến CPI)
. tw (tsline cpieps, yaxis(2)) (tsline cpihat), ti("ARIMA(1,1,1) model of US CPI")
scheme(s2 mono)

1
Ví dụ 5: dự báo bằng mô hình ARMAX - STATA
Ước lượng ARMAX model
. arima d.cpi d.oilprice if tin(, 2008q4), ar(1) ma(1) nolog

1
Ví dụ 5: dự báo bằng mô hình ARIMA – so sánh Static và
Dynamic forecasts - STATA
Static (one-period-ahead) từ 2006q1 đến 2008q4
Dynamic (multi-period-ahead) ex ante Forecasts từ 2009q1 đến 2010q3.

Cú pháp
. predict double cpihat_s if tin(2006q1,), y
. label var cpihat_s "static forecast"
. predict double cpihat_d if tin(2006q1,), dynamic(tq(2008q4)) y
. label var cpihat_d "dynamic forecast”

Vẽ đồ thị
. twoway (tsline cpihat_s if tin(2006q1,)) (tsline cpihat_d if tin(2005q1,))
(tsline cpi if tin(2006q1,))

Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics\Time-series Graphs\Line Plots....
1
Ví dụ 5: dự báo bằng mô hình ARIMA – Dynamic forecast

You might also like