Professional Documents
Culture Documents
Phan II - ARIMA PDF
Phan II - ARIMA PDF
PHẦN 2
1
NỘI DUNG PHẦN 2
q Chương 1: Lập mô hình và dự báo với chuỗi thời gian đơn biến
(Univariate time-series)
q Chương 2: Lập mô hình với chuỗi thời gian đa biến và phân tích mô
hình Véc-tơ tự hồi quy (Multiequation time-series and VAR analysis)
q Chương 3: Mô hình đồng liên kết và mối quan hệ dài hạn giữa các
biến (Cointegration and Error Correction models)
q Chương 5: Các mô hình chuỗi thời gian phi tuyến (Non-linear time-
series models)
2
Chương 1
• Chuỗi thời gian (time series) là chuỗi các dữ liệu quan sát
của một biến số ngẫu nhiên được thu thập theo thời gian.
• Thông thường chuỗi thời gian được quan sát và thu thập
với các khoảng thời gian bằng nhau và kết quả là ta có
chuỗi thời gian rời rạc (discrete-time time series).
• Nếu thời gian t là liên tục thay vì ngắt quãng, ta có chuỗi
thời gian liên tục (continuous-time time series).
• Có rất nhiều các ví dụ về tài chính trong thực tế là biểu
hiện của chuỗi thời gian: chỉ số lạm phát hàng tháng, chỉ số
cung tiền hàng tuần, chỉ số giá cả chứng khoán hàng ngày
v.v...
4
1.1 Giới thiệu chuỗi thời gian
• Ngày nay với sự tiến bộ của công nghệ và ứng dụng máy
tính chúng ta có thể cập nhật số liệu cho lãi suất theo từng
giờ thay vì theo ngày, và chỉ số giá cả chứng khoán theo
từng phút .
• Khi phân tích một tập hợp các biến chuỗi thời gian khác
nhau trong cùng 1 thời kỳ quan sát thì được gọi là “phân
tích chuỗi thời gian đa biến” (multivariate time-series
analysis) hoặc đơn giản hơn là “multiple time-series
analysis”
5
1.2 Mô hình chuỗi thời gian đơn biến
Univariate Time Series Models
Trong loại mô hình này chúng ta sẽ cố gắng dự báo TSSL từ
thông tin của chính nó trong quá khứ.
6
1.2 Mô hình chuỗi thời gian đơn biến
• Mục đích của phân tích chuỗi thời gian đơn biến là đi tìm
sự phụ thuộc của biến Xt vào các giá trị của chính nó trong
qua khứ {Xt-1 , Xt-2 , ... Xt-n}
7
1.2 Mô hình chuỗi thời gian đơn biến
Non- Gausian distribution
Gausian distribution
8
1.2.1 Chuỗi thời gian đơn biến “dừng” và “không dừng”
Stationary and Nonstationary Time Series
Nonstationary
Trong phân tích chuỗi thời gian chúng ta không thể tự hạn chế
bằng cách chỉ phân tích những chuỗi thời gian có tính “dừng”.
Hầu hết các chuỗi thời gian trong thực tế đếu là “không dừng”.
với giá trị trung bình µt là hàm số theo thời gian t (có thể là
linear trend hay quadratic trend) và et là chuỗi thời gian dừng
“yếu” .
9
1.2.1 Chuỗi thời gian đơn biến “dừng” và “không dừng”
Stationary and Nonstationary Time Series
1
Nhận diện và xử lý chuỗi thời gian không dừng
• Sử dụng đồ thị ACF: nếu đồ thị ACF thoái hóa chậm thì đó
là dấu hiệu của “true unit root process” hay chuỗi thời gian
là không dừng.
• Kiểm định KPSS giúp xác định chuỗi thời gian thay đổi
theo xu hướng xác định (deterministic trend) hay ngẫu
nhiên (stochastic trend).
1
NON-STATIONARITY IN MEAN
a. Deterministic trend
TREND STATIONARY
• Sau đó lưu lại giá trị của phần dư (residuals). Lúc này các
giá trị phần dư sẽ là detrended series hay dừng theo xu
hướng (trend stationarity).
TREND STATIONARY
1
a. DETERMINISTIC TREND
• Trong kinh tế - tài chính, tất nhiều chuỗi thời gian thể hiện xu
hướng tăng theo cấp số nhân (exponential trend/growth). Các
biến tăng trưởng là hàm phi tuyến theo thời gian thay vì là
tuyến tính.
Yt = a 0+at 1+ at 2 2+ + a t k k + a t
a t ~ WN (0,o a2 ).
• Đối với những chuỗi thời gian loại này, chúng ta cần lấy
logarit:
ln(Yt) = a+ bt+ a t
• Nếu f = 1, ví dụ
Yt = c + Yt−1 + at.
1
b. STOCHASTIC TREND
• Thay thế đệ quy (recursive) giá trị độ trễ lag của Yt cho vế phải
của phương trình:
Yt = c + Yt-1 + at
= c + (c + Yt-2 + at-1 ) + at
t
= tc + Y0 + å ai
i=1
Deterministic trend
• Mô hình này còn được gọi là “random walk with drift”.
• Nếu c = 0, ta có “random walk”. 1
DETERMINISTIC so với STOCHASTIC TREND
• Nhìn bề ngoài thì cả 2 loại xu hướng này đều có biểu hiện là chuỗi thời gian
gia tăng theo thời gian nhưng bản chất bên trong thì hoàn toàn khác nhau.
• Để hiểu tại sao, giả định rằng chúng ta áp đặt một chính sách can thiệp vào
kỳ t, và kết quả là giá trị Yt gia tăng bởi vì giá trị nhiễu at cùng kỳ sẽ gia tăng
lớn tương ứng. Vấn đề là tác động của at sẽ như thế nào đến kỳ kếtiếp?
• Đối với chuỗi thời gian có đặc tính dừng, những cú sốc sẽ
chỉ là tạm thời và chuỗi thời gian sẽ luôn quay về giá trị
trung bình của nó trong dài hạn.
2
Tháo bỏ đặc tính xu hướng của chuỗi thời gian –
1. DETRENDING
• Hồi quy Yt trên biến thời gian và lưu giữ giá trị của phần
dư và sau đó kiểm định xem phần dư có dừng hay không
(stationary)?
2
2. Lấy sai phân - DIFFERENCING
• Differencing (lấy sai phân) được sử dụng để loại bỏ
“stochastic trend”.
Y =Y + a
t t -1 t
Non-stationary
Y -Y = a
t t -1 t
DYt = at Stationary
2
2. Lấy sai phân - DIFFERENCING
• Differencing luôn dẫn đến bị mất quan sát.
• Differencing sẽ dẫn đến hệ quả là bạn đã vứt đi thông tin
quan trọn nếu có từ mối quan hệ dài hạn giữa các biến
• 1st regular difference: d=1
(1 - L)Y = Y - Y = DY
t t t -1 t
(1 - L) Y
2
t
= D Y = (1 - 2L + L )Y = Y - 2Y + Y
2
t
2
t t t -1 t -2
2
Lấy sai phân - DIFFERENCING
2
Kiểm định KPSS
2
Kiểm định KPSS
• Sửa sai: quay trở lại và “detrending” chuỗi thời gian thay
vì “differencing”.
2
NON-STATIONARITY IN VARIANCE
2
Stationary/Unit Root Testing
Một ví dụ điểm hình của chuỗi thời gian không dừng (nonstationary series) là
chuyển động theo phương trình random walk như sau:
Nếu phần dư e là stationary, yt có Unit root và “dừng” sau khi lấy sai phân, vì vậy
yt còn gọi là biến I(1). Tương tự biến dừng ở level được gọi là I(0).
EViews cung cấp rất nhiều các công cụ để kiệm định Unit Root:
§Augmented Dickey-Fuller (1979)
§Phillips-Perron (1988)
§GLS-detrended Dickey-Fuller (Elliot, Rothenberg, and Stock, 1996),
Kwiatkowski, Phillips, Schmidt, and Shin (KPSS, 1992),
§Elliott, Rothenberg, and Stock Point Optimal (ERS, 1996),
§Ng and Perron (NP, 2001)
2
Stationary/Unit Root Testing
3
Stationarity/Unit Root Testing
Thực hiện Unit Root Tests trong Eviews
Chọn 1 trong 6 phương pháp kiểm định sau: ADF, DFGLS, PP,
KPSS, ERS, and NP.
Kế đó ta cần chọn kiểm định Unit root ở mức “level” trước. Sau
đó nếu kết luận là có Unit Root ta cần lấy sai phân và tiếp tục
thự hiện kiểm định ở mức độ “first difference”. Và cứ tiếp tục
như vậy cho đến khi kết luận là không còn Unit Root.
Cuối cùng bạn phải khai báo nhân tố ngoại sinh, bao gồm:
constant hay constant và linear trend, hay không bao gồm cả
constant và linear trend (rất hạn chế sử dụng).
3
Stationarity/Unit Root Testing
3
VARIANCE STABILIZING TRANSFORMATION
• Ta cần tìm hàm số T sao cho giá trị đã được chuyển đổi
của chuỗi thời gian T(Yt) sẽ có phương sai là hằng số
• Phương pháp này chỉ áp dụng đối với các chuỗi thời gian dương
(positive series).
• Nếu chuỗi có giá trị âm, ta cộng mỗi quan sát một giá trị dương
sao cho tất cả các giá trị của chuỗi là dương.
• Phương pháp chuyển đổi nên được thực hiện trước khi thực hiện
các phân tích khác ví dụ như lấy sai phân (differencing).
• Phương pháp này không chỉ ổn định phương sai mà còn cải
thiện đặc tính phân phối chuẩn của chuỗi thời gian.
3
1.3 Phân tích chuỗi thời gian đơn biến
Univariate Time series analysis
process.
3
a. Tiến trình ngẫu nhiên thuần túy (purely random
process) hay “nhiễu trắng” (A White Noise Process)
• Tiến trình nhiễu trắng được định nghĩa như sau:
E( yt )= µ
Var(yt ) = s 2
if t=s
ìs 2
g t-s = í0 otherwise
î
• Do vậy hàm tự tương quan (autocorrelation function) sẽ có giá trị zero
ngoại trừ giá trị lớn nhất của nó là 1 khi s = 0.
• Chúng ta có thể sử dụng định nghĩa này để kiểm định các hệ số tự tương
quan bằng cách xây dựng khoảng tin cậy (confidence interval)
1
• Ví dụ, nếu khoảng tin cậy là 95% hay giá trị tương ứng sẽ là ±.1.96
T .
Do vậy nếu hệ số tương quan ,t s , rơi bên ngoài vùng này với bất cứ giá
trị nào của s, thì khi đó ta sẽ loại bỏ giả thiết Null là giá trị của hệ số tương
quan tại mức trễ s bằng zero.
3
a. Tiến trình ngẫu nhiên thuần túy (purely random
process) hay “nhiễu trắng” (A White Noise Process)
• Câu hỏi
1.Giả dụ rằng một chuỗi thời gian với 100 quan sát được kiểm định cho thấy
các giá trị của hệ số tự tương quan (autocorrelation coefficients) của 5 độ trễ
đầu tiên là: 0.207, -0.013, 0.086, 0.005, -0.022.
2.Hãy kiểm định xem từng hệ số tự tương trên có ý nghĩa thống kê hay
không? Và kế đó sử dụng 2 kiểm định Box-Pierce và Ljung-Box để xem có
khả năng các hệ số tự tương quan này đồng thời bằng zero hay không?
• Giải pháp
1.Một giá trị hệ số tự tương quan sẽ có ý nghĩa thống kê (khác zero) nếu nó
nằm ngoài khoảng tin cậy (-0.196,+0.196) ứng với mức ý nghĩa 5% level, do
vậy ta thấy chỉ có hệ số tự tượng quan đầu tiên là có ý nghĩa thống kê.
2. Để trả lời câu hỏi thứ 2, ta tính Q=5.09 và Q*=5.26
Tra bảng phân phối Chi 2 và so sánh với giá trị c2(5)=11.1 ở mức ý nghĩa 5%
và ta kết luận rằng tất cả 5 hệ số tự tương quan đồng thời bằng zero.
3
Ví dụ về hàm tự tương quan ACF
3
b. Tiến trình bình quân trượt – MA (Moving Average Processes)
• Gọi ut (t=1,2,3,...) chuỗi các biến có phân phối đồng dạng và độc lập
(independently and identically distributed (iid) random variables) với
E(ut )=0 và Var(u t)=se2 , thì khi đó
yt = µ + ut + q1ut-1 + q2ut-2 + ... + qqut-q
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Ví dụ về mô hình MA
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Ví dụ về mô hình MA
Var(Xt) = E[Xt-E(Xt)][Xt-E(Xt)]
Vì E(Xt) = 0, nên ta có
Var(Xt) = E[(Xt)(Xt)]
= E[(ut + q1ut-1+ q2ut-2)(ut + q1ut-1+ q2ut-2)]
= E[ u t2 + q 12 u t-1
2
+ q 22 u t-2
2
+cross-products]
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Ví dụ về mô hình MA (cont’d)
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Ví dụ về mô hình MA (cont’d)
g2 = E[Xt-E(Xt)][Xt-2-E(Xt-2)]
= E[Xt][Xt-2]
= E[(ut + q1ut-1+q2ut-2)(ut-2 +q1ut-3+q2ut-4)]
= E[( q 2 u t2-2 )]
= q2s
2
g3 = E[Xt-E(Xt)][Xt-3-E(Xt-3)]
= E[Xt][Xt-3]
= E[(ut +q1ut-1+q2ut-2)(ut-3 +q1ut-4+q2ut-5)]
=0
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Ví dụ về mô hình MA (cont’d)
Chúng ta đã tìm được các giá trị của tự hiệp phương sai (autocovariance),
bây giờ chúng ta có thể tính các giá trị tự tương quan tương ứng
(autocorrelations):
g
t 0 = g 0 =1
0
g (q 1 + q 1q2 )s 2
(q 1 + q 1q2 )
t1 = 1 = =
g0 (1+ q 1 + q 22 )s 2
2
(1+ q 1 + q 22 )
2
g (q 2)s 2 q2
t2 = =
2
=
g0 (1+q 12 + q 22 )s 2 (1+q 12 + q 22 )
g
t 3 =g 3 =0
0
g
t s = g s = 0" s > 2
0
(iii) Với q1 = -0.5 và q2 = 0.25, thay thế các giá trị này vào công thức đã
cho ở trên, ta có t1 = -0.476, t2 = 0.190.
4
b. Tiến trình bình quân trượt (Moving Average Processes)
Đồ thị ACF
0.8
0.6
0.4
acf
0.2
0
0 1 2 3 4 5 6
-0.2
-0.4
-0.6
4
c. Tiến trình Tự hồi quy (Autoregressive Processes)
• Mô hình tự hồi quy bậc p, AR(p) có thể được diễn đạt như sau:
• Hoặc ta có thể diễn đạt bằng cách sử dụng ký hiệu độ trễ “L” như sau:
Lyt = yt-1 Liyt = yt-i
p
y t = µ + å f i y t -i + u t
i=1
• Hay
4
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Điều kiện dừng của mô hình AR
• Điều kiện dừng của mô hình tổng quát AR(p) là các nghiệm của nó
phải nằm ngoài vòng tròn đơn vị :
1- f1z - f 2 z -...-f p z = 0
2 p
4
c. Tiến trình Tự hồi quy (Autoregressive Processes)
• Các giá trị Moments của tiến trình Tự Hồi Quy được diễn đạt như sau với
giá trị trung bình Mean được cho bởi:
f0
E( yt )=
1 - f1 - f2 - ... - f p
• Nếu mô hình AR model là stationary, thì hàm Tự tương quan ACF sẽ thoái
hóa theo cấp số nhân về zero.
5
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR
yt = µ+f1yt -1 + ut
(i) Hãy tính unconditional Mean của yt.
5
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
= su
2
(1-f21)
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
(iii) Bây giờ để tính ACF, trước hết ta phải tính các giá trị “Autocovariances”:
g1 = Cov(yt, yt-1) = E[yt-E(yt)][yt-1-E(yt-1)]
Bởi vì giá trị a0 đã được thiết lập = zero, E(yt) = 0 và E(yt-1) = 0, vì vậy
g1 = E[ytyt-1]
g1 = E[(u t + f1u t-1 + f12u t-2 + ...)(u t -1 + f1u t -2 + f1 u t-3 + ...) ]
2
f
= E[ 1 t-1 u
2
+ f 1
3
u 2
t-2 + ... + cross - products]
= f1s + f1 s + f 1 s + ...
2 3 2 5 2
f1s 2
=
(1- f 12 )
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
= f12 s 2 + f 14 s 2 + ...
= f1 s (1+ f1 + f1 + ...)
2 2 2 4
f12s 2
=
(1- f 12 )
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
• Lập lại các bước trên cho g3:
f13s 2
g3 =
(1-f 12 )
Và tổng quát cho độ trễ s, giá trị Autocovariance sẽ là:
f1s s 2
gs =
(1- f 12 )
Hàm ACF bây giờ có thể đạt được bằng cách chia các giá trị của
Covariances bằng giá trị phương sai:
5
c. Tiến trình Tự hồi quy (Autoregressive Processes)
Ví dụ về mô hình AR (cont’d)
g0
t0 = =1
g0
æ ö æ 2 2 ö
ç f1s 2 ÷ ç f1 s ÷
ç ÷ ç 2 ÷
ç (1- f1 ) ÷ f
2
ç (1- )
1 ÷
g1 è ø g2 è ø
t1 = g = = f1 t2 = =
g 0 æç
= f 12
æç o 2 ö o 2 ö÷
0
÷
ç 2 ÷
ç 2 ÷
ç (1- f 1 ÷
) ç (1- f )
1 ÷
è ø è ø
t3 = f13
…
ts = f 1s
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
• Hàm PACF đo lường mức độ tương quan giữa quan sát ở độ trễ k và quan sát
hiện tại, sau khi đã loại bỏ những tác động trung gian của các quan sát ở giữa
(intermediate lags hay lags < k).
• Vì vậy tkk đo lường mối tương quan giữa yt và yt-k sau khi loại bỏ những tác
động của yt-k+1 , yt-k+2 , …, yt-1 .
• Từ lags 3+, công thức sẽ trở nên ngày càng phức tạp.
5
c. Tiến trìnhTự hồi quy (Autoregressive Processes)
• Trong trường hợp mô hình AR(p), có mối tương quan trực tiếp giữa yt và yt-s
chỉ khi s£ p.
• Vì vậy so với mô hình AR(p), mô hình PACF về mặt lý thuyết sẽ bằng Zero
sau lag p.
• Trong trường hợp mô hình MA(q), thì mô hình này có thể được viết tương tư
như là AR(¥), vì vậy sẽ có mối tương quan trực tiếp giữa yt và tất cả các giá
trị của chính nó trước đó.
• Đối với mô hình MA(q), mô hình PACF về mặt lý thuyết sẽ thoái hóa giảm
dần .
6
d. Tiến trình ARMA
6
d. Tiến trình ARMA
• Tương tự như điều kiện về tính dừng (stationarity condition), phần tiến
trình MA(q) của mô hình ARMA với phương trình q(z)=0 sẽ cần có
nghiệm > 1 (theo giá trị tuyệt đối).
• Giá trị trung bình (mean) của chuỗi ARMA được tính như sau:
µ
E (yt ) =
1 - f1 - f2 -...-fp
• Hàm ACF của tiến trình ARMA sẽ thể hiện sự kết hợp mô hình AR và
phần của mô hình MA, tuy nhiên cho lags > q, hàm ACF sẽ giống như mô
hình AR(p) riêng biệt.
6
d. Tiến trình ARMA
Thay đổi của hàm ACF và PACF ứng với tiến trình AR và MA
Tiến trình tự tương quan – AR (autoregressive process) có các thuộc tính sau:
• Đồ thị ACF có các hệ số thoái hóa dần
• Số lượng các thanh bị “nhô lên” vượt mức ý nghĩa (spikes) của PACF =
AR order
Tiến trình bình quân trượt - MA (moving average process) có các đặc tính sau:
• Số lượng các thanh nhô lên vượt mức ý nghĩa (spikes) của ACF = MA
order
• Đồ thị PACF có các hệ số thoái hóa dần
ACF PACF
AR(p) Đuôi thoái hóa dần theo cấp số nhân Đuôi bị triệt tiêu ngay sau độ trễ p
hoặc theo hình lượn sóng
MA(q) Đuôi bị triệt tiêu ngay sau độ trễ q Đuôi thoái hóa dần theo cấp số nhân
hoặc theo hình lượn sóng
ARMA(p,q) Đuôi thoái hóa dần ngay sau độ trễ (q-p) Đuôi thoái hóa dần ngay sau độ trễ (p-q)
6
d. Tiến trình ARMA
0.05
0
1 2 3 4 5 6 7 8 9 10
-0.05
-0.1
-0.15
acf and pacf
-0.2
-0.25
-0.3
acf
-0.35 pacf
-0.4
-0.45
Lag
6
d. Tiến trình ARMA
ACF và PACF cho mô hình MA(2):
yt = 0.5ut-1 - 0.25ut-2 + ut
0.3 acf
pacf
0.2
0.1
acf and pacf
0
1 2 3 4 5
-0.1
-0.2
-0.3
-0.4
Lags
6
d. Tiến trình ARMA
0.9
acf
pacf
0.8
0.7
0.6
acf and pacf
0.5
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10
-0.1
Lags
6
d. Tiến trình ARMA
0.6
0.5
acf
pacf
0.4
acf and pacf
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10
-0.1
Lags
6
d. Tiến trình ARMA
ACF và PACF cho mô hình AR(1) thoái hóa nhanh với hệ số âm:
yt = -0.5yt-1 + ut
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10
acf and pacf
-0.1
-0.2
-0.3
-0.4 acf
-0.5
pacf
-0.6
Lags
6
d. Tiến trình ARMA
0.9 acf
pacf
0.8
0.7
0.6
acf and pacf
0.5
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10
Lags
6
d. Tiến trình ARMA
0.6
acf
pacf
0.4
acf and pacf
0.2
0
1 2 3 4 5 6 7 8 9 10
-0.2
-0.4
Lags
7
d. Tiến trình ARMA
• Box và Jenkins (1970) đưa ra phương pháp ước lượng hệ thống dành cho
mô hình ARMA. Phương pháp tiếp cận này có 3 bước như sau:
1. Identification (nhận diện mô hình)
2. Estimation (ước lượng)
3. Model diagnostic checking (kiểm tra chẩn đoán mô hình)
Bước 1:
- Xác định bậc p, q cho mô hình ARMA(p,q).
- Sử dụng đồ thị ACF và PACF
7
d. Tiến trình ARMA
Bước 3:
- Kiểm tra chẩn đoán mô hình
7
qBox-Jenkins yêu cầu dữ liệu với ít nhất từ 40 cho đến 50 kỳ quan sát bằng nhau.
qDữ liệu cũng phải khắc phục các quan sát có giá trị ngoại biên hay các dữ liệu bị
mất.
q Dữ liệu cũng cần phải được xử lý đảm bảo tính ổn định bằng cách lấy log hay
nghịch đảo. Vũ Việt Quảng – Khoa Tài Chính – ĐHKT TPHCM 737
Box-Jenkins yêu cầu dữ liệu
với ít nhất từ 40 cho đến 50
kỳ quan sát bằng nhau.
7
d. Tiến trình ARMA
Một số phương pháp phát triển gần đây đối với mô hình ARMA
• Mục tiêu bây giờ là lựa chọn số lượng các thông số hồi quy sao
cho tối thiểu hóa các “chỉ tiêu” giúp lựa chọn mô hình
(Information Criterion).
7
d. Tiến trình ARMA
Phương pháp sử dụng “nội dung thông tin” để giúp lựa chọn mô hình
• Nội dung thông tin giúp lựa chọn mô hình thay đổi tùy thuộc vào mức độ
trừng phạt khi một thông số không có liên quan được đưa thêm vào mô
hình.
• Có 3 chỉ tiêu phổ biến được sử dụng là:
Akaike’s (1974) information criterion (AIC), Schwarz’s (1978) Bayesian
information criterion (SBIC), and the Hannan-Quinn criterion (HQIC).
AIC = ln(s 2
) + 2k / T
k
SBIC = ln(sˆ 2 ) + ln T
T
2k
HQIC = ln(sˆ 2 ) + ln(ln(T ))
T
với k = p + q + 1, T = kích cỡ mẫu. Vì vậy chỉ tiêu SBIC sẽ trừng phạt nghiêm
khắc hơn chỉ tiêu AIC.
• Chỉ tiêu IC nào phù hợp hơn nếu các mô hình khác nhau về độ trễ?
– SBIC là có tính nhất quán nhất nhưng không hiệu quả (inefficient).
– AIC không nhất quán (consistent), và có khuynh hướng lựa chọn mô
hình “lớn hơn”.
7
d. Tiến trình ARMA - Ví dụ trong tài chính
7
d. Tiến trình ARMA - Ví dụ trong tài chính
7
e. Tiến trình ARIMA
• Mô hình ARIMA khác biệt với mô hình ARMA do sử dụng khái niệm
“liên kết – itegrated”. I là từ viết tắt của “integrated”.
• Tiến trình tự hồi quy được liên kết (integrated autoregressive process)
là một tiến trình có nghiệm đặc trưng nằm bên trong vòng tròn đơn vị.
• Khi cần thiết chúng ta sẽ lấy sai phân (difference) đối với các biến và
xây dựng mô hình ARMA trên những biến đã được lấy sai phân này.
• Và như vậy mô hình ARMA(p,q) được xây dựng trên những biến đã
được lấy sai phân d lần sẽ được gọi là mô hình ARIMA(p,d,q).
7
e. Tiến trình ARIMA
• Đây là một phương pháp giúp mô hình hóa và dự báo đối với chuỗi thời gian.
• Trong phương pháp này chúng ta kỳ vọng quan sát gần nhất sẽ có mức độ
ảnh hưởng lớn nhất đối với kết quả dự báo trong tương lai. Do vậy chúng ta
sẽ sử dụng trọng số khác nhau như thế nào cho các quan sát trước đó?
8
e. Tiến trình ARIMA
• Với T lần thay thế liên tiếp ta có được kết quả như sau:
æ T ö
St = ç åa (1-a) yt -i ÷ + (1-a) S0
i T
è i =0 ø
vì a³0, nên tác động từ mỗi quan sát trong quá khứ sẽ giảm dần theo cấp
số nhân khi độ trễ của quan sát tăng dần.
• Các giá trị dự báo được thiết lập bởi phương trình:
ft+s = St với s = 1, 2, 3....
cho tất cả các giá trị tầm xa dự báo trong tương lai s = 1, 2, ...
• Kỹ thuật này được gọi là “mềm hóa dự báo đơn giản sử dụng trọng số theo
cấp số nhân) (simple exponential smoothing).
8
e. Tiến trình ARIMA
Mô hình mềm hóa dự báo sử dụng trọng số theo cấp số nhân
(Exponential Smoothing) (cont’d)
• Mô hình này không phát huy tác dụng nhiều đối với dữ liệu tài chính vì
những lý do sau:
– Không có nhiều “cấu trúc” trong dữ liệu để từ đó cần phải “mềm hóa”
– Mền hóa không áp dụng cho dữ liệu chuỗi thời gian có tính thay đổi theo
chu kỳ ngắn trong năm (seasonality).
– Phương pháp mềm hóa cũng chính là mô hình ARIMA(0,1,1) với hệ số
MA là (1-a) - (xem Granger & Newbold, p174)
– Giá trị dự báo không hội tụ về giá trị trung bình trong dài hạn khi s®¥
• Chúng ta có thể sửa đổi mô hình Single Exponential Smoothing bằng cách:
– Cho phép tác động từ thay đổi theo xu hướng (Holt’s method)
– Hoặc cho phép tác động từ thay đổi theo chu kỳ trong năm- seasonality
(Winter’s method).
8
Đồ thị ACF cho thấy hiện tượng tự tương quan (autocorrelations) có ý nghĩa
thống kê cho một loạt các giá trị độ trễ lags. Tuy nhiên đồ thị PACF xác nhận
rằng hiện tượng tự tương quan từ lags 2 trở lên chỉ đơn thuần là do sự phát tán
“tự tượng quan” của giá trị độ trễ 1
8
Sau khi sử dụng “Nonseasonal difference”, ví dụ hồi quy mô hình
ARIMA(0,1,0) với hằng số , đồ thị ACF có dạng sau:
8
Sau khi sử dụng “Nonseasonal difference”, ví dụ hồi quy mô hình
ARIMA(0,1,0) với hằng số , đồ thị PACF có dạng sau:
8
Lưu ý rằng: (a) Tự tương quan ở Lag1 có ý nghĩa thống kê và dương; (b) PACF chỉ có 2
thanh nhô lên và có ý nghĩa thống kê, trong khi đó ACF có 4 thanh có ý nghĩa. Do vậy
“differenced series” thể hiện dấu hiệu AR(2). Do vậy chúng ta thiết lập bổ sung mô
hình AR(2), ví dụ ARIMA(2,1,0) chúng ta có đồ thị ACF và PACF cho các phần dư như
sau:
8
Hiện tượng tự tương quan ở 2 giá trị lags quan trọng: Lags 1 và 2 đã bị loại bỏ hoàn
toàn, và do vậy không còn hiện tượng tự tương quan nào ở cấp độ Lags cao hơn:
8
9
ARIMA có thể hồi quy cho cả hai loại mô hình:
Standard ARIMA models. Ví dụ ARIMA(1, 1,1):
Phương trình (1a) và (1b) là như nhau. Và điều này cũng đúng
cho mô hình ARIMA (p, d, q) tổng quát.
9
1.4 Dự báo trong kinh tế lượng
(Forecasting in Econometrics)
• Dự báo (Forecasting) = Tiên đoán (prediction)
• Dự báo cũng là một dạng kiểm định tính “đầy đủ hay phù hợp”
(adequacy) của mô hình, ví dụ:
- Dự báo TSSL trong tương lai của một cổ phiếu nào đó
- Dự báo giá cả bất động sản với các đặc điểm cho trước
- Dự báo mức độ rủi ro của một danh mục đầu tư cho những năm sắp
tới
- Dự báo tính bất ổn (volatility) trong TSSL của trái phiếu
• Chúng ta có thể phân biệt 2 phương pháp tiếp cận trong dự báo:
- Dự báo theo cấu trúc (Econometric or structural forecasting )
- Dự báo theo chuỗi thời gian (Time series forecasting)
• Tuy nhiên đôi khi rất khó phân loại 2 cách dự báo này, ví dụ VARs.
9
a. Dự báo trong phạm vi mẫu (In-Sample forercast) so với
dự báo ngoài phạm vi mẫu (Out-of-Sample forercast)
• Chúng ta mong đợi kết quả dự báo của mô hình phải tốt trong phạm vi mẫu
(in-sample).
• A good test of the model since we have not used the information from
1999M1 onwards when we estimated the model parameters.
9
b. Dự báo như thế nào?
• Để có thể hiểu được phương pháp dự báo chúng ta cần phải hiểu
khái niệm kỳ vọng có điều kiện (conditional expectations):
E(yt+1 | Wt )
• Chúng ta không thể dự báo cho dữ liệu tuân theo tiến trình “nhiễu
trắng” (a white noise process): E(ut+s | Wt ) = 0 " s > 0.
y 949
c. Các mô hình dự báo
= !!
9
c. Các mô hình dự báo (cont’d)
9
d. Dự báo với mô hình ARMA (cont)
9
d. Dự báo với mô hình ARMA (cont’d)
ft, 4 = E(yt+4 | t ) = µ
9
e. Dự báo với mô hình AR
1
e. Dự báo với mô hình AR (cont’d)
1
f. Làm sao chúng ta có thể kiểm định xem kết quả dự
báo có tốt hay không?
•Ví dụ, chúng ta dự báo rằng TTSL ngày mai của FTSE sẽ là 0.2, nhưng kết quả
thực tế xảy ra là -0.4. Vậy kết quả này có chính xác hay không?
•Định nghĩa ft,s là giá trị dự báo thực hiện ở thời điểm t cho s kỳ trong tương lai
(ví dụ dự báo cho thời điểm t+s), và yt+s là giá trị thực tế xảy ra của y tại thời điểm
t+s.
• Có một vài chỉ tiêu phổ biến giúp đánh giá kết quả dự báo của chuỗi thời gian
như sau: 1 N
MSE =
N
å ( yt+s - ft ,s )
2
t=1
N
MAE là (Mean Absolute Error) : MAE = 1 å yt +s - f t,s
N t=1
N
1 yt+s - ft,s
MAPE là “Mean absolute percentage error” MAPE=100´ å
N t =1 yt+s 1021
f. Làm sao chúng ta có thể kiểm định xem kết quả dự báo
có tốt hay không? (cont’d)
𝒚𝒕+𝒔− 𝒇𝒕,𝒔 𝟐
𝑻
𝒕= 𝑻 𝟏 𝒚𝒕+𝒔
𝑼=
𝒚𝒕+𝒔− 𝒇𝒃𝒕,𝒔 𝟐
𝑻
𝒕= 𝑻 𝟏 𝒚𝒕+𝒔
1
f. Làm sao chúng ta có thể kiểm định xem kết quả dự báo
có tốt hay không? (cont’d)
1
g. Những nhân tố nào thực sự có ảnh hưởng đến chất
lượng của mô hình dự báo?
• “signal” vs “noise”
1
Các hạn chế của công tác dự báo: trường hợp nào là có
thể dự báo và trường hợp nào là không thể dự báo?
• Các thang đo đánh giá mang tính thống kê (Statistical evaluation
metrics) có thể không phù hợp.
• Tất cả các mô hình dự báo thống kê là đều mang đậm tính chất “nội
suy” (extrapolative)
• Các mô hình dự báo đều có khuynh hướng trượt theo điểm gãy cấu
trúc trước đó. are prone to break down around turning points
• Các chuỗi thời gian có điểm gãy cấu trúc hay cơ chế thay đổi
(structural changes or regime shifts) thì không thể dự báo.
• Mức độ chính xác của dự báo thường giảm dần khi tầm xa của dự báo
gia tăng.
• Dự báo không thể thay thế cho công việc “tiên đoán dựa vào định tính”
(jugdments) 1
Trở lại với câu hỏi cơ bản nhưng cũng quan trọng nhất: tại sao
chúng ta cần dự báo?
• Tại sao chúng ta lại không sử dụng các “chuyên gia” để thực hiện dự báo
theo định tính “(judgemental forecasts)?
• Dự báo theo định tính có các nhược điểm sau:
Các nhà tâm lý học đã chỉ ra rằng Dự báo theo định tính thường có
khuynh hương thiên lệch sau:
– Quá tự tin (over-confidence)
– Không nhất quá (inconsistency)
– Dựa quá nhiều vào những thông tin gần nhất (recency)
– Neo quá chặt vào một điểm mốc nào đó (anchoring)
– Ảo tưởng (illusory patterns)
– Nghĩ theo số đông “group-think”.
• Phương pháp tiếp cận tối ưu phổ biến (The Usually Optimal Approach)
Sử dụng các mô hình dự báo mang tính thống kê và những mô hình này
được xây dựng dựa vào các nền tảng lý thuyết tài chính vững chắc, bổ
sung thêm bằng các đánh giá tiên đoán theo cảm tính của các chuyên gia.
Và sau đó tập hợp tất cả lại và thông đạt kết quả. 1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
• Forecast name. khai báo “series name” hoặc sử dụng tên mặc định bởi EViews
•S.E. (optional). Nếu muốn lưu lại giá trị forecast standard errors, khai báo tên của
chuỗi dữ liệu forecast S.Es này.
• GARCH (optional). Chỉ sử dụng cho mô hình dự báo bởi ARCH.
• Forecasting method.
•Dynamic sẽ tính toán multi-step forecasts bắt đầu từ kỳ đầu tiên của “forecast
sample”. Chỉ áp dụng khi phương trình dự báo có biến trễ của biến độc lập như AR hay
ARMA.
• Static sử dụng giá trị thực tế thay vì giá trị dự báo để tính toán một chuỗi các giá trị
one-step ahead forecasts,
•Coef uncertainty in S.E. calc: trong quá trình tính toán “forecast standard Errors”
Eviews sẽ bỏ qua tính toán Coefficient uncertainty nếu bỏ lựa chọn này.
•Structural khi phương trình có cấu trúc ARMA, thì cả 2 phương pháp dynamic và
static đều tiến hành dự báo có sử dụng phần dư (residuals). Khi chọn Structural,
Eviews sẽ bỏ qua giá trị “forecasted residuals” và thực hiện dự báo chỉ sử dụng phần
cấu trúc của phương trình ARMA
• Sample range. Khai báo để EViews thực hiện “out-of-sample forecasts”.
•Output. Chọn kết quả của dự báo là đồ thị (graph) hay bằng số (numerical forecast
evaluation)
•Insert actuals for out-of-sample observations. Chọn ô này nếu muốn quan sát khác
biệt giữa giá trị dự báo và giá trị thực tế. Trong một số trường hợp vẫn phải sử dụng
Menu để xem sự khác biệt bằng đồ thị: Open as Group\View\Graph....
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
1
Thực hành dự báo ARMA trên EVIEWS 7.2
Dynamic forecast
Static forecast
1
Thực hành ARIMA(1,1, 1) trên STATA - Ví dụ 1:
use "D:\UEH\ECONOMETRICS TEACHING\PART 2\ARIMA\Presentations\wpi1.dta", clear
. twoway (tsline ln_wpi)
1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA
1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA
Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics > Time-series graphs > Correlogram (ac)....
1
Ví dụ 1: Thực hành ARIMA(1,1, 1) trên STATA
1
Ví dụ 2: mô hình ARIMA với hiệu ứng mùa vụ - STATA
Vẽ đồ thị kết quả ước lượng mô hình ARMA sử dụng “log-differenced series”
1
Ví dụ 2: mô hình ARIMA với hiệu ứng mùa vụ - STATA
• ac D.ln_wpi, ylabels(-.4(.2).6)
• pac D.ln_wpi, ylabels(-.4(.2).6)
Bên cạnh mô hình AR, MA(1) và MA(4) cũng được sử dụng bổ sung
cho hiệu ứng mùa vụ theo quý (remaining quarterly effect).
1
Ví dụ 2: mô hình ARIMA bổ sung hiệu ứng mùa vụ - STATA
1
Ví dụ 3: mô hình SARIMA (seasonal ARIMA model) -STATA
use "d:\ueh\econometrics teaching\part 2\arima\presentations\air2.dta", clear
generate lnair = ln(air)
ac lnair
pac lnair
1
Ví dụ 3: mô hình SARIMA (seasonal ARIMA model)- STATA
arima lnair, arima(0,1,1) sarima(0,1,1,12) noconstant
arima DS12.lnair, ma(1) mma(1, 12) noconstant
Tùy chọn mar() và mma() có thể được lặp lại để kiểm soát các mẫu hình mùa vụ khác
nhau trong cùng 1 chuỗi thời gian, ví dụ:
arima DS4S12.sales, ar(1) mar(1, 4) mar(1, 12) ma(1) mma(1, 4) mma(1, 12)
1
Ví dụ 4: mô hình ARMAX models - STATA
Bên cạnh mô hình Arima, ta có thể sử dụng mô hình ARMAX mà theo đó mô hình
biến phụ thuộc là sự kết hợp các mối quan hệ tuyến tính của các biến độc lập, cũng
như các phần dư của mô hình.
1
Ví dụ 4: mô hình ARMAX models - STATA
1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA
•xb, chế độ mặc định, STATA sẽ tính toán giá trị dự báo cho biến phụ thuộc
hiện hành trong phương trình hồi quy (difference)
• y tính toán giá trị dự báo cho biến phụ thuộc gốc (level).
• stdp tính toán “standard error” của giá trị dự báo tuyến tính “xb”.
• mse tính toán giá trị MSE của giá trị dự báo.
• residuals tính toán giá trị phần dư.
• yresiduals tính toán giá trị phần dư theo biến phụ thuộc gốc
1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA
predict xb, xb
predict y, y
predict yr, yresiduals
Khi thực hiện dự báo, nếu muốn bỏ qua giá trị dự báo của phần dư
và chỉ sử dụng phần “cấu trúc” trong phương trình ARMA, chúng ta
sẽ sử dụng tùy chọn “structural” như sau:
và
1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting)
1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA
1
Ví dụ 5: dự báo bằng mô hình ARIMA (Dynamic forecasting) -
STATA
1
Ví dụ 5: dự báo bằng mô hình ARIMA – Dynamic forecast - STATA
. tsset time
. tsappend,add(8)
. arima consump L(1/4).consump
. predict double consumphat if tin(1970q1,), dynamic(tq(1998q1))y
1
Ví dụ 5: dự báo bằng mô hình ARIMA – Static forecast - STATA
Cú pháp
. use "d:\ueh\econometrics teaching\part 2\arima\presentations\usmacro1.dta", clear
. arima cpi, arima(1, 1, 1) nolog
1
Ví dụ 5: dự báo bằng mô hình ARIMA - Sử dụng biến sai phân
Cú pháp
. arima D.cpi, ar(1 4) nolog
. estimates store e42a
1
Ví dụ 5: dự báo bằng mô hình ARIMA – Static forecast - STATA
Vẽ đồ thị
. Predict dcpihat, xb
. twoway (tsline dcpihat)
Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics > Time-series Graphs > Line Plots....
1
Ví dụ 5: dự báo bằng mô hình ARIMA – vẽ đồ thị kết quả dự
báo của biến gốc và phần dư- STATA
. estimates restore e42a
. predict double cpihat, y (giá trị dự báo cho biến CPI)
. predict double cpieps, yresiduals (giá trị dự báo cho phần dư biến CPI)
. tw (tsline cpieps, yaxis(2)) (tsline cpihat), ti("ARIMA(1,1,1) model of US CPI")
scheme(s2 mono)
1
Ví dụ 5: dự báo bằng mô hình ARMAX - STATA
Ước lượng ARMAX model
. arima d.cpi d.oilprice if tin(, 2008q4), ar(1) ma(1) nolog
1
Ví dụ 5: dự báo bằng mô hình ARIMA – so sánh Static và
Dynamic forecasts - STATA
Static (one-period-ahead) từ 2006q1 đến 2008q4
Dynamic (multi-period-ahead) ex ante Forecasts từ 2009q1 đến 2010q3.
Cú pháp
. predict double cpihat_s if tin(2006q1,), y
. label var cpihat_s "static forecast"
. predict double cpihat_d if tin(2006q1,), dynamic(tq(2008q4)) y
. label var cpihat_d "dynamic forecast”
Vẽ đồ thị
. twoway (tsline cpihat_s if tin(2006q1,)) (tsline cpihat_d if tin(2005q1,))
(tsline cpi if tin(2006q1,))
Hoặc sử dụng tùy chọn khai báo trên MENU như sau:
Graphics\Time-series Graphs\Line Plots....
1
Ví dụ 5: dự báo bằng mô hình ARIMA – Dynamic forecast