Phần 2

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 17

Phần 2: Thu thập dữ liệu VNI index trong vòng 52 tuần, xây dựng mô hình ARIMA (p, d, q)

theo tiến trình Box-Jenkin và thực hiện dự báo.


1. Giới thiệu
Thị trường chứng khoán nói chung và thị trường Việt Nam nói riêng luôn là nơi thu hút hàng
trăm, hàng nghìn các cá nhân đầu tư mạo hiểm, các tổ chức chuyên nghiệp lớn nhỏ trên toàn
quốc mua bán các loại chứng khoán (cổ phiếu) được niêm yết trên sàn giao dịch với mục đích
tối đa hóa lợi nhuận và thâu tóm quyền lực. Tuy nhiên, đi kèm với mức tỷ suất lợi tức hấp dẫn,
sự biến động thất thường của giá chứng khoán trong các giao dịch theo thời gian luôn là những
rủi ro tiềm ẩn đối với những cá thể hoạt động trong lĩnh vực này. Thực tế, không phải nhà đầu
tư nào cũng dự đoán được đường đi của giá cả trong tương lai, thậm chí họ có thể đối mặt với
nguy cơ vỡ nợ nếu mắc một sai lầm không không thể lường trước. Bởi lẽ, việc dự đoán trước
những biến động của chỉ số chứng khoán luôn là một đề tài sốt dẻo được nhiều nhà thực
nghiệm và nhà đầu tư quan tâm xuyên suốt hai thập kỉ vừa qua.
Quyết định đầu tư vào bất kỳ loại chứng khoán nào, nhà hoạch định cũng phải cân nhắc đồng
thời lợi ích và rủi ro phát sinh. Quá trình kiểm soát vận hành nền kinh tế, sự suy giảm trong các
yếu tố vĩ mô hoặc những dự đoán không mong đợi đến từ các chính sách của doanh nghiệp có
thể tác động tích cực hoặc tiêu cực lên giá cả chung của chứng khoán được niêm yết. Vì vậy, ở
bài nghiên cứu này, chúng ta sẽ đặt ra những giả thuyết và thống kê mức chỉ số chứng khoán từ
những giá trị tiệm cận trong quá khứ, để dự báo xu hướng tăng giảm nhằm cung cấp một góc
nhìn đa chiều, cung cấp chiến lược mua đi bán lại các chứng khoán tương đối an toàn đối với
cá nhân, doanh nghiệp quyết định đầu tư lâu dài.
2. Tổng quan
2.1. Dữ liệu và phạm vi nghiên cứu
Tại Việt Nam, chỉ số VNIndex đại diện cho tất cả các cổ phiếu được niêm yết trên sàn giao
dịch Thành phố Hồ Chí Minh, song giá trị này bị chi phối bởi từng cổ phiếu được sử dụng hàng
ngày trên thị trường. Vậy nên, trong quá trình đó, nếu có sự biến đổi trong giá cổ phiếu, thì chỉ
số VNIndex sẽ linh hoạt điều chỉnh để các doanh nghiệp nhận thức được tình hình biến động
tức thời.
Bài nghiên cứu nhỏ này sẽ thu thập dữ liệu của chỉ số VNIndex trên sàn trong vòng 52 tuần
liên tục (24/04/2022 – 23/04/2023). Nguồn cung cấp dữ liệu được tham khảo từ www.cafef.vn
và www.cophieu68.vn, vậy một chuỗi dữ liệu với 52 quan sát sẽ được hình thành. Bên cạnh đó,
đối với các mô hình hồi quy thông thường khác, dữ liệu có thể được đưa trực tiếp vào mô hình
mà không cần trải qua khâu chuyển đổi dữ liệu. Ngược lại, đối với chuỗi thời gian (timeseries),
chuyển hóa chuỗi dữ liệu là bước ngoặt cần thiết để chọn mô hình hồi quy phù hợp và mang độ
tin cậy cao hơn. Để đảm bảo mô hình phân tích hồi quy là mô hình tuyến tính và không gặp cái
hiện tượng dị tật trong mô hình như đa cộng tuyến hay phương sai thay đổi, lấy logarit của tât
chỉ chỉ số VNIndex trong 52 tuần là một bước bắt buộc để có thể phân tích chuỗi đơn giản và
hiệu quả hơn.
2.2. Các biến số trong mô hình nghiên cứu

Ký hiệu Ý nghĩa

Ln_VNI Hàm logarit của chi số VNIndex


MA Tiến trình bình quân trượt
(Moving Average Process)
AR Tiến trình tự hồi quy
(Autoregressive Process)
PACF Hàm tự tương quan một phần
(Partial Autocorrelation Function)
ACF Hàm tự tương quan
(Autocorrelation Function)
ARIMA Mô hình trung bình trượt kết hợp tự hồi quy
(Autoregressive integrated moving average)
Time – series Dữ liệu chuỗi thời gian

3. Phương pháp nghiên cứu


Trong thời buổi hội nhập quốc tế trong đa dạng lĩnh vực, việc ứng dụng các lý thuyết tiêu
biểu của mô hình chuỗi dữ liệu vào dự báo các đề tài ở thị trường tài chính về lợi suất tài sản
hay các mô mình chứng khoáng vĩ mô cũng như dự đoán những tác nhân tạo làn sóng kinh tế
mới nổi khu vực được áp dụng rộng rãi, điều đó đã mang đến những kết quả thực nghiệm và
thu được lợi ích thực tế vượt trội.
Không thể phủ định những đóng góp quan trọng của các loại phương pháp đánh giá mô hình
chuỗi hiệu quả, việc vận dụng những phương pháp này vào thực tế giúp dự đoán một cách có
cơ sở hơn về xu hướng phát triển thời đại, nhất là công nghệ kĩ thuật số hiện nay. Tuy nhiên,
đặc biệt ở bài thực nghiệm này, dãy chỉ số VNIndex sẽ được dự đoán và được phác họa dưới
hình dạng đồ thị dựa trên sự mô tả của tiến trình trung bình trượt kết hợp với tự hồi quy
(ARIMA) hay còn gọi là phương pháp luận Box Jenkins nhằm nhìn nhận vấn đề về quy mô kinh
tế được khách quan và chính xác hơn. Mô hinh là phối hợp giữa MA và AR, mô hình là kết quả
của quá trình định lượng theo thời gian, cho nên đầu vào của chúng chính là độ trễ của chính nó
và từ những tín hiệu quá khứ của chuỗi được dự báo để dự báo nó. Tương tự, tính chất phân
phối xác xuất ngẫu nhiên sẽ điều chỉnh dự báo của các dãy chỉ số này không thể lường trước
được, nghĩa là có thể chuyển hướng tích cực hoặc tiêu cực rất đột ngột, thay vì hồi quy xác
định yếu tố phụ thuộc và dự đoán được chiều hướng tăng giảm dựa trên tính chất thị trường
như trong dữ liệu bảng.
Hơn nữa, bởi lẽ một số ưu điểm như dễ kiểm soát và dễ tiến hành chạy mô hình, song
ARIMA còn có khả năng cập nhật liên tục số liệu vừa công bố, chỉ tiêu này thật sự có lợi nếu
được gán vào yêu cầu phân tích các tác động và dự đoán các chỉ số vĩ mô. Tất cả những điều ấy
mang đến cho ARIMA một vị thế nhất định trong lĩnh vực nghiên cứu và ngày càng trở nên
thông dụng hơn, nhưng tất cả chỉ có thể được duy trì độ chính xác ngắn hạn bởi vì trên thực tế
dự đoán quá xa thời hạn hiện tại thì kết quả phác họa không còn khả quan và sẽ ảnh hưởng tới
độ tin cậy của mô hình. Ngày nay, mô hình kiểm định chuỗi dữ liệu VNIndex bằng phương
pháp ARIMA chưa được khai thác sâu sắc, vậy nên các bài dự đoán số liệu thành công trong
lĩnh vực này sẽ được trọng dụng rất cao và trở thành công cụ hữu hiệu đối với các doanh
nghiệp sử dụng đầu cơ để sinh lời ở Việt Nam.
4. Các bước nghiên cứu và thảo luận kết quả
4.1. Các bước nghiên cứu
Bước 1: Nhận dạng mô hình thử nghiệm là phân tích mức độ tương quan giữa các quan sát,
tức là nhận dạng 3 thành phần p, d, q của mô hình ARIMA để dự báo bằng biểu đồ, bảng dữ
liệu tương quan, thường là sử dụng biểu đồ ACF và PACF. Đồng thời, phải kiểm định tính dừng
của chuỗi dữ liệu để nhận diện (d). Giả sử, nếu chuỗi dừng ở bậc 0 ký hiệu là I(0) tương tự với
I(1) và I(2) đại diện cho chuỗi dừng ở sai phân bậc 1 và 2. Thực tế, chuỗi thời gian đều là
“không dừng”, cho nên chúng ta phải linh hoạt trong việc chuyển đổi dữ liệu và xử lí chuỗi
dừng để quá trình hồi quy được suôn sẻ và tăng độ tin cậy.
Mô hình ARIMA (p,d,q) tổng quát có dạng:
yt = µ+ ø1 yt-1 + ø2 yt-2 +…+ øp yt-p + ø1 ut-1 + ø2 ut-1 +…+ øq ut
với
yt là chuỗi dừng bậc d của chuỗi ban đầu

 là tham số tự hồi quy.


p là bậc tự hồi qui
q là bậc trung bình trượt
ut là nhiễu trắng (white noise)
Bước 2: Ước lượng mô hình là ước lượng tham số của mô hình và xác định chỉ tiêu AR (p) và
MA (q) tối ưu, nghĩa là ước lượng các thông số của các số hạng tự hồi quy và trung bình trượt
trong mô hình sử dụng Correlogram kết hợp phương pháp nội dung thông tin (Information
Criteria) như AIC, BIC, SC, HQ. Cuối cùng là so sánh các tiêu chí R- squares hiệu chỉnh và các
thông số cho đến khi chọn được mô hình tốt nhất cho dự báo.
Bước 3: Kiểm tra chẩn đoán mô hình khi đã lựa chọn mô hình ARIMA cụ thể, ta sẽ tiến hành
kiểm định các khuyết tật trong mô hình, đặc biệt sẽ kiểm tra hiện tượng tự tương quan và
phương sai thay đổi của phần dư, tính chất White noise để xem lựa chọn mô hình là đã phù hợp
với dữ liệu ở mức chấp nhận được hay không.
Bước 4: Dự báo chỉ số hoàn thành tất cả các bước trên đã tạo ra bước đầu cho việc dự báo
đường đi của mô hình chuỗi dữ liệu trong ngắn hạn. Có thể nói, một trong số các lý do về tính
phổ biến của phương pháp ARIMA là thành công của nó trong dự báo giá trị tương lai một cách
tin cậy và sát xao hơn so với các mô hình truyền thống khác. Ở bước này, xu hướng được vẽ
trong đồ thị phác họa bằng phương pháp Static hoặc Dynamic sẽ thể hiện chiều hướng thay đổi
của lượng chỉ số trong tương lai gần.
4.2. Kết quả và thảo luận
4.2.1. Đồ thị biểu hiện tính dừng

Hình 1.1: Kiểm định tính dừng dữ liệu


Hình 1.2 Kiểm định tính dừng bằng hàm logarit
Bằng lệnh twoway, hình 1 và 2 biểu diễn dữ liệu thông thường và dữ liệu sau khi chuyển đổi
thành logarit của chỉ số VN-Index tại Việt Nam. Việc sử dụng hàm log trong quy trình mô tả đồ
thị biểu hiện sự thay đổi giá trị một cách tương đối thay vì sự biến đổi tuyệt đối của dãy dữ liệu
gốc. Nhìn chung, chuyển đổi dữ liệu sẽ giúp cho dữ liệu trở nên đơn giản hơn và khắc phục
được nhiều yếu tố phát sinh.
Ở đồ thị này cho thấy chuỗi VN-Index là không dừng ở cả hình 1 và 2, vì dữ liệu biến thiên
đáng kể và có xu hướng di chuyển ngẫu nhiên (ở đây là đi lên) thay vì trở về và dao động xung
quanh giá trị trung bình. Điều này cho thấy cả giá trị trung bình và phương sai của chuỗi tỷ giá
thay đổi theo thời gian. Một chuỗi thời gian được cho là dừng nếu trung bình và phương sai của
nó là không đổi qua thời gian, tất nhiên nếu phân tích một chuỗi không dừng có thể dẫn đến
trường hồi quy giả mạo, dẫn đến một R-squares cao và hệ số hồi quy trong mô hình trở nên vô
nghĩa về mặt thống kê, vậy nên về cơ bản chúng ta phải biến đổi và làm cho dữ liệu chuỗi là
dừng và đáng tin cậy.
4.2.2. Kiểm định tính dừng và sai phân (d) bằng thuật toán của Dickey-Fuller và
Phillips – Perron
1. Kiểm định tính dừng cho dữ liệu gốc
Dickey - Fuller test for unit root Number of obs = 52

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical v
Z(t) -2.284 -4.146 -3.498 -3.179
MacKinnon approximate p-value for Z(t) = 0.4426

D.c Coef. Std. Err. t P>t [95% Conf. Interval]


c
L1. -.1772517 .0775918 -2.28 0.027 -.3331782 -.0213252
_trend -.6283617 .5563005 -1.13 0.264 -1.746289 .4895659
_cons 210.5668 99.58905 2.11 0.040 10.43511 410.6985

Bảng 2.1. Kiểm định tính dừng bằng thuật toán dfuller
Thông qua dữ liệu phân tích từ hai bảng 2.2.1, bởi vì giá trị tuyệt đối của Test Statistic nhỏ
hơn tất cả các giá trị tuyệt đối của thông số ứng với các mức ý nghĩa 1%,5% và 10%, nên ta kết
luận đây là chuỗi chưa dừng.

Dickey - Fuller test for unit root Number of obs = 51

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical v
Z(t) -6.593 -3.579 -2.929 -2.600
MacKinnon approximate p-value for Z(t) = 0.4426

D2.c Coef. Std. Err. t P>t [95% Conf.


c
LD. -.9343785 .1417149 -6.59 0.000 -1.219165 -.6495916

_cons -5.15482 5.687313 -0.91 0.369 -16.5839 6.274262

Bảng 2.2. Kiểm định tính dừng bằng dfuller đối với sai phân bậc 1
Phillips-Perron test for unit root Number of obs = 51
Newey-West lags = 3

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical
Z(rho) -46.308 -25.734 -19.818 -16.814
Z(t) -6.587 -4.148 -3.499 -3.179
MacKinnon approximate p-value for Z(t) = 0.0000

D.c Coef. Std. Err. t P>t [95% Conf. Interval]


c
L1. .0515722 .1436522 0.36 0.721 -.23726 .3404043
_trend .2849076 .3867236 0.74 0.465 -.4926523 1.062468
_cons -12.65164 11.67046 -1.08 0.284 -36.11668 10.81339

Bảng 2.3. Kiểm định tính dừng bằng pperron đối với sai phân bậc 1
Bằng cả hai kiểm định của Dickey- Fuller và Phillips – Perron, hệ số thống kê Test Statistic
có giá trị tuyệt đối lớn hơn tất cả các giá trị tuyệt đối của thông số ứng với các mức ý nghĩa
1%,5% và 10%, nên ta kết luận đây là chuỗi đã dừng. Ở đây t-sta = -6.593 đối với thuật toán
dfuller và đối với pperron cũng tương tự.

2. Kiểm định tính dừng cho dữ liệu chuyển đổi thành logarit

Dickey - Fuller test for unit root Number of obs = 52

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical v
Z(t) -2.189 -4.146 -3.498 -3.179
MacKinnon approximate p-value for Z(t) = 0.4426

D.ln_c Coef. Std. Err. t P>t [95% Conf. Interval]


ln_c
L1. -.1691552 .0772817 -2.19 0.033 -.3244587 -.0138518
_trend -.0005303 .0004852 -1.09 0.280 -.0015053 .0004447
_cons 1.19713 .5528153 2.17 0.035 .0862065 2.308055

Bảng 2.4. Kiểm định tính dừng bằng dfuller dữ liệu logarit
Tương tự với dữ liệu logarit, xác định chuỗi VNIndex dù đã chuyển đổi thành logarit nhưng
chuỗi ban đầu vẫn chưa dừng.

Dickey - Fuller test for unit root Number of obs = 51

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical v
Z(t) -6.727 -3.579 -2.929 -2.600
MacKinnon approximate p-value for Z(t) = 0.0000

D.ln_c Coef. Std. Err. t P>t [95% Conf. Interval]


ln_c
LD. -.9564345 .1421763 -6.73 0.000 -1.242148 -.6707206
_cons -.0044847 .0050096 -0.90 0.375 -.0145519 .0055826

Bảng 2.5. Kiểm định tính dừng bằng dfuller dữ liệu logarit đối với sai phân bậc 1

Phillips-Perron test for unit root Number of obs = 51


Newey-West lags = 3

__________________________________Interpolated Dickey-Fuller ___________________


Test Statistic 1% Critical value 5% Critical value 10% Critical
Z(rho) -48.013 -25.734 -19.818 -16.814
Z(t) -6.720 -4.148 -3.499 -3.179
MacKinnon approximate p-value for Z(t) = 0.0000

D.ln_c Coef. Std. Err. t P>t [95% Conf. Interval]


D.ln_c
L1. .0314077 .1439613 0.22 0.828 -.2580458 .3208613
_trend .0002393 .0003407 0.70 0.486 -.0004457 .0009243
_cons -.010771 .0102691 -1.05 0.299 -.0314184 .0098763
Bảng 2.6. Kiểm định tính dừng bằng pperron dữ liệu logarit đối với sai phân bậc 1
Và tương tự với chuỗi gốc, hàm logarit của chỉ số VNIndex có trung bình và phương sai
không thay đổi theo thời gian khi và chỉ khi tính toán trên sai phân bậc 1. Vậy nói chung, ở cả
hai chuỗi dữ liệu thô sơ ban đầu và dữ liệu sau khi chuyển đổi, tính dừng có thể tồn tại nếu
chúng ta tính toán dựa trên độ trễ bằng 1, nên kết luận d = 1.
4.2.3. Xác định hệ số tương quan và thông số (p, q) bằng ACF và PACF

Bảng 3.1. Giản đồ tương quan của sai phân bậc 1 của chuỗi dữ liệu

Dựa trên giản đồ tương quan đã lấy sai phân, thông qua 24 độ trễ của mô hình, đối với hàm
PACF cho ra kết quả có 4 hoặc 5 độ trễ có ý nghĩa thống kê tại mức ý nghĩa 5%, vậy nên p = 4
hoặc p = 5. Tương tự, giá trị của q xác định dựa trên hàm ACF, giá trị của q chỉ có thể là = 4.
4.2.4. Hồi quy mô hình bằng phương pháp ARIMA và kiểm định phần dư
- Mô hình ARIMA (4;1;4) kết hợp phương pháp nội dung thông tin
Log likelihood = -259.4801
OPG
D.c Coef. Std. Err. z P>z [95% Conf. Interval]
c
_cons -5.702473 2.870132 -1.99 0.047 -11.32783 -.0771166
ARMA
ar
L1. .0593791 .2134093 0.28 0.781 -.3588955 .4776537
L2. -.0820024 .2355719 -0.35 0.728 -.5437148 .3797101
L3. -.0083583 .314805 -0.03 0.979 -.6253649 .6086482
L4. .4311861 .224793 1.92 0.055 -.0094001 .8717722

ma
L1. .0717191 . . . . .
L2. -.0167996 .9862326 -0.02 0.986 -1.94978 1.916181
L3. -.071718 .2825903 -0.25 0.800 -.6255847 .4821488
L4. -.9831973 .2291751 -4.29 0.000 -1.432372 -.5340225
/sigma 33.35971 . . . . .

Phương pháp nội dung thông tin (AIC, BIC):


Models Obs ll(null) ll(model) df AIC BIC
. 52 . -259.4801 8 534.9602 550.5702

Bảng 4.1. Bảng dự đoán bằng mô hình ARIMA (4, 1, 4)

- Mô hình ARIMA (5;1;4) kết hợp phương pháp nội dung thông tin
Log likelihood = -259.1231
OPG
D.c Coef. Std. Err. z P>z [95% Conf. Interval]
c
_cons -6.441308 7.140689 -0.90 0.367 -20.4368 7.554185
ARMA
ar
L1. -.579002 1.360493 -0.43 0.670 -3.245518 2.087514
L2. -.3426844 .499777 -0.69 0.493 -1.322229 .6368605
L3. -.8386435 .4929011 -1.07 0.089 -1.804712 .127425
L4. -.4631566 1.018907 -0.45 0.649 -2.460178 1.533865
L5. .0589939 .4091758 0.14 0.885 -.742976 .8609638
ma
L1. .7360404 2145.984 0.00 1.000 -4205.315 4206.787
L2. .5421306 .9862326 0.00 0.999 -1156.032 1157.116
L3. 1.133783 .2825903 0.00 1.000 -3940.232 3942.5
L4. .3276865 .2291751 0.00 1.000 -1514.972 1515.628
/sigma 32.92347 38820.32 0.00 0.500 0 76119.35

Phương pháp nội dung thông tin (AIC, BIC):


Models Obs ll(null) ll(model) df AIC BIC
. 52 . -259.1231 11 540.2462 561.7099

Bảng 4.2 Bảng dự đoán bằng mô hình ARIMA (5, 1, 4)


Các thông số ở phương pháp nội dung thông tin với Log Likelihood là giá trị hàm logarit ước
lượng giá trị hợp lý tối đa, và AIC là chỉ số Akaike Information Criteria và BIC là chỉ số
Bayesian Information Criteria, cả hai chỉ số đều có chức năng đo lường sai số trong mô hình
tuy nhiên BIC nghiên về theo hướng thống kê suy diễn nhiều hơn.
ARIMA (4;1;4) ARIMA (5;1;4)
AR&MA 2 0
SigmaSQ 33.35971 32.92347
Log likelihood -259.4801 -259.1231
Akaike (AIC) 534.9602 540.2462
Bayesian (BIC) 550.5702 561.7099
Bảng 4.3. Bảng so sánh và lựa chọn mô hình
Đối với việc lựa chọn mô hình tiêu chuẩn phù hợp, ta cần đánh giá khách quan các thông số
Sigma SQ, Log likelihood và trong đó đặc biệt xem xét chỉ tiêu AIC và BIC. Kết quả từ bảng
2.4.3. đã chỉ ra mô hình ARIMA (4,1,4) thỏa mãn điều kiện và thích hợp dùng làm mô hình sự
báo chuỗi trong tương lai, bởi vì cả hai giá trị AIC và BIC đều có số liệu nhỏ hơn ở mô hình
ARIMA (4,1,4)
4.2.5. Kiểm định hiện tượng tự tương quan, phương sai thay đổi và tính chất White
noise của phần dư bằng kiểm định Durbin – Watson và Dickey – Fuller
4.2.5.1. Thống kê mô tả
Variable Obs Mean Std. Dev. Min Max
a 52 -3.124245 36.88733 -136.8805 79.89073
Bảng 5.1.1. Thống kê mô tả chuỗi
Hình 5.1.2. Đồ thị biểu diễn phần dư của mô hình ARIMA (4;1;4)
Đồ thị biểu diễn phần dư có sự chênh lệch lớn, tuy nhiên vẫn theo xu hướng dao động trở về
giá trị trung bình.
4.2.5.2. Kiểm định tự tương quan
Durbin-Watson d-statistic ( ., 52) = 2.064615
Bảng 5.2. Bảng kiểm định hiện tượng tự tương quan
Dùng kiểm định Durbin Watson để đánh giá có sự tồn tại của hiện tượng tự tương quan hay
không.
Giả thiết đặt ra:
H0: Không có hiện tượng tự tương quan
H1: Tồn tại hiện tượng tự tương quan
Bảng 2.5.3 cho thấy p–value = 2.064615 > 5%, vậy không có cơ sở để bác bỏ H0, mô hình
ARIMA trên phần dư không có khuyết tật tự tương quan.
4.2.5.3. Kiểm định tính chất White noise
Portmanteau test for white noise
Portmanteau (Q) statistic = 11.0208
Prob > chi2(24) = 0.9889
Bảng 5.3. Bảng kiểm định tính chất White noise
Xác định giá trị p - value lớn hơn 10% (p = 0.9889) nên phần dư mô hình có tính chất nhiễu
trắng (White noise). Thực tế, White noise đóng vai trò rất quan trọng trong các mô hình dự báo
chỉ số tài chính, kinh tế học bởi vì dựa trên những tính chất ngẫu nhiên từ tác động của White
noiser đã giúp ích rất nhiều cho các nhà thực nghiệm trong việc xây dựng các mô hình toán học
kỹ thuật để ước lượng tham số, xu hướng biến động trong các mô hình dự báo giá chứng khoán,
giá tài sản của các doanh nghiệp trong các vấn đề đầu tư danh mục. Vì vậy, nhiễu trắng cung cấp
thông tin nền tảng và cốt lõi cho hầu hết các mô hình thống kê suy diễn từ các vấn đề thực tiễn
trong khoa học đời sống và xã hội.
4.2.5.4. Kiểm định phương sai thay đổi
Dickey - Fuller test for unit root
Number of obs = 52

D.ln_c Coef. Std. Err. t P>t [95% Conf. Interval]


ln_c
L1. -.1691552 .0772817 -2.19 0.033 -.3244587 -.0138518
_trend -.0005303 .0004852 -1.09 0.280 -.0015053 .0004447
_cons 1.19713 .5528153 2.17 0.035 .0862065 2.308055
Bảng 5.4. Bảng xác định hiện tượng phương sai thay đổi (cons)
Ở kiểm định hiện tượng phương sai thay đổi trong hồi quy dữ liệu chuỗi bị được đánh giá bởi
tác động của hằng số cons. Phần kiểm định tính dừng phía trên về chuỗi logarit dừng ở sai phân
bậc 1, hằng số cons có giá trị p-value = 0.035 < 5%. Vậy, ta kết luận mô hình ổn định không có
phương sai thay đổi.
4.2.5.5. Xác định thông số AR và MA
Eigenvalue Modulus
.01893687 + .8355456i .83576
.01893687 - .8355456i .83576
.7965153 .796515
-.7750099 .77501

Eigenvalue Modulus
-.9999995 .83576
.999999 .83576
-.03585928 + .9909152i .796515
-.03585928 - .9909152i .77501
Bảng 5.5.1. Bảng xác định thông số AR và MA

Hình 5.5.2. Đồ thị xác định thông số AR và MA


Nhìn vào cột Modulus hoặc là đồ thị ARMA:
AR thỏa điều kiện khi nó có tính ổn định, điều kiện là phải nằm trong vòng tròn khi và chỉ khi
có giá trị trong khoảng (0;1) ở Modulus.
MA thỏa điều kiện khi nó có tính khả nghịch khi nó nằm trong vòng tròn và giả trị Modulus
dao động trong khoảng (0;1).
4.2.6. Dự báo và phác thảo đồ thị
Bảng 5.6.1. Đồ thị dự báo chuỗi VNIndex (Dynamic Forecast)

Bảng 5.6.1. Đồ thị dự báo chuỗi VNIndex (Static Forecast)


Một khi mô hình ARIMA được ước lượng, chúng ta có thể dùng hai phương pháp khác nhau
để cùng dự báo, trong đó dự báo tĩnh (static forecast) và dự báo động (dynamic forecast). Có
nhiều điểm khác biệt trong hai loại dự báo, nhưng rõ rệt nhất là kiểu sử dụng biến dự báo, trong
khi dự báo tĩnh cho phép chúng ta sử dụng giá trị hiện tại và các giá trị trễ (lags) của biến dự
báo, nhưng đối với dynamic forecast, sau dự báo cho giai đoạn đầu tiên, chúng ta sử dụng các
giá trị đã được dự báo trước đó để dự báo cho các giai đoạn tiếp theo. Bởi vì lý do trên, dự báo
động không tốt và cũng không chính xác bằng dự báo tĩnh.
Tiến hành thực hiện dự báo của chuỗi VNIndex từ trong vòng 20 tuần kể từ tuần thứ 54 trở
đi, do mô hình chỉ đáng tin cậy trong ngắn hạn nên bài thử nghiệm khuyến khích dự báo trong
tương lai gần để thông tin kết quả sẽ có tính ổn định và an toàn đối với các nhà đầu tư khi có kế
hoạch tham gia thị trường này.
Mô hình dự báo bằng phương pháp Dynamic chỉ ra có một sự sụt giảm trong giá giao dịch
lần cuối ở chỉ số VNIndex tại Việt Nam, ngược lại Static Forecast lại cho ra xu hướng ngược
hoàn toàn với phương pháp Dynamic. Tuy nhiên trong thời gian dự báo trong 20 tuần sẽ có sai
số vì thị trường chứng khoán nội địa chịu tác động mạnh từ một số tác nhân tâm lý của nhà đầu
tư, ví dụ như việc thay đổi về thông tin chính sách nhà nước chẳng hạn. Vì thế, dự báo bằng mô
hình ARIMA chỉ là một bài phỏng đoán dựa trên những giá trị có sẵn trong quá khứ để củng cố
niềm tin cho nhà đầu tư, cung cấp cho họ một góc nhìn đúng đắn và chính xác từ những biến
động đang và sắp xảy ra trên thị trường chứng khoán. Một cách tốt nhất, các nhà đầu tư nên
được khuyến nghị xem xét đồng thời chỉ số dự báo và dựa vào lý thuyết phân tích kỹ thuật để
tối thiểu hóa rủi ro phát sinh khi hoạch định chiến lược đầu tư tại cả ở Việt Nam nói riêng và
quốc tế nói chung.
5. Kết luận

Tài liệu tham khảo:


1. Damodar N. Gujarati, biên dịch Xuân Thành, hiệu đính Cao Hào Thi, “Kinh tế lượng về
chuỗi thời gian Ⅱ: Dự báo với mô hình ARIMA và VAR”, Chương trình Giảng dạy Kinh
tế Fullbright, 3rd ed.
https://fsppm.fulbright.edu.vn/cache/MPP05-522-R4.2V-2013-04-09-14520525.pdf
2. Nguyễn Hồ Diệu Uyên, Nguyễn Thị Thanh Huyền (2014), “Ứng dụng mô hình ARIMA
trong dự báo chỉ số VN-Index”.
https://media.neliti.com/media/publications/448514-the-application-of-arima-model-to-vn-ind-
87c75ae8.pdf
3. Phùng Thanh Bình (2011), “Chương 13: Chuỗi dừng và không dừng”, Gujarati:
Econometrics by example.
https://vi.vnp.edu.vn/wp-content/uploads/securepdfs/2020/01/Gujarati-2011-
Ch%C6%B0%C6%A1ng-13-_-Chu%E1%BB%97i-d%E1%BB%ABng-v%C3%A0-
kh%C3%B4ng-d%E1%BB%ABng.pdf

You might also like