Professional Documents
Culture Documents
Bước 1: Khai báo kiểu dữ liệu
Bước 1: Khai báo kiểu dữ liệu
Bước 1: Khai báo kiểu dữ liệu
Import. Các cột dữ liệu đầu vào được thể hiện như sau: A B C D E F G H, lần lượt đại
diện cho các tên cột trong bảng dữ liệu: NAME, YEAR, DPO, LEV, LIQ, ROE,
LOG_TA_, PE.
Trong dữ liệu đầu vào, stata cho rằng biến NAME là biến dạng chuỗi (string variables),
do đó để đồng nhất dạng của dữ liệu, chúng ta cần thực hiện mã hóa dữ liệu bằng lệnh:
encode NAME,gen(FIRM)
Để Stata có thể xác định được dạng dữ liệu mà chúng ta đang có là dữ liệu bảng, chúng ta
thực hiện lệnh:
Với câu lệnh trên, chúng ta đã giúp Stata hiểu được rằng dữ liệu đầu vào là dữ liệu bảng:
Chúng ta thực hiện việc thông kê mô tả dữ liệu đầu vào qua các giá trị như giá trị trung
bình, độ lệch chuẩn, giá trị nhỏ nhất, giát trị lớn nhất; thực hiện lệnh:
Chúng ta muốn tìm hiểu sự tự tương quan giữa các biến, chúng ta sử dụng lệnh:
Tiếp theo, chúng ta thực hiện việc chạy mô hình OLS, FEM, REM và tìm ra đâu là mô
hình phù hợp.
1. Chạy mô hình
Bước 3: Chạy mô hình OLS, FEM, REM
Sử dụng chương trình Stata13 chạy mô hình với dữ liệu. Ta thực hiện chạy lần lượt ba
mô hình Pooled OLS, Fixed Effects Model, Random Effects Model bằng cách thực hiện
các lệnh:
Kết quả chạy mô hình được thể hiện ở trang tiếp theo.
Chúng ta có hệ số R-squared là 0.0069, Adj R-squared là 0.0052 đều nhỏ hơn 0.05, điều
này cho thấy mô hình Pool OLS là chưa đáng tin cậy. trong khi đó, hệ số F (Prob > F) là
0.0011, nhỏ hơn 0.05, cho thấy mô hình có ý nghĩa thống kê.
Bên cạnh đó, hệ số sig ( P > |t| ) cho thấy duy nhất biến PE là có ý nghĩa đối với mô hình
do hệ số sig nhỏ hơn 5%, các biến còn lại đều lớn hơn 5%.
Tiếp theo là mô hình tác động cố định :
Trong mô hình tác động cố định, ta thấy rằng giá trị R-sq overall là 0.0065 nhỏ hơn 0.5,
giá trị Prob > F là 0.0161 nhỏ hơn 0.05. Đồng thời, giá trị sig. ( P > |t| ) của các biến lev,
liq, roe, logta đều lớn hơn 0.05 ngoại trừ biến PE. Điều này cho thấy mô hình chưa đáng
tin cậy với dữ liệu của chúng ta.
Tiếp theo là mô hình tác động ngẫu nhiên :
Trong mô hình tác động ngẫu nhiên, ta thấy rằng giá trị R-sq overall là 0.0069 nhỏ hơn
0.5, giá trị Prob > chi2 của kiểm định Wald là 0.0011 nhỏ hơn 0.05. Đồng thời, giá trị
sig. ( P > |z| ) của các biến lev, liq, roe, logta đều lớn hơn 0.05 ngoại trừ biến PE. Điều
này cho thấy mô hình chưa đáng tin cậy với dữ liệu của chúng ta.
Sau đó, chúng ta thực hiện lưu ba mô hình trên để có thể lựa chọn mô hình phù hợp sau
đó bằng cách thực hiện lần lượt các lệnh :
Chúng ta thực hiện kiểm định Hausman (Hausman test) để lựa chọn giữa hai mô hình tác
động cố định và tác động ngẫu nhiên. Lệnh như sau :
hausman fe re
Chúng ta được kết quả chạy lệnh như hình dưới đây :
Kết quả chỉ ra rằng, Prob > chi2 = 0.7463, lớn hơn 0.05. Ta có kiểm định sau :
Chúng ta thực hiện lựa chọn giữa mô hình tác động ngẫu nhiên và mô hình hồi quy tuyến
tính bằng cách thực hiện lệnh :
xttest0
Chúng ta được kết quả chạy lệnh như hình dưới đây :
Kết quả cho thấy, Pro > chibar2 = 1.0000, lớn hơn 0.05. Ta có kiểm định sau:
Vậy, chúng ta chọn mô hình hồi quy tuyến tính (OLS) hơn là mô hình tác động ngẫu
nhiên (REM).
Bước 5 : Kiểm tra các khuyết tật của mô hình
Sau khi lựa chọn được mô hình OLS là mô hình phù hợp nhất, ta thực hiện việc kiểm tra
xem liệu mô hình này có những khuyết tật như đa cộng tuyến, phương sai sai số thay đổi,
tự tương quan hay không.
Đầu tiên, chúng ta kiểm tra hiện tượng đa cộng tuyến bằng lệnh :
vif
Ta thấy giá trị Mean VIF là 1.09, nhỏ hơn 10. Do đó, không có hiện tượng đa cộng tuyến
trong mô hình.
Chúng ta kiểm tra liệu có hiện tượng phương sai sai số thay đổi hay không bằng lệnh :
imtest, white
Hình 10 : Kiểm tra hiện tượng phương sai sai số thay đổi
Kết quả chạy kiểm định cho thấy, giá trị Prob > chi2 = 0.0451, nhỏ hơn 0.05. Do đó,
chúng ta chấp nhận H1, điều này đồng nghĩa với việc có hiện tượng phương sai sai số
thay đổi.
Chúng ta kiểm tra liệu mô hình có hiện tượng tự tương quan hay không bằng lệnh :
Kết quả chạy kiểm định cho thấy, giá trị Prob > F = 0.0149, nhỏ hơn 0.05 tức 5%. Do đó,
chúng ta chấp nhận H1, điều này có nghĩa là mô hình của chúng ta có hiện tượng tự tương
quan.
Tóm lại, mô hình hồi quy tuyến tính của chúng ta có hiện tượng tự tương quan và phương
sai sai số thay đổi. Để khắc phục được điều này, chúng ta thực hiện bước tiếp theo.
Để có thể khắc phục được những lỗi trong mô hình, chúng ta thực hiện lệnh :
Dù đã khắc phục lỗi của mô hình, giá trị sig. ( P > |z| ) của các biến lev, liq, roe, logta
đều lớn hơn 0.05 ngoại trừ biến PE.
Sau khi chạy mô hình GLS, ta nhận thấy đây là mô hình phù hợp nhất trong bốn mô hình
chúng ta đã chạy. Dưới đây là bảng so sánh kết quả của bốn mô hình Pool, FEM, REM
và GLS :
Hình 13 : So sánh giữa bốn mô hình.
Trong hình trên, các phương trình (1), (2), (3), (4) lần lượt thể hiện cho mô hình hồi quy
tuyến tính (Pooled OLS), mô hình tác động cố định (Fixed Effects Model), mô hình tác
động ngẫu nhiên (Randome Effects Model), bình phương nhỏ nhất tổng quát
(Generalized Leasted Squared). Các ký hiệu lev, liq, roe, logta, PE là các biến kiểm soát
và biến dpo là biến phụ thuộc. Các dấu *, **, *** là 10%, 5% và 1% theo thứ tự.
Từ hình trên, ta thấy rằng có mối tương quan dương giữa tỷ lệ đòn bẩy (LEV) và tỷ lệ chi
trả cổ tức(DPO). Có mối tương quan âm giữa quy mô của doanh nghiệp (LOG(TA)) và tỷ
lệ chi trả cổ tức (DPO). Tồn tại tương quan dương giữa rủi ro của doanh nghiệp (P/E)và
tỷ lệ chi trả cổ tức(DPO).
Bên cạnh đó, ta thấy có mối tương quan âm giữa tính thanh khoản (LIQ) và tỷ lệ chi trả
cổ tức (DPO); có mối tương quan âm giữa lợi nhuận (ROE) và tỷ lệ chi trả cổ tức (DPO).
Tuy nhiên, kết quả này không có ý nghĩa thống kê.