Download as pdf or txt
Download as pdf or txt
You are on page 1of 74

Chương 4

Mô hình hồi quy tuyến tính đa biến


(Multiple/Multivariate Linear Regression - MLR)

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 1


Khái quát hóa từ mô hình hồi quy tuyến tính đơn biến đến mô hình
hồi quy tuyến tính đa biến (Multiple Linear Regression)
• Trong chương trước chúng ta đã sử dụng mô hình hồi quy tuyến tính đơn
biến sau: yt     x n  un

n = 1,2,...,N
• Chương này chúng ta sẽ tìm hiểu mô hình hồi quy tuyến tính mở rộng khi
biến phụ thuộc (y) được giải thích bởi nhiều biến độc lập (x).
Ví dụ quyết định cấu trúc vốn của một doanh nghiệp phụ thuộc vào các
nhân tố sau: 1. Size; 2. Profitability; 3. Volatility in EBIT; 4. Industry
median; 5. Growth opputinities....

• Tương tự , TTSL của một cổ phiếu (stock returns) có thể chịu ảnh hưởng
từ các nhân tố (APT model) thay vì chỉ là beta của cổ phiếu (systematic
risk).
• Do vậy sử dụng mô hình hồi quy tuyến tính trong các trường hợp ví dụ này
cần đưa vào nhiều biến giải thích thay vì đơn biến.
• Về mặt kỹ thuật phân tích kinh tế lượng, không có khó khăn gì từ việc mở
rộng mô hình đơn biến thành mô hình hồi quy tuyến tính đa biến với k-1
regressors (independent variables).
2
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM
Khái quát hóa từ mô hình hồi quy tuyến tính đơn biến đến mô hình
hồi quy tuyến tính đa biến (Multiple Linear Regression)

• Trong chương trước chúng ta đã sử dụng mô hình hồi quy tuyến tính đơn
biến sau:
yt    xt  ut t = 1,2,...,N

• Chương này chúng ta sẽ tìm hiểu mô hình hồi quy tuyến tính mở rộng khi
biến phụ thuộc (y) được giải thích bởi nhiều biến độc lập (x).

Ví dụ:quyết định cấu trúc vốn của một doanh nghiệp phụ thuộc vào các
nhân tố sau:
1. Size;
2. Profitability;
3. Volatility in EBIT;
4. Industry median;
5. Growth opputinities
....

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 3


Phương trình hồi quy đa biến (Multiple Regression) và
hằng số của phương trình (the Constant Term)

• Bây giờ ta viết lại phương trình đa biến như sau:

yt   1   2 x 2 t   3 x 3 t  ...   k x kn  un

t=1,2,...,T

• Đâu là biến x1? Biến x1 bây giờ là hằng số (constant term). Trên thực tế hằng
số của phương trình hồi quy đa biến luôn được thể hiện bởi ma trận (T x 1):
1
1
x1   


1
với 1 là hệ số gắn liền với hằng số của phương trình mà trong chương trước
chúng ta gọi là  .
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 4
Các phương thức khác nhau để diễn đạt mô hình hồi quy đa
biến - MLR (Multiple/Multivariate Linear Regression Model)

• Với mỗi giá trị của n, chúng ta có các phương trình hồi quy như sau:
y1   1   2 x 21   3 x 31  ...   k x k 1  u1
y2   1   2 x 22   3 x 32  ...   k x k 2  u2
  
y N   1   2 x 2 N   3 x 3 N  ...   k x kN  uN

• Viết lại dưới dạng ma trận tổng quát: y = X +u

với y=N1
X=Nk
 = k 1
u=N1
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 5
Bên trong các ma trận của mô hình MLR
(Multiple Linear Regression Model)

• Chẳng hạn nếu k = 2, chúng ta sẽ có 2 regressors, một trong đó sẽ là ma


trận của hằng số hay ma trận cột của các giá trị 1:

 y1  1 x 21   u1 
 y  1 x 22    1   u2 
 2 
     
   2    
     
 y N  1 x2 N   uN 

N 1 Nk k1 N1

• Lưu ý rằng các ma trận được viết theo cách thức tương thích với nhau

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 6


Các thông số hồi quy ( ) sẽ được ước lượng như thế nào
trong trường hợp tổng quát này?
• Trong chương trước với mô hình hồi quy đơn biến, chúng ta tính tổng
bình phương của các phần dư (residual sum of squares - RSS), và sau
đó giải bài toán tối thiểu hóa RSS để tìm  and .
• Trong mô hình tổng quát và theo phương pháp bình phương bé nhất
chúng ta vẫn cần phải tính RSS:
 uˆ 1 
 uˆ 
uˆ   2 
 
 
 uˆ N 
• và RSS sẽ được tính toán như sau:
 uˆ 1 
 uˆ 
uˆ ' uˆ  uˆ 1 uˆ 2  uˆ N  2   uˆ 12  uˆ 22  ...  uˆ N2   uˆ n2
 
 
 uˆ N 
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 7
RSS = u′u

u = Y – XB

RSS =(Y − XB)′(Y − XB)

RSS = (Y′ − B′X′)(Y − XB)

RSS = Y′Y − Y′XB − B′X′Y + B′X′XB

RSS = Y′Y − 2Y′XB + B′X′XB

RSS
 (Y Y  2Y XB  BX XB )
B
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 8
RSS
 ( 2 X 'Y  2 X XB )
B
0 = −2X′Y + 2X′XB

− 2X′XB = −2X′Y
X′XB = X′Y

B = (X′X)-1 X′Y

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 9


Ước lượng các hệ số hồi quy OLS cho mô hình MLR
(Multiple Regression Model)

• Để xác định các hệ số ước lượng (the parameter estimates): 1, 2,...,
k, chúng ta cần giải bài toán tối thiểu hóa RSS hay bài toán đạo hàm
bậc nhất đối với s bằng 0.

• Giải phương trình ma trận ta sẽ xác định được s như sau:

 ˆ1 
 
ˆ  ˆ 2 
     ( X X ) 1 X  y

 
 ˆ k 

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 10


Các giả định cho mô hình tuyến tính tổng quát
(General Linear Model)

(A1) Functional form (DGP): mô hình hồi quy tuyến tính: Y=Xb+u
(A2) E(u) = 0

(A3) X’X là non-singular hoặc Full Rank. Rank của ma trận X là k với k < N
(No Perfect Collinearity)
Sẽ có một vài phần trong ma trận X’X có phần tử = 0 và do vậy giá trị
nghịch đảo của nó sẽ là không xác định. OLS vẫn là BLUE, nhưng giá trị
ước lượng của var[b]=(X’X)-1Y’(I-X(X’X)-1X’)Y/(n-k) có thể sẽ có giá trị
rất lớn.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 11


Các giả định cho mô hình tuyến tính tổng quát (General
Linear Model)

(A4) X có các giá trị thay đổi không ngẫu nhiên (non random/non-stochastic)
hay không có tương quan với phần dư (error term): E(X’u) = 0 .
COV(X,u)=0
 Giả định này có nghĩa là có một mối quan hệ nhân quả đơn phương giữa
biến phụ thuộc y, và các biến độc lập x .
 Thay đổi trong x gây nên sự thay đổi trong y nhưng sự thay đổi trong
biến phụ thuộc y không gây ra những thay đổi trong các biến độc lập x.
 Giả định này cũng ngụ ý rằng biến y thay đổi ngẫu nhiên (stochastic).

(A5) Không có hiện tượng phương sai thay đổi (no heteroskedasticity) :
E(ui2) = σu2 <  cho tất cả các giá trị của i

(A6) Không có hiện tượng tự tương quan (No Serial Correlation):


Cov (εi , εj) = 0 for ij,

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 12


(A7) Sai số của tổng thể u có phân phối chuẩn: u ~ N(0, σu 2I)
Chứng minh thuộc tính không chệch (unbiased) của OLS Estimator

ˆ  (X' X) 1 X' (X  U)  (X' X) 1 X' X  (X' X) 1 X' U A(1) & A(3)
 I  (X' X) 1 X' U
   (X' X) 1 X' U

E ( ˆ )  E[   ( X ' X ) 1 X 'U ]
 E (  )  E[( X ' X ) 1 X 'U ] A(4) & A(2)
   ( X ' X ) 1 X ' E (U )


Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 13


Xác định phương sai của OLS Estimator
ˆ )  E[(
cov( ˆ  E[ˆ ])(
ˆ  E[
ˆ ])' ]
ˆ  )(
 E[( ˆ  )' ]
ˆ    (X' X) 1 X' U or ˆ    (X' X) 1 X' U
ˆ  )'  U ' X ( X ' X ) 1
(
cov( ˆ )  E[( ˆ   )( ˆ   )' ]
 E[(( X ' X ) 1 X 'U ) ( U ' X ( X ' X ) 1 )]
 ( X ' X ) 1 X ' E[UU ' ] X ( X ' X ) 1 A(4)

 ( X ' X ) 1 X '  2 I X ( X ' X ) 1


  2 ( X ' X ) 1 X ' X ( X ' X ) 1 A(5) & A(6)

  2 ( X ' X ) 1 I
  2 ( X ' X ) 1
V ( ˆ )  ( X ' X ) 1 ˆ 2
k x k k x n n x k 1 x1
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 14
Tính toán Sai Số Chuẩn (Standard Errors) cho mô hình
MLR (Multiple Regression Model)

• Các giá trị của  xác định ma trận k  1 .

• Vấn đề là làm sao xác định được sai số chuẩn (standard errors) của các hệ

số ước lượng Beta này? s2 


 uˆ 2
t

T 2
• Trong chương trước ta đã tính được phương sai của sai số tổng thể, 2 :
u' u
s2 
Tk
• Trong trường hợp tổng quát ta sử dụng ký hiệu ma trận: s2 ( X ' X ) 1
• Với k = số biến giải thích (number of regressors).
• Ta có thể chứng minh được rằng OLS phương sai của  được xác định từ
các phần tử nằm trong đường chéo (diagonal elements) của ma trận
này. Vì vậy phương sai 1 sẽ là phần tử thứ nhất của đường chéo, phương
sai của 2 sẽ là phần tử thứ 2 và … phương sai của k sẽ là phần tử thứ
kth của đường chéo .
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 15
Tính toán Sai Số Chuẩn (Standard Errors) cho mô hình
MLR (Multiple Regression Model): ví dụ

• Có mô hình sau với k=3 được ước lượng với 15 quan sát:
y  1   2 x2   3 x3  u
và ta có các thông số sau được tính toán từ kết quả hồi quy với X’s.
 2.0 35 . 
. 10 30 . 
( X ' X ) 1   35
. 10 .  ,( X ' y)   2.2  , u' u  10.96
. 65
10 . 4.3 
. 65  0.6 

• Để tính toán các hệ số ước lượng ta chỉ việc nhân ma trận với vecto :
 X ' X 1 X ' y
• Để tính toán sai số chuẩn (standard errors) ta cần giá trị ước lượng của2:
RSS 10.96
s2    0.91
T  k 15  3
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 16
Tính toán Sai Số Chuẩn (Standard Errors) cho mô hình
MLR (Multiple Regression Model): ví dụ

• Ma trận phương sai – hiệp phương sai (variance-covariance matrix) của 


được xác định bởi :
 183
. 320
. 0.91
s2 ( X ' X ) 1  0.91( X ' X ) 1   320
. . 
0.91 594
0.91 594
. . 
393

• Phương sai của beta nằm trên đường chéo của ma trận trên:
Var ( 1 )  183
. SE ( 1 )  135
.
Var (  )  0.91  SE (  )  0.96
2 2

Var ( 3 )  3.93 SE ( 3 )  198


.

• Ta có phương trình hồi quy đầy đủ như sau:


yˆ  1.10  4.40 x2t  19.88 x3t
1.35 0.96 1.98
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 17
Kiểm định đồng thời nhiều giả thiết (Multiple Hypotheses):
F-test

• Chúng ta đã sử dụng t-test để kiểm định một giả thiết đơn (single
hypotheses) hay giả thiết chỉ liên quan đến một hệ số hồi quy.
• Để kiểm định đồng thời nhiều hơn một hệ số hồi quy chúng ta sẽ sử dụng
F-test.
• F-test luôn liên quan đến hai phương trình hồi quy:
• Phương trình hồi quy không bị giới hạn (unrestricted regression - URR) là
phương trình hồi quy mà theo đó các hệ số ước lượng được xác định bởi
các dữ liệu mà không bị ràng buộc nào như chúng ta đã thực hiện trong
các phần trước.
• Phương trình hồi quy bị giới hạn (restricted regression - RR) là phương
trình hồi quy mà theo đó các hệ số ước lượng được xác định bởi các dữ
liệu và bị ràng buộc. Ví dụ: ràng buộc được áp đặt đối với một vài hệ số
s.
• Kiểm định “nested hypotheses” có thể được diễn đạt “đơn giản” là kiểm
định F-test khi mà phương trình giới hạn là tập hợp con của phương trình
không bị giới hạn.
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 18
F-test:
Phương trình hồi quy với ràng buộc (Restricted) và không bị
ràng buộc (Unrestricted Regressions)

• Ví dụ, ta có phương trình tổng quát sau:


yt = 1 + 2x2t + 3x3t + 4x4t + ut (1)

• Và bây giờ chúng ta muốn kiểm định giả thiết 3+4 = 1


• Do vậy phương trình hồi quy không bị giới hạn sẽ là phương trình (1) ở
trên và phương trình bị giới hạn sẽ là:
yt = 1 + 2x2t + 3x3t + 4x4t + ut s.t. 3+4 = 1

• Chúng ta thay thế ràng buộc (3+4 = 1) vào trong phương trình hồi quy
sao cho ràng buộc này sẽ tự động áp đặt lên các dữ liệu data.
3+4 = 1  4 = 1- 3

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 19


F-test: thiết lập phương trình hồi quy bị ràng buộc
(restrited regression)

yt = 1 + 2x2t + 3x3t + (1-3)x4t + ut


yt = 1 + 2x2t + 3x3t + x4t - 3x4t + ut

(yt - x4t) = 1 + 2x2t + 3(x3t - x4t) + ut

• Và đây là phương trình hồi quy với ràng buộc (restricted regression). Chúng
ta sẽ ước lượng bình thường bằng cách tạo ra thêm 2 biến phụ Pt and Qt.

Pt = yt - x4t
Qt = x3t - x4t

Và phương trình hồi quy cuối cùng mà chúng ta sẽ ước lượng có dạng như sau:

Pt = 1 + 2x2t + 3Qt + ut

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 20


Tính toán F-Test Statistic

• F-test statistic được tính theo công thức sau:

(𝑅𝑆𝑆𝑅 − 𝑅𝑅𝑆𝑈𝑅 )/𝑚


𝐹=
𝑅𝑅𝑆𝑈𝑅 /(𝑛 − 𝑘𝑈𝑅 )

với RSSUR = RSS từ Unrestricted regression


RRSR = RSS từ Restricted regression
m = số ràng buộc (number of restrictions)
n = số quan sát (number of observations)
k = số regressors trong phương trình không có ràng buộc
bao gồm luôn hằng số (hay tổng số tham số được ước
lượng-parameters).

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 21


Phân phối (The F-Distribution)

• F-statistic sẽ có phân phối F tương ứng (F-distribution) với 2 thông


số bậc tự do bao gồm m là số ràng buộc và (T-k) . Lưu ý rằng thứ tự
của các thông số về bậc tự do này rất quan trọng.

• Giá trị so sánh thích hợp cho F-statistic (F critical value) sẽ nằm ở cột
thứ m, và hàng thứ (T-k).

• Các giá trị của phân phối F chỉ có giá trị dương và không đối xứng. Do
đó chúng ta sẽ bác bỏ giả thiết Null chỉ khi :
F test statistic > critical F-value

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 22


Xác định số ràng buộc trong F-test

• Ví dụ :
H0: hypothesis No. of restrictions, m
1 + 2 = 2 1
2 = 1 and 3 = -1 2
2 = 0, 3 = 0 and 4 = 0 3

• Nếu mô hình là: yt = 1 + 2x2t + 3x3t + 4x4t + ut,


Thì khi đó giả thiết Null sẽ là:
H0: 2 = 0, và 3 = 0 và 4 = 0

Giả thiết này sẽ được kiểm định bởi F-statistic và nó sẽ kiểm định giả thiết
Null là tất cả các hệ số hồi quy sẽ đồng thời bằng 0 trừ hệ số chặn.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 23


Những trường hợp ràng buộc không thể sử dụng F hoặc t-test

• Lưu ý:
Chúng ta không thể kiểm định sử dụng những giả thiết sau khi mà các hệ số
hồi quy có mối liên hệ phi tuyến với nhau trong phương trình ràng buộc:

H0: 2 3 = 2 or H0: 2 2 = 1

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 24


Mối quan hệ giữa phân phối t và phân phối F (t vs F-Distributions)

• Bất kỳ giả thiết nào có thể kiểm định với t-test thì đều có thể kiểm định với
F-test, nhưng chiều ngược lại thì không đúng.

Ví dụ, ta có giả thiết sau:


H0: 2 = 0.5
H1: 2  0.5
2  0.5
ta có thể kiểm định giả thiết này sử dụng t-test: test stat 
SE ( 2 )
hoặc ta cũng có thể kiểm định giả thiết trên bằng F-test.

• Lưu ý rằng các 2 phương pháp kiểm định đều cho ra cùng một kết quả vì
phân phối t (t-distribution ) chỉ là một trường hợp đặc biệt của phân phối F
(F-distribution).

• Ví dụ, nếu ta có biến ngẫu nhiên Z, và Z  t (T-k) thì khi đó Z2  F(1,T-k)

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 25


Ví dụ về F-test
Câu hỏi nghiên cứu:

• Giả định ta muốn kiểm định TTSL của cổ phiếu công ty (y) có hay không độ nhạy
cảm đơn vị (unit sensitivity) đối với 2 nhân tố x2 và x3 trong tổng cộng 3 nhân tố.
Phương trình hồi quy này được thực hiện với 144 quan sát hàng tháng có dạng
như sau:

yt = 1 + 2x2t + 3x3t + 4x4t+ ut


- Thiết lập phương trình hồi quy không ràng buộc và ràng buộc (unrestricted và
restricted regressions)?

- nếu RSS cho từng phương trình hồi quy tương ứng là 436.1 và 397.2 , hãy thực
hiện F test.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 26


Ví dụ về F-test

• Giải pháp:

Độ nhạy cảm đơn vị ngụ ý rằng H0:2=1 and 3=1.

Phương trình hồi quy không ràng buộc là phương trình trên.

Phương trình hồi quy với ràng buộc có dạng: (yt-x2t-x3t)= 1+ 4x4t+ut

Đặt zt=yt-x2t-x3t, => zt= 1+ 4x4t+ut

ta có thể tính F-test theo công thức với T=144, k=4, m=2, RRSS=436.1,
URSS=397.2

F-test statistic = 6.68. Critical value (tra bảng F) sẽ là F(2,140) = 3.07 (5%) and
4.79 (1%).

Kết luận: Bác bỏ H0.


Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 27
Kiểm định các ràng buộc hay áp đặt ràng buộc cho mô hình?

• Áp đặt các ràng buộc (IMPOSING RESTRICTIONS )


 Chúng ta áp đặt các ràng buộc chỉ khi chúng được giả định là đúng bằng
cách áp đặt những hạn chế trên các thông số của mô hình thống kê.
 Ưu điểm chính của những áp đặt ràng buộc này là để có thể có được kết
quả ước lượng chính xác hơn đối với các thông số

• Kiểm định các ràng buộc của mô hình (TESTING RESTRICTIONS )


 Ràng buộc là một biểu hiện chính thức của một giả thuyết. Kiểm định một
hạn chế là kiểm định một giả thuyết.
 Một ràng buộc được cho là đúng, và do đó không cần thử nghiệm và sẽ áp
đặt.
 Một ràng buộc có thể kiểm chứng là một giả thuyết cho rằng “không ràng
buộc” là đúng, và do đó cần được kiểm định.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 28


Giả thiết “lồng nhau” (nested hypotheses)

Một giả thuyết được xem là lồng nhau (nested) nếu giả thuyết này có thể
được thể hiện dưới dạng kết hợp của hai mô hình khác nhau:
1) mô hình không có ràng buộc (unrestriced model),
2) mô hình với ràng buộc (restricted model).

Một giả thuyết được xem là không lồng nhau (non-nested) nếu giả thuyết
này không thể được thể hiện dưới dạng kết hợp từ mô hình không có ràng
buộc và mô hình với ràng buộc

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 29


Các bước kiểm định một giả thuyết hay một ràng buộc

1. Thiết lập mô hình kiểm định. Xác định giả thuyết trống (null) và giả thuyết
thay thế (alternative hypotheses).

2. Căn cứ vào giả thuyết trống (null) chọn phương pháp kiểm định thống kê
thích hợp và phân phối của kiểm định thống kê.

3. Lựa chọn mức độ ý nghĩa và tìm giá trị thống kê so sánh (critical value) để
thực hiện kiểm định thống kê.

4. Sử dụng dữ liệu mẫu để tính toán giá trị thực tế (giá trị tính toán) của giá trị
thống kê của kiểm định (t-, F-, Chi-square, LR hay LM statistics).

5. So sánh giá trị thực tế của chỉ số kiểm định thống kê với giá trị so sánh và
đưa ra quyết định chấp nhận hoặc bác bỏ giả thuyết.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 30


Lý thuyết giới hạn trung tâm (Central Limit Theorem) và
tổng quan về các dạng phân phối

Lý thuyết giới hạn trung tâm: Nếu một mẫu dữ liệu với n quan sát được rút ra từ
tổng thể P ~ N (µ, σ2), thì khi n càng lớn thì mẫu quan sát sẽ có xấp xĩ phân phối
chuẩn X ~N(µ, σ2).
Sự xấp xĩ này sẽ ngày càng trở nên chính xác khi kích thước mẫu ngày càng lớn.

Phân phối x2 (Chi-Square distribution)


Nếu Z1, Z2 ....Zk là k biến độc lập có phân phối chuẩn thì khi đó Z = Z12 + Z22
+....Zk2 sẽ có phân phối Chi-squares , xk2 với k bậc tự do.

Đặc tính của phân phối x2 Chi-Square


 Nếu Z1 biến độc lập có phân phối chuẩn thì khi đó Z12 sẽ có phân phối Chi-
squares , x12
 Phân phối Chi-squares , xk2 được xác định hoàn toàn dựa vào số bậc tự do của
chính nó và có giá trị trung bình là k với phương sai là 2k.
 xk2 thay đổi từ 0 đến vô cực.
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 31
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 32
Lý thuyết giới hạn trung tâm (Central Limit Theorem) và
tổng quan về các dạng phân phối

Phân phối Students’t (Students’ t distribution)


Nếu Z1 là biến số có phân phối chuẩn và Z2 có phân phối Chi-squares , xk2 với k bậc
tự do và độc lập với Z1 thì khi đó:

𝑧1
𝑡= có phân phối t với k bậc tự do
𝑧2 /𝑘

Đặc tính của phân phối t


 Các giá trị của t phân phối đối xứng xung quanh giá trị bình quân của nó là 0.
 t thay đổi từ trừ vô cực đến cộng vô cực.
 Khi bậc tự do gia tăng thì phân phối t tiến gần về phân phối chuẩn.
 Phân phối t có phương sai là k/(k-2)

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 33


𝑧1
𝑡=
𝑧2 /𝑘

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 34


Lý thuyết giới hạn trung tâm (Central Limit Theorem) và
tổng quan về các dạng phân phối

Phân phối F (F distribution)


Nếu Z1 và Z2 là những biến độc lập có phân phối Chi-squares , xk2 với k1 và k2 bậc tự
do, thì khi đó:
𝑧1 /𝑘1
𝐹= có phân phối F với k1 và k2 bậc tự do
𝑧2 /𝑘2

Đặc tính của phân phối F


 Đồ thị phân phối F có khuynh hướng lệch về bên phải nhưng khi k1 và k2 tăng dần
thì nó sẽ tiệm cận phân phối chuẩn.
 F thay đổi từ 0 đến cộng vô cực.
 Khi bậc tự do gia tăng thì phân phối t tiến gần về phân phối chuẩn.
 Giá trị bình phương của phân phối t với k bậc tự do sẽ có phân phối F với 1 và k
bậc tự do, F1,k .
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 35
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 36
Lựa chọn phương pháp kiểm định thống kê thích hợp

Kiểm định các giả thiết với mẫu nhỏ : t-Test


Kiểm định t-Test với mẫu nhỏ có thể được sử dụng để kiểm định ràng buộc có giá
trị cố định hoặc các một mối quan hệ tuyến tính duy nhất giữa các ràng buộc
trong mô hình hồi quy tuyến tính cổ điển.
Giá trị kiểm định thống kê sẽ là t-statistic tuân theo phân phối t (t distribution).
 i^ -  i
t =  ~ t(n-k)
s.e.( i^)^

Với i^ là giá trị ước lượng của thông số beta thứ ith,
i là giá trị ràng buộc của of i^
s.e.( i^)^ giá trị ước lượng S.E. của i^, và t(n-k) là phân phối t với n-k bậc
tự do

Nguyên tắc ra quyết định: bác bỏ H0 nếu t > t(n-k,) critical value

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 37


Lựa chọn phương pháp kiểm định thống kê thích hợp

• Kiểm định các giả thiết với mẫu nhỏ - F-Test


• Kiểm định F-Test với mẫu nhỏ có thể được sử dụng để :
 kiểm định một ràng buộc duy nhất có giá trị cố định,
 hai hoặc nhiều ràng buộc có giá trị cố định duy nhất giống nhau, ràng buộc
tuyến tính duy nhất, và
 hai hoặc nhiều ràng buộc tuyến tính đồng thời trong mô hình hồi quy tuyến
tính cổ điển.

(𝑅𝑆𝑆𝑅 − 𝑅𝑅𝑆𝑈𝑅 )/𝑚


𝐹=
𝑅𝑅𝑆𝑈𝑅 /(𝑛 − 𝑘𝑈𝑅 )

• Chi tiết về Kiểm định F-Test đã được giới thiệu ở phần trên

Nguyên tắc ra quyết định: bác bỏ H0 nếu F > F(m, n-k, 0.5) critical value

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 38


Lựa chọn phương pháp kiểm định thống kê thích hợp
Kiểm định các giả thiết với mẫu lớn - Asymptotic t-Test
• Kiểm định Asymptotic t-test có thể được sử dụng để kiểm định:
 một ràng buộc duy nhất với giá trị cố định,
 ràng buộc tuyến tính duy nhất, hoặc
 ràng buộc phi tuyến duy nhất trong tất cả các loại mô hình thống kê.
• Giá trị thống kê của kiểm định (Asymptotic t-statistic ) sẽ có phân phối t xấp xĩ
(approximate t-distribution)
 i^ -  i
t =  ~ t(n-k)
s.e.( i^)^
Lưu ý: s.e.( i^)^ bây giờ là giá trị ước lượng sai số chuẩn tiệm cận (asymptotic
standard error) của i^, và t(n-k) là phân phối t với n-k bậc tự do

Để tính t-statistics, sữ dụng dữ liệu quan sát để ước lượng mô hình không ràng
buộc (unrestricted model). Sau đó giá trị ước lượng của i^ và s.e.( i^)^ sẽ được
sử dụng để tính giá trị thực tế của t-statistic.
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 39
Lựa chọn phương pháp kiểm định thống kê thích hợp

• Kiểm định các giả thiết với mẫu lớn - Likelihood Ratio Test
• Kiểm định Likelihood Ratio có thể được sử dụng để kiểm định bất kỳ loại ràng
buộc nào hoặc ràng buộc trong bất kỳ loại mô hình nào miễn là hai điều kiện sau
đây được thỏa mãn:
1) Các biến số mà có thể cho ra ước lượng maximum likelihood tốt nhất sẽ được
sử dụng để ước lượng các thông số cho mô hình (correct specification) .
2) Hai mô hình sau đây có thể ước lượng được: mô hình không có ràng buộc và
mô hình với ràng buộc.

Giá trị thống kê của kiểm định sẽ là LR statistic tuân theo phân phối chi-squares:

LR = 2(ln Lu – ln Lr) ~ 2(m)


Với m là số ràng buộc
• Nguyên tắc ra quyết định: bác bỏ H0 nếu LR > Chi-squares critical value
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 40
Kiểm định Likelihood Ratio –đồ thị minh họa

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 41


Lựa chọn phương pháp kiểm định thống kê thích hợp

Kiểm định các giả thiết với mẫu lớn - Wald Test

•Kiểm định Wald có thể được sử dụng để kiểm định bất kỳ loại ràng buộc
nào hoặc ràng buộc trong bất kỳ loại mô hình nào.

•Giả thiết Null là mô hình bị ràng buộc (restricted model) và giả thiết thay
thế (altenative hypotheses) là mô hình không có ràng buộc (unrestricted
model).

•Để thực hiện kiểm định Wald chúng ta chỉ cần phải ước lượng duy nhất
phương trình không có ràng buộc.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 42


Lựa chọn phương pháp kiểm định thống kê thích hợp

•Tuy nhiên kiểm định Wald yêu cầu rằng các ràng buộc phi tuyến hay tuyến
tính xuất hiện trong giả thiết Null cùng với các giá trị Wald-statistic phải
được xác định theo định dạng ma trận: R() = r

với R() là hàm số theo beta và là vector cột Jx1 của các kết hợp tuyến tính
hay phi tuyến của các thông số ước lượng.

 là vector Kx1 của các thông số hồi quy;


r là vecto Jx1 của các con số 0 hay khác 0;
J là số lượng các ràng buộc được kiểm định.
K là số lượng các thông số ước lượng trong mô hình hồi quy

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 43


Lựa chọn phương pháp kiểm định thống kê thích hợp

Kiểm định các giả thiết với mẫu lớn - Wald Test

Giá trị Wald statistic có phân phối xấp xĩ chi-square với số bậc tự do là số
lượng ràng buộc và được tính theo công thức sau:

𝑊 = (𝛽𝑈𝑅 − 𝛽𝑅 )2 𝐼 (𝛽𝑈𝑅 )

Với I là ma trận thông tin.

Khi mô hình hồi quy là tuyến tính thì kiểm định Wald tương tự như kiểm
định F : 𝑁𝑈𝑅2
𝑊 = 2
(1 − 𝑁𝑈𝑅 )

Nguyên tắc ra quyết định: bác bỏ H0 nếu W > Chi-squares critical value

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 44


Kiểm định Wald – đồ thị minh họa

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 45


Lựa chọn phương pháp kiểm định thống kê thích hợp

Kiểm định các giả thiết với mẫu lớn - Kiểm định nhân tử Lagrange
(Lagrange Multiplier Test )

Kiểm định nhân tử Lagrange có thể được sử dụng để kiểm định bất kỳ loại
ràng buộc nào hoặc ràng buộc trong bất kỳ loại mô hình nào .

Giả thiết Null là mô hình bị ràng buộc (restricted model).

Để thực hiện kiểm định nhân tử Lagrange :


Bước 1: ước lượng duy nhất phương trình có ràng buộc, lưu giữ lại phần

Bước 2: thực hiện hồi quy với biến phụ thuộc là phần dư (auxiliary
regression) và biến giải thích là các biến trước đây trong mô hình bị ràng
buộc, sử dụng OLS.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 46


Lựa chọn phương pháp kiểm định thống kê thích hợp
Kiểm định các giả thiết với mẫu lớn - Kiểm định nhân tử Lagrange
(Lagrange Multiplier Test )

Giá trị thống kê kiểm định là LM statistic có phân phối xấp xĩ chi-squares
(approximate chi square distribution).

LM statistic được tính bằng công thức sau:


LM = nR2 ~ 2(m)

Với
n là kích cỡ mẫu.
m là số ràng buộc
R2 là unadjusted R2 có được từ hồi quy “hỗ trợ (auxiliary regression).

Nguyên tắc ra quyết định: bác bỏ H0 nếu LM > Chi-squares critical value

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 47


Kiểm định LM – đồ thị minh họa

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 48


So sánh các phương pháp kiểm định giả thiết: Wald, LR và LM tests

 Dưới dạng tổng quát nhất thì kiểm định Wald gần giống như kiểm
định LR và kiểm định LM vì đều dựa trên sự khác biệt của các thông số
ước lượng từ phương trình hồi quy không có ràng buộc và có ràng buộc.

 Và hơn nữa cả 3 kiểm định này đều cho các giá trị như nhau khi kích cỡ
mẫu quan sát tiến dần về vô cực.

 Tuy nhiên cả 3 kiểm định này sẽ cho kết quả khác nhau ứng với một
mẫu quan sát cho trước.

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 49


So sánh các phương pháp kiểm định giả thiết: Wald, LR và LM tests

Nếu mô hình hồi quy là tuyến tính thì ta có:

Wald stat > LR stat > LM stat

 Do vậy nếu kiểm định LM bác bỏ giả thiết mô hình có ràng buộc là có
giá trị thì tất cả các kiểm định khác cũng sẽ cho kết luận tương tự.

 Nếu mô hình hồi quy là tuyến tính giản đơn thì kiểm định Wald (F và t-
tests) là thuận lợi nhất. Tuy nhiên khi mô hình được mở rộng, ví dụ phi
tuyến tính, thì khi đó kiểm định LM là thuận lợi nhất do phương pháp
này chỉ cần ước lượng mô hình có ràng buộc.

 Hơn nữa là kiểm định LM dựa vào phần dư của mô hình có ràng buộc
nên được sử dụng để kiểm định “mô hình không đúng” (wrong
specification), “bỏ sót biến” (omitted variables) , phương sai thay đổi,
hiện tượng nội sinh....
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 50
Data Mining/Snooping/Fishing/Dredging

• White (2000): Data snooping xảy ra khi một bộ dữ liệu được sử dụng
nhiều hơn một lần cho các mục đích suy luận tìm kiếm mối quan hệ giữa
các biến trong bộ dữ liệu nhằm mục đích lựa chọn mô hình cho phù hợp.
Khi việc sử dụng lại dữ liệu như vậy xảy ra , luôn luôn có khả năng rằng
bất kỳ kết quả khả quan nào thu được có thể chỉ đơn giản là do cơ hội.
• Data snooping liên quan đến việc các nhà nghiên cứu sử dụng suy luận
thống kê và thực hiện phân tích hồi quy sau khi tìm hiểu và phân tích bộ
dữ liệu và điều này trái ngược với thông thường là các nhà nghiên cứu
xây dựng mô hình dựa trên nền tảng lý thuyết kinh tế -tài chính trước khi
tìm hiểu đặc điểm của bộ dữ liệu.
• Data snooping có thể được thực hiện một cách chuyên nghiệp và có đạo
đức, hoặc sai lạc và không có đạo đức, hoặc sai lạc vì vô tình. Sai lạc vì
vô tình là một lỗi phổ biến trong việc sử dụng số liệu thống kê.
• Nếu Data snooping xảy ra, mức ý nghĩa thống kê thật sẽ lớn hơn mức ý
nghĩa danh nghĩa đạt được.
Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 51
Chỉ tiêu thống kê đo lường mức độ phù hợp của mô hình
(Goodness of Fit Statistics)

• Sau khi thực hiện phân tích hồi quy chúng ta cần đo lường xem mô
hình hồi quy đã thực sự phù hợp với các dữ liệu như thế nào.

• Độ phù hợp của mô hình (goodness of fit) sẽ kiểm định xem mô hình
hồi quy trên mẫu dữ liệu (sample regression function) có phù hợp với
dữ liệu thức tế hay không?
y
• Chỉ tiêu thống kê đo lường mức độ phù hợp của mô hình phổ biến
nhất là R2. R2 chính là bình phương của hệ số tương quan (correlation
coefficient) giữa biến y và biến .

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 52


Chỉ tiêu thống kê đo lường mức độ phù hợp của mô hình
(Goodness of Fit Statistics)

• Một cách đo lường khác là đánh giá sự khác biệt của các giá trị y xung
quanh giá trị bình quân của nó : TSS (Total Sum of Squares)

• TSS có thể được tách làm 2 thành phần:


 ESS (explained sum of squares) phần sai số được giải thích bằng mô
hình và
 RSS (residual sum of squares) phần sai số không được giải thích.

TSS    yt  y 
2

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 53


Định nghĩa R2

• TSS = ESS + RSS


 ty  y 2
 
 tˆ
y  y 2
  t
ˆ
u 2

t t t

• Chia 2 về cho TSS, mức độ phù hợp của mô hình được tính như sau:
ESS TSS  RSS RSS
R2    1
TSS TSS TSS

• R2 luôn có giá trị giữa 0 và 1:

RSS = TSS i.e. ESS = 0 => R2 = ESS/TSS = 0


ESS = TSS i.e. RSS = 0 => R2 = ESS/TSS = 1

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 54


Các trường hợp giới hạn: R2 = 0 và R2 = 1

yt
yt

xt xt

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 55


Các vấn đề với R2 như là chỉ tiêu đo lường mức độ phù hợp
của mô hình (Goodness of Fit Measure)
• Các vấn đề gặp phải khi sử dụng R2 :
1. Định nghĩa và giá trị của R2 phụ thuộc vào biến động của y xung quanh
giá trị trung bình của nó.
 Như vậy khi mô hình được thay đổi với các biến số khác
(reparameterised/rearranged) và biến phụ thuộc thay đổi, R2 sẽ thay
đổi.

2. R2 không bao giờ giảm khi ta bỏ thêm các biến giải thích vào mô hình:
Mô hình 1: yt = 1 + 2x2t + 3x3t + ut
Mô hình 2: y = 1 + 2x2t + 3x3t + 4x4t + ut
R2 cho mô hình 2 sẽ không bao giờ thấp hơn R2 của mô hình 1.

3. R2 thường rất cao đối với hồi quy chuỗi thời gian (time series
regressions).

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 56


Adjusted R2

• Để khắc phục những nhược điểm của R2, người ta thường sử dụng
“adjusted R2 “ theo đó R2 sẽ được điều chỉnh theo đó số bậc tự do bị mất đi
khi một biến giải thích được đưa thêm vào mô hình: R 2

 T 1 
R 1 
2
(1  R 2 )
T  k 
• Như vậy khi ta bỏ thêm một biến giải thích vào mô hình, k sẽ gia tăng và
nếu R2 không tăng tương ứng thì adjusted R2 hay R 2 sẽ giảm.

• Tuy vậy vẫn còn tồn tại những bất lợi cho R2 hay adjusted R2 như là ứng
viên sáng giá cho tiêu chí để lựa chọn mô hình:

1. Không giúp đưa ra kết luận rõ ràng (a “soft” rule)


2. Không có phân phối cho các giá trị của R 2 hay R2

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 57


Mô hình hồi quy tuyến tính đa biến – Thực hành trên EVIEWS
Có dữ liệu về chỉ số S&P500 và các biến vĩ mô GDP, CPI, UST-bill 3 months như
sau:

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 58


Thực hiện kéo và thả dữ liệu từ Excel vào Eviews và có kết quả như sau:

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 59


Kết quả hồi quy mô hình tuyến tính đa biến – APT
như sau:

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 60


H0 = không bỏ sót biến GDP
Cả F và LR tests đều cho ra kết quả là bác bỏ giả
thiết H0 hay biến GDP nên được đưa vào mô hình

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 61


Kiểm định Non-nested Hypotheses
• Tất cả các giả thiết được kiểm định cho đến giờ đều trong ngữ cảnh
của “nested” models.

• Bây giờ giả sử chúng ta muốn so sánh 2 mô hình kiểm định (non-
nested models) sau:
Model 1 : yt  1   2 x2t  ut
Model 2 : yt  1   2 x3t  vt

• Chúng ta có thể sử dụng R2 hoặc adjusted R2, nhưng nếu ta gặp trường
hợp số biến giải thích là khác nhau giữa 2 mô hình?

• Có một cách tiếp cận khác là sử dụng kiểm định mô hình kết hợp :
Model 3 : yt   1   2 x2t   3 x3t  wt

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 62


Kiểm định Non-nested Hypotheses

• Có tất cả 4 khả năng cho ra kết quả như sau khi mô hình 3 được ước lượng:
– 2 có ý nghĩa thống kê nhưng 3 thì không
– 3 có ý nghĩa thống kê nhưng 2 thì không
– 2 và 3 đều không có ý nghĩa thống kê
– Cả 2 và 3 đều có ý nghĩa thống kê

• Những vấn đề khác khi sử dụng mô hình kiểm định “kết hợp”
– Mô hình kết hợp có thể không có ý nghĩa về mặt lý thuyết
– Có thể có tương quan cao giữa 2 biến số khi được kết hợp chung vào
trong cùng một mô hình x2 and x3.
– Để kiểm định Non-nested Hypotheses, xem Davidson and MacKinnon
(1981) hay Gujatari (2003, page 533)

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 63


Mô hình hồi quy đa biến - Thực hành Eviews
Nhập dữ liệu từ excel và đặt tên là macro.wf1:
- Mở chương trình Eviews
- Cách 1: sử dụng Proc Import
- Cách 2: kéo rê file excel từ Window Explorer và thả trực tiếp vào
môi trường Eviews

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 64


C3: Mô hình hồi quy đa biến - Thực hành Eviews
Chuyển đổi biến trong file macro.wf1 như sau:

-Cách 1: sử dụng function “Series” hay “Genr” trong cửa sổ command, ví dụ:
Genr dcredit = consumer_credit - consumer_credit(-1)
hoặc
Series dcredit = consumer_credit - consumer_credit(-1)
hoặc
Genr dcredit = d(consumer_credit)
hoặc
Series dcredit = d(consumer_credit)
=> Tất cả đều cho kết quả như nhau.

- Cách 2: sử dụng menu Quick\Generate Series... sau đó chọn Genr và nhập vào
các phương trình chuyển đổi như sau:
dcredit = consumer_credit - consumer_credit(-1)
dcredit = d(consumer_credit)

=> Tất cả đều cho kết quả như nhau.


Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 65
Mô hình hồi quy đa biến - Thực hành Eviews – phần 2

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 66


Mô hình hồi quy đa biến - Thực hành Eviews – phần
2

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 67


Mô hình hồi quy đa biến - Thực hành Eviews – Kiểm định Wald

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 68


Mô hình hồi quy đa biến - Thực hành Eviews – Kiểm định LR

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 69


Mô hình hồi quy đa biến - Thực hành Eviews –Stepwise regression

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 70


Mô hình hồi quy đa biến - Thực hành Eviews –Stepwise regression

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 71


Bài tập chương 1: Mô hình hồi quy đa biến (Multiple Regression)
và thực hành sử dụng biến giả (Dummy) với dữ liệu về thị trường
bất động sản
• Mô hình Hedonic House Pricing Models được sử dụng để đánh giá tài sản
thực, đặc biệt là nhà ở dựa trên cho một loạt những đặc điểm tương ứng.

(a) λ = 1 for both dependent and independent variables—a linear specification

(c) λ = 0 for both dependent and all continuous independent variables –


a logarithmic specification

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 72


Project chương 1: A Multiple Regression Example:
Hedonic House Pricing Models
Thực hành sử dụng biến Dummy

Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 73


Definition Standard explanatory variable Expected sign
1. AGE – the old age of the house/building Continuous variable (-)
2. BEDRS, the total number of bedrooms. - (+)
3. FBATH - the total number of full baths. - (+)
4. FIREPL - the total number of fireplaces. - (+)
5. HBATH - the total number of half baths. - (+)
6. SQFT, the total number of square feet of interior living space. - (+)
1. WATERD = 1 if the house has a water front, bay or ocean view (Dummy for water front) Dummy (+)
2. DEEPD = 1 if DWF, BAY, OCN and otherwise = 0 for deep water (+)
1. POOLD = 1 if the house has a swimming pool, otherwise 0 (Dummy for swimming pool) (+)
2. NORFD = 1 if the house is located in Norfolk, otherwise 0 (Dummy for location) (+)
3. CHESD = 1 if the house is located in Chesapeake, otherwise 0 (Dummy for location) (+)
4. VBCHD = 1 if the house is located in Virginia Beach, otherwise 0 (Dummy for location) (+)
5. PORTD = 1 if the house is located in Portsmouth, otherwise 0 (Dummy for location) (+)
6. NEWD =1 if the house was new at the time of sale, otherwise 0 (Dummy for new construction) (+)
7. OWND = 1 if the type of ownership of the house is simple, (Dummy for ownership) (-)
otherwise 0 Dummy for type of home (+)
8. DETD =1 if type of home is “detached”, otherwise 0 Continuous variable (+)
9. MKTTIME the number of days it took to sell a house Continuous variable (+)
10. TIME: the number of months represent the period of time from 1995
up to the last month of the year sold.Vũ Việt Quảng - Khoa Tài Chính - ĐHKT TPHCM 74

You might also like