A6 HQTQ

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 71

Chương 6: PHÂN TÍCH

HỒI QUY TƯƠNG QUAN


Nội dung
◼ Những vấn đề chung về phương pháp phân tích hồi quy tương
quan
◼ Hồi quy tương quan tuyến tính đơn
◼ Dạng phương trình hồi quy tuyến tính đơn
◼ Phương pháp bình phương nhỏ nhất
◼ Ước lượng các hệ số (và ý nghĩa)
◼ Hệ số xác định
◼ Hệ số tương quan
◼ Kiểm định hệ số hồi quy
◼ Khoảng tin cậy của hệ số hồi quy
◼ Kiểm định ý nghĩa của mô hình
◼ Dự doán dựa vào phương trình hồi quy
◼ Hồi quy tương quan phi tuyến???
◼ Hồi quy tương quan bội
1. Một số vấn đề chung về HQ-TQ

1.1. Khái niệm HQ-TQ


1.2. Liên hệ hàm số và liên hệ tương quan
1.3. Một số dạng liên hệ
1.4. Nhiệm vụ của phương pháp HQ-TQ
2. Hồi quy tuyến tính đơn
2.1. Phương trình hồi quy tuyến tính đơn
2.2. Phương pháp bình phương nhỏ nhất
2.3. Ước lượng các hệ số (và ý nghĩa)
2.4. Hệ số xác định
2.5. Hệ số tương quan
2.6. Kiểm định hệ số hồi quy
2.7. Khoảng tin cậy của hệ số hồi quy
2.8. Kiểm định ý nghĩa của mô hình
2.9. Dự doán dựa vào phương trình hồi quy
2.1. Phương trình hồi quy tuyến tính đơn

Phương trình hồi quy tổng thể chung:


Hệ số hồi Sai số
Tham số tự Biến độc lập ngẫu
quy
do nhiên
Biến phụ
thuộc

Yi = β0 + β1Xi + ε i
Phương trình hồi quy tổng thể chung
(tiếp)

Y Yi = β0 + β1Xi + ε i
Giá trị thực tế

εi Độ dốc = β1
Giá trị lý thuyết Sai số ngẫu
nhiên

Tham số tự


do = β0
Xi X
Phương trình hồi quy mẫu
Phương trình hồi quy mẫu cung cấp một ước lượng
cho đường hồi quy tổng thể
Ước lượng Ước lượng Ước lượng hệ
(hoặc dự tham số tự do số hồi quy
đoán) giá trị y
của quan sát
i Giá trị x của

yˆ i = b0 + b1x i quan sát i

Trung bình của các sai số ngẫu nhiên ei có giá trị bằng 0

ei = ( y i - yˆ i ) = y i - (b0 + b1x i )
2.2. Phương pháp bình phương
nhỏ nhất (OLS)

◼ b0 và b1 được tính bằng cách lấy giá trị b0


và b1 thỏa mãn tổng bình phương chênh
lệch giữa y và ŷ là nhỏ nhất:

min SSE = min  ei2

= min  (y i −yˆ i )2

= min  [y i − (b0 + b1x i )]2


2.3. Ước lượng các hệ số

◼ Từ đó, công thức tính các hệ số:

◼ Cách 1:  y = nb0 + b1  x



 xy = b0  x + b1  x 2

b = xy − x y
 1  2x
◼ Cách 2: 
b = y − b x
 0 1
Ý nghĩa của các hệ số trong
phương trình hồi quy

◼ b0 là tham số tự do, thể hiện giá trị của y khi x = 0,
là ảnh hưởng trung bình của tất cả các tiêu thức
nguyên nhân khác ngoài x tới y.

◼ b1 là hệ số hồi quy, nói lên ảnh hưởng trực tiếp của
x đến y. Khi x thay đổi 1 đơn vị thì y thay đổi
trung bình b1 đơn vị (y trung bình thay đổi b1 đơn
vị).
Ví dụ

◼ Một công ty bất động sản mong muốn khảo sát


mối quan hệ giữa giá bán nhà và diện tích nhà
(theo mét vuông)

◼ Một mẫu ngẫu nhiên gồm 10 căn nhà được lựa


chọn
◼ Biến phụ thuộc (Y) = giá nhà (đơn vị tính
$1000s)
◼ Biến độc lập (X) = Diện tích (mét
vuông)
Dữ liệu mẫu
Giá nhà ($1000s) Diện tích (Mét vuông)
(Y) (X)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
Mô tả bằng đồ thị

Đồ thị scatter


450
400
($1000s)

350
300
250
200
Gi nh

150
100
50
0
0 500 1000 1500 2000 2500 3000

Diện tích ( ét vuông)


Sử dụng SPSS
◼ Analyze/Regression/Linear...
Bảng kết quả SPSS
(tiếp)
Regression Statistics
Multiple R 0.76211 The regression equation is:
R Square 0.58082
Adjusted R Square 0.52842 gia nha = 98.24833 + 0.10977 (dien tich)
Standard Error 41.33032
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Đồ thị kết quả
◼ Mô hình về giá nhà: Đồ thị scatter và
đường hồi quy
450
400
($1000s)

350 Hệ số hồi quy


300
250
= 0.10977
Gi nh

200
150
100
50
Hệ sô tự do 0
= 98.248 0 1000 2000 3000
Diện tích ( ét vuông)

gia nha = 98.24833 + 0.10977 (dien tich)


2.4. Hệ số tương quan

◼ Được sử dụng để đánh giá chiều hướng và cường độ
của mối liên hệ tương quan tuyến tính
◼ Công thức tính: xy − x y x
r= = b1
 x y y
◼ Tính chất:

Liên hệ hàm số Liên hệ hàm số


Không có mối liên hệ
Liên hệ nghịch Liên hệ thuận

-1 0 +1

Mối liên hệ nghịch càng chặt chẽ Mối liên hệ thuận càng chặt chẽ
2.5. Hệ số xác định, R2

◼ Nhằm đánh giá sự phù hợp của mô hình: sự


thay đổi của biến độc lập giải thích được bao
nhiêu phần trăm sự thay đổi của biến phụ
thuộc
◼ Ký hiệu R2
SSR
R =
2
SST
Lưu ý:

0 R 1
2
Đồ thị minh họa
(tiếp)
Y
yi 
 2 y
SSE = (yi - yi )
_
SST = (yi - y)2

y  _2
_ SSR = (yi - y) _
y y

xi X
Đo lường các biến thiên

◼ Biến thiên của biến phụ thuộc:


SST = SSR + SSE
Biến thiên của biến Biến thiên của hồi quy Biến thiên của phần dư
phụ thuộc Su of Squares Su of Squares
Su of Squares Total Regression Residual

SST =  (y i − y)2 SSR =  (yˆ i − y)2 SSE =  (y i − yˆ i )2


Trong đó:
y = giá trị trung bình của biến phụ thuộc
yi = giá trị quan sát của biến phụ thuộc
ŷi = giá trị dự đoán y với giá trị xi cho trước
Hệ số tương quan và Hệ số xác định
(tiếp)

◼ Trong phương trình hồi quy đơn, hệ số xác


định và hệ số tương quan có mối liên hệ như
sau:

R 2 = r2
Adjusted R Square(hệ số r bình phương hiệu
chỉnh): sự ảnh hưởng của các biến độc lập, (1-
Rsquars) là sự ảnh hưởng của sai số t\j nhiên
và biến ngoài mô hình
Bảng kết quả SPSS
SSR 18934.9348
Regression Statistics
R =2
= = 0.58082
Multiple R 0.76211 SST 32600.5000
R Square 0.58082
Adjusted R Square 0.52842 58.08% sự thay đổi trong giá
Standard Error 41.33032 nhà được giải thích bằng sự
Observations 10
thay đổi trong diện tích
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
2.6. Kiểm định ý nghĩa của hệ số
hồi quy
◼ Sử dụng thống kê t
◼ Có mối liên hệ tuyến tính giữa X and Y không?
◼ Cặp giả thuyết:
H0: β1 = 0 (không có mối liên hệ tuyến tính)
H1: β1  0 (có mối liên hệ tuyến tính)
◼ Tiêu chuẩn kiểm định

b1 − β1
Trong đó:

t= b1 = hệ số hồi quy trong pt mẫu


sb1 β1 = hệ số hồi quy trong pt tổng
thể chung
sb1 = sai số chuẩn của hệ số hồi
d.f. = n − 2 quy
Sai số chuẩn của hệ số hồi quy

◼ Công thức tính

2
s
sb =
2 e
1
 i
(x − x ) 2

với:
sb1 = sai số chuẩn của hệ số hồi quy

SSE
se = = sai số chuẩn của mô hình. Kết quả từ SPSS
n−2
Bảng kết quả SPSS
Regression Statistics
Multiple R 0.76211 se = 41.33032
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Bảng kết quả SPSS
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error
Observations
41.33032
10
sb1 = 0.03297
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Ví dụ
Giá nhà Diện tích (mét Phương trình hồi quy:
$1000s vuông)
(y) (x)
gia nha = 98.25 + 0.1098 (dien tich)
245 1400
312 1600
279 1700
308 1875 Hệ số hồi quy trong mô hình này
199 1100 = 0.1098
219 1550
405 2350 Liệu diện tích có thực sự ảnh
324 2450 hưởng đến giá bán?
319 1425
255 1700
Kết quả SPSS

b1 sb1
H0: β1 = 0 Từ kết quả SPSS:
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039

b1 − β1 0.10977 − 0
t= = t = 3.32938
sb1 0.03297
Kết quả SPSS
(tiếp)
Tiêu chuẩn kiểm định: t = 3.329
b1 sb1 t
H0: β1 = 0
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
d.f. = 10-2 = 8 Square Feet 0.10977 0.03297 3.32938 0.01039

t8,.025 = 2.3060
Kết luận:
a/2=.025 a/2=.025 Bác bỏ H0

Diện tích có mối liên hệ với


-tn-2,α/2 0 tn-2,α/2 giá bán nhà
-2.3060 2.3060 3.329
Kiểm định dựa trên giá trị P-value
(tiếp)
P-value = 0.01039
P-value
H0: β1 = 0 Từ bảng kết quả SPSS:
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
Square Feet 0.10977 0.03297 3.32938 0.01039

Đây là kiểm định 2 phía, Kết luận: P-value < α do đó


do đó: Bác bỏ H0
P(t > 3.329)+P(t < -3.329)
= 0.01039 Diện tích thực sự có
(với bậc tự do = 8) ảnh hưởng đến giá nhà
2.7. Khoảng tin cậy của hệ số hồi quy
Công thức:
b1 − t n−2,α/2 sb1  β1  b1 + t n−2,α/2 sb1
d.f. = n - 2

Bảng kết quả SPSS:


Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

Với mức ý nghĩa 5% khi diện tích tăng lên 1 m2 thì giá
nhà tăng trong khoảng (0.0337, 0.1858) (1000$)
2.8. Kiểm định ý nghĩa của mô hình
◼ Sử dụng thống kê F
◼ Mô hình hồi quy có ý nghĩa thống kê hay không?

◼ Cặp giả thuyết:


H0: R2 = 0 H0: b1 = 0

H1: R2  0 H1: b1  0
2.8. Kiểm định ý nghĩa của mô hình
(tiếp)

Kiểm định F: MSR



F=
MSE
Với: SSR
MSR =
k
SSE
MSE =
n − k −1
Trong đó: F tuân theo phân phối F với k là số biến độc lập trong
mô hình (đối với hồi quy đơn là 1) và (n – k - 1) là bậc tự do (đối
với hồi quy đơn là n-2
Bảng kết quả SPSS
Regression Statistics
Multiple R 0.76211
MSR 18934.9348
R Square 0.58082 F= = = 11.0848
Adjusted R Square 0.52842 MSE 1708.1957
Standard Error 41.33032
Observations 10 Bậc tự do Gi trị P-value
của kiể định F
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
Kiểm định F –
Kiểm định ý nghĩa của mô hình
(tiếp)

H0: R2 = 0 Tiêu chuẩn kiể định:


H1: R2 ≠ 0 MSR
F= = 11.08
a = .05 MSE
df1= 1 df2 = 8 Kết luận:
Critical Bác bỏ H0 với a = 0.05
Value:
Fa = 5.32
Mô hình thực sự có ý nghĩa.
a = .05 Diện tích thực sự ảnh hưởng
đến giá nhà
0 Do not Reject H0
F
reject H0
F.05 = 5.32
Bảng kết quả SPSS tổng quát
Regression Statistics
Multiple R : Hệ số tương quan (r)

R Square : Hệ số xác định (R2 ) = SSR/SST

Adjusted R Square: Hệ số xác định hiệu chỉnh = 1 - (1 - R2 ) * n-1/n-k-1


Standard Error : Sai số chuẩn mô hình (SE hoặc Se ) Se2 = SSE/n-k-1

Observations : Số quan sát ( n)


ANOVA Sum of
df Squares Mean Squares F Significance F
Regression k SSR MSR = SSR/k MSR/MSE

Residual n-k-1 SSE MSE = SSE/n-k-1


Total n -1 SST
Standar
Coefficients d Error t Stat P-value Lower 95% Upper 95%
Intercept bo Sbo t qsb0 = b0 /Sb0
Square Feet b1 Sb1 tqsb1 =b1 /Sb1
11.6
2.9. Dự đoán dựa vào phương trình hồi quy
Dự đoán điểm

◼ Dựa vào phương trình hồi quy mẫu để dự


đoán giá trị y với giá trị x cụ thể

◼ Với giá trị x0 , giá trị dự đoán là:

ŷ 0 = b 0 + b1x 0
Ví dụ:
Dự đoán giá nhà với diện
tích là 2000 mét vuông:

gia nha = 98.25 + 0.1098 (dien tich)


= 98.25 + 0.1098(2000)
= 317.85

Giá trị dự đoán là 317.85($1,000s) = $317,850


Dự đoán khoảng
Dự đoán giá trị trung bình
Giá trị trung bình của tiêu thức kết quả với
một giá trị cụ thể của tiêu thức nguyên nhân

1 (x 0 − x) 2 
ŷ 0  t n − 2,α/2s e  + 2
 n  (x i − x) 

Với ŷ 0 l giá trị dự đo n điể của y với giá trị cụ
thể của tiêu thức nguyên nhân x0
Ví dụ

Với mức ý nghĩa 5%, dự đoán mức giá trung bình
của nhà có diện tích 2000 mét vuông


y0 = 317.85 ($1,000s)
1 (x 0 − x) 2
ŷ 0  t n -2,α/2s e + = 317.85  37.12
n  (x i − x) 2

Vậy mức giá trung bình trong khoảng từ $280,660 đến
$354,900
Dự đoán khoảng
Dự đoán giá trị cá biệt
Giá trị cá biệt của tiêu thức kết quả với một
giá trị cụ thể của tiêu thức nguyên nhân:

 1 (x 0 − x) 2 
ŷ 0  t n − 2,α/2s e 1 + + 2
 n  (x i − x) 
Ví dụ

Với mức ý nghĩa 5%, dự đoán giá nhà của nhà có
diện tích 2000 mét vuông


y0 = 317.85 ($1,000s)

1 (X 0 − X) 2
ŷ 0  t n -1,α/2s e 1+ + = 317.85  102.28
n  (X i − X) 2

Vậy giá nhà tỏng khoảng từ $215,500 đến $420,070

Ch. 11-42
3. Hồi quy tương quan phi tuyến

◼ Một số dạng phương trình

◼ Tỷ số tương quan
4. Hồi quy tuyến tính bội
4.1. Phương trình hồi quy tuyến tính bội

4.2. Ước lượng các hệ số (và ý nghĩa)

4.3. Hệ số hồi quy chuẩn hóa

4.4. Hệ số xác định

4.5. Kiểm định hệ số hồi quy

4.6. Khoảng tin cậy của hệ số hồi quy

4.7. Kiểm định ý nghĩa của mô hình

4.8. Dự doán dựa vào phương trình hồi quy


4.1. Xây dựng
phương trình hồi quy bội

Ý tưởng: Xác định xem có mối liên hệ tuyến tính giữa 1
biến phụ thuộc (Y) và nhiều biến độc lập (Xi) hay không

Mô hình hồi quy bội với k biến độc lập:


Hệ số hồi quy
Tham số tự do Sai số ngẫu nhiên
của tổng thể

Y = β0 + β1X1 + β 2 X 2 +  + βk Xk + ε
Phương trình hồi quy bội

Sử dụng dữ liệu mẫu để ước lượng cho các hệ số của mô


hình hồi quy bội

Phương trình hồi quy bội với k biến độc lập:


Giá trị ước Ước lượng của
lượng của y Ước lượng của các hệ số hồi quy
tham số tự do

yˆ i = b0 + b1x1i + b 2 x 2i +  + bk x ki

Hệ số hồi quy riêng phần


4.2. Ước lượng
hệ số hồi quy riêng phần
Hai biến độc lập
y
yi
<
Giá trị quan sát yˆ = b0 + b1x1 + b 2 x 2

yi
ei = (yi – yi)

<
x2i
x2
x1i Xác định các hệ số
trong phương trình bằng
phương pháp
x1
bình phương nhỏ nhất
4.2. Ước lượng
hệ số hồi quy riêng phần

 y = n.b 0 + b1  x1 +b 2  x 2 + ...b k  x k

 x1y = b 0  x1 + b1  x1 +b 2  x1x 2 + ...b k  x1x k
2


  x 2 y = b 0  x 2 + b1  x x
1 2 +b 2  x 2 + ...b k  x 2 x k
2

.....
.....

.....

 x k y = b 0  x k + b1  x1 x k +b 2  x 2 x k + ...b k  x k
2

4.3. Hệ số hồi quy chuẩn hóa

 Sx k 
Hệ số hồi quy chuẩn hóa: Beta k = b k . 
 Sy 
 
dùng để so sánh các hệ số hồi quy với nhau
Ví dụ:
Hồi quy bội với 2 biến độc lập
◼ Một nhà phân phối bánh ngọt muốn đánh giá ảnh
hưởng của các nhân tố tới nhu cầu thị trường

◼ Biến phụ thuộc: y - Số lượng bánh bán ra (cái/tuần)


◼ Biến độc lập: x1 - Giá bán ($)
x2 - Chi phí quảng cáo ($100)

◼ Dữ liệu được tổng hợp trong 15 tuần


Ví dụ về lượng bánh bán ra
Lượng
bánh
Giá
bán
Chi phí
quảng c o Phương trình hồi quy bội:
Tuần bán ra ($) ($100)
1 350 5.50 3.3
2 460 7.50 3.3 Lượng bánh = b0 + b1 x1
3 350 8.00 3.0
+ b2 x2
4 430 8.00 4.5
5 350 6.80 3.0
6 380 7.50 4.0
7 430 4.50 3.0
8 470 6.40 3.7
9 450 7.00 3.5
10 490 5.00 4.0
11 340 7.20 3.5
12 300 7.90 3.2
13 440 5.90 4.0
14 450 5.00 3.5
15 300 7.00 2.7
12.2
Ước lượng phương trình
hồi quy tuyến tính bội
◼ Sử dụng SPSS để xác định các hệ số và các chỉ
tiêu đo lường sự phù hợp của mô hình hồi quy bội.
◼ Analyze/Regression/Linear...

Ch. 12-52
Kết quả hồi quy bội
Regression Statistics
Multiple R 0.72213
R Square 0.52148
Adjusted R Square 0.44172 Luong = 306.526 - 24.975(Gia) + 74.131(CPQC)
Standard Error 47.46341
Observations 15

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Giá bán -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Chi phí quảng c o 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Ý nghĩa hệ số hồi quy

Luong = 306.526 - 24.975(Gia) + 74.131(CPQC)


trong đó:
y: Lượng bánh bán ra (cái/tuần)
x1: Giá bánh ($)
x2: Chi phí quảng cáo ($100)
b1 = -24.975: Giá bán b2 = 74.131: Chi phí
tăng lên 1$ sẽ làm quảng cáo tăng lên
cho lượng bánh bán 100$ sẽ làm cho
ra giảm trung bình là lượng bánh bán ra
24.975 cái 1 tuần tang 74.131 cái 1
trong điều kiện chi phí tuần trong điều kiện
quảng cáo không đổi. giá bán không đổi.
4.4. Kiểm định hệ số hồi quy

◼ Sử dụng kiểm định t-Student đối với kiểm định hệ


số hồi quy riêng phần
◼ Cho biết biến độc lập có thực sự có ý nghĩa không
◼ Cặp giả thuyết:
◼ H0: βi = 0 (không có liên hệ tuyến tính)
◼ H1: βi ≠ 0 (tồn tại liên hệ tuyến tính giữa
biến xi and y)
Kiểm định hệ số hồi quy
Tiêu chuẩn kiểm định:

bi − 0
t= (df = n – k – 1)
se b i

Trong đó:

se b i = se 2b i =
SSE
=
(yi − ŷi )
2

n − K −1 n − K −1
Kiểm định hệ số hồi quy
Regression Statistics
t-value của biến Gi l t = -2.306,
Multiple R 0.72213
R Square 0.52148
với p-value .0398
Adjusted R Square 0.44172
Standard Error 47.46341 t-value của biến Chi phí quảng c o
Observations 15 l t = 2.855, với p-value .0145

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Giá bán -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Chi phí quảng c o 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Ví dụ: Kiểm định các hệ số
hồi quy
Từ bảng kết quả SPSS:
H0: βj = 0 Coefficients Standard Error t Stat P-value
H1: βj  0 Giá bán -24.97509 10.83213 -2.30565 0.03979
Chi phí
d.f. = 15-2-1 = 12 quảng c o 74.13096 25.96732 2.85478 0.01449

a = .05 Thống kê t của mỗi biến đều nằm trong


t12, .025 = 2.1788 miền bác bỏ (p-values < .05)
Quyết định:
a/2=.025 a/2=.025 Bác bỏ H0 với từng biến
Kết luận:
Với mức ý nghĩa 5% và phương
trình hồi quy mẫu trên, cả Giá
-tα/2 tα/2 bán và Chi phí quảng cáo đều
0
-2.1788 2.1788 thực sự có ảnh hưởng tới
lượng bánh bán ra.
4.5. Khoảng tin cậy của hệ số hồi quy
Hai giới hạn đối với khoảng tin cậy của hệ số hồi quy βj

b j  t n−K −1,α/2Sb j Trong đó:


(n – K – 1) d.f.

Coefficients Standard Error


Intercept 306.52619 114.25389 Trong ví dụ này, t có:
Price -24.97509 10.83213
(15 – 2 – 1) = 12 d.f.
Advertising 74.13096 25.96732

Ví dụ: Tìm khoảng tin cậy 95% cho hệ số hồi quy của giá bán (x1):
-24.975 ± (2.1788 x 10.832)
Vậy khoảng tin cậy là: -48.576 < β1 < -1.374
4.5. Khoảng tin cậy của hệ số hồi quy

Khoảng tin cậy đối với hệ số hồi quy βj

Coefficients Standard Error … Lower 95% Upper 95%


Intercept 306.52619 114.25389 … 57.58835 555.46404
Price -24.97509 10.83213 … -48.57626 -1.37392
Advertising 74.13096 25.96732 … 17.55303 130.70888

Ví dụ: Kết quả SPSS cho biết hai giới hạn của khoảng tin cậy:
Với khoảng tin cậy 95%, khi giá bán tăng lên 1$ thì lượng
bánh bán ra hàng tuần sẽ giảm trong khoảng 1.37 đến 48.58 cái.
4.6. Hệ số xác định R2
Regression Statistics
SSR 29460.0
Multiple R 0.72213
R = 2
= = .52148
R Square 0.52148 SST 56493.3
Adjusted R Square 0.44172
Standard Error 47.46341
52.1% sự biến động của lượng
Observations 15 b nh b n ra được giải thích bởi gi
b n v chi phí quảng c o
ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Giá bán -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Chi phí quảng c o 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall Ch. 12-61
4.7. Kiểm định ý nghĩa của mô hình

◼ Kiểm định F ý nghĩa hay sự phù hợp của mô hình


◼ Cho biết có mối liên hệ tuyến tính giữa tất cả biến
độc lập X và biến phụ thuộc Y hay không.
◼ Sử dụng tiêu chuẩn kiểm định F
◼ Cặp giả thuyết:
H0: β1 = β2 = … = βk = 0 (không có MLH tuyến tính)
H1: có ít nhất βi ≠ 0 (có ít nhất 1 biến độc lập
ảnh hưởng đến Y)
4.7. Kiểm định ý nghĩa của mô hình

◼ Tiêu chuẩn kiểm định F:

MSR SSR/k
F= =
MSE SSE/(n − k − 1)

◼ Cơ sở ra quyết định là

F  Fk, n − k −1, α ◼ → Bác bỏ H0


4.7. Kiểm định ý nghĩa của mô hình
Regression Statistics
Multiple R 0.72213
MSR 14730.0
R Square 0.52148
F= = = 6.5386
Adjusted R Square 0.44172
MSE 2252.8
Standard Error 47.46341
Observations 15 Bậc tự do P-value của
kiể định F

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888

Copyright © 2010 Pearson Education, Inc. Publishing as Prentice Hall Ch. 12-64
Kiểm định
sự phù hợp của mô hình

H0: β1 = β2 = 0 Thống kê F:
H1: β1 và β2 không cùng bằng 0 F = 6.5386
a = .05
df1= 2 df2 = 12
Quyết định:
Gi trị tới hạn: Vì thống kê F nằm trong
Fa = 3.885 miền bác bỏ (p-value < .05)
nên bác bỏ H0
a = .05
Kết luận:
0 F Với ức ý nghĩa 5%, có ít nhất ột
Chưa đủ Bác bỏ H0
cơ sở biến độc lập ảnh hưởng tới Y
bác bỏ H0
F.05 = 3.885
4.8. Dự đoán dựa vào mô hình hồi quy bội

◼ Với mô hình hồi quy tổng thể cho trước là


y i = β0 + β1x1i + β 2 x 2i +  + βK x Ki + ε i (i = 1,2,, n)

thực hiện dự đoán đối với một quan sát mới có dữ liệu:
(x1,n+1, x 2,n+1, . . . , x K,n+1)
Giá trị dự đoán không chệch tốt nhất của y^n+1 là:

yˆ n+1 = b0 + b1x1,n+1 + b 2 x 2,n+1 +  + bK x K,n+1

◼ Không nên dự đoán khi giá trị của X nằm ngoài khoảng
dữ liệu sử dụng để ước lượng các tham số của
phương trình hồi quy mẫu vì dữ liệu chưa đủ để đảm
bảo mô hình tuyến tính mở rộng có ý nghĩa.
4.8. Dự đoán dựa vào mô hình hồi quy bội

Dự đoán lượng bánh bán ra trong tuần khi giá


bán là $5.50 và chi phí quảng cáo là $350:

Sales = 306.526 - 24.975(Price) + 74.131(Adv ertising)


= 306.526 - 24.975 (5.50) + 74.131 (3.5)
= 428.62

Chú ý, chi phí quảng cáo


Lượng bán dự có đơn vị là 100$ nên
$350 sẽ tương ứng với
báo là 428.62 X2 = 3.5
cái
DẠNG CÂU HỎI THI
DẠNG CÂU HỎI THI
DẠNG CÂU HỎI THI

III. Bài tập

Người quản lý của một đại lý xe ô tô đã sử dụng rất quan tâm đến
giá bán lại của chiếc xe đã qua sử dụng. Ông ta thấy rằng số năm sử
dụng của xe rất quan trọng trong việc xác định giá trị bán lại. Ông
thu thập dữ liệu về số năm sử dụng và giá trị bán lại của 15 chiếc xe
và chạy phân tích hồi quy với giá trị của chiếc xe (nghìn USD) là
biến phụ thuộc và số năm sử dụng của xe (theo năm) là biến độc lập.
Thật không may, ông ta làm đổ cà phê vào bản in và mất một số kết
quả, được ký hiệu từ "A" đến "F". Phần kết quả còn lại được cho
bên dưới.
DẠNG CÂU HỎI THI

You might also like