Professional Documents
Culture Documents
Baigiang TKNC5
Baigiang TKNC5
Baigiang TKNC5
Trong thùc tÕ, nhiÒu khi cÇn dù b¸o hoÆ c í c l î ng gi¸ trÞ
cña mét ®¹i l î ng (biÕn ®î c í c l î ng, ®î c m« t¶) theo
mét hay nhiÒu ®¹i l î ng kh¸c (biÕn dï ng ®Ó í c l î ng,
dï ng ®Óm« t¶) th«ng qua mét c«ng thøc nµo ®ã. Lóc ®ã
ng êi ta dï ng ph ¬ng ph¸p Ph©n tÝch Håi quy.
ThÝdô. XÐt mèi quan hÖgi÷ chØsè trÝtuÖIQ cña n häc sinh
vµ kÕt qu¶ häc tËp cña c¸c m«n trong tr êng. Ng êi ta cÇn
biÕt, liÖu cã thÓ í c l î ng chØsè IQ qua ®iÓm sè c¸c m«n häc
hay kh«ng?
NÕu c«ng thøc dï ng ®ÓbiÓu diÔn sù phô thuéc cña biÕn
® î c m« t¶ (cßn gäi lµ biÕn phô thuéc) vµo c¸c biÕn dï ng ®Ó
m« t¶ (® î c gäi lµ biÕn ®éc lËp) cã d¹ng tuyÕn tÝnh th×
ph ¬ng ph¸p ® î c gäi lµ håi quy tuyÕn tÝnh. T ¬ng tù,
ng êi ta cßn cã c¸c ph ¬ng ph¸p håi quy ®a thøc, håi quy
phi tuyÕn, v.v.
Håi quy ®¬n
Trong nhiÒu bµi to¸n, gi÷a biÕn ®éc lËp vµ biÕn phô thuéc
kh«ng cã mèi quan hÖtuyÕn tÝnh. Lóc ® ã ph¶i dï ng m« h×nh
håi quy phi tuyÕn
Y = f(X) + e
Trong ®ã f lµ mét hµm sè d¹ng phi tuyÕn.
ThÝdô. C© n nÆng cña trÎ nhá sÏ t¨ng theo th¸ng tuæi cña trÎ ,
nh ng t¨ng kh«ng ®Òu, cµng vÒsau møc t¨ng c© n hµng th¸ng
cµng Ýt. Nh vËy, ph¶i dï ng mét ph ¬ng tr×nh håi quy phi
tuyÕn ®Ódù ®o¸n c© n nÆ ng cña trÎ theo th¸ng tuæi.
Mét sè d¹ng phi tuyÕn.
* D¹ng b×nh ph ¬ng: Y = a. X 2 + b , lËp ph ¬ng Y = a. X 3 + b
* D¹ng ®a thøc: Y = a + b. X + c. X 2 + d . X 3 + ...
* D¹ng mò: Y = e a. X +b + c
* D¹ng l« ga: Y = a.log( X ) + b
* D¹ng c¨n: Y = a. X + b + c
* D¹ng nghÞch ® ¶o Y = a /( X + b) + c
. . .
Chó ý
1. Tr í c khi tiÕn hµnh thñ tôc håi quy, nªn dï ng ® å thÞ®¸m m©y
®iÓm biÓu diÔn quan hÖgi · biÕn ® éc lËp vµ biÕn phô thuéc ®Ó í c
®o¸n vµ lùa chän m« h× nh håi quy thÝch hî p;
2. NÕu hai m« h×nh ®Òu ®a ra kÕt qu¶ dù b¸o tèt nh nhau th×
nªn dï ng m« h×nh nµo ®¬n gi¶n h¬n ®ÓdÔgi¶i thÝch vµ sö dông
trong thùc tÕ;
¦ í c l î ng tham sè håi quy b»ng ph ¬ng ph¸p BPBN
X©
y dùng hµm håi quy mÉu d¹ng
Yˆi = aˆ. X i + bˆ
Yi = Yˆi + eˆi = aˆ. X i + bˆ + eˆi
∂2 f ∂2 f
m
2n 2∑ X i
ˆ
∂aˆ∂aˆ ∂aˆ∂b = i =1
∂2 f ∂2 f m m
ˆ 2∑ X 2∑ X 2
ˆ ˆ i i
∂b∂a ∂b∂b i =1
ˆ i =1
DÔdµng kiÓm tra tÝnh x¸c ®Þnh d ¬ng cña ma trËn trªn, vËy
f ®¹t min t¹i ( aˆ , bˆ)
C¸ch gi¶i quyÕt
§ ¹o hµm riªng phÇn cña f sÏ triÖt tiªu t¹i ®iÓm f ®¹t min
(®iÒu kiÖn cÇn):
m
∂f
= − ∑ 2(Yi − aˆ. X i − bˆ) = 0
∂aˆ i =1
m
∂f
= − ∑ 2(Yi − aˆ. X i − bˆ) X i = 0
∂bˆ i =1
Tõ ®ã ta cã
m m m m m
∑Yi = aˆ ∑ X i + mbˆ ; ∑Yi X i = aˆ ∑ X i2 + bˆ∑ X i
i =1 i =1 i =1 i =1 i =1
m
∑ X iYi − mX Y
aˆ = im=1 ; bˆ = Y − aX
ˆ
∑ X i2 − m( X )2
i =1
Mét sè tÝnh chÊt cña tham sè håi quy í c l î ng b»ng ph ¬ng
ph¸p BPBN
a) Trung b× nh cña c¸c phÇn d b»ng 0 :
1 m
eˆ = ∑ eˆi = 0
m i =1
b) § êng th¼ng håi quy lu«n ®i qua ®iÓm trung b× nh mÉu
Y = aX ˆ + bˆ
c) Trung b× nh c¸c gi¸ trÞdù b¸o b»ng trung b× nh mÉu cña Y :
m m
1 1
Yˆ = ∑Yˆi = Y = ∑Yi
m i =1 m i =1
d) C¸c gi¸ trÞdù b¸o kh«ng t ¬ng quan ví i c¸c phÇn d :
Cov ( eˆ, Yˆ ) = 0
e) PhÇn d kh«ng t ¬ng quan ví i biÕn ®éc lËp:
Cov ( eˆ, X ) = 0
C¸c gi¶ thiÕt cæ®iÓn cña m« h×
nh håi quy í c l î ng b»ng
ph ¬ng ph¸p BPBN
1) C¸c gi¸ trÞcña biÕn ®éc lËp X lµ kh«ng ngÉu nhiªn vµ ®î c
x¸c ®Þnh tõ tr í c
2) Sai sè ngÉu nhiªn cã kú väng b»ng 0 :
E (e | X i ) = 0
3) Sai sè ngÉu nhiªn cã ph ¬ng sai cè ®Þnh:
Var ( e | X i ) = σ 2
4) C¸c phÇn d kh«ng t ¬ng quan ví i nhau:
Cov ( ei , e j ) = 0 , ∀i ≠ j
5) PhÇn d lµ ®¹i l î ng ngÉu nhiªn cã ph© n bè chuÈn:
ei N (0, σ 2 )
§ Þnh lý Gaus-Markov
Ví i c¸c gi¶ thiÕt tõ 1 ®Õn 5 cña m« h× nh HQTT cæ®iÓn, í c l î ng
BPBN cña c¸c thamsè håi quy a vµ b lµ c¸c í c l î ng
- TuyÕn tÝnh
- Kh«ng chÖch
- Cã ph ¬ng sai bÐnhÊt ( í c l î ng hiÖu qu¶) trong lí p c¸c
í c l î ng tuyÕn tÝnh kh«ng chÖch cña a vµ b ).
CM: Hai ý ®
Çu Bµi tËp
TÝnh chÊt cña tham sè håi quy í c l î ng b»ng ph ¬ng ph¸p
BPBN
a) ¦ í c l î ng cña c¸c tham sè lµ í c l î ng kh«ng chÖch:
E ( aˆ ) = a ; Cov ( aˆ ) = σ 2 ( X T . X ) −1
b) C¸c phÇn d cã kú väng b»ng 0 :
E ( eˆ) = 0 ; Cov ( eˆ) = σ 2 ( I − X ( X T X ) −1 X T )
c) ¦ í c l î ng cña ph ¬ng sai:
m
1 1
σˆ 2 =
m − k −1
eˆT eˆ = ∑
m − k − 1 i =1
eˆi2
σˆ 2 ( e)
∑ i
X 2
σˆ 2 (e)
Var ( aˆ ) = m ; Var (bˆ) = i =1 .m
m
∑( Xi − X ) 2
∑ i
( X − X ) 2
i =1 i =1
3) Sai sè tiªu chuÈn cña c¸c tham sè håi quy
se( aˆ ) = Var ( aˆ ) , se(bˆ) = Var (bˆ)
Kho¶ng tin cËy cña c¸c hÖsè håi quy
§ Þnh lý. Ví i c¸c gi¶ thiÕt 1 ®Õn 5 cña m« h×nh HQTT cæ®iÓn, c¸c
®¹i l î ng sau liªn quan ®Õn thamsè håi í c l î ng ®î c theo
ph ¬ng ph¸p BPBN:
aˆ − a bˆ − b
;
se( aˆ ) se(bˆ)
lµ ®¹i l î ng ngÉu nhiªn cã ph©n phèi t-Student ví i m-2 bËc tù do
HÖqu¶. Ví i x¸c suÊt ý nghÜa α cho tr í c, kho¶ng tin cËy cña c¸c
thamsè håi quy sÏ lÇn l î t lµ
Ví i θ = a hoÆ
c θ = b ta ®Æ
t ra bµi to¸n kiÓm ®Þnh:
Gi¶ thuyÕt H 0 : θ = θ0
§ èi thuyÕt
- Hai phÝa H1 : θ ≠ θ 0
- Mét phÝa ph¶i H1 : θ > θ 0
- Mét phÝa tr¸i H1 : θ < θ0
C¸ch 1. Dï ng kho¶ng tin cËy cña tham sè: so s¸nh gi¸ trÞ θ0 ví i
kho¶ng tin cËy (θˆ − se(θˆ).tm −2 (α ) ; θˆ + se(θˆ).tm −2 (α ))
- NÕu θ0 n»m trong kho¶ng ®ã th×chÊp nhËn gi¶ thuyÕt,
- NÕu θ0 n»m ngoµi kho¶ng ®ã th×b¸c bá gi¶ thuyÕt
* Y lµ biÕn phô thuéc, ®î c dù b¸o b»ng c¸c biÕn cßn l¹i
* X1 , X 2 ,...,X k lµ c¸c biÕn ®éc lËp dï ng ®Ódù b¸o biÕn Y
* a1 , a 2 , ...,a k lµ c¸c hÖsè håi quy cho biÕt phÇn ®ãng gãp cña
mçi ®¬n vÞcña tõng biÕn ®éc lËp vµo sù t¨ng gi¶m cña biÕn phô thuéc ;
* b lµ h»ng sè håi quy (intercept), cho biÕt Y cã thÓnhËn gi¸ trÞban
®Çu lµ bao nhiªu khi tÊt c¶ c¸c biÕn ®éc lËp b»ng 0 ;
* e lµ phÇn d håi quy, thÓhiÖn sai sè cña m« h× nh ®î c í c l î ng
Khi vÕph¶i cña ph ¬ng tr×nh håi quy phÝa trªn ® î c thay b»ng
mét biÓu thøc phi tuyÕn cña c¸c biÕn ®éc lËp, ta sÏ cã m« h× nh
håi quy phi tuyÕn béi.
ThÝ dô
Y = a1 * X1 +a 2 * X 2 +...+a k * X k + b + e
* Y lµ tæng thu nhËp cña hé;
* X1 lµ diÖn tÝch ®Êt n«ng nghiÖp cña hé;
* X 2 lµ diÖn tÝch ® Êt v ên cña hé;
* X3 lµ diÖn tÝch ® Êt rõng;
* X 4 lµ sè tiÒn mua ph© n hãa häc;
* X5 lµ sè tiÒn mua thuèc trõ s© u;
* X 6 lµ sè tiÒn tr¶ cho tr¹m b¬m phôc vô t í i tiªu;
....
Nh vËy a1sÏ cho biÕt 1 ha ® Êt n«ng nghiÖp sÏ ®em l¹i bao nhiªu tiÒn;
a 4 cho biÕt 1000 ® ång mua ph© n bãn sÏ cho bao nhiªu thu nhËp;
a 6 thÓhiÖn tiÒn chi cho c¸c c¸n bé thñy lî i sÏ cã hiÖu qu¶ nh thÕnµo;
v.v.
¦ í c l î ng tham sè håi quy b»ng ph ¬ng ph¸p BPBN
LÊy mÉu
(Y1 , X 11 , X 21,..., X k1 )
(Y2 , X 12 , X 22 ,..., X k 2 )
...
(Ym , X 1m , X 2 m ,..., X km )
M« h×
nh håi quy sÏ cã d¹ng
Y1 = b + a1 X 11 + a2 X 21 + ... + ak X k 1 + e1
Y2 = b + a1 X 12 + a2 X 22 + ... + ak X k 2 + e2
...
Ym = b + a1 X 1m + a2 X 2 m + ... + ak X km + em
¦ í c l î ng tham sè håi quy b»ng ph ¬ng ph¸p BPBN
vµ
1 X 11 X 21 ... X k1
1 X X ... X
X = 12 22 k2
...
1 X 1m X 2m ... X km
¦ í c l î ng tham sè håi quy b»ng ph ¬ng ph¸p BPBN
M« h×
nh håi quy sÏ cã d¹ng ma trËn
Y = X .a + e
m
∑i
e 2
= (Y − X .a )T
(Y − X .a ) = f ( a ) = f ( b, a1 ,..., ak ) → min
i =1
Tøc lµ
Y T .Y − 2a T . X T .Y + a T . X T . X .a = f ( a ) → min
C¸ch gi¶i quyÕt
§ ¹o hµm riªng phÇn cña f sÏ triÖt tiªu t¹i ®iÓm f ®
¹t min
(®iÒu kiÖn cÇn):
∂f
= −2 X T .Y + 2 X T . X .a = 0
∂a
VËy ta cã
a = ( X T . X ) −1 X T .Y
∂2 f
= 2 X T .X
∂a ∂a
DÔdµng thÊy ® ©y lµ ma trËn cña mét d¹ng toµn ph ¬ng x¸c
®Þnh d ¬ng, vËy f ®¹t min t¹i nghiÖm võa t×m® î c.
ý nghÜa hi`nh häc cña Håi quy tuyÕn tÝnh
béi
Ví i c¸c quan s¸t trong mÉu, biÕn phô thuéc Y vµ c¸c biÕn ® éc
lËp X 1, X 2 ,..., X k ®Òu lµ nh÷ng vÐc t¬trong kh«ng gian c¸c biÕn .
Ŷ = a1. X 1 + a2 . X 2 + ... + ak . X k ,
ˆ
e = Y-Y
Wp
Wq
.
Yˆ ®îc
Trong trêng hîp nµy, cã thÓ dÔ dµng thÊy chÝnh
Y bÐ nhÊt cña
lµ íc lîng b×nh ph¬ng
C¸c gi¶ thiÕt cæ®iÓn cña m« h×
nh håi quy í c l î ng b»ng
ph ¬ng ph¸p BPBN
1) C¸c gi¸ trÞcña c¸c biÕn ®éc lËp lµ kh«ng ngÉu nhiªn vµ ®î c
x¸c ®Þnh tõ tr í c
2) Sai sè ngÉu nhiªn cã kú väng b»ng 0 :
E ( e | X 1 , X 2 ,..., X k ) = 0
3) Sai sè ngÉu nhiªn cã ph ¬ng sai cè ®Þnh:
Var ( e | X 1 , X 2 ,..., X k ) = σ 2
4) C¸c phÇn d kh«ng t ¬ng quan ví i nhau:
Cov (ei , e j ) = 0 , ∀i ≠ j
5) PhÇn d lµ ®¹i l î ng ngÉu nhiªn cã ph© n bè chuÈn:
ei N (0, σ 2 )
§ Þnh lý Gaus-Markov
Ví i c¸c gi¶ thiÕt tõ 1 ®Õn 5 cña m« h× nh HQTT cæ®iÓn, í c l î ng
BPBN cña c¸c tham sè lµ c¸c í c l î ng
- TuyÕn tÝnh
- Kh«ng chÖch
- Cã ph ¬ng sai bÐnhÊt ( í c l î ng hiÖu qu¶) trong lí p c¸c í c
l î ng tuyÕn tÝnh kh«ng chÖch cña c¸c tham sè håi quy).
ng qu¸t: XÐt vÐc t¬c¸c hÖsè c = ( c0 , c1,..., ck ) . Lóc ®
Tæ ã ®èi ví i tæ
hî p tuyÕn tÝnh c T a = c0 .b + c1.a1 + c2 .a2 + ... + ck .ak ) th× í c l î ng
c T aˆ = c0 .bˆ + c1.aˆ1 + c2 .aˆ2 + ... + ck .aˆk ) lµ í c l î ng tuyÕn tÝnh, kh«ng
chÖch vµ cã ph ¬ng sai bÐnhÊt. Trong ® ã, aˆ = (bˆ, aˆ , aˆ ,..., aˆ ) lµ í c
1 2 k
nh ph ¬ng bÐnhÊt cña c¸c hÖsè håi quy a = (b, a1 , a2 ,..., ak ) .
l î ng b×
CM: SGK
2. § ¸nh gi¸ chÊt l î ng cña m« h×
nh.
* § èi ví i m« h×
nh tuyÕn tÝnh béi, R ® î c gäi lµ hÖsè t ¬ng quan
béi gi÷a biÕn phô thuéc Y vµ tËp biÕn ® éc lËp { X 1 , X 2 ,..., X k } ,
* Trong thùc hµnh, ® ÓtiÖn tÝnh to¸n vµ nhËn xÐt, ng êi ta th êng
dï ng ®¹i l î ng R 2 thay cho R . § ¹i l î ng nµy cßn ® î c gäi lµ
hÖsè x¸c ®Þnh.
.
3. § ¸nh gi¸ chÊt l î ngcña m« h× nh qua viÖc ph©
n tÝch c¸c
sai sè.
Tõ ®
ã t×
m c¸ch hiÖu chØnh m« h×
nh cho phï hî p h¬n.
Mét sè d¹ng ph©n bè cã thÓcña sai sè
D¹ng 1:
C¸c sai sè tËp trung quanh trôc y , t ¬ng ® èi ®Òu vÒhai phÝa so
ví i trôc ®ã vµ hÇu nh kh«ng thay ® æi theo y . Mäi gi¸ trÞcña
biÕn y ® Òu ® î c í c l î ng ví i mét ® é chÝnh x¸c gÇn nh
nhau. M« h× nh ® ·® î c lùa chän ® óng ® ¾n. NÕu ®é ph© n t¸n
vÉn lí n (hÖsè R nhá), muèn n© ng cao chÊt l î ng cña m« h× nh
th×ph¶i t¸c ® éng vµo c¸c biÕn ® éc lËp (thªm hoÆ c biÕn ®æi, söa
ch÷a c¸c biÕn m« t¶ ch¼ ngh¹n).
D¹ng 2.
Ng î c l¹i, còng cã thÓmét biÕn ® éc lËp cã vai trß nhÊt ®Þnh ®
èi
ví i viÖc dù ® o¸n biÕn phô thuéc, song v×t¸c ® éng cña mét biÕn
thø ba mµ vai trß cña nã bÞche lÊp ® i
Wp
Wq
2 2 2
Yp Yq Y
2
- Yp Y 2 - Y 2 Y - Y 2
n- p p q n- p p q
F =( 2 - 2 )/ ( 2 )= = .
Y Y Y p - q Y 2 - Y 2 p - q Y - Y 2
p p
§ ã lµ tû lÖcã hiÖu chØnh cña b×nh ph ¬ng ®é dµi c¸c vÐc t¬chiÕu. NÕu tû
lÖnµy gÇn 0 th׶nh cña hai phÐp chiÕu rÊt gÇn nhau, hai m« h× nh lµ t ¬ng
®¬ng, ta cã thÓchän m« h× nh cã sè biÕn m« t¶ Ýt h¬n mµ vÉn cã ®î c
“chÊt l î ng håi quy” hÇu nh kh«ng thay ®æi.
5. § a céng tuyÕn
3. Bæsung thªm quan s¸t vµo tËp sè liÖu hoÆc lËp mÉu mí i.
6. M« h×
nh håi quy ®a thøc.
Mèi liªn hÖgi÷a biÕn phô thuéc vµ c¸c biÕn ®éc lËp kh«ng cßn lµ
tuyÕn tÝnh, cÇn dï ng m« h×
nh håi quy bËc cao h¬n ®Óm« t¶ quy luËt.
Chó ý.
- B»ng c¸ch kiÓm ® Þnh tÝnh kh¸c 0 cña c¸c hÖsè gij , ta cã
thÓx¸c ® Þnh tÝnh t ¬ng t¸c cña c¸c biÕn ® éc lËp trong m«
h×nh håi quy. Cã nghÜa lµ kiÓm tra ® î c xem c¸c biÕn ® éc
lËp cã “céng h ëng” ví i nhau trong viÖc t¸c ® éng lªn biÕn
phô thuéc hay kh«ng.
- B»ng ph ¬ng ph¸p t ¬ng tù nh trªn, ta cã thÓthµnh lËp c¸c
m« h×nh håi quy ®a thøc bËc cao h¬n.
M« h×
nh bËc hai.
Ví i c¸c biÕn ®
éc lËp X1, X 2 ,..., X m vµ biÕn phô thuéc Y , ta t× m
c¸c hÖsè håi quy α i , γ ij , i, j = 1, 2,..., m , ®Ó í c l î ng Y :
m m m
Y b ai X i gij X i X j e
i 1 i 1 j 1
m« h× nh trªn ®©
y®î c® a vÒm« h×
nh tuyÕn tÝnh th«ng th êng
ví i m m2 biÕn ®éc lËp.
7. M« h×
nh håi quy phi tuyÕn tæ
ng qu¸t.
Gi¶ sö f lµ mét hµm kh¶ vi liªn tôc. Lóc ®ã ®¹o hµm riªng phÇn cña g
sÏ triÖt tiªu t¹i ®iÓm (gi¸ trÞcña tham sè) g ®¹t min:
m
−1 ∂g ∂f ( a , X i )
. = ∑ (Yi − f ( a , X i )) = 0 , j = 1,..., s
2 ∂a j i =1 ∂a j
Tøc lµ
G T ( a ).(Y − f ( a )) = 0 (*)
ví i
∂f ( a , X 1 ) ∂f ( a , X 1 )
∂a ...
Y1 f (a , X1 ) 1 ∂as
Y = ; f (a ) = ; G = ...
Y f ( a , X m ) ∂f ( a , X ) ∂f ( a , X m )
m m ...
∂a1 ∂as
B í c 1. Cho mét gi¸ trÞban ®Çu nµo ®ã cña vÐc t¬c¸c tham sè .
Lóc ® ã, theo § Þnh lý gi¸ trÞtrung b×
nh ta cã
f = f + G ().()
trong ®ã . Thay gi¸ trÞcña f vµo (*) ta nhËn ®î c hÖph ¬ng tr×
nh
( aˆ , bˆ)