Professional Documents
Culture Documents
Tema 5
Tema 5
PROCEDIMENTS DE
CONTRASTACIÓ I SELECCIÓ DE
MODELS
Lliçó 6: PROCEDIMENTS DE
5.1. Procediments de contrastació.
CONTRASTACIÓ I SELECCIÓ DE
MODELS
5.2.Tres contrastos asimptòtics: Raó de versemblança,
Wald i multiplicadors de Lagrange.
5.3. Validació versus selecció de models
Bibliografia:
1
5.1. Procediments de contrastació
i. Introducció
H0: µ = 1,75
H1: µ ≠ 1,75
2
– El procediment seguit per a contrastar hipòtesis
consisteix a establir una regla de decisió basada en
l’evidència empírica. Aquesta regla es construeix a
partir del que anomenem estadístic de prova del
contrast:
Decisions
No Rebutjar H0 Rebutjar H0
H0 Certa Decisió correcta Error Tipus I
Situacions
H0 Falsa Error Tipus II Decisió correcta
3
– El nivell de significació del contrast està sempre sota control de
l’investigador, és a dir, es tria el nivell d’error tipus I que s’està
disposat a assumir (p.e. α=0,05).
– Atenció: com més petit sigui aquest error més augmentarà l’error
tipus II, ja que α i β estan inversament relacionades. S’ha d’intentar
que per un determinat nivell d’error tipus I, el procediment de
contrastació tingui una probabilitat associada a l’error tipus II el més
petita possible.
– Procediment habitual:
1. Definirem un estadístic de prova calculat a partir de les dades de
partida.
2. El compararem amb un valor crític d’una determinada distribució,
un cop fixat el nivell de significació que volem assumir.
3. La regla de decisió (rebutjar o no H0) es basarà en comparar
l’estadístic de prova amb el valor crític. Si l’estadístic de prova és
més gran que el valor crític, es rebutja la H0 .
Zona de no rebuig
8
4
5.2. Tres contrastos asimptòtics
– El procediment de contrastació per intervals de confiança
és especialment adequat quan es contrasta una hipòtesi
nul·la relativament “senzilla”, p.e. quan conté un únic
paràmetre.
– La idea en aquests procediments és que un cop s’ha estimat
un paràmetre, es calcula un interval pel nivell de confiança
triat al voltant de l’estimador i es rebutja H0 si el valor que li
suposem cau fora d’aquest interval.
– En molts casos, aquests contrastos es realitzen a partir dels
estadístics de proba de la t i de la F. Malgrat això, aquests
són solament vàlids en l’entorn de models lineals. Però, com
podem contrastar hipòtesis més complexes o en l’entorn de
models no lineals?
9
N −∑ N
ε i2
L = Π f (β ; ε i ) =
N 1
⋅ exp i =1 2
i =1
σ ε ⋅ 2π 2 ⋅σ ε
5
i. Raó de versemblança
Exemple:
Suposem que es pretén modelitzar el preu de les vivendes d’una zona (PREU) en
funció de la mida de la vivenda, mesurada en metres quadrats (MIDA), el nombre
d’habitacions (HABITACIONS), la distància a la incineradora de la zona
(DISTÀNCIA) i el nombre de banys de la vivenda (BANYS). Per fer-ho es disposa
d’una mostra de 142 observacions.
PREU i = β 1 + β 2 MIDA i + β 3 HABITACION S i + β 4 DISTÀNCIA i + β 5 BANYS i + u i
on les variables estan expressades en logaritmes neperians.
12
6
Si volem fer el contrast H 0 : β3 = β 4 = 0
H A : No H 0
( )
λ* = − 2 ln λ = − 2 ln L βˆ R − ln L βˆ
( ) on sabem que
( )
ln L βˆ = 21,77521 ( )
ln L βˆ R = 17 ,73117
13
i. Raó de versemblança
– Cas particular: H0: β3 = β4 = ... = βk = 0 y = β1 + β2x2 + u
H1: No H0 y = β1 + β2x2 + β3x3 + … + βkxk + u
1. Restriccions lineals
En aquest cas, el nombre de restriccions és k-2
2. NO var. dep. retardada
7
ii. Wald
– És d’utilitat quan H0 (model restringit) presenta dificultats d’estimació
– S’estima el model no restringit
– Contrast asimptòticament equivalent al de la “F”
≈ χ12
Var (βˆ − β ) Var (βˆ )
i i
H1: βi ≠ β* i
*
i
15
ii. Wald
σ 2 ⋅ (X ' ⋅ X )
−1
16
8
ii. Wald
−1
' ∂f ∂f ˆ
() () () () ()
'
−1
W = f βˆ ⋅ βˆ ⋅ I βˆ ⋅ β ⋅ f βˆ ≈ χ q2
∂β ∂β
∂ 2 log L
Matriu d’informació: I (β ) = − E (β )
∂β ∂β
'
17
ii. Wald
A=
(R ⋅ βˆ − r ) ⋅ [R ⋅ (X ⋅ X )
'
' −1
⋅ R' ] ⋅ (R ⋅ βˆ − r ) ≈ χ
−1
2
σ2 q
A T −k
⋅ ≈ Fq ,T − k
B=
(Y − X ⋅ βˆ ) ⋅ (Y − X ⋅ βˆ ) = e ⋅ e ≈ χ
'
'
2
T −k
B q
σ2 σ2
18
9
iii. Multiplicadors de Lagrange
19
ML = T ⋅ R 2 ≈ χ q2 Exemple
T: grandària mostral
q: número de restriccions
R2: coeficient de determinació de la regressió entre els residus MQO
obtinguts de l’estimació del model restringit sobre les derivades
parcials del terme d’error del model ampliat sobre els paràmetres
(amb signe invertit), avaluats sota H0 (model restringit).
20
10
iv. Comparació entre tests
– Tots tres contrastos són equivalents a nivell assimptòtic, malgrat que
en mostra finita (petita) es compleix la següent desigualtat:
General Restringit
Wald Sí No
RV Sí Sí
ML No Sí
21
22
11
Eines de validació
23
2. Models no ennierats.
24
12
a) Models ennierats
25
b) Models no ennierats
26
13
1. Coeficient de determinació corregit
N −1
R = 1− (1 − R 2 )
2
N −K
– Quan el nombre de variables explicatives K augmenta, la
fracció (N-1)/(N-K) també augmenta mentre que (1-R2)
disminueix, ja que l’R2 augmenta per definició. La idea és que
amb aquest estadístic tots dos efectes es compensen i permet,
per tant una valoració adequada de la bondat d’ajust del
model.
27
2 2
AIC = − ·ln( L) + ·K
N N
28
14
2.b. Criteri d’informació: de Schwarz (SC)
29
N+K 2
EPF = (σˆ )
N −K
30
15