Professional Documents
Culture Documents
Tema 7
Tema 7
Econometria (ADE)
Universitat de València
Curs 2022-2023
1
Tema 7. Incompliment de les hipòtesis
bàsiques
1. Introducció
2. Multicol·linealitat
3. Normalitat
4. Heteroscedasticitat
5. Autocorrelació
2
7.1. Introducció
4
7.1. Introducció
5
7.1. Introducció
6
7.2. Multicol·linealitat
7
7.2. Multicol·linealitat
Multicol·linealitat perfecta
• Es tracta d'un cas teòric ja que en la pràctica no sol produir‐se
aquest tipus de multicol·linealitat.
• Es produeix solament quan hi ha un regressor que és una
combinació lineal exacta d'altres regressors del model. Per
exemple: trampa de les fictícies, despesa mesurada en euros i en
dòlars...
• Si hi ha col·linealitat perfecta no és possible efectuar estimacions
dels paràmetres, els estimadors no estan definits i per això ni tan
sols cal plantejar‐se quines propietats tenen els estimadors.
• La col·linealitat perfecta és una “curiositat” teòrica. En la pràctica
no sol donar‐se i si es donara no podríem estimar, la qual cosa ens
avisaria de la seua existència.
8
7.2. Multicol·linealitat
• En la pràctica no solen donar‐se situacions de multicol·linealitat
perfecta, a no ser que es dissenye mal el model.
• No obstant això, sí que és habitual que les variables explicatives
presenten cert grau de col·linealitat.
• Com més alta siga la correlació entre els regressors, més difícil serà
separar els seus efectes, fent que augmenten les variàncies dels
estimadors MQO. Augmenta el risc d'obtenir estimacions imprecises.
• Si l'elevada correlació entre els regressors fa que els resultats de
l'estimació siguen “insatisfactoris”, direm que el model sofreix de
multicol·linealitat.
• En tota regressió hi ha certa multicol·linealitat, per la qual cosa només
es diu que existeix multicol·linealitat quan es creu que està afectant
seriosament els resultats de regressió.
9
7.2. Multicol·linealitat
• La col·linealitat és part d'un problema més general que és la precisió
dels estimadors. Com menor siga la variància, més precisos seran els
estimadors i per tant més fiables seran les estimacions.
• En el tema 3 vam veure que la variància dels estimadors depenia de 4
factors: 𝝈𝝈𝟐𝟐 , 𝑵𝑵, 𝑽𝑽𝑽𝑽𝑽𝑽 x𝒋𝒋 i 𝑹𝑹𝟐𝟐𝒋𝒋 .
𝜎𝜎 2 𝜎𝜎 2
𝑉𝑉𝑉𝑉𝑉𝑉 𝛽𝛽̂𝑗𝑗 = =
SQT𝑗𝑗 1 − R𝑗𝑗2 𝑁𝑁 ∗ 𝑉𝑉𝑉𝑉𝑉𝑉(x𝑗𝑗 ) 1 − R𝑗𝑗2
10
7.2. Multicol·linealitat
Com afecta la col·linealitat a la variància dels estimadors?
• Si hi ha una elevada col·linealitat entre els regressors (X), els estimadors
MQO segueixen sent ELNEO, però la seva variància és elevada, és a dir
són poc precisos.
• Si hi ha un elevat grau de col·linealitat entre els regressors, estem dient
que x𝑗𝑗 està molt correlacionat amb un o més dels altres regressors del
model; i si això ocorre, és com si els altres regressors poguessin explicar
el comportament de x𝑗𝑗 .
• El quart factor R𝑗𝑗2 representa la proporció de la variació total en x𝑗𝑗
que és explicada per la resta de regressors. Si la col·linealitat és elevada,
R𝑗𝑗2 serà elevat.
• Si R𝑗𝑗2 augmenta, la variància dels estimadors també augmenta.
• Si R𝑗𝑗2 = 1, estaríem en el cas de multicol·linealitat perfecta. En aquest
cas, no es poden obtenir els estimadors MQO. La seua variància és com
si fos infinita.
11
7.2. Multicol·linealitat
13
7.2. Multicol·linealitat
14
7.2. Multicol·linealitat
15
7.2. Multicol·linealitat
• Solucionar o alleujar la col·linealitat és complicat i no sempre és
possible.
• També podríem intentar alleujar els efectes que provoca la col·linealitat
intentant que els altres 3 factors que afecten la precisió dels estimadors
contribueixen a reduir la variància:
𝜎𝜎 2
𝑉𝑉𝑉𝑉𝑉𝑉 𝛽𝛽̂𝑗𝑗 =
𝑁𝑁 ∗ 𝑉𝑉𝑉𝑉𝑉𝑉(x𝑗𝑗 ) 1 − R𝑗𝑗2
16
7.2. Multicol·linealitat
Algunes reflexions sobre la col·linealitat:
• Als investigadors ens agradaria entendre tots els fenòmens i
estimar de forma precisa els efectes de tots els regressors,
però això no és sempre possible.
• Cal preguntar‐se: la multicol·linealitat és necessàriament un
problema?
• Si l'objecte de la regressió no és la interpretació o estimació dels
efectes individuals dels diferents regressors sinó tan sols la predicció
del regressant, en aquest cas la col·linealitat no és un problema greu.
• Si l'objectiu del meu model és la predicció, llavors un elevat R2 és
suficient perquè el model compleixi amb el seu objectiu de ser
adequat per a la predicció.
17
7.2. Multicol·linealitat
Una multinacional desitja analitzar els factors que determinen els salaris dels seus
treballadors i per a això es disposa d'una mostra per la qual es coneix:
• SALARI: salari brut anual del treballador en milers d'euros.
• EXPLAB: experiència laboral del treballador en anys.
• SEXE: variable fictícia que pren valor 1 si el treballador és home i 0 en cas contrari.
• TAMSUC: grandària de la sucursal mesurada pel nombre de treballadors.
18
7.2. Multicol·linealitat
19
7.3. Normalitat
20
7.3. Normalitat
21
7.3. Normalitat
22
7.3. Normalitat
• La hipòtesi nul·la del contrast de JB és Normalitat, i l’alternativa és no
normalitat:
𝐻𝐻0 : 𝑆𝑆 = 0 i 𝐾𝐾 = 3
𝐻𝐻1 : 𝑆𝑆 ≠ 0 o 𝐾𝐾 ≠ 3
• L’estadístic de JB és:
𝑁𝑁 2 𝐾𝐾 − 3 2
𝐽𝐽𝐽𝐽 = (𝑆𝑆 + )
6 4
• En una distribució normal teòrica, l'anterior expressió prendrà un valor
nul, ja que els coeficients d'asimetria ( 𝑆𝑆 ) i curtosi (K) prenen
respectivament els valors de 0 i 3.
• Es distribueix asimptòticament com una χ2 amb 2 graus de llibertat.
23
7.3. Normalitat
• El valor de χ22 per a un nivell de significació del 5% (α=0.05)=5.99
• Si el valor obtingut de l'estadístic de Jarque-Bera és menor que el valor
crític χ22, no es rebutja la hipòtesi nul·la de normalitat. En cas contrari
es rebutja la hipòtesi nul·la de normalitat.
• Si la mostra és suficientment gran, el supòsit de normalitat de la
pertorbació no és necessari i es pot realitzar inferència aproximada.
24
7.3. Normalitat
• El valor de l’estadístic de contrast és 676,58, que és major que 5,99. Per tant rebutgem la hipòtesi nul·la
de normalitat de les pertorbacions.
• El valor de probabilitat del contrast és 0,0000, és menor que 0.05, per tant, rebutgem la hipòtesi nul·la
al 5%.
• Però la mostra de la que s’ha obtingut esta distribució dels residus està formada per 1695 famílies. Per
tant, l’incompliment de la normalitat no té conseqüències greus. Podem fer inferència (aproximada).
25
7.4. Heteroscedasticitat
26
7.4. Heteroscedasticitat
27
7.4. Heteroscedasticitat
• Quan hi ha homoscedasticitat, totes les pertorbacions del model tenen la
mateixa variància.
• Quan hi ha heteroscedasticitat, la variància de les pertorbacions (u) no és
constant, és diferent per a cada valor de i.
Homoscedasticitat Heteroscedasticitat
28
7.4. Heteroscedasticitat
• Gràficament, el supòsit d’homoscedasticitat vol dir que la variabilitat al
voltant de la línia de regressió és la mateixa al llarg de tota la mostra de
les x; és a dir, que no augmenta o disminueix quan x varia.
31
7.4. Heteroscedasticitat
Conseqüències de l’heteroscedasticitat
• Quan hi ha heteroscedasticitat:
1. Els estimadors obtinguts per MQO no són òptims. Per tant, el mètode
de mínims quadrats ordinaris ja no és el més adequat.
2. L'estimació de les variàncies dels estimadors obtinguda aplicant la
fórmula usual no és vàlida. Conseqüentment, els estadístics t i F
basats en aquesta estimació donaran lloc a inferències errònies.
Què es pot fer?
La solució teòrica és estimar per Mínims Quadrats Generalitzats (MQG).
Però no sempre és factible.
Si decidim utilitzar MQO (encara que no és òptim), com a mínim hem de
calcular les variàncies dels estimadors correctament: variàncies robustes
a la heteroscedasticitat.
32
7.4. Heteroscedasticitat
Com podem detectar la presència d’heteroscedasticitat?
• Una primera aproximació consisteix a analitzar el gràfic dels residus mínims
quadràtics enfront de la Y‐estimada o enfront del regressor que creiem que està
generant l'heteroscedasticitat.
Residuos de la regresión (= MARKTVAL observada - estimada)
800
0
Per a les empreses més
grans, els residus són
-200 majors.
-400
-600
0 200 400 600 800 1000 1200
BOOKVAL
33
7.4. Heteroscedasticitat
Detecció de l’heteroscedasticitat
• A banda d’una primera aproximació visual, existeixen contrastos
d’heteroscedasticitat: Breusch-Pagan-Godfrey i el contrast de
White.
• Veurem només el constrast de White.
• En el test de White, la hipòtesi nul·la i l’alternativa són:
𝐻𝐻0 : 𝜎𝜎𝑖𝑖2 = 𝜎𝜎 2 ∀𝑖𝑖 És a dir, 𝐻𝐻0 : Homoscedasticitat
𝐻𝐻1 : 𝜎𝜎𝑖𝑖2 = 𝑓𝑓(𝑥𝑥𝑖𝑖 ) 𝐻𝐻1 : Heteroscedasticitat
34
7.4. Heteroscedasticitat
Detecció de l’heteroscedasticitat. Test de White
Els passos per a efectuar aquest contrast són:
1. S'estima el model original i es calculen els residus al quadrat.
𝑦𝑦𝑖𝑖 = 𝛽𝛽1 + 𝛽𝛽2 𝑋𝑋2𝑖𝑖 + 𝛽𝛽3 𝑋𝑋3𝑖𝑖 + 𝑢𝑢𝑖𝑖
2. Es realitza la següent regressió auxiliar, prenent com regressant el quadrat
dels residus obtinguts en l'estimació del model original:
𝑢𝑢� 𝑖𝑖2 = 𝛼𝛼1 + 𝛼𝛼2 𝑋𝑋2𝑖𝑖 + 𝛼𝛼3 𝑋𝑋3𝑖𝑖 + 𝛼𝛼4 𝑋𝑋2𝑖𝑖
2 2
+ 𝛼𝛼5 𝑋𝑋3𝑖𝑖 + 𝛼𝛼6 𝑋𝑋2𝑖𝑖 𝑋𝑋3𝑖𝑖 + ε𝑖𝑖
Se suposa que els residus depenen de les x del model original, de les x2 i dels
productes creuats entre les diferents variables explicatives. Com més gran siga
𝑅𝑅2 , major serà la dependència dels residus respecte a les variables exògenes,
per la qual cosa es tendirà a rebutjar el supòsit de Homocedasticitat.
2
3. Designant per 𝑅𝑅𝑟𝑟𝑟𝑟 al coeficient de determinació de la regressió auxiliar, es
2
calcula l'estadístic 𝑛𝑛𝑅𝑅𝑟𝑟𝑟𝑟 .
4. S’efectua el contrast.
35
7.4. Heteroscedasticitat
Detecció de l’heteroscedasticitat. Test de White
• L’estadístic de White (W) sota la hipòtesi nul·la té la següent
distribució:
2
𝑊𝑊 = 𝑛𝑛𝑅𝑅𝑟𝑟𝑟𝑟 → χ2m
• És distribueix asimptòticament com una Chi-quadrat amb m
graus de llibertat, sent m el nombre de regressors en la
regressió auxiliar, excloent el terme independent (nombre
de regressors de la ra menys 1).
2
• Si l’estadístic de White= 𝑛𝑛𝑅𝑅𝑟𝑟𝑟𝑟 > χ2m, rebutjarem la Hipòtesi
nul·la: hi ha heteroscedasticitat.
36
7.4. Heteroscedasticitat
Test de White. Un exemple
• Estimem el següent model per MQO:
log 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = 𝛽𝛽1 + 𝛽𝛽2 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 + 𝛽𝛽3 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 + 𝑢𝑢
• Obtenim el model estimat:
log�𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = 11,49 + 0,011𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 − 0,024ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎
• S’estima la regressió auxiliar:
⦁ 𝑢𝑢� 𝑖𝑖2 = 𝛼𝛼1 + 𝛼𝛼2 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 + 𝛼𝛼3 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 + 𝛼𝛼4 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 2 +
𝛼𝛼5 ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 2 + 𝛼𝛼6 𝑠𝑠𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢 ∗ ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 + ε𝑖𝑖
2
𝑛𝑛 = 322; 𝑅𝑅𝑟𝑟𝑟𝑟 = 0,0567
2
• L’estadístic de White és 𝑊𝑊 = 𝑛𝑛𝑅𝑅𝑟𝑟𝑟𝑟 = 322 ∗ 0,0567 = 18,26
• Amb 5 graus de llibertat (m=5), és una χ25. Per a 𝛼𝛼 = 0,05, el seu valor en
taules és 11,07. Rebutgem la hipòtesi nul·la d’homoscedasticitat.
37
7.4. Heteroscedasticitat
38
7.4. Heteroscedasticitat
Si hi ha heteroscedasticitat, què fem?
• Els estimadors MQO ja no són òptims. Podem estimar el model per
Mínims Quadrats Generalitzats (MQG).
• Cal conèixer com és la desviació típica de les pertorbacions. Normalment, no ho
sabrem... i no podrem calcular el model per MQG.
40
7.5. Autocorrelació
• Exemple visual d’autocorrelació
Autocorrelació No autocorrelació
𝑢𝑢𝑖𝑖
𝑢𝑢𝑖𝑖
𝑖𝑖
𝑖𝑖
La pertorbació 𝑢𝑢𝑖𝑖−1 és similar a 𝑢𝑢𝑖𝑖 .
Autocorrelació positiva.
41
7.5. Autocorrelació
• L’autocorrelació pot ser positiva o negativa.
43
7.5. Autocorrelació
• Detecció d’autocorrelació:
• Els contrasts estadístics més habituals per a detectar
autocorrelació són: Durbin-Watson, Wallis, h-Durbin, etc.
44
7.5. Autocorrelació
• Conseqüencies d’autocorrelació:
• Amb autocorrelació en les pertorbacions, els estimadors MQO seguiran
sent no esbiaixats (És a dir, 𝐸𝐸 𝛽𝛽̂ = 𝛽𝛽).
• Però, estimadors ja no seran òptims → Existiran altres estimadors amb una
variància més baixa.
• L’estimació de la variància dels estimadors (𝜎𝜎�𝛽𝛽�2 ) ja no serà vàlida.
• Per tant, no podrem fer contrastos d’hipòtesis amb els estadístics t i F que
utilitzen l’estimació de la variància del estimadors.
45
7.5. Autocorrelació
Si hi ha autocorrelació, què fem? (Mateixes mesures que amb
heterocedasticitat!)
• Els estimadors MQO ja no són òptims. Podem estimar el model per
Mínims Quadrats Generalitzats (MQG).
• Cal conèixer com és la desviació típica de les pertorbacions. Normalment, no ho
sabrem... i no podrem calcular el model per MQG.
• Si decidim seguir estimant per MQO, sabent que no són òptims,
almenys hem de calcular les variàncies dels estimadors de forma
correcta. Caldrà corregir les variàncies per tal que siguen robustes en
cas d’autocorrelació. En eixe cas, la inferència torna a ser vàlida.
• En Gretl, així com en la majoria de paquets economètrics, existeix
l’opció de calcular variàncies robustes a l’heterocedasticitat i
autocorrelació.
• A l’hora d’estimar per MQO, podrem triar l’opció de “desviacions
típiques robustes”.
46