Praktika8egina Gidoia-1 - 1

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 6

8.

PRAKTIKA MULTIKOLINEALITATEA
Helburuak
 Multikolinealitate gogorraren antzematea

1. Ariketa
nba.gdt fitxategia 2011-2012 denboraldiko NBAko 54 jokalariren estatistikei dagokien datu-multzoa
da. Eredu hau planteatzen da:

Sarreraki=β1+ β2Minutuaki + β3Erreboteaki + β4Asistentziaki + β5Txapelali + β6Puntuaki+ui


a) Eredua estimatu
Proba bat egiten saiatu, baina ezinezkoa da.
Sarrerak =b1 + b2*errebotea + b3*erreboteaD + b4* erreboteaE +u

Modelo 1: MCO, usando las observaciones 1-54


Variable dependiente: Sarrera

Coeficiente Desv. Típica Estadístico t valor p


const 552.962 1093.77 0.5056 0.6153
ErreboteakD 3229.65 461.442 6.999 <0.0001 ***
EreboteakE −3432.58 1074.29 −3.195 0.0024 ***

Media de la vble. dep. 7323.635 D.T. de la vble. dep. 5829.649


Suma de cuad. residuos 8.26e+08 D.T. de la regresión 4025.464
R-cuadrado 0.541181 R-cuadrado corregido 0.523188
F(2, 51) 30.07748 Valor p (de F) 2.35e-09
Log-verosimilitud −523.3008 Criterio de Akaike 1052.602
Criterio de Schwarz 1058.568 Crit. de Hannan-Quinn 1054.903

Gretelek automatikoki bat kentzen du, multikolinealitate perfektua dago. Birekin


egingo dugu, hirurekin ez.

Modelo 3: MCO, usando las observaciones 1-54


Variable dependiente: Sarrera

Coeficiente Desv. Típica Estadístico t valor p


const −2846.15 1701.75 −1.672 0.1009
Minutuak 1.07451 149.818 0.007172 0.9943
Erreboteak 378.038 316.482 1.195 0.2382
Asistentziak 408.877 269.581 1.517 0.1359
Txapelak 1625.90 1704.71 0.9538 0.3450
Puntuak 632.617 154.174 4.103 0.0002 ***

Media de la vble. dep. 7323.635 D.T. de la vble. dep. 5829.649


Suma de cuad. residuos 3.81e+08 D.T. de la regresión 2816.362
R-cuadrado 0.788623 R-cuadrado corregido 0.766605
F(5, 48) 35.81651 Valor p (de F) 4.30e-15
Log-verosimilitud −502.3754 Criterio de Akaike 1016.751
Criterio de Schwarz 1028.685 Crit. de Hannan-Quinn 1021.353
b) Multikolinealitate gogorra egon daitekeen aztertu 1. diagnostikoa erabiliz. (aldagai
azaltzaileen korrelazio matrizea)

Aldagai azaltzaileen korrelazio matrizea lortu:


Ikusi – korrelazio matrizea - aukeratu ereduaren aldagaiak ( min, erreb, asist, txap,
punt).

Coeficientes de correlación, usando las observaciones 1 - 54


Valor crítico al 5% (a dos colas) = 0.2681 para n = 54

Minutuak Erreboteak Asistentziak Txapelak Puntuak


1.0000 0.5784 0.6065 0.4428 0.8945 Minutuak
1.0000 -0.0294 0.8301 0.5162 Erreboteak
1.0000 -0.1313 0.4583 Asistentziak
1.0000 0.3620 Txapelak
1.0000 Puntuak

Korrelazio matrizearen balio absolutuan 0.8 baino handiagoak diren bi korrelazio


topatzen ditugu. Puntuen eta minutuen artean (0.89) eta beste errebote eta txapelen
artean (0.83). Multikolinealitaterako lehenengo diagnostikoarekin multikolinealitate
gogorra egon daitekeela ondorioztatu dezakegu. Bigarren diagnostikoa ere ikusi
beharko litzateke.

c) Multikolinealitate gogorra egon daitekeen aztertu 2. diagnostikoa erabiliz. (R^2


handia eta banakako adierazgarritasunik ez)

Ereduaren R2= 0.788623 da, handia da, hau da, ereduak menpeko aldagaiaren
aldakotasunaren zati handi bat azaltzen du. ANOVA kontrastean H0 errefusatuko da
(p-balioa= 4.30e-15 ≤ 0.05), hau da, eredua globalki adierazgarria da. Bestalde,
banakako adierazgarritasun kontrasteetan, 5etik 4 ez dira adierazgarriak (H0 ez da
errefusatzen). Honek multikolinealitate gogorra dukagula esango digu eta neurriren
bat hartu beharko genuke konpontzeko.

d) Multikolinealitate gogorra egon daitekeen aztertu 3. diagnostikoa erabiliz. (Bariantza


Inflazio Faktoreak)

Ereduan: Analisia - kolinealitatea

Factores de inflación de varianza (VIF)


Mínimo valor posible = 1.0
Valores mayores que 10.0 pueden indicar un problema de colinealidad

Minutuak 10.636
Erreboteak 4.256
Asistentziak 2.821
Txapelak 3.524
Puntuak 5.723

VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de correlación múltiple


entre la variable j y las demás variables independientes

Minutuen BIF 10.6363> 10, hau da, minutuetan bariantza 10.6 aldiz handitzen da
beste aldagaiekin duen erlazioarengatik. Multikolinealitate gogorra dagoelaren
indikatzailea da, bereziki minutuei eragiten dion multikolinealitatea.

e) Proposatu eredutik kendu daitekeen aldagai bat (edo bat baino gehiago)

Hiru diagnostikoak bilduz, minutuen aldagaia izan daiteke eredutik atera daitekeen
aldagai bat, BIF handiena zuen (3.diagnostikoan), t-arrazoia txikiena (p-balio
handiena) (2. Diagnostikoan) eta korrelazio handiena zeukan puntuekin
(1.diagnostikoan)
Normalean eredutik kentzen da eta ikusten da betetzen den ala ez.

2. Ariketa
cerveza.gdt fitxategian hurrengo aldagaien datuak ematen dira:
qcerve: eskatutako garagardo kantitatea (litroak)
pcerve: garagardoaren prezioa (euroak)
psusti: beste alkoholdun edarien prezioa (euroak)
ngp: elikadura-produktuen prezio-maila orokorraren igoera (%)
ren: errenta eskuragarria, milaka eurotan.

Datuak eskualde jakin bateko ondoz ondoko hiruhilekoei dagozkie. Log-log eredu hau
planteatzen da:
ln qcerve=β 1+ β 2 ln pcerve+ β3 ln psusti+ β 4 ln ngp+¿ β 5 lnren+u ¿

a) Eredua estimatu.

Modelo 1: MCO, usando las observaciones 1:1-8:2 (T = 30)


Variable dependiente: l_qcerve

Coeficiente Desv. Típica Estadístico t valor p


const −3.24324 3.74300 −0.8665 0.3945
l_pcerve −1.02042 0.239042 −4.269 0.0002 ***
l_psusti −0.582934 0.560150 −1.041 0.3080
l_ngp 0.209545 0.0796926 2.629 0.0144 **
l_ren 0.922864 0.415514 2.221 0.0356 **

Media de la vble. dep. 4.018531 D.T. de la vble. dep. 0.133258


Suma de cuad. residuos 0.089920 D.T. de la regresión 0.059973
R-cuadrado 0.825389 R-cuadrado corregido 0.797451
F(4, 25) 29.54377 Valor p (de F) 3.80e-09
Log-verosimilitud 44.58235 Criterio de Akaike −79.16469
Criterio de Schwarz −72.15871 Crit. de Hannan-Quinn −76.92342
rho −0.321734 Durbin-Watson 2.630645

b) Multikolinealitate gogorra egon daitekeen aztertu 1. diagnostikoa erabiliz. (aldagai


azaltzaileen korrelazio matrizea)

Coeficientes de correlación, usando las observaciones 1:1 - 8:2


Valor crítico al 5% (a dos colas) = 0.3610 para n = 30

l_pcerve l_psusti l_ngp l_ren


1.0000 0.9669 0.7739 0.9711 l_pcerve
1.0000 0.8094 0.9715 l_psusti
1.0000 0.8211 l_ngp
1.0000 l_ren

Korelazio matrizean balio absolutuan 0.8 baino handiagoak diren bost korrelazio topatzen ditugu.
Beste alkoholdun edarien prezioen eta garagardoaren prezioaren artean (0.9669), elikadura
produktuen prezio maila orokorraren igoeraren eta beste alkoholdun edarien prezioen artean
(0.8094), errenta eskuragarriaren eta garagardoaren prezioaren artean (0.9711), errenta
eskuragarriaren eta beste alkoholdun edarien artean (0.9715) eta errenta eskuragarriaren eta
elikadura produktuen prezio maila orokorraren igoeraren artean (0.8211).
Multikolinealitaterako lehenengo diagnostikoarekin multikolinealitate gogorra egon daitekeela
ondorioztatu dezakegu. Bigarren diagnostikoa ere ikusi beharko litzateke.
Lehenengo diagnostikoarekin: multikolinealitate gogorra dagoela dago, bikoteka aztertuta.

c) Multikolinealitate gogorra egon daitekeen aztertu 2. diagnostikoa erabiliz. (R^2


handia eta banakako adierazgarritasunik ez)

Ereduaren R^2=0.825389, handia da, hau da, ereduak menpeko aldagaiaren aldakortasunaren zati
handi bat azaltzen du.
ANOVA kontrastean H0 errefusatuko da (p-balioa= 3.80e-09<0.05), hau da, eredua globalki
adierazgarria da. Bestalde, banakako adierazgarritasun kontrasteetan aldi berean betak banaka
adierazgarriak dira. Diagnostiko honekin ezin dugu esan ereduari eragiten dion multikolinealitatea
dagoenik.

d) Multikolinealitate gogorra egon daitekeen aztertu 3. diagnostikoa erabiliz. (Bariantza


Inflazio Faktoreak)

Factores de inflación de varianza (VIF)


Mínimo valor posible = 1.0
Valores mayores que 10.0 pueden indicar un problema de colinealidad

l_pcerve 22.362
l_psusti 22.171
l_ngp 3.265
l_ren 27.520

VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de correlación múltiple


entre la variable j y las demás variables independientes

Hiru BIF daude 10 baino handiagoak direnak, horrek esan nahi du multikolinealitatea gogorra
dagoela esan dezakegula.

e) Proposatu eredutik kendu daitekeen aldagai bat (edo bat baino gehiago)
Hiru diagnostikoak bilduz, errenta erabilgarria aldagaia izan daiteke eredutik atera daitekeen
aldagaia, , BIF handiena zuen (3.diagnostikoan), t-arrazoia txikiena (p-balio handiena)
(2.diagnostikoan) eta korrelazio handia zeukan puntuekin (1.diagnostikoa).
(normalean eredutik kentzen da eta ikusten da betetzen den ala ez).

You might also like