Professional Documents
Culture Documents
Praktika8egina Gidoia-1 - 1
Praktika8egina Gidoia-1 - 1
Praktika8egina Gidoia-1 - 1
PRAKTIKA MULTIKOLINEALITATEA
Helburuak
Multikolinealitate gogorraren antzematea
1. Ariketa
nba.gdt fitxategia 2011-2012 denboraldiko NBAko 54 jokalariren estatistikei dagokien datu-multzoa
da. Eredu hau planteatzen da:
Ereduaren R2= 0.788623 da, handia da, hau da, ereduak menpeko aldagaiaren
aldakotasunaren zati handi bat azaltzen du. ANOVA kontrastean H0 errefusatuko da
(p-balioa= 4.30e-15 ≤ 0.05), hau da, eredua globalki adierazgarria da. Bestalde,
banakako adierazgarritasun kontrasteetan, 5etik 4 ez dira adierazgarriak (H0 ez da
errefusatzen). Honek multikolinealitate gogorra dukagula esango digu eta neurriren
bat hartu beharko genuke konpontzeko.
Minutuak 10.636
Erreboteak 4.256
Asistentziak 2.821
Txapelak 3.524
Puntuak 5.723
Minutuen BIF 10.6363> 10, hau da, minutuetan bariantza 10.6 aldiz handitzen da
beste aldagaiekin duen erlazioarengatik. Multikolinealitate gogorra dagoelaren
indikatzailea da, bereziki minutuei eragiten dion multikolinealitatea.
e) Proposatu eredutik kendu daitekeen aldagai bat (edo bat baino gehiago)
Hiru diagnostikoak bilduz, minutuen aldagaia izan daiteke eredutik atera daitekeen
aldagai bat, BIF handiena zuen (3.diagnostikoan), t-arrazoia txikiena (p-balio
handiena) (2. Diagnostikoan) eta korrelazio handiena zeukan puntuekin
(1.diagnostikoan)
Normalean eredutik kentzen da eta ikusten da betetzen den ala ez.
2. Ariketa
cerveza.gdt fitxategian hurrengo aldagaien datuak ematen dira:
qcerve: eskatutako garagardo kantitatea (litroak)
pcerve: garagardoaren prezioa (euroak)
psusti: beste alkoholdun edarien prezioa (euroak)
ngp: elikadura-produktuen prezio-maila orokorraren igoera (%)
ren: errenta eskuragarria, milaka eurotan.
Datuak eskualde jakin bateko ondoz ondoko hiruhilekoei dagozkie. Log-log eredu hau
planteatzen da:
ln qcerve=β 1+ β 2 ln pcerve+ β3 ln psusti+ β 4 ln ngp+¿ β 5 lnren+u ¿
a) Eredua estimatu.
Korelazio matrizean balio absolutuan 0.8 baino handiagoak diren bost korrelazio topatzen ditugu.
Beste alkoholdun edarien prezioen eta garagardoaren prezioaren artean (0.9669), elikadura
produktuen prezio maila orokorraren igoeraren eta beste alkoholdun edarien prezioen artean
(0.8094), errenta eskuragarriaren eta garagardoaren prezioaren artean (0.9711), errenta
eskuragarriaren eta beste alkoholdun edarien artean (0.9715) eta errenta eskuragarriaren eta
elikadura produktuen prezio maila orokorraren igoeraren artean (0.8211).
Multikolinealitaterako lehenengo diagnostikoarekin multikolinealitate gogorra egon daitekeela
ondorioztatu dezakegu. Bigarren diagnostikoa ere ikusi beharko litzateke.
Lehenengo diagnostikoarekin: multikolinealitate gogorra dagoela dago, bikoteka aztertuta.
Ereduaren R^2=0.825389, handia da, hau da, ereduak menpeko aldagaiaren aldakortasunaren zati
handi bat azaltzen du.
ANOVA kontrastean H0 errefusatuko da (p-balioa= 3.80e-09<0.05), hau da, eredua globalki
adierazgarria da. Bestalde, banakako adierazgarritasun kontrasteetan aldi berean betak banaka
adierazgarriak dira. Diagnostiko honekin ezin dugu esan ereduari eragiten dion multikolinealitatea
dagoenik.
l_pcerve 22.362
l_psusti 22.171
l_ngp 3.265
l_ren 27.520
Hiru BIF daude 10 baino handiagoak direnak, horrek esan nahi du multikolinealitatea gogorra
dagoela esan dezakegula.
e) Proposatu eredutik kendu daitekeen aldagai bat (edo bat baino gehiago)
Hiru diagnostikoak bilduz, errenta erabilgarria aldagaia izan daiteke eredutik atera daitekeen
aldagaia, , BIF handiena zuen (3.diagnostikoan), t-arrazoia txikiena (p-balio handiena)
(2.diagnostikoan) eta korrelazio handia zeukan puntuekin (1.diagnostikoa).
(normalean eredutik kentzen da eta ikusten da betetzen den ala ez).