8-Diskriminaciona Analiza

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 6

Diskriminaciona i kanonika analiza

Diskriminaciona i kanonika analiza

Imamo podatke koje smo prikupili od razliitih preduzea o broju zaposlenih, prihodu firme, elji za izvozom, zainteresovanost za vladinu pomo.... Ako nas zanima da li se preduzea koja imaju veliku elju da izvoze znaajno razlikuju od preduzea koja imaju malu elju da izvezu (deskripcija). Ako elimo da formiramo pravilo koje e nam pomoi da na osnovu prihoda firme i ostalih nezavisnih promenljivih koje su date u sledeoj tabeli odredimo da li ta firma ima veliku ili malu elju da izveze svoj proizvod (da predvidimo kojoj grupi pripada ). Ako nas zanima da li to pravilo vri ispravnu klasifikaciju preduzea Ako nas zanima koja nezavisna promenljiva najvie doprinosi da firma ima malu ili veliku elju da izveze. Koju emo tehniku koristiti?

Diskriminaciona i kanonika analiza


Diskriminacionu analizu Zato? Imamo jednu nemetriku zavisnu promenljivu i vie metrikih nezavisnih promenljivih. Imamo unapred definisane grupe. Velika elja za izvozom i mala elja za izvozom. elimo da na osnovu podataka o zavisnoj i nezavisnim promenljivama formiramo pravilo na osnovu kojeg emo znati kojoj (unapred odreenoj) grupi pripada (naravno i na osnovu informacija o nezavisnim promenljivama).

Slinosti i razlike izmeu diskriminacione analize i drugih analiza


Diskriminaciona analiza Br. zav. prom. Br. Nezav. prom. Jedna Vie Regresija ANOVA Slinosti Jedna Vie Razlike Vrsta zav. prom. Nemetrika Vrsta nezav. prom. Metrika Metrika Metrika Metrika Nemetrika Jedna Vie

Diskriminaciona i kanonika analiza


Sprovoenje diskriminacione analize treba da se vri u nekoliko koraka: 1. 2. 3. 4. 5.
5

Formirati grupe Oceniti diskriminacionu funkciju Odrediti znaajnost funkcije i varijabli Interpretirati diskriminacionu funkciju Izvesti klasifikaciju i validaciju
6

2. Ocena diskriminacione funkcije


Rezultat diskriminacione analize je diskriminaciona funkcija koja ima sledei oblik:

2. Ocena diskriminacione funkcije


Ako su ispunjene pretpostavke primene diskriminacione analize moemo dalje nastaviti sa primenom i analizom. Koliko diskriminacionih funkcija treba da imamo u ovom naem primeru? Jednu Zato? Broj diskriminacionih funkcija je min(m-1,p). Gde je m broj grupa m=2 a p broj nezavisnih promenljivih p=4. Znai manji broj od 1 i 4 je 1. Poto je diskriminaciona funkcija slina regresionoj sledei korak je ocenjivanje diskriminacionih koeficijenata.
7 8

Gde su: Z diskriminacioni skor(rezultat); bidiskriminacioni koeficijent uz i-tu nezavisnu promenljivu; Xii-ta nezavisna promenljiva (prediktor).

2. Ocena diskriminacione funkcije


Imamo tri vrste koeficijenata:
Obini diskriminacioni koeficijenti slue za raunanje diskriminacionog skora na osnovu kojeg vrimo dodeljivanje grupi i komentariu se kao i regresioni koeficijenti u regresiji. Standardizovani diskriminacioni koeficijenti kao i beta koeficijenti kod regresije pokazuju znaajnost nezavisnih promenljivih (vei koeficijent znai vei doprinos nezavisne promenljive diskriminaciji izmeu grupa) Diskriminaciona optereenja ona predstavljaju obine korelacione koeficijente izmeu nezavisne promenljive i cele diskriminacione jednaine odnosno diskriminacionih skorova.

3. Odreivnje znaajnost funkcije i varijabli


Kao i kod regresione analize i ovde moramo da utvrdimo znaajnost diskriminacione funkcije. Znaajnost se testira testiranjem nulte hipoteze o jednakosti grupnih sredina (centroida) H0: A=B. Ako se ona odbaci znai da su centroidi statistiki razliiti odnosno da stvarno postoji razlika izme grupa koje su unapred odreene. Test koji se koristi za testiranje ovih hipoteza zove se Wilksovo i rauna se kao odnos unutargrupne varijanse i ukupne varijanse. to je vee wilksovo to su centroidi sliniji odnosno funkcija ne diskriminie dobro opservacije (ne odbacuje se nulta hipoteza) Ova statistika ima F raspored

10

3. Odreivnje znaajnost funkcije i varijabli


U naem primeru wilksovo lambda iznosi 0,766 a realizovana znaajnost 0,004. ta moemo zakljuiti? Da imamo dovoljno dokaza da odbacimo nultu hipotezu. Centroidi se razlikuju odnosno diskriminacija izmeu grupa je znaajna. Nakon ovakvog zakljuka moemo da krenemo sa interpretacijom rezultata. Kanonika korelacija=0,483 Diskriminaciona optereenja X10,585 X20,249 X30,541 X40,358

4. Interpretacija diskriminacione funkcije


ta nam pokazuje kanonika korelacija? U ovom sluaj kanonika korelacija iznosi 0,483 a predstavlja isto to i viestruki koeficijent R u regresionoj analizi. Slino, kanonika korelacija na kvadrat je isto to i koeficijent determinacije kod regresije. Tako da moemo rei da je 23,3% varijanse zavisne promenljive elja za izvozomobjanjena modelom. ta nam pokazuju standardizovani diskriminacioni koeficijenti?

Standardizovani diskriminacioni koeficijenti: X10,825 X2 -0,196 X3-0,824 X4. 0,156

11

12

4. Interpretacija diskriminacione funkcije i klasifikacija (5)


Pokazuju da nezavisne promenljive X1 i X3 odnosno broj zaposlenih i godine funkcionisanja fime na domaem tritu su najvanije diskriminacione promenljive. U najveoj meri one odreuju kojoj grupi pripada firma. ta pokazuju diskriminaciona optereenja? Na primer, pokazuje da 58,5 posto varijanse nezavisna promenljiva X1 deli sa diskriminacionom funkcijom. Kako glasi pravilo diskriminacije ako centroid za grupu velika elja za izvozom iznosi 0,713 a centroid druge grupe iznosi (-0,413) a veliine grupa 22 i 38 respektivno? Taka preseka je Z=(nAZbarB + nBZbarA)/ nA + nB =0,3. Znai ako je diskriminacioni skor novog preduzea manji od 0,3 preduzee ima malu elju za izvozom i suprotno.
13

5. Validacija

Na osnovu podataka iz Klasifikacione matrice izraunati proporciju pogodaka

Proporcija pogodaka je (16+29)/60=75%


14

Diskriminaciona analiza
Jedan istraiva eli da sprovede viestruku diskriminacionu analizu sa tri grupe i zainteresovan je za korienje informacija za tri varijable koje je prikupio tokom istraivanja. Koliko diskriminacionih funkcija je mogue konstruisati? Broj grupa (m) iznosi 3 a broj promenljivih (p) je takoe 3. Broj diskriminacionih funkcija se odredjuje kao min (m-1),(p) odnosno manji od ova dva broja. Znai min(2),(3) odnosno mogue je konstruisati 2 diskriminacione funkcije ali to ne znai da moramo obe da iskoristimo.

Diskriminaciona analiza
Na osnovu klasifikacione matrice odrediti da li diskriminaciona analiza daje poboljane rezultate klasifikovanja u odnosu na kriterijum maksimalne anse i na kriterijum proporcionalne anse. Kriterijum maksimalne anse 22/60*100=36,6% Kriterijum proporcionalne anse ((22/60)2+ (21/60)2+ (17/60)2)*100= =33,7% Proporcija pogotka diskriminacione funkcije (15+14+8)/60*100= =61,7% Diskriminaciona analiza daje poboljanje rezultata klasifikovanja od 68,5% (61,7-36,6)/36,6
Zainteresova nost za izvoz Visoka Niska Srednja Visoka Niska Srednja Ukupno

15 4 4

4 14 5

3 3 8

22 21 17

15

16

Kanonika korelacija
Ako kod prvog primera (prva tabela na prezentaciji) elimo da utvrdimo korelaciju izmeu zavisnih i nezavisnih promenljivih koju statistiku analizu treba da primenimo? Kanoniku korelacionu analizu. Zato? Zato to su promenljive na intervalnoj skali a elimo da utvrdimo povezanost dve grupe promenljivih i to ba korelaciju nezavisnih promenljivih sa zavisnim promenljivama. Kanonika korelacija je proirenje viestrukog regresionog modela.

Kanonika korelacija
Koliko kanonikih funkcija imamo u ovom primeru? Broj kanonikih funkcija je m= min (p,q) gde je p broj zavisnih promenljivih a q broj nezavisnih promenljivih. Znai manji broj od 2 i 4 je 2. ta pokazuju sledee tabele? Greka u knjizi. Pokazuju kako izgledaju funkcije za kriterijumske i varijable prediktora. V1=0,774Y2-0.044Y1 V2=-0,0662Y2+0,8723Y1
Originalni kanoniki koeficijenti za kriterijumske (zavisne) varijable V1 Y2-nivo interesovanja za pomo vlade Y1-elja za izvozom 0,744 3 -0,044 V2 -0,0662 X1 X2 0,8723 X3 X4 Originalni kanoniki koeficijenti za varijable prediktora (zavisne) U1 0,0533 0,061 -0,4268 0,1496 U2 0,042 0,559 0,79152 0,0441 18

17

Kanonika korelacija

Canonical Correlation 1 2 0,8503 0,5712 Adjusted Canonical Correlation 0,84 0,559 Approx. Standard Error 0,036 0,0877 Squared Canonical Correlation 0,7230 0,3263

Kanonika korelacija
Komentarisati standardizovane kanonike koeficijente i kanonika optereenja koja su data u sledeim tabelama Standardizovani kanoniki koeficijenti pokazuju relativnu vanost/znaajnost varijabli. Vrednosti koje su zaokruene pokazuju koje promenljive vie utiu na vrednost linearne jednaine. U jednaini V1 zavisna promenljiva Y2 mnogo vie utie na V1 nego Y1.. Standardizovani kanoniki koeficijenti za kriterijumske varijable (Y) V1 Y2 Y1 1,0058 -0,0510 V2 -0,0896 1,0085

1 - kanonika korelacija izmeu V1 i U1. 2- kanonika korelacija izmeu V2 i U2. Kanonike korelacije za prvi par i drugi par iznose 0,85 i 0,57. Pokazuje da su kanonike korelacije, odnosno ove dve funkcije 1 i 2, znaajne na nivou od 1%. Koliina varijanse koja je zajednika za linearne kombinacije prve i druge funkcije odnosno procenat varijanse koji dele V1 i U1 je 72,3% a V2 i U2 je 32,63%.
19

Test H0: kanonika korelacija je nula


Likelihood ratio 1 2 0,18659015 0,67367729 Approx. F 17,7528 8,8805 Num df 8 3 Denum df 108 55 Prob>F 0,0001 0,0001

Standardizovani kanoniki koeficijenti za varijable prediktora (X) U1 X1 X2 X3 X4 0,5686 0,0531 -0,393 0,3801 U2 0,4485 0,4841 0,7289 0,1121
20

Kanonika korelacija
Iako opte gledano standardizovani kanoniki koeficijenti i kanonika optereenja (loadings) treba da pokau istu stvar u teoriji se preporuuje da se koriste kanonika optereenja. Prva funkcija V1 je predstavljena promenljivom Y2 (0,99), a druga funkcija V2 je predstavljena promenljivom Y1 (0,99)
Kanonika optereenja za kriterijumske varijable (Y) V1 Y2 Y1 0,9987 0,0887 V2 0,0505 0,9961

Kanonika korelacija
Kriterijumska varijabla Y2 proizvodi najveu korelaciju sa prvom linearnom kombinacijom varijabli prediktora, a kriterijumska varijabla Y1 ima veu korelaciju sa drugom linearnom kombinacijom varijabli prediktora. Sve ovo do sada navedeno pokazuje nam da su potrebni rezultati obe funkcije za objanjenje varijacija u ove dve kriterijumske (zavisne) varijable.
Kanonika unakrsna optereenja za kriterijumske varijable (Y) U1 Y2 Y1 0,8492 0,0754 U2 0,0288 0,569

Kanonika optereenje za varijable prediktora (X) U1 X1 X2 X3 X4 0,8583 -0,1131 -0,5716 0,7716 U2 0,3108 0,6215 0,7369 0,2091
21

Kanonika unakrsna optereenje za varijable prediktora (X) V1 X1 X2 X3 X4 0,7298 -0,0962 -0,4861 0,6561 V2 0,1775 0,355 0,4204 0,1195
22

Kanonika analiza
Kako je kanonika analiza razliita od regresione? Kada istraiva ima vie varijabli kriterijuma (zavisne varijable) i vie prediktor varijabli (nezavisne varijable), odgovarajua statistika tehnika je kanonika korelacija. Ona je nastavak viestruke regresije gde se ispituje veza izmeu jedne zavisne promenljive i vie nezavisnih.

23

You might also like