Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 20

Neparametrijska

statistika
Hi-kvadrat test, Spirmanov ρ koeficjent korelacije rangova, Man-Vitnijev U-test
sume rangova
Opšta podela
• PARAMETRIJSKA STATISTIKA
• NEPARAMETRIJSKA STATISTIKA
• Mi smo se do sada bavili parametrijskom statistikom
• Koristili smo parametrijske testove (Pirsonovo r, t-test)
Neparametrijski testovi
• Ne počivaju na istim pretpostavkama kao i parametrijski testovi
• Dakle, ne počiva na pretpostavkama o normalnosti distribucije i homogenosti varijanse
• JEDINA teorijska pretpostavka neparametrijskih testova je nezavisnost merenja
Šta im je zajedničko?
• I parametrijski, i neparametrijski testovi ispituju verovatnoću (p) naših
podataka pod pretpostavkom H0

Zanimljivost: p vrednost je prvi put upotrebio Karl

Pearson kada je koristio hi-kvadrat test

Karl Pearson (1857-1936)


Neki od tih testova...
• Hi-kvadrat (χ2) test
• Spirmanov ro (ρ) koeficijent korelacije rangova (ordinalnih varijabli)
• Man-Vitnijev U-test sume rangova

Zanimljivost 2: definisanje nivoa značajnost od 0.05

se pripisuje Ronaldu Fišeru

Ronald Fisher
(1890-1962)
Suparnički testovi u zavisnosti od podataka
koje koristimo
Parametrijski test Neparametrijski test

t-test za nezavisne uzorke Man-Vitnijev U test

t-test za zavisne uzorke Wilcoxonov test

Pirsonovo r Spirmanovo ro

I tako dalje...
χ test
2

• Grčko slovo hi – χ
• Koristi se za analizu kategorijalnih podataka
• Da li se učestalosti ispitanika po nominalnim kategorijama značajno razlikuju?
• Analiza učestalosti, tj. frekvencija

1. Hi-kvadrat test za proveru slaganja sa teorijskim modelom

2. Hi-kvadrat test za proveru zavisnosti nominalnih varijabli (kontingencija)


Hi-kvadrat test za proveru slaganja sa teorijskim modelom
• Imamo unapred definisan teorijski model (npr. bacanje novčića 1/2, bacanje kockice 1/6
itd).
• Očekujemo da će serija bacanja novčića napraviti distribuciju tako da je pola bacanja P,
a pola G
• Međutim, frekvencije naših bacanja, tj. opažene frekvencije P i G ne moraju biti nužno
jednake tako da imamo 50% G, a 50% P
• Hi-kvadrat test proverava da li se opažene (empirijske) frekvencije razlikuju od
očekivanih (teorijskih) frekvencija
Kako se računa?

•O– opažene (empirijske) frekvencije –


observed
•E– očekivane (teorijske) frekvencije –
expected
Primer: zamislite da smo bacilli novčić 120
puta...
Glava Pismo Total n bacanja

Opažene 63 57 120

Očekivane 60 60 120

= 0.3
Stepeni slobode
• Setite se značajnosti t statistika i stepeni slobode
• Kod hi-kvadrata za slaganje sa teorijskim modelom, df je broj kategorija nominalne
varijable minus 1 (k-1)
• U ovom slučaju imamo (2-1) tj. jedan stepen slobode.
• Postoje kritične vrednosti hi-kvadrata koje se koriste za interpretaciju značajnosti.
• Sigurno možemo reći sledeće: hi-kvadrat statistik je neznačajan ukoliko je on manji ili
jednak stepenima slobode.
• Logika je ista (setimo se t-testa): ukoliko se dobijeni hi-kvadrat nalazi na 5% površine
hi-kvadrat distribucije on je značajan na nivou 0.05.
Hi-kvadrat test za proveru zavisnosti
nominalnih varijabli (kontingencija)
• Imamo dve nominalne varijable
• Da li distribucija neke nominalne varijable ostaje nepromenjena duž različitih
kategorija druge nominalne varijable?
• Jednostavnije, da li je varijabilnost neke kategorija slučajna ili zavisi od kategorija neke
druge varijable?
• Računa se istom formulom.
• Kroz primer, zamislimo da imamo nominalnu varijablu POL (M i Ž) i stav prema
smrtnoj kazni koji je meren nominalno (ZA i PROTIV).
• Pitamo se sledeće: Da li se muškarci i žene podjednako raspoređuju po stavu ZA i
PROTIV smrtne kazne ili ne?
Isti primer
STAV PREMA SMRTNOJ KAZNI TOTAL

PROTIV ZA

POL Žene 131 (95.98) 58 (93.01) 189

Muškarci 128 (163.02) 193 (157.98) 321

TOTAL 259 251 510

U zagradama su očekivane frekvencije, a levo od njih opažene. Kako smo dobili očekivane
frekvencije?
-Tako što smo uzeli vrednosti margina i podelili njihov proizvod sa ukupnim N. Na primer, za
gornju levu ćeliju (Žene PROTIV) uzeli smo vrednosti (259*189)/510 = 95.98 itd.
Da li je varijabilnost stava o smrtnoj kazni
slučajna ili zavisi od pola?

= .55
• = 44.55, p<.001

• Naš hipotetički zaključak bi bio ovakav: stav o smrtnoj kazni zavisi od pola.
Pogledom na podatke vidimo da su muškarci skloniji da podrže smrtnu kaznu
od žena.
• df = (r-1)*(k-1) = (2-1)*(2-1) = 1
Spirmanov ρ koeficijent rang korelacije
• Koristi se za računanje korelacije kada imamo ordinalne varijable.
• Isto se kreće u rasponu od -1 do +1 kao i Pirsonovo r
• Zamislite da imamo grupu ljudi koja radi prijemni ispit za upis na studije psihologije.
Prijmeni se sastoji od dva testa. Prvi je test znanja iz psihologije, a drugi je test opšteg
obrazovanja. Nakon prijemnog, fakultet je objavio samo rang listu studenata, ali ne i
pojedinačne bodove.
• Spirmanovo ro odgovara na pitanje: Na koji način su povezi rangovi na jednom testu sa
rangovima na drugom testu?
• Spirmanovo ρ je robustnije u poređenju sa Pirsonovim r, tj. manje osetljivo na štrčke.
Spirmanov ρ koeficijent rang korelacije
• Može i da opiše nelinearne odnose dve varijable

d2= predstavlja kvadiranu


razliku između rangova. Ako je
ispitanik X na jednoj listi bio
prvi, a drugoj listi peti, onda
sledi (1-5)2
Man-Vitnijev U test sume rangova
Trkač Rang
• Analog t-testu za nezavisne uzorke
P. Roglič 1
• Da li se postignuća dve nezavisne grupe na (SLO)
T. Pogačar 2
nekoj oridinalnoj varijabli značajno razlikuju? (SLO)

PRIMER W. Van Aert 3


(BEL)
• Imamo 8 biciklista u trci, 4 su Slovenci, a drugih 4 su M. Mohorič 4
(SLO)
Belgijanci. R. Evenepoel 5
(BEL)
• Želimo da saznamo: „Koja grupa je bila bolja u trci?“
J. Polanc 6
(SLO)
J. Philipsen 7
(BEL)
D. Teuns 8
(BEL)
Man-Vitnijev U test sume rangova
• Računamo U za prvu grupu i U za drugu grupu.
• Tačnije, gledamo koliko se Belgijanaca na rang listu nalazilo ispod prvog Slovenca,
zatim ispod drugog Slovenca itd.
• Isto uradimo i za drugu ekipu

• U1= 4+4+3+2 = 13

• U2 = 2+1+0+0 = 3
• U = U1 + U2 = n1*n2 = 13+3 = 16
• Poredimo manje U sa kritičnom vrednošću, ako je naše U manje, odbacujemo H0

You might also like