Professional Documents
Culture Documents
Neparametrijska Statistika
Neparametrijska Statistika
statistika
Hi-kvadrat test, Spirmanov ρ koeficjent korelacije rangova, Man-Vitnijev U-test
sume rangova
Opšta podela
• PARAMETRIJSKA STATISTIKA
• NEPARAMETRIJSKA STATISTIKA
• Mi smo se do sada bavili parametrijskom statistikom
• Koristili smo parametrijske testove (Pirsonovo r, t-test)
Neparametrijski testovi
• Ne počivaju na istim pretpostavkama kao i parametrijski testovi
• Dakle, ne počiva na pretpostavkama o normalnosti distribucije i homogenosti varijanse
• JEDINA teorijska pretpostavka neparametrijskih testova je nezavisnost merenja
Šta im je zajedničko?
• I parametrijski, i neparametrijski testovi ispituju verovatnoću (p) naših
podataka pod pretpostavkom H0
Ronald Fisher
(1890-1962)
Suparnički testovi u zavisnosti od podataka
koje koristimo
Parametrijski test Neparametrijski test
Pirsonovo r Spirmanovo ro
I tako dalje...
χ test
2
• Grčko slovo hi – χ
• Koristi se za analizu kategorijalnih podataka
• Da li se učestalosti ispitanika po nominalnim kategorijama značajno razlikuju?
• Analiza učestalosti, tj. frekvencija
Opažene 63 57 120
Očekivane 60 60 120
= 0.3
Stepeni slobode
• Setite se značajnosti t statistika i stepeni slobode
• Kod hi-kvadrata za slaganje sa teorijskim modelom, df je broj kategorija nominalne
varijable minus 1 (k-1)
• U ovom slučaju imamo (2-1) tj. jedan stepen slobode.
• Postoje kritične vrednosti hi-kvadrata koje se koriste za interpretaciju značajnosti.
• Sigurno možemo reći sledeće: hi-kvadrat statistik je neznačajan ukoliko je on manji ili
jednak stepenima slobode.
• Logika je ista (setimo se t-testa): ukoliko se dobijeni hi-kvadrat nalazi na 5% površine
hi-kvadrat distribucije on je značajan na nivou 0.05.
Hi-kvadrat test za proveru zavisnosti
nominalnih varijabli (kontingencija)
• Imamo dve nominalne varijable
• Da li distribucija neke nominalne varijable ostaje nepromenjena duž različitih
kategorija druge nominalne varijable?
• Jednostavnije, da li je varijabilnost neke kategorija slučajna ili zavisi od kategorija neke
druge varijable?
• Računa se istom formulom.
• Kroz primer, zamislimo da imamo nominalnu varijablu POL (M i Ž) i stav prema
smrtnoj kazni koji je meren nominalno (ZA i PROTIV).
• Pitamo se sledeće: Da li se muškarci i žene podjednako raspoređuju po stavu ZA i
PROTIV smrtne kazne ili ne?
Isti primer
STAV PREMA SMRTNOJ KAZNI TOTAL
PROTIV ZA
U zagradama su očekivane frekvencije, a levo od njih opažene. Kako smo dobili očekivane
frekvencije?
-Tako što smo uzeli vrednosti margina i podelili njihov proizvod sa ukupnim N. Na primer, za
gornju levu ćeliju (Žene PROTIV) uzeli smo vrednosti (259*189)/510 = 95.98 itd.
Da li je varijabilnost stava o smrtnoj kazni
slučajna ili zavisi od pola?
= .55
• = 44.55, p<.001
• Naš hipotetički zaključak bi bio ovakav: stav o smrtnoj kazni zavisi od pola.
Pogledom na podatke vidimo da su muškarci skloniji da podrže smrtnu kaznu
od žena.
• df = (r-1)*(k-1) = (2-1)*(2-1) = 1
Spirmanov ρ koeficijent rang korelacije
• Koristi se za računanje korelacije kada imamo ordinalne varijable.
• Isto se kreće u rasponu od -1 do +1 kao i Pirsonovo r
• Zamislite da imamo grupu ljudi koja radi prijemni ispit za upis na studije psihologije.
Prijmeni se sastoji od dva testa. Prvi je test znanja iz psihologije, a drugi je test opšteg
obrazovanja. Nakon prijemnog, fakultet je objavio samo rang listu studenata, ali ne i
pojedinačne bodove.
• Spirmanovo ro odgovara na pitanje: Na koji način su povezi rangovi na jednom testu sa
rangovima na drugom testu?
• Spirmanovo ρ je robustnije u poređenju sa Pirsonovim r, tj. manje osetljivo na štrčke.
Spirmanov ρ koeficijent rang korelacije
• Može i da opiše nelinearne odnose dve varijable
• U1= 4+4+3+2 = 13
• U2 = 2+1+0+0 = 3
• U = U1 + U2 = n1*n2 = 13+3 = 16
• Poredimo manje U sa kritičnom vrednošću, ako je naše U manje, odbacujemo H0