Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 38

Uslovi za primenu t testa i ANOVE

• slučajno i nezavisno razvrstavanje u grupe

• zavisna varijabla je intervalna ili racio

• distribucije su normalne
• varijanse su homogene
• uzorci su podjednake veličine
Nisu ispunjeni uslovi
Primeniti testove koji ne zahtevaju normalnu
• namerno i zavisno
distribuciju nitirazvrstavanje u grupe
intervalni nivo merenja
NEPARAMETRIJSKI TESTOVI

• zavisna varijabla nije intervalna ili racio

• distribucije nisu normalne


• varijanse nisu homogene (korekcija)
• uzorci nisu podjednake veličine (korekcija)
Neparametarski testovi
Nazivaju se i “testovi nezavisni od distribucije”.
I dalje nam je cilj da donosimo zaključke o
populaciji na osnovu uzorka, ali...
... nije nam bitno kakve su karakteristike, tj.
parametri distribucije varijable u populaciji iz
koje je uzorak uzet.
... su testovi robustniji, tj. manje osetljivi na
povrede uslova tipa intervalni nivo merenja,
normalna distribucija, veliki uzorci...
Različiti nivoi merenja 0, 1, 2...?

PUŠAČ SisP 1 SisP 2 SisP 3


da 148 blHip rizik
ne 118 opt ok
ne 122 norm ok
da 138 pov rizik
da 185 teHip rizik
ne 115 opt ok
NV ZV
ne 131 pov rizik
da 169 umHip rizik
ne 131 pov rizik
da 162 umHip rizik
ne 125 norm ok
ne 126 norm ok
0, 1?
χ2

(HI KVADRAT)
TEST
Dejan Pajić
Filozofski fakultet u Novom Sadu, Odsek za psihologiju
Matrica sirovih podataka
PUŠAČ SisP 1 SisP 2 SisP 3
da 148 blHip rizik
ne 118 opt ok
ne 122 norm ok
da 138 pov rizik
da 185 teHip
TABELE KONTINGENCIJE rizik
opt ok
NV ne ZV (CROSSTABS)
115
ne 131 pov rizik
da U ovom169
primeru 2 umHip
x2 rizik
ne 131 pov rizik
da 162 umHip rizik
ne 125 norm ok
ne 126 norm ok
Matrica sirovih podataka
POL GRIC
H0: Ne postoje međupolne
m da
razlike u učestalosti
z ne
grickanja noktiju
z da
m ne ili
m ne
z da H0: Ne postoji veza između pola i
z ne učestalosti grickanja noktiju
m ne
z da ili (?)
m ne
H0: Pol ne utiče na učestalost
z da
grickanja noktiju
z ne
Tabela kontingencije
Tabela je nastala ukrštanjem
OPAŽENE
96 od FREKVENCIJE
320 devojčica gricka(fvarijable
)
onokte POL...
67 od 250 dečaka gricka nokte
MARGINALNE FREKVENCIJE
UKUPAN BROJ ISPITANIKA
dečaci (N)
devojčice ∑

grickaju 96 67 163

ne grickaju 224 183 407


... i varijable
∑ 320 250 570
"GRICKANJE NOKTIJU".
Opaženo se poredi sa slučajnim
Poznate su nam OPAŽENE
Da li očekujemo da je odnos frekvencije i želimo da
Da li očekujemo
testiramo
50% da li one
: 50% (275odstupaju
:(tj.
275)? od nečeg
da li je slučajno) dašto je
je odnos
SLUČAJNO. 50% : 50% (275 : 275)?
dečaci devojčice ∑

grickaju 96 67
Ne pravimo nikakve pretpostavke o 163
parametrima varijable u populaciji!
ne grickaju 224 183 407
Sve naše pretpostavke zasnivaju se na
∑ opaženim
320 frekvencijama!
250 570
Očekivane ("slučajne") verovatnoće
Verovatnoća da neko iz našeg
Verovatnoća
Frekvencije u da je neko ćelijama
marginalnim iz možemo da
uzorka gricka nokte:Verovatnoća da dečak
našeg uzorka
posmatramo i kao dečak:
verovatnoće određenog ishoda.
163 / 570 = 0,29. gricka nokte je
320 / 570 = 0,56.
(163 / 570) * (320 / 570)
dečaci devojčice ∑

grickaju 96 67 163

ne grickaju 224 183 407

∑ 320 250 570


Očekivane (teorijske)
Uz ovakve opaženeverovatnoće
frekvencije,
očekujemo verovatnoću od
Tako na osnovu
(320 / marginalnih
570) * (163 / frekvencija
570) = 0,16možemo da
izračunamo
da jeočekivane
neko dečak(koje
koji bi se dobile
gricka nokte.slučajno).

dečaci devojčice ∑

grickaju 96 (0,16) 67 (0,13) 163 (0,29)

ne grickaju 224 (0,40) 183 (0,31) 407 (0,71)

∑ 320 (0,56) 250 (0,44) 570 (1)


Očekivane (teorijske) frekvencije
Očekivane frekvencije
se računaju po formuli
Množenjem verovatnoća ukupnim N dobijamo
ft = ∑ r * ∑ k / N
odgovarajuće očekivane frekvencije (ft).
npr. 163 * 320 / 570 = 91,5

dečaci devojčice ∑

Sume opaženih
grickaju frekvencija
96 (91,5) 67 (71,5) 163 (163)
moraju biti jednake
ne grickaju
sumama224očekivanih!!!
(228,5) 183 (178,5) 407 (407)

∑ 320 (320) 250 (250) 570 (570)


Primer 1
Kako bi mogla da izgleda tabela kontingencije da
ne postoji razlika između dečaka i devojčica?

dečaci devojčice ∑

grickaju 50 (50) 50 (50) 100

ne grickaju 50 (50) 50 (50) 100

∑ 100 100 200


Primer 2
Da li u ovom primeru postoje razlike između
dečaka i devojčica u incidenciji grickanja noktiju?

dečaci devojčice ∑

grickaju 32 (32) 8 (8) 40

ne grickaju 128 (128) 32 (32) 160

∑ 160 40 200
Primer 3
Razlike među grupama su značajne ako su
ZNAČAJNE RAZLIKE IZMEĐU
Da li u ovom primeru postoje razlike između
OPAŽENIH I OČEKIVANIH FREKVENCIJA!!!
dečaka i devojčica u incidenciji grickanja noktiju?

dečaci devojčice ∑

grickaju 8 (32) 32
32 (8)
(8) 40
40

ne grickaju 152 (128) 8 (32) 160

∑ 160 40
40 200
Suma razlika između fo i ft

dečaci devojčice ∑ (32 - 8)2 / 8 = 72


grickaju 8 (32) 32 (8) 40

Sumi više doprinose


ne grickaju 152 (128)
8 (32) 160
(8 - 32)2 / 32 = 18

veće160RELATIVNE,
40 200
(152 - 128)2 / 128 = 4,5
a ne apsolutne razlike.

2
( f o - f t)
χ =∑
2
ft
Minimalna vrednost χ2 je 0

dečaci devojčice ∑ (8 - 8)2 / 8 = 0


grickaju 32 (32) 8 (8) 40

ne grickaju 128 (128) 32 (32) 160


(32 - 32)2 / 32 = 0
∑ 160 40 200
(128 - 128)2 / 128 = 0

2
( f o - f t)
χ =∑
2
ft
Logika interpretacije χ2 testa
Najmanja vrednost χ2 testa je 0.

χ2 je veći kada su razlike između opaženih i


očekivanih frekvencija veće.

Veći χ2 je i značajniji, tj. veća je verovatnoća da je


neka razlika statistički značajna.

Značjan χ2 govori da se opažene frekvencije


razlikuju od teorijskih: distribucija opaženih
frekvencija razlikuje se od slučajne distribucije.
χ2 test za više uzoraka
H0: Ne postoji značajna razlika među studentima
različitih grupa u stavu prema pristupanju Srbije EU.
Uzorak su bili studenti psihologije, istorije i engleskog.
Stav meren trostepenom skalom: za, neodlučan, protiv.
Koliko varijabli je "mereno"?
2 (studijska grupa, stav)
Kog je nivoa zavisna varijabla?
Ordinalnog
Koje su dimenzije tabele kontingencije?
3x3
Matrica sirovih podataka
GRUPA EU
psi 0
psi 2
Da
eng li je isto?
1
ist 1
eng 0
Zbog čega ne smemo (ne možemo)
ist 0
0 1 2
da primenimo t test?
psi 2
eng 0
ist 2
psi 1
0 1 2
eng 2
psi 1
ist 0
χ2 test za više uzoraka

psihologija istorija ekonomija ∑

za 12 (39) 13 (19) 85 (52) 110

svejedno 26 (16) 5 (8) 14 (21) 45

protiv 46 (29) 24 (15) 14 (40) 84

∑ 84 42 113 240
χ2 test za jedan uzorak
Da li je više studenata istorije za ili protiv ulaska u EU?

istorija ft ft

za 12 28 84

svejedno 26 Šta28je očekivano?


0

protiv 46 28 0

∑ 84 84 84
χ2 test za jedan uzorak
Da li distribucija školskih ocena odstupa od...

1 2 3 4 5 ∑

5 12 31 28 24 100

20 20 20 20 20 100

5 20 50 20 5 100

0 6 7 7 80 100

Moguće je proveriti odstupanje dobijene distribucije


od bilo koje teorijske (npr: Kolmogorov-Smirnov test).
Vežba 1

PBC.csv
1. Da li je razlika u broju muških i ženskih pacijenata
značajna?
2. Da li se učestalost Ludwig nivoa razlikuje?
3. Da li postoje međupolne razlike u učestalosti
pojave hepatomegalije?
4. Da li postoje međupolne razlike u učestalosti
pojave paučastih nevusa?
5. Da li postoje razlike u učestalosti paučastih nevusa
u zavisnosti od pojave hepatomegalije (proveriti ft)?
χ2 test za zavisne uzorke
Da li se stav studenata prema ulasku Srbije u EU
(za, protiv)Isti
promenio posle
ispitanik bi odluke o kandidaturi?
bio u više ćelija!
Kako popuniti tabelu kontingencije?
U U koju ćeliju staviti
ispitanika koji je
za protiv ∑ ZA.
i pre i posle bio

pre

posle


Matrica sirovih podataka
EU pre EU posle
0 0
1 2
1 1
0 1
2 0
0 0
1 2
1 0
0 2
2 1
1 2
2 1
0 0
χ2 test zaInteresuje
zavisne nas
uzorke (McNemar)
samo sadržaj ćelija koje
govore o nastalim promenama
Kod zavisnih uzoraka se "ukrštaju" merenja!
(u našem slučaju ćelije b i c).

posle

za protiv ∑

za 51 23
23 74
pre
protiv 55 26 31

∑ 56 49 105
χ2 test za zavisne uzorke (McNemar)

Da li je ovo značajna promena?

posle

protiv za ∑

za 23 51 74
pre
protiv 8 23 31

∑ 31 74 105
Broj stepeni slobode kod χ2 testa
psihologija istorija ekonomija ∑

dečaci devojčice ∑ za 12 13 85 110

grickaju 96 67 163 svejedno 26 5 14 45


ne
224 183 407 protiv 46 24 14 84
grickaju
∑ 320 250 570 ∑ 84 42 113 240

df = 1 df = 4
Zamislite
Zavisi od brojadaćelija
znatetj.
marginalne
veličinefrekvencije.
tabele.
Koliko ćelija može nezavisno da varira?
Računa se kao (k - 1) * (r - 1).
Granične vrednosti χ2 testa

df 0,05 0,01
1 3,84 6,63
2 5,99 9,21
3 7,81 11,34
4 9,48 13,27
5 11,07 15,08
6 12,59 16,81
7 14,06 18,47
Uslovi za primenu χ2 testa
„Radi“ samo sa frekvencijama.
Jedan ispitanik u jednoj ćeliji.
Suma opaženih frekvencija mora biti jednaka
sumi očekivanih frkevencija.
Ne sme biti previše nula (spojiti kategorije?)
Ne sme biti previše niskih frekvencija
ako je negde ft < 5 primenjuje se Jejtsova korekcija
(|fo - ft|- 0,5) ili Fišerov egzaktni test
χ2 test za više uzoraka
Da li ćemo utvrditi razliku među grupama ili
razliku u zastupljenosti stavova?

psihologija istorija ekonomija ∑

za 12
2 (39) 13 (19) 85 (52) 110
χ je test ASOCIJACIJE!
svejedno 26 (16) 5 (8) 14 (21) 45

protiv 46 (29) 24 (15) 14 (40) 84

∑ 84 42 113 240
Razlika : korelacija, korelacija : razlika
rb pol uspeh Postoji statistički značajna
1. 1 9
5 razlika u rezultatu na testu
2. 1 17
7 znanja između studenata i
3. 2
1 27
9
studentkinja.
4. 1 17
5
5. 2
1 45
21
To znači da sigurno postoji
6. 2 33
27
7. 1
2 33
7
statistički značajna
8. 2 39 korelacija između...
9. 2 47
45
10. 1
2 21
47 pola i uspeha.
Koeficijent korelacije kao jačina efekta

- + ∑
M 500
5 700
7 1200
12
χC2i =Φ0,67;
su značajni700
Žp > 7
0,05
ako 5χ2 = 66,67;
500 1200
12 p < 0,01
je χ2 značajan
Φ = ∑0,03 1200
12 1200
12 2400
24= 0,03
Φ
Vežba 2

Titanik.csv
1. Da li se broj stradalih putnika razlikuje u
zavisnosti od klase?
2. Koje podgrupe se konkretno razlikuju?
3. Da li se ovi rezultati razlikuju po nivoima roda?
4. Da li se broj stradalih putnika razlikuje u
zavisnosti od roda?
5. Kolika je korelacija između roda i
preživljavanja?
Vežba 3

Znanje.csv
1. Da li postoji razlika u broju bodova osvojenih
na testu znanja između studenata koji su
dolazili na nastavu i onih koji nisu?
2. Da li postoji razlika u prolaznosti na testu
znanja između studenata koji su dolazili na
nastavu i onih koji nisu?
3. Kolika je korelacija između varijabli pod 2?
Snaga statističkih testova

Neparametrijski testovi imaju manju snagu.

Stvarno stanje (u populaciji)


H0 nije tačna H0 jeste tačna
H0
greška tipa I
nije
tačna
SNAGA
nema greške
α
Naša
(statistička)
odluka H0
jeste
greška tipa II nema greške
tačna β
Pregled testova za testiranje razlika
NIVO MERENJA
NACRT
ZAVISNE VARIJABLE
NEZAVISNI UZORCI ZAVISNI UZORCI

INTERVALNI t-test (ANOVA) za t-test (ANOVA) za


RACIO nezavisne uzorke ponovljena merenja

ANOVA NE MOŽETest
Wald-Wolfowitz na nominalnim
predzaka (Sign)
ORDINALNI Mann-Whitney U transformaciju)
χ2 MOŽE (uz Wilcoxonov test
na racio
Kruskal-Wallisov test Friedmanov test

NOMINALNI Pearsonov χ2 McNemarov χ2

You might also like