6-Z-Test I T-Test 2012

You might also like

Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 57

2007/2008

1
Procedure za testiranje hipoteze
Testiranje hipoteze
- testovi -
Parametarski Neparametarski
za jednu
populaciju
za dve i vie
populacija
2007/2008
2
Parametarski testovi za jednu populaciju
jedna
populacija
z-test
jednostrani
dvostrani
o poznato
srednja
vrednost
proporcija
t-test
jednostrani
dvostrani
z-test
jednostrani
dvostrani
o nepoznato
2007/2008
3
Dvostrani z-test za srednju vrednost
Pretpostavke:
poznata standardna devijacija populacije -
populacija je normalno distribuirana
Nulta hipoteza ima samo znak =
Alternativna hipoteza ima znak
Izraunava se vrednost z
N

x
z

=
2007/2008
4
Dvostrani z-test - Primer
Da li je neto teina kutije sa ajem jednaka 300 g?
Sluajni uzorak od 25 kutija ima x
sr
= 305,4 g
Poznato je da je = 15 g (standardna devijacija
populacije)
Testirati hipotezu za = 0,05
H
0
: = 300 i H
1
: 300
1,80
25
15
300 - 305,4
N

x
z + = =

=
2007/2008
5
Dvostrani z-test - reenje
Vrednost z u regionu za prihvatanje: -1,96 < z (+1,80) < 1,96

Odluka: Prihvata se hipoteza za = 0,05
Zakljuak: Nema dokaza da srednja vrednost nije 300
z
0 1,96 -1,96
0,025
Odbacuje se H
0

0,025
Odbacuje se H
0

z = + 1,80
2007/2008
6
Dvostrani z-test vrednost p
povrina levo od -1,80 = 0,0359
povrina desno od +1,80 = 1 0,9641 = 0,0359
p = 0,0359 + 0,0359 = 0,0718
1/2 p-vrednosti = 0,0359
0 +1,80 -1,80
z
odbacuje se
1/2 = 0,025 1/2 = 0,025
1/2 p-vrednosti = 0,0359
odbacuje se
Izraunata z vrednost
2007/2008
7
Dvostrani z-test Reenje
Vrednost z u regionu za prihvatanje: -1,96 < z
(+1,80) < 1,96

vrednost p: p (z -1,80 i z 1,80) = 0,0718
p > ( = 0,05)
Nulta hipoteza se prihvata
2007/2008
8
Pretpostavke:
poznata standardna devijacija populacije -
populacija je normalno distribuirana
Nulta hipoteza ima znak s ili >
Alternativna hipoteza ima znak > ili <
Izraunava se vrednost z
Jednostrani z-test za srednju vrednost
N

x
z

=
2007/2008
9
Jednostrani z-test - primer
Da li je neto teina kutije sa ajem vea od 300 g?
Sluajni uzorak od 25 kutija ima x
sr
= 305,4 g
Poznato je da je = 15 g
Testirati hipotezu za = 0,05
H
0
: 300 i H
1
: > 300
1,80
25
15
300 - 305,4
N

x
z + = =

=
2007/2008
10
Jednostrani z-test - reenje
Odluka: Ne prihvata se nulta hipoteza za = 0,05
Zakljuak: Ima dokaza da srednja vrednost nije 300
z = + 1,80
z
0
Odbacuje se H
0

+1,645
0,05
2007/2008
11
Jednostrani z-test vrednost p
povrina desno od +1,80 = 1 0,9641 = 0,0359 < ( = 0,05)
Nulta hipoteza se ne prihvata
0
+1,80
z
odbacuje se H
0

p-vrednosti = 0,0359
= 0,05
Izraunata z vrednost
2007/2008
12
Uticaj standardne devijacije
Da li je neto teina kutije sa ajem jednaka 300 g?
Sluajni uzorak od 25 kutija ima x
sr
= 305,4 g
Poznato je da je = 10 g (standardna devijacija
populacije)
Testirati hipotezu za = 0,05
H
0
: = 300 i H
1
: 300

70 , 2
25
10
300 - 305,4
N

x
z + = =

=
2007/2008
13
Uticaj standardne devijacije
z
0
1,96
-1,96
z = + 1,80
x
1,96
z = + 2,70
=10
=15
0 -1,96
=300
=305,4 x
=300
=305,4
2007/2008
14
Parametarski testovi za jednu populaciju
N
Sd
x
t

=
z-test
jednostrani
dvostrani
o poznato
srednja
vrednost
t-test
jednostrani
dvostrani
o nepoznato
N

x
z

=
N
Sd
x
t

=
2007/2008
15
Studentov t-test
Teorija normalne raspodele je razvijena iz velikog broja
podataka
Praktinim radom esto ne moe da se dobije veliki broj
podataka
Razvijena je teorijska raspodela verovatnoe sluajne
promenljive t za mali broj podataka uzetih iz normalne
raspodele
Kada se radi sa malim brojem podataka nisu poznate
populaciona standardna devijacija i srednja vrednost
se zamenjuje sa Sd, a sa x
sr

2007/2008
16
Studentov t-test
Postoji beskonano mnogo t-krivih koje zavise od broja
podataka
t-raspodela se pribliava normalnoj raspodeli kada se
poveava broj podataka
2007/2008
17
Dvostrani t-test za srednju vrednost
Parametarski test
Pretpostavka za test
Nije poznata standardna devijacija populacije -
Populacija je normalno distribuirana
Izraunava se veliina t prema izrazu:
N
Sd
x
t

=
2007/2008
18
Dvostrani t-test - Primer
Da li je sadraj kontrolnog uzorka za odredjivanje Na
jednak 135 mmol/L?
U sluajnom uzorku od N = 16 izraunato je:
x
sr
= 135,8 mmol/L i Sd = 2,04 mmol/L
Testirati hipotezu za = 0,05 = 15
H
0
: = 135 i H
1
: = 135
1,569
0,51
0,8
16
2,04
135 135,8
N
Sd
x
t = =

=

=
2007/2008
19
Kritina vrednost za t
Nulta hipoteza se prihvata, razlika nije statistiki znaajna
t < t
0,05
p > 0,05
t
0 2,131
0,025 0,025
-2,131
region za odbacivanje
t = 1,569
region za odbacivanje
jednostr. 0,05 0,025 0,005
dvostr. 0,10 0,05 0,01
= 1 6,314 12,706 63,657
2 2,920 4,303 9,925
3 2,353 3,182 5,841
.... .... .... ....
13 1,771 2,160 3,012
14 1,761 2,145 2,977
15 1,753 2,131 2,947
16 1,746 2,120 2,921

2007/2008
20
Dvostrani t-test - primer
Uticaj veliine uzorka
N = 36 x
sr
= 135,8 mmol/L Sd = 2,04 mmol/L
= 135mmol/L
H
0
: = 135 i H
1
: 135
= 0,05 (dvostrani test) = 35
2,35
0,34
0,8
36
2,04
135 135,8
N
Sd
x
t = =

=

=
Nulta hipoteza se ne prihvata, razlika jeste statistiki znaajna
t
0,05,35
= 2,030 t > t
0,05
p < 0,05
2007/2008
21
Dvostrani t-test - primer
Nulta hipoteza se ne prihvata, razlika je statistiki znaajna
t
0,05,35
= 2,030 t > t
0,05
p < 0,05
t
0
2,030
0,025 0,025
-2,030
region za odbacivanje
t = 2,35
region za odbacivanje
2007/2008
22
Dvostrani t-test - primer
Uticaj standardne devijacije
N = 36 x
sr
= 135,8 mmol/L Sd = 4,04 mmol/L
= 135mmol/L
H
0
: = 135 i H
1
: 135
= 0,05 (dvostrani test) = 35
188 , 1
0,673
0,8
36
4,04
135 135,8
N
Sd
x
t = =

=

=
Nulta hipoteza se prihvata, razlika nije statistiki znaajna
t
0,05,35
= 2,030 t < t
0,05
p > 0,05
2007/2008
23
Jednostrani t-test - primer
Da li je sadraj kontrolnog uzorka za odredjivanje Na vei
od 135 mmol/L?
U sluajnom uzorku od N = 16 izraunato je:
x
sr
= 135,8 mmol/L i Sd = 2,04 mmol/L
H
0
: 135 H
1
: > 135
Testirati hipotezu za = 0,05 = 15
1,569
0,51
0,8
16
2,04
135 135,8
N
Sd
x
t = =

=

=
2007/2008
24
Jednostrani t-test - reenje
Nulta hipoteza se prihvata, t
0,05,15
= 1,753
t < t
0,05
p > 0,05 razlika nije statistiki znaajna
t
0 1,753
0,05
t=1,569
jednostr. 0,05 0,025 0,005
dvostr. 0,10 0,05 0,01
= 1 6,314 12,706 63,657
2 2,920 4,303 9,925
3 2,353 3,182 5,841
.... .... .... ....
13 1,771 2,160 3,012
14 1,761 2,145 2,977
15 1,753 2,131 2,947
16 1,746 2,120 2,921

2007/2008
25
Parametarski testovi za jednu populaciju
jedna
populacija
z-test
jednostrani
dvostrani
o poznato
srednja
vrednost
proporcija
t-test
jednostrani
dvostrani
z-test
jednostrani
dvostrani
o nepoznato
2007/2008
26
z-test za proporciju
Pretpostavke
Populacija obino sledi binomnu raspodelu
Aproksimacija za normalnu raspodelu se koristi ako je
Np 5 i N(1 - p) 5
p proporcija koja se testira
Izraunava se vrednost z za proporciju
N
) p 1 ( p
p p
z
s


~
p
s
- izraunata proporcija
2007/2008
27
Dvostrani z-test za proporciju - primer
Sistem za pakovanje tableta daje 10% neispravnih
pakovanja
Korienjem novog sistema u sluajnom uzorku od 200
kutija dobijeno je 11 neispravnih
Da li novi sistem daje jednak broj neispravnih pakovanja?
Testirati hipotezu za = 0,05
Np = 2000,1 = 20 5
N(1 - p) = 200 (1-0,1) = 180 5
2007/2008
28
Dvostrani z-test za proporciju - reenje
H
0
: p = 0,1
H
1
: p 0,1
= 0,05
N = 200
2,12
200
0,10) (1 0,10
0,10
200
11
N
p) (1 p
p p
z
s
=

=


=
p = 0,1
p
s
= 11/200
N = 200
2007/2008
29
Dvostrani z-test za proporciju - reenje
Odluka: Nulta hipoteza se ne prihvata za = 0,05
Zakljuak: Nema dokaza da je proporcija jednaka 0,1
z = -2,12
z 0 1,96 -1,96
0,025
odbacuje se H
0

0,025
odbacuje se H
0

2007/2008
30
Jednostrani z-test za proporciju - primer
Sistem za pakovanje tableta daje 10%
neispravnih pakovanja
Korienjem novog sistema u sluajnom uzorku
od 200 kutija dobijeno je 11 neispravnih
Da li novi sistem daje manji broj neispravnih
pakovanja?
Testirati hipotezu za = 0,05
Np = 2000,1 = 20 > 5
N(1 - p) = 200 (1-0,1) = 180 > 5
2007/2008
31
Jednostrani z-test za proporciju - reenje
H
0
: p 0,1
H
1
: p < 0,1
= 0,05
N = 200
2,12
200
0,10) (1 0,10
0,10
200
11
N
p) (1 p
p p
z
s
=

=


~
p = 0,1
p
s
= 11/200
N = 200
2007/2008
32
Jednostrani z-test za proporciju - reenje
Odluka: Nulta hipoteza se ne prihvata za = 0,05
Zakljuak: Ima dokaza da je proporcija manja od 0,1, odnosno novi
sistema daje znaajno manji procenat neispravnih pakovanja
z
0
-1,645
0,05
odbacuje se H
0

z = - 2,12
2007/2008
33
Testovi za dve i vie populacija
dve i vie
populacija
varijansa
srednja
vrednost
F test
z-test
t-test
ANOVA
broj
uzoraka
2 n
2007/2008
34
Razlika izmeu dve srednje vrednosti
Uzorci su iz normalno distribuiranih populacija sa
poznatim varijansama
z-test: dvostrani i jednostrani

Uzorci su iz normalno distribuiranih populacija sa
nepoznatim varijansama
t-test: dvostrani i jednostrani
2007/2008
35
Dvostrani z-test za razliku izmeu dve sr. vrednosti
Testira se razlika izmedju srednjih vrednosti dve
nezavisne populacije

Pretpostavke:
populacione standardne devijacije su poznate
populacije su normalno distribuirane

Izraunava se vrednost z
2007/2008
36
Dvostrani z-test za razliku izmeu dve sr. vrednosti
H
0
:
1
-
2
= 0 H
1
:
1
-
2
= 0
H
0
:
1
=
2
H
1
:
1
=
2

= 0,05 z = 1,96
H
0
se odbacuje kada je: 1,96 > z
izraunato
> 1,96

2
2
2
1
2
1
2 1
N

x x
z
+

=
2007/2008
37
Dvostrani z-test za dve sr. vrednosti - primer
I serija tableta
= 2,5 mg N = 25 x
sr
= 102 mg
II serija tableta
= 2,5 mg N = 25 x
sr
= 97 mg
07 , 7
707 , 0
5
25
5 , 2
25
5 , 2
97 102
N N
x x
z
2 2
II
2
II
I
2
I
II I
= =
+

=
o

o

=
z
0,05
= 1,96 z
izr
> 1,96
Nulta hipoteza se ne prihvata, razlika u teini znaajna
2007/2008
38
Dvostrani z-test za dve sr. vrednosti - primer
Uticaj standardne devijacije
I serija tableta
= 8,5 mg N = 25 x
sr
= 102 mg
II serija tableta
= 8,5 mg N = 25 x
sr
= 97 mg
865 , 0
78 , 5
5
25
5 , 8
25
5 , 8
97 102
N N
x x
z
2 2
II
2
II
I
2
I
II I
= =
+

=
o

o

=
z
0,05
= 1,96 z
izr
< 1,96
Nulta hipoteza se prihvata, razlika u teini nije znaajna
2007/2008
39
Dvostrani z-test za dve sr. vrednosti - primer
Uticaj veliine uzorka
I serija tableta
= 8,5 mg N = 75 x
sr
= 102 mg
II serija tableta
= 8,5 mg N = 75 x
sr
= 97 mg
602 , 3
388 , 1
5
75
5 , 8
75
5 , 8
97 102
N N
x x
z
2 2
II
2
II
I
2
I
II I
= =
+

=
o

o

=
z
0,05
= 1,96 z
izr
> 1,96
Nulta hipoteza se ne prihvata, razlika u teini znaajna
2007/2008
40
Jednostrani z-test za razliku izmeu dve sr.vrednosti
Levostrani
H
0
:
1
-
2
0 H
1
:
1
-
2
< 0
H
0
:
1

2
H
1
:
1
<
2
H
0
se odbacuje kada je z
izraunato
< 1,645

Desnostrani
H
0
:
1
-
2
0 H
1
:
1
-
2
> 0
H
0
:
1

2
H
1
:
1
>
2

H
0
se odbacuje kada je z
izraunato
> 1,645
2007/2008
41
t-Test za razliku izmedju dve srednje vrednosti
Testira se razlika izmedju srednjih vrednosti dve
nezavisne populacije
Pretpostavke
Obe populacije su normalno distribuirane
Populacione standardne devijacije su nepoznate

Izrazi za izraunavanje t zavise od broja podataka
u grupama
2007/2008
42
t-Test za razliku izmedju dve srednje vrednosti
1 N
Sd Sd
x x
t
2
2
2
1
2 1

=
Za N
1
= N
2
= N
2 1
2 1
2 1
2
2
2
2
1
1
2 1
N N
N N
2 N N
Sd N Sd N
x x
t

+
+

=
Za N
1
= N
2

2007/2008
43
t-test za dve srednje vrednosti
kontrola 1 kontrola 2
146 152 149 145
140 149 153 146
151 147 149 148
148 145 145 147
144 142 149 151
145 150 150 154
142 146 152 143
141 153
x = 145,9
Sd = 3,68
x = 148,9
Sd = 3,31

kontrola 1
kontrola 2
sr.vrednost
uzorka
sr.vrednost
populacije
sr.vrednost
uzorka
sr.vrednost
populacije
2007/2008
44
Dvostrani t-test
N
1
= 15, x
sr1
= 145,9 mmol/L, Sd
1
= 3,86 mmol/L
N
2
= 15, x
sr2
= 148,9 mmol/L, Sd
2
= 3,31 mmol/l

H
0
:
1
-
2
= 0 (H
0
:
1
=
2
)
H
1
:
1
-
2
0 (H
0
:
1

2
)
= 0,05 = 15 + 15 - 2 = 28
kritina vrednost t
0,05, =28
= 2,048
208 , 2
359 , 1
0 , 3
847 , 1
0 , 3
1 5 ' 1
31 , 3 86 , 3
9 , 148 9 , 145
t
2 2
= = =

=
2007/2008
45
H
0
se ne prihvata, razlika je statistiki znaajna
t
izraunato
> 2,048 , p < 0,05
Dvostrani t-test
t = 2,208
t
0
2,048
0,025 0,025
-2,048
region za odbacivanje region za odbacivanje
2007/2008
46
Jednostrani t-test
Levostrani
H
0
:
1
-
2
0 H
1
:
1
-
2
< 0
H
0
:
1

2
H
1
:
1
<
2
H
0
se odbacuje kada je t
izraunato
< t
0,05,


Desnostrani
H
0
:
1
-
2
0 H
1
:
1
-
2
> 0
H
0
:
1

2
H
1
:
1
>
2

H
0
se odbacuje kada je t
izraunato
> t
0,05,

2007/2008
47
Uticaj razliitih faktora
Na krajnji zakljuak kod testiranja hipoteze utiu:
veliina razlike izmeu srednjih vrednosti
veliina uzorka
varijacija (veliina standardne devijacije) u uzorku
razlika izmeu
srednjih vrednosti
veliina uzorka
Sd uzorka
t-test t +
+
2007/2008
48
Razlika izmeu srednjih vrednosti
mala razlika izmeu grupa
Nulta hipoteza se lako dokazuje
velika razlika izmeu grupa
Nulta hipoteza se teko dokazuje
2007/2008
49
Razlika izmeu srednjih vrednosti
to je razlika izmeu srednjih vrednosti vea to je
tee dokazati nultu hipotezu

Velika razlika izmeu srednjih vrednosti daje
veliku vrednost t (veu od kritine vrednosti za
izabrani nivo znaajnosti)
2007/2008
50
Veliina uzorka
mali broj podataka u grupi
Nulta hipoteza se lako dokazuje
veliki broj podataka u grupi
Nulta hipoteza se teko dokazuje
2007/2008
51
Veliina uzorka
to je uzorak vei to je tee dokazati nultu
hipotezu
Veliki uzorak (veliko N) daje veliku vrednost t
(veu od kritine vrednosti za izabrani nivo
znaajnosti)

2007/2008
52
Veliina standardne devijacije
velika varijacija unutar grupa
Nulta hipoteza se lako dokazuje
mala varijacija unutar grupa
Nulta hipoteza se teko dokazuje
2007/2008
53
Veliina standardne devijacije
to je vea standardna devijacija to je lake
dokazati nultu hipotezu
Velika standardna devijacija daje malu vrednost t
(manju od kritine vrednosti za izabrani nivo
znaajnosti)

2007/2008
54
t-Test za razliku izmedju parova vrednosti
N
Sd
d
t
d
=
( )
N
d
N
x x
d
2 1

=

=
( )
1 N
d N d
Sd
2
2
d

=

= N - 1
N - broj parova
2007/2008
55
t-Test za razliku izmedju parova - primer
H
0
: d = 0 i H
1
: d = 0
= 0,05 (dvostrani test)
= 11
t
0,05, = 11
= 2,201

915 , 1
12
2,261
25 , 1
t = =
t < t
0,05
H
0
se prihvata
razlika nije statistiki znaajna

pre

posle

d

d
2


141

140

1

1

145

143

2

4

146

146

0

0

140

142

-2

4

143

140

3

9

140

136

4

16

145

144

1

1

140

142

-2

4

141

138

3

9

142

137

5

25

145

146

-1

1

144

143

1

1





d = 15

d
2
= 75

2007/2008
56
t-test za proporciju
p - poeljno obeleje q - alternativno obeleje
N
1
= 400, p
1
= 40% sniene vrednosti,
q
1
= 100 - 40 = 60%
N
2
= 210, p
2
= 30% sniene vrednosti,
q
2
= 100 - 30 = 70%
2
2 2
1
1 1
2 1
N
q p
N
q p
p p
t
+

=
2007/2008
57
t-test za proporciju
H
0
: p
1
- p
2
= 0 (p
1
= p
2
) i H
1
: p
1
- p
2
= 0 (p
1
= p
2
)
= 0,05 = 608
kritina vrednost t
0,05, = 608
= 1,97



t > t
0,05

H
0
se odbacuje, razlika je statistiki znaajna
5 , 2
210
70 30
400
60 40
30 40
=


= t

You might also like