Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 46

STATISTIKA U FARMACIJI

Analiza varijanse - ANOVA

1
2008/2009 S. Spasić
Testovi za dve i više populacija

dve i više
populacija

srednja
vrednost varijansa

2 broj n
uzoraka
F test

z-test
ANOVA
t-test

2
2008/2009 S. Spasić
F-test za odnos dve varijanse

 Parametarski test
 Testira razliku izmedju dve nezavisne populacione
varijanse
 Pretpostavka za test:
 obe populacije su normalno distribuirane

3
2008/2009 S. Spasić
F-test - postavljanje hipoteze

 Hipoteze
H 0: 12 = 22 i H 1: 12 ≠ 22

 Izračunava se

Sd12
F , uslov Sd12  Sd 22
Sd 22

Dve grupe stepena slobode


df1 = N1 - 1; df2 = N2 - 1

Sledi F distribuciju

4
2008/2009 S. Spasić
F-test - kritične vrednosti

odbacuje se H0 odbacuje se H0

α/2 prihvata se H0
α/2

0 1,0 F
Flevo Fdesno

5
2008/2009 S. Spasić
F-test - Rešenje

Sd1 = 1,30 Sd2 = 1,16


H 0: 12 = 22
H 1: 12  22
α  0,05 0,025 0,025

df1  22 df2  24
2,00 F
1,30 2
F 2
 1,25
1,16

H0 se prihvata, nema značajne razlike izmedju Sd12 i Sd22

6
2008/2009 S. Spasić
F-test - Rešenje
φ1
φ2
1 2 3 ... 18 22
1 161,4 199,5 215,7 ... 247,3 248,6
2 18,51 19,00 19,16 ... 19,44 19,45
3 10,13 9,55 9,28 ... 8,67 8,65
4 7,71 6,94 6,59 ... 5,82 5,79
... ... ... ... ... ... ...
22 1,30 3,44 3,05 ... 2,10 2,05
23 4,28 3,42 3,03 ... 2,08 2,02
24 1,26 3,40 3,01 ... 2,05 2,00
25 1,24 3,39 2,99 ... 2,04 1,98

F0,05, 20, 24 = 2,00 – 2,05 Fizr = 1,25 Fizr < F0,05


H0 se prihvata, nema značajne razlike izmedju Sd12 i Sd22
7
2008/2009 S. Spasić
Testovi za dve i više populacija

Analiza varijanse (ANOVA)

Jednofaktorska Dvofaktorska
ANOVA ANOVA

F-test Efekat
interakcija

Tukey-
Snedecor
test

8
2008/2009 S. Spasić
Student t-test

 Student t-test – testiranje razlike između srednjih vrednosti


2 grupe podataka
 H0 : μ1 = μ2 H1 : μ1 ≠ μ2
 α = 0,05 (nivo značajnosti testa)
 0,05 (5%) – verovatnoća da se odbaci ispravna nulta
hipoteza

 greška tip I – odbacivanje ispravne nulte hipoteze


 greška tip II – prihvatanje neispravne nulte hipoteze

9
2008/2009 S. Spasić
Student t-test

 Testiranje razlike između srednjih vrednosti više grupa


podataka
 potrebno izvođenje t-testa više puta

 Koliko je potrebno t-testova?


 3 grupe podataka: A, B i C – 3 t-testa
 poređenja: A:B, A:C i B:C
 4 grupe podataka: A, B, C i D – 6 t-testova
 poređenja: A:B, A:C, A:D, B:C, B:D i C:D

10
2008/2009 S. Spasić
Istovremeno izvođenje više t-testova

 Kod izvođenja više t-testova javlja se “Familywise error


rate” problem (FWER)
 FWER – verovatnoća da se neispravno odbaci
najmanje jedna nulta hipoteza u grupi poređenja
 FWER = 1 – (1 – α)k
 α – nivo značajnosti testa
 k – broj t-testova
 Za 6 t-testova:
 FWER = 1 – (1 – 0,05)6 = 1 – 0,735 = 0,265 = 27%
 27% verovatnoće da napravimo najmanje jednu grešku
tip I

11
2008/2009 S. Spasić
ANOVA

 Analiza varijanse omogućava istovremeno testiranje


razlika između više srednjih vrednosti

 Ispituje se jedna ili više nezavisnih varijabli – faktora


uticaja na zavisnu varijablu
 Jedan faktor uticaja – jednofaktorska ANOVA
 Više faktora uticaja – višefaktorska ANOVA (multipla
ANOVA – MANOVA)
 Svaki faktor uticaja ima više kategorija (grupa)

12
2008/2009 S. Spasić
Jednofaktorska ANOVA - hipoteze

 H0: 1 = 2 = 3
 Sve populacione srednje vrednosti su jednake
 Faktor uticaja nema efekta
 H1: 1  2  3
H1: 1 = 2  3
H1: 1  2 = 3
H1: 1 = 3  2 H1:  - nisu sve jednake
 Najmanje 1 srednja vrednost je različita
 Postoji efekat faktora uticaja

13
2008/2009 S. Spasić
Jednofaktorska ANOVA

H0 : μ1  μ2  μ3

H1 : μ  Nisu sve jednake

Sve srednje vrednosti su jednake:


Nulta hipoteza je ispravna
(nema efekta faktora uticaja)

μ1  μ2  μ3
14
2008/2009 S. Spasić
Jednofaktorska ANOVA
H0 : μ1  μ2  μ3

H1 : μ  Nisu sve jednake

Najmanje jedna srednja vrednost je različita:


Nulta hipoteza nije ispravna
(postoji efekat faktora uticaja)

ili

μ1  μ2  μ3 μ1  μ2  μ3
15
2008/2009 S. Spasić
Logika Analize varijanse

 Varijacija (varijansa) između grupa upoređuje se sa


varijacijom (varijansom) unutar grupa
 Varijacija između grupa je varijacija (razlika) između
srednjih vrednosti koja je posledica uticaja uzorka i
uticaja faktora koji se ispituje (ako postoji)
 Varijacija unutar grupa je varijacija koja je posledica
uticaja uzorka
 Ukupna varijacija je zbir varijacije između grupa i
varijacije unutar grupa

16
2008/2009 S. Spasić
Jednofaktorska ANOVA - osnovna ideja

 Uporedjivanje dva tipa varijacije da bi se ocenila razlika


izmedju srednjih vrednosti
 Baza za poredjenje je odnos varijansi
 Zašto ANOVA?
 Test baziran na varijansama je osetljiviji nego test
baziran na srednjim vrednostima
 ANOVA ima manji rizik za grešku tip I

 ANOVA ima manji rizik za grešku tip II

17
2008/2009 S. Spasić
Jednofaktorska ANOVA

Pretpostavke za test

 Eksperimentalne jedinice su slučajno odabrane


 Populacije su normalno distribuirane
 Homogenost varijansi - Populacije imaju jednake varijanse
 Podaci su izraženi intervalnom ili skalom odnosa

18
2008/2009 S. Spasić
Varijansa

Sd2 
 i
x  x 2
Varijansa
N 1

 xi  x 
2 Suma kvadrata odstupanja od srednje
vrednosti (suma kvadrata, SK)

N 1 Broj stepena slobode

19
2008/2009 S. Spasić
Razdvajanje varijacije

 Mere varijacije se dobijaju “razdvajanjem” ukupne varijacije

SK ig
varijansa između grupa
Vig 
m 1

SK ug
varijansa unutar grupa
Vug 
Nm

SK tot
ukupna varijansa Vtot 
N 1
20
2008/2009 S. Spasić
Jednofaktorska ANOVA – F test

H0: μ1= μ2 = … = μc
H1: μ – najmanje jedna srednja vrednost je različita

Vig
F
Vug

Stepeni slobode
 df1 = m – 1 (m = broj grupa)
 df2 = N – m (N = ukupan broj podataka u svim grupama zajedno)

21
2008/2009 S. Spasić
Kritične vrednosti F

Ako su srednje vrednosti jednake,


F =Vig/Vug  1
Odbacuje se H0 samo za veliko F
odbacuje se H0


prihvata se H0

0 F

Fα, df1, df2


Uvek jednostrani test!
22
2008/2009 S. Spasić
Razdvajanje varijacije

 Ukupna varijacija (suma kvadrata odstupanja od srednje


vrednosti) može da se razdvoji u dva dela:

SKtot = SKig + SKug

SKtot = ukupna suma kvadrata


(ukupna varijacija)
SKig = suma kvadrata između grupa
(varijacija između grupa)
SKug = suma kvadrata unutar grupa
(varijacija unutar grupa)
23
2008/2009 S. Spasić
Ukupna varijacija

  
2

2
SK tot  X1,1  X  X2,1  X    Xni ,i  X 
2

grupa 1 grupa 2 grupa 3

24
2008/2009 S. Spasić
Varijacija izmedju grupa

 
2
 
2
SK ig  n1 X1  X  n2 X2  X    nc Xc  X  
2

x3
x
x2
x1

grupa 1 grupa 2 grupa 3

25
2008/2009 S. Spasić
Varijacija unutar grupa

  
2
2
SKug  X1,1  X1  X2,1  X1    Xni ,i  Xi  
2

x3
x2
x1

grupa 1 grupa 2 grupa 3

26
2008/2009 S. Spasić
Faktori koji utiču na zaključak

Razlika između
srednjih vrednosti

+
Veličina uzorka + ANOVA F

Varijacija unutar
grupa

27
2008/2009 S. Spasić
Razlika između srednjih vrednosti

mala razlika između grupa velika razlika između grupa


Nulta hipoteza se lako dokazuje Nulta hipoteza se teško dokazuje
28
2008/2009 S. Spasić
Veličina uzorka

mali broj podataka u grupi veliki broj podataka u grupi


Nulta hipoteza se lako dokazuje Nulta hipoteza se teško dokazuje
29
2008/2009 S. Spasić
Varijacija unutar grupa

velika varijacija unutar grupa mala varijacija unutar grupa


Nulta hipoteza se lako dokazuje Nulta hipoteza se teško dokazuje
30
2008/2009 S. Spasić
ANOVA - izrazi za izračunavanje

suma kvadrata odstupanja od


Σx  Nx 
2 2
srednje vrednosti - SK
V
N 1 broj stepena slobode - df

2
2 2 2  Σx 
SK  Σx  N (x)  Σx  N   
N

Σx 2  N
Σx 2
 Σx 2 
Σx 2
C
N2 N

31
2008/2009 S. Spasić
ANOVA - izrazi za izračunavanje

1. C
Σx  2

2. SK tot  Σx 2  C

3. SK ig 
Σx 1 2 Σx 2 2
  .... 
Σx i 2
C
n1 n2 ni

4. SK ug  SK tot  SK ig

32
2008/2009 S. Spasić
ANOVA - sumarna tabela

izvor varijacije SK d.f. varijansa


izmedju grupa SK ig m-1 V ig = SK ig /(m-1)
unutar grupa SK ug N-m V ug = SK ug /(N-m)
ukupno SK tot N-1 -

Vig
F kritična vrednost Fα za df1 = m-1 i df2 = N-m
Vug

33
2008/2009 S. Spasić
Jednofaktorska ANOVA- primer
Ispitivanje toksičnog delovanja leka na tri tipa ćelija
Prikazano je vreme (u danima) posle koga je ostalo 50% ćelija

tip A tip B tip C


1,2 1,5 2,0
1,5 1,4 1,8
vreme 1,7 1,3 1,7
(dani) 1,8 1,6 2,2
1,6 1,8 1,9
1,4 1,4 2,1
∑x 9,2 9,0 11,7
xsr 1,53 1,50 1,95
∑x2 14,34 13,66 22,99

34
2008/2009 S. Spasić
Jednofaktorska ANOVA- primer

2,5

H0: A = B = C
2
H1:  - nisu sve xC
jednake x
1,5 xA xB
 = 0,05
dani
df1 = 2 i df2 = 15
1

0,5

0
A B C
grupe 35
2008/2009 S. Spasić
ANOVA – primer 1

(9,2  9,0  11,7) 2 894,01


1. C   49,667222
18 18

2. SK tot  (14,34  13,66  22,99 )  C  50,99  C  1,322778

9,2 2 9,0 2 11,7 2


3. SK ig     C  50,421667 - C  0,754445
6 6 6

4. SK ug  1,322778  0,754445  0,568333

36
2008/2009 S. Spasić
ANOVA – primer 1

varijacija SK φ V
izmedju grupa 0,7544 2 0,3772
unutar grupa 0,5684 15 0,0379
ukupno 1,3228 17 -

0,3772
F  9,953
0,0379

F0,05 = 3,68 za df1 = 2 i df2 = 15


Nulta hipoteza se odbacuje, negde postoji 0 3,68 F
razlika izmedju srednjih vrednosti !

37
2008/2009 S. Spasić
ANOVA – Tukey-Snedecor test

D  Sx  Q Sx 
Vug
n
1 

N
n2 
n 
m  1 N 
 

0,03789
n6 Q  3,67 Sx   0,07947
6

D  0,07947  3,67  0,292

38
2008/2009 S. Spasić
ANOVA – Tukey-Snedecor test

Hipoteza Razlika Statistički zaključak


H0 : μA = μB 1,53 – 1,50 = 0,03 0,03 < 0,29 H0 se prihvata
H0 : μA = μC 1,53 – 1,95 = |0,42| 0,42 > 0,29 H0 se odbacuje
H0 : μB = μC 1,50 – 1,95 = |0,45| 0,45 > 0,29 H0 se odbacuje

x A  xB x A  xC xB  x C
f(x)

μAμB μ3 x

39
2008/2009 S. Spasić
ANOVA – Tukey-Snedecor test

grupa xsr xsr – 1,50 xsr – 1,53 xsr – 1,95


C 1,95 0,45 0,42 -
A 1,53 0,03 -
B 1,50 - - -

40
2008/2009 S. Spasić
ANOVA – primer 2

grupa A grupa B grupa C grupa D


2,51 2,49 2,50 2,52
H0: A = B = C = D
2,51 2,50 2,49 2,52
H1:  - nisu sve jednake 2,52 2,53 2,48 2,53
 = 0,05 2,52 2.50 2,48 2,51
df1 = 3 i df2 = 23 2,50 2,50 2,47 2,52
2,53 2,52 2,48 2,53
2,52 2,52
2,52
n 7 6 6 8
xsr 2,516 2,507 2,483 2,521
Σx 17,61 15,04 14,9 20,17
Σx2 44,3023 37,7014 37,0022 50,8539

41
2008/2009 S. Spasić
ANOVA - primer

(17,61  15,04  14,90  20,17) 2


1. C  169,8518
27

2. SK tot  ( 44,3023  37,7014  37,0022 


 50,8539 )  C  0,00801

17,612 15,04 2 14,9 2 20,17 2


3. SK ig      C  0,005474
7 6 6 8

4. SK ug  0,008  0,005474  0,002526

42
2008/2009 S. Spasić
ANOVA - primer

varijacija SK φ V
izmedju grupa 0,005474 3 0,001825
unutar grupa 0,002526 23 0,00011
ukupno 0,00801 26 -

0,001825
F  16,591
0,00011

F0,05 = 3,03 za df1 = 3 i df2 = 23


0 3.03 F
Nulta hipoteza se odbacuje, negde postoji
razlika izmedju srednjih vrednosti !
43
2008/2009 S. Spasić
ANOVA - Tukey-Snedecor test

D  Sx  Q Sx 
Vug
n
1 
N
n2 
n m 1  N 
 

0,00011
n  6,716 Q  3,926 Sx   0,00405
6,716

D  0,00405  3,926  0,016

44
2008/2009 S. Spasić
ANOVA - Tukey-Snedecor test

Hipoteza Razlika Statistički zaključak


H0 : μA = μB 2,516 - 2,507 = 0,009 0,009 < 0,016 H0 se prihvata
H0 : μA = μC 2,516 - 2,483 = 0,033 0,033 > 0,016 H0 se odbacuje
H0 : μA = μD 2,521 - 2,516 = 0,006 0,005 < 0,016 H0 se prihvata
H0 : μB = μC 2,507 - 2,483 = 0,024 0,024 > 0,016 H0 se odbacuje
H0 : μB = μD 2,521 - 2,507 = 0,015 0,014 < 0,016 H0 se prihvata
H0 : μC = μD 2,521 - 2,483 = 0,034 0,038 > 0,016 H0 se odbacuje

f(x)
x A  xB  xD  x C

x
μA=μB=μD μC

45
2008/2009 S. Spasić
ANOVA - Tukey-Snedecor test

grupa xsr xsr - 2,483 xsr - 2,507 xsr - 2,516 xsr - 2,521
D 2,521 0,038 0,014 0,005 -
A 2,516 0,033 0,009 -
B 2,507 0,024 -
C 2,483 -

46
2008/2009 S. Spasić

You might also like