Neparametarska Disperziona Analiza I Post Hoc Testovi

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Letopis naučnih radova

Godina 27 (2003), broj 1, strana 66–73


UDK: 303.71:311 Originalni naučni rad
Original scientific paper

TESTOVI VIŠESTRUKIH UPOREĐENJA∗


Čobanović, Katarina, Nikolić-Đorić, Emilija, Mutavdžić, Beba**

REZIME
U radu se izlažu neki od najviše korišćenih testova upoređenja koji se, uglavnom,
odnose na upoređenje proseka ispitivanih uzoraka prilikom izvođenja analize vari-
janse eksperimentalnih i drugih rezultata. Primenjeni testovi su: test najmanje zna-
čajne razlike (LSD test), Takijev test (Tukey HSD test), Dankenov (Duncan test),
Njuman – Kelsov (Newman – Keuls test) i Šefeov (Scheffé test). Testovi se odnose
na upoređenje proseka mase ploda pri pomološkom ispitivanju 32 sorte jabuke,
Rimski Šančevi, 1997 godina. U radu je izvedeno vrednovanje efikasnosti pojedinih
testova. Većina statističkih softvera sadrži navedene testove.

Ključne reči: Proseci tretmana, testovi upoređenja, kritična vrednost,


konzervativnost testa

UVOD

Primena metoda analize varijanse u istraživačkom radu uopšteno podrazumeva


testiranje hipoteze da je k ≥ 3 sredina osnovnih skupova jednako (Kirk, 1968).
U istraživačkom radu, prilikom izvođenja analize varijanse, statistički značajan F-
test podrazumeva odbacivanje nulte hipoteze o jednakosti aritmetičkih sredina tretmana.
U takvom slučaju izvode se dalja isptivanja kako bi se utvrdilo postojanje razlike između
tretmana, pri čemu se češće upoređuju proseci nego totali tretmana. Veći broj autora
ističe potrebu izvođenja upoređenja tretmana pomoću odgovarajućih testova (Montgo-
mery, 1997; Kirk, 1968; Hadživuković i sar. 1972; Hadživuković, Čobanović, 1994;
Čobanović i sar. 1996). Takozvani post hoc ili a posteriori postupci podrazumevaju
izvođenje svih mogućih upoređenja između aritmetičkih sredina tretmana.
Post hoc postupci mogu da se odnose na individualna upoređenja aritmetičkih sre-
dina tretmana ili na grupe ovih sredina. Mnogi postupci višestrukih upoređenja odnose


Rad je deo istraživanja na Projektu „Razvoj i strukturne promene agrarne privrede i ruralnih područja” (2004)
**
Prof.dr Katarina Čobanović, Mr Emilija Nikolić-Đorić, Mr Beba Mutavdžić, Poljoprivredni fakultet,
Departman za ekonomiku poljoprivrede i sociologiju sela, Novi Sad.

66
se i na upoređenja između proseka tretmana pomoću kontrasta (unapred određena upo-
ređenja). Uopšteno, kontrast predstavlja upoređenje proseka tretmana koji su od interesa
primenjujući linearnu kombinaciju totala tretmana (Montgomery, 1997; Hadživuković,
1991).
U većini praktičnih situacija obično su upoređenja zasnovana na parovima aritme-
tičkih sredina (Montgomery, 1997). Pri tome se upoređuju svi parovi aritmetičkih sre-
dina k ispitivanih tretmana, pri čemu se definiše sledeća polazna nulta hipoteza, Ho:µi=µj
za sve vrednosti i≠j.

METOD RADA I OSNOVNE KARAKTERISTIKE


PRIMENJENIH TESTOVA UPOREĐENJA

U radu su korišćeni rezultati pomološkog ispitivanja sorti jabuke, pri čemu su, pored
niza ispitivanih karakteristika jabuke, posmatrani samo podaci o masi ploda (grami).
Rezultati potiču sa oglednog zasada jabuka na Rimskim Šančevima u toku 1997. godine
(Pudar, 2000).
Rezultati 32 sorte jabuke u toku 1997. godine obrađeni su primenom metode analize
varijanse, prema planu potpuno slučajnog rasporeda, sa nejednakim brojem ponavljanja.
Preliminarna analiza originalnih podataka ukazala je na nehomogenost varijansi tre-
tmana, što je potvrđeno primenom Hartlijevog, Bartletovog, Kohranovog i Levenovog
testa (Madansky, 1988). Originalni podaci su imali lognormalnu raspodelu. Izvedena je
logaritamska transformacija originalnih podataka, čime su podaci svedeni na normalnu
raspodelu. Treba napomenuti da je logaritamskom transformacijom umanjena, ali nije
eliminisana heterogenost varijansi između grupa (sorte jabuka). Nakon izvršene trans-
formacije izvedena je analiza varijanse, pri čemu je vrednost F-testa bila F=21,99**.
Upoređenja proseka sorata izvedena su pomoću sledećih testova: test najmanje
značajne razlike (LSD - test); Takijev (Tukey HSD – test); Dankenov (Duncan – test);
Njuman – Kelsov (Newman – Keuls test) i Šefeov (Scheffé test). Svi primenjeni testovi
su parametarski, i u još većem stepenu od F-testa su osetljivi na ispunjenje pretpostavki
da je raspodela obeležja normalna i da su varijanse osnovnih skupova homogene.
Statistička značajnost F-testa upućuje na potrebu izvođenja upoređenja proseka
sorata. Ukupan broj upoređenja sredina sorata (tretmana) u ovom slučaju je:
2 ) = 496, što je dobijeno na osnovu izraza k(k-1)/2, pri čemu je k broj ispitivanih
( 32
tretmana (uzoraka).
Osnovne karakteristike primenjenih testova daju se u produžetku. Karakteristično za
ove testove je da se pri utvrđivanju kritične vrednosti koristi ocenjena standardna greška
razlike dve aritmetičke sredine i ocenjena standardna greška aritmetičke sredine, koje su
zasnovane na ocenjenoj varijansi pogreške ( S P2 ) iz tabele analize varijanse. U slučaju
LSD testa koristi se standardna greška razlike dve aritmetičke sredine data sledećim
izrazom:

1 1
S( xi − x j ) = S P2 ( + ), (1)
ni n j

ukoliko se radi o nejednakom broju ponavljanja tretmana.

67
Ili,
2 S P2
S( xi − x j ) = , (2)
n
ukoliko se radi o jednakom broju ponavljanja tretmana, tj. ako je ogled balansiran, tada
je n1 = n2 ... = nk = n.
U slučaju ostalih testova koristi se standardna greška aritmetičke sredine data izra-
zom:

S P2
Sx = , (3)
n
ukoliko se radi o jednakom broju ponavljanja tretmana.
Ukoliko je broj ponavljanja tretmana nejednak, tada se n u izrazu (3) zamenjuje
vrednošću n , koja je data izrazom:
k
n= , (4)
[(1/ n1 ) + (1/ n2 ) + ... + (1/ nk )]
pri čemu je k broj tretmana (Kirk, 1968).
1) Test najmanje značajne razlike (LSD test) zasnovan je na utvrđivanju sledeće kri-
tične vrednosti:
LSDα = tα ( N − k ) S( xi − x j ) (5)

U izrazu (5) tα ( N − k ) je kritična vrednost iz tablica Studentove distribucije; S p2 je


varijansa pogreške iz tabele analize varijanse; (N-k) su stepeni slobode pogreške iz
tabele analize varijanse.
Razlika svakog para proseka, X i − X j , upoređuje se sa najmanje značajnom
razlikom, LSDα . Ukoliko je ta razlika X i − X j ≥ LSDα zaključuje se da se
polazna nulta hipoteza odbacuje, tj. zaključuje se da se proseci osnovnih skupova µi
i µ j značajno razlikuju.
Ovaj test se koristi kada je F-test značajan i kada se žele sačiniti planirana
upoređenja proseka. Iako je LSD test najrasprostranjeniji u primenama, ukoliko se
primeni za broj poređenja koji je veći od broja stepeni slobode sume kvadrata
tretmana iz analize varijanse, za rezultat ima nerealno veliki broj statistički
značajnih poređenja. Ako je α prag značajnosti za jedno poređenje, verovatnoća da
se pogrešno odbaci bar jedna nulta hipoteza u slučaju m poređenja je 1 − (1 − α ) m .
Tako, na primer, u slučaju α = 0,05 i k=5 tretmana ako bi se primenila sva
poređenja (m=10), verovatnoća pogrešnog odbacivanja nulte hipoteze je 0,40.
Postoje procedure korekcije LSD testa u slučaju višestrukih poređenja, kao što su

68
Bonferonijev (Bonferroni) test, gde je prag značajnosti za individualna poređenja
α ′ = α m i Dan-Šidakov (Dunn-Šidák) test gde je α ′ = 1 2 ⋅ ⎡⎢1 − (1 − α ) m ⎤⎥ .
1

⎣ ⎦

2) Takijev test je sličan LSD testu. Ovaj test ima i naziv HSD (honestly significant
difference) test. U primeni ovog testa utvrđuje se sledeća kritična vrednost.
HSDα = qα ( k ; N − k ) S x . (6)

Vrednost q α u izrazu (6) utvrđuje se iz posebnih tablica po Takiju, u zavisnosti od


broja tretmana k i stepena slobode pogreške.
Ukoliko je razlika X i − X j ≥ HSDα , nulta hipoteza o jednakosti sredina se
odbacuje.
Takijev test je više konzervativan u odnosu na Dankenov ili Njuman - Kelsov
test. Analitički je pokazano da od svih testova koji daju jednake intervale poverenja
za sve parove sredina, ovaj test daje najkraći interval.

3) Dankenov test (višestruki intervalni test) ima čestu primenu u praktičnom radu.
Kritična vrednost ovog testa utvrđuje se primenom sledećeg izraza (Montgomery,
1997):
R p = rα ( p ; N − k ) S x . (za p = 2,3, ...,k) (7)

Kritična tablična vrednost, rα , iz izraza (7) koristi se iz posebnih tablica po


Dankenu, u zavisnosti od stepena slobode pogreške u tabeli analize varijanse i broja
intervala sredina p = 2,3,..., k.
U primeni ovog testa proseci tretmana se rangiraju prema veličini. Tada se
razlika najvećeg i najmanjeg proseka upoređuje sa najmanje značajnim intervalom
R p , itd. Ukoliko je razlika X i − X j ≥ R p , ona je statistički značajna.
Ovaj test je vrlo efikasan test i zbog toga se često koristi. Pogodan je ukoliko se
žele testirati višestruke hipoteze.

4) Njuman-Kels test je sličan Dankenovom testu. Kritična vrednost se utvrđuje prime-


nom sledećeg izraza (Montgomery, 1997):
K p = qα ( k ; N − k ) S x (za p = 2,3,...,k). (8)

Tablična vrednost, qα , u izrazu (8) preuzima se iz posebnih tablica za ovaj test.


Postupak upoređenja je analogan kao i kod Dankenovog testa. I kod ovog testa arit-
metičke sredine tretmana su rangirane.
Njuman-Kels test je više konzervativan u odnosu na Dankenov test. I ovaj test
se može primeniti ukoliko se testiraju višestruke hipoteze.

5) Šefeov metod se koristi kada je F-test statistički značajan i kada se žele sačiniti
neplanirana upoređenja sredina tretmana. Šefeov postupak se sastoji u utvrđivanju
sledeće kritične vrednosti (Kirk, 1968):

69
⎡ k (C ) 2 ⎤
S = ( k − 1) Fα ( r1 ;r2 ) S P2 ⎢ ∑ j ⎥ , (9)
⎣⎢ j −1 n j ⎦⎥

gde je Fα tablična vrednost iz tablica F-distribucije; r1 i r2 su stepeni slobode


pogreške iz tabele analize varijanse; k je broj tretmana; Cj koeficijent kontrasta; nj je
koeficijent nivoa tretmana. Ukoliko je kontrast proseka tretmana veći od kritične
vrednosti, tada se hipoteza da je kontrast jednak nuli odbacuje. Šefeov test je više
konzervativan u odnosu na Njuman – Kels test i Dankenov test, što uslovljava da će
primenom ovog testa biti znatno manje značajnih poređenja u odnosu na druge
testove. Prednost ovog testa je u manjoj osetljivosti na odstupanje raspodele po-
dataka od normalne distribucije, kao i narušavanje pretpostavke o homogenosti
varijansi.

REZULTATI

Prosečne vrednosti 32 ispitivane sorte jabuke koje se odnose na logaritmovane


vrednosti mase ploda prezentirane su na Grafikonu 1. To su istovremeno i proseci tre-
tmana koji se upoređuju pomoću navedenih testova. Grafički prikaz proseka sorata uka-
zuje na njihovu neujednačenost, što je i razumljivo, jer se sorte razlikuju s obzirom na
pojedine karakteristike, u ovom slučaju radi se o masi ploda jabuke.

Grafikon 1. Box-Whisker grafikon aritmetičkih sredina tretmana (sorte jabuke)


Graph 1. Box-Whisker graph of treatment means (apple varieties)

Rezultati izvedenih upoređenja parova proseka tretmana pomoću ispitivanih testova


dati su u Tabeli 1.

70
Tabela 1. Broj sredina tretmana koje se statistički značajno i visoko značajno razlikuju
od i-te sredine
Table 1. Number of treatment means which show statisticaly significant difference to i-th mean
Redni Testovi – Tests
broj LSD Dankenov Njuman – Takijev Sefeov
sredine Duncan Kelsov Tukey HSD Scheffé
Newman –
Order Keuls
number 0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01 0,05 0,01
of mean
1. 22 21 21 18 16 13 17 12 6 4
2. 22 21 21 18 16 13 18 13 6 5
3. 23 21 21 20 20 17 19 17 7 7
4. 21 17 18 11 9 7 9 6 1 1
5. 21 19 19 13 13 13 11 11 8 7
6. 18 13 16 13 13 13 8 5 1 1
7. 21 16 18 12 9 7 8 6 1 1
8. 18 16 16 13 13 12 6 4 0 0
9. 22 19 16 10 10 6 10 8 1 1
10. 22 17 19 13 10 7 9 8 2 2
11. 25 23 25 22 21 21 14 13 8 7
12. 22 18 15 14 13 12 11 10 8 5
13. 18 16 17 13 11 8 9 8 2 2
14. 28 26 24 20 20 19 19 18 10 10
15. 23 22 21 16 15 12 16 11 6 2
16. 22 20 21 20 19 14 17 14 9 8
17. 22 17 17 10 9 6 10 7 1 1
18. 23 18 20 14 13 13 9 7 0 0
19. 24 21 18 13 13 13 11 8 2 1
20. 25 22 24 21 21 20 19 18 10 9
21. 19 19 19 14 13 13 13 11 5 4
22. 28 27 28 27 27 24 19 19 8 7
23. 30 30 30 30 30 28 28 27 18 17
24. 19 16 19 14 13 13 11 9 3 2
25. 23 20 19 14 14 12 9 9 1 0
26. 18 13 16 13 13 13 8 5 1 1
27. 19 15 18 14 13 13 6 4 0 0
28. 19 15 21 20 18 14 5 4 1 0
29. 26 22 24 20 20 19 18 18 7 6
30. 21 19 20 17 15 13 13 11 8 6
31. 15 10 17 13 10 7 2 2 0 0
32. 23 17 18 12 10 8 10 7 1 1
Ukupan broj
poređenja 351 303 318 256 240 211 196 165 71 59
Total num-
ber of com-
parisons

71
Broj sredina tretmana (proseka sorata) koje se statistički značajno i visoko značajno
razlikuju od i-te sredine je najveći u primeni LSD testa. Prema ovom testu, od ukupno
496 mogućih upoređenja 351 upoređenje je značajno, a 303 visoko značajno. Primenom
Dankenovog testa 318 upoređenja je značajno, a 256 visoko značajno. Njuman – Kelsov
test daje manje značajnih (240), odnosno, visoko značajnih (211) upoređenja u odnosu
na prethodna dva testa, a Takijev HSD test daje svega 196 značajnih i 165 visoko
značajnih upoređenja. Šefeov test daje najmanje značajnih (71) i visoko značajnih (59)
upoređenja u odnosu na prethodne testove.
Neujednačenost značajnosti rezultata upoređenja pojedinih testova indikator je
njihove različite rigoroznosti i efikasnosti, odnosno, konzervativnosti. Proizilazi da je
najmanje rigorozan LSD – test, a da je Šefeov test najviše rigorozan, odnosno, ovaj test
je više konzervativan u odnosu na ostale testove, što potvrđuju i navodi u literaturi (Kirk,
1968; Mongomery, 1997; STATGRAPHICS, 1991). Tako se u literaturi navodi da je, na
primer, Takijev HSD test, s obzirom na konzervativizam, između Njuman – Kelsovog i
Šefeovog testa a da je Šefeov metod, najčešće, više konzervativan u odnosu na Njuman –
Kelsov i Dankenov test.

ZAKLJUČAK

U radu su na osnovu eksperimentalnih rezultata ispitivanja 32 sorte jabuke


primenjeni najčešće korišćeni testovi za višestruka upoređenja proseka tretmana.
Rezultati testova ukazuju da je broj sredina sorata koje se statistički značajno i visoko
značajno razlikuju od i-te sredine različit u zavisnosti od vrste testa. Najveći broj
statistički značajnih ili visoko značajnih upoređenja daje LSD test, zatim sledi Dankenov
višestruki intervalni test, Njuman – Kelsov test i Takijev test, a najmanji broj daje
Šefeov metod. Najkonzervativniji test je Šefeov, a najmanje konzervativan je LSD test.
Dobijeni rezultati ispitivanja testova upoređenja potvrđuju navode iz literature.

LITERATURA

1. Čobanović Katarina, Nikolić-Đorić Emilija, Mutavdžić Beba: Analiza podataka i pri-


mena odgovarajućeg statističkog metoda u poljoprivrednim istraživanjima, Statistička
revija, Broj 3-4, Godina XLV, Beograd, 1996. (64–76).
2. Hadživuković, S., Zegnal, R., Čobanović, K: Eksperimentalno ispitivanje rezultata
nekih testova, Statistička revija, Broj 3-4, Godina XXII, Beograd, 1972. (197–211).
3. Hadživuković, S.: Statistički metodi s primenom u poljoprivrednim i biološkim is-
traživanjima, Drugo prošireno izdanje, Poljoprivredni fakultet, Novi Sad, 1991.
4. Hadživuković, S., Čobanović, K.: Statistika: Principi i primena, Poljoprivredni fa-
kultet, Novi Sad, 1994.
5. Kirk, R.E.: Experimental Design: Procedures For the Behavioral Sciences,
Brooks/Cole Publishing Company, Belmont, California, 1968.
6. Madansky, A.: Prescriptions for Working Statisticians, Springer-Verlag, New York,
1988.
7. Montgomery, D.C.: Design and Analysis of Experiments, Fourth Edition, John Wiley
and Sons, Inc., 1997.

72
8. Pudar, V.: Pomološka ispitivanja sorti jabuke za proizvodnju biološki vrednije hrane,
Magistarska teza, Poljoprivredni fakultet, Novi Sad, 2000.
9. STATGRAPHICS, Version 5.0, Reference Manual, STSC, Inc., 1991.

MULTIPLE COMPARISON TESTS


by
Čobanović, Katarina, Nikolić-Đorić, Emilija, Mutavdžić, Beba

SUMMARY

Upon the experimental results with 32 apple varieties, concerning fruit weight, there
were investigated the effects of five different tests of multiple comparisons. The most
conservative test is Scheffé test, while LSD-test is less conservative. The Newman –
Keuls, Duncan and Tukey HSD test fall between LSD – test and Scheffé procedures with
regard to conservatism.

Key words: Treatment means, comparison tests, critical value, test conservatism

Primljeno: 07. 10. 2003.


Prihvaćeno: 10. 10. 2003.
Recenzent: Prof. dr Milenko Jovanović

73

You might also like