Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 10

POGLAVLJE 8 Testiranje statistikih hipoteza 247

8.4 TESTIRANJE HIPOTEZE ZASNOVANO NA DVA


UZORKA
Neki autori smatraju da ovi metodi spadaju meu najkorisnije statistike metode
u eksperimentalnoj praksi.
Predmet testiranja ne mora biti sama vrijednost jednog parametra u dva skupa, ve
razlika izmeu ovih vrijednosti.
Ako dva skupa obiljeimo sa 1 i 2, a vrijednosti istog parametra u njima sa 1 i 2,
predmet testiranja je razlika D = 1 2. Ako sa D0 obiljeimo hipotetinu vrijednost ove
razlike, nultu i alternativnu hipotezu moemo prikazati jednim od tri mogua oblika:
A. H0 : D =D0 H1 : D D0 dvosmjerna alternativna hipoteza,
B. H0 : D D0 H1 : D > D0 jednosmjerna alternativna hipoteza,

C. H0 : D D0 H1 : D < D0 jednosmjerna alternativna hipoteza.


Nultu hipotezu testiramo po identinom postupku kao u sluaju jednog skupa.
Dakle, nakon formulisanja nulte, alternativne hipoteze i specifikovanja nivoa
znaajnosti, u drugom koraku testiranja izabraemo odgovarajui test i izraunati
statistiku testa; nakon provjere uslova, na osnovu realizovane vrijednosti ove statistike,
odrediemo p-vrijednost i donijeti odluku da li nultu hipotezu da odbacimo ili ne
odbacimo. U posljednjem koraku formuliemo zakljuak u kontekstu postavljenog
problema.
Statistika testa i ovdje u sutini ima generalni oblik 8.1, s tim to se svuda umjesto
jednog parametra uzima razlika izmeu parametara dva skupa.
Ocjena razlike - Hipotetina vrijednost razlike (8.6)
Statistika testa =
Standardna greka ocjene razlike

Budui da smo razliku izmeu parametara dva skupa oznaili sa D, ocjenu te razlike
oznaiemo sa D ("D kapa"). Slijedei istu logiku kao kod testova zasnovanih na jednom
uzorku, i ovdje se mogu formulisati dva parametarska testa Z i t sa statistikama testa oblika
8.6:
-D
D -D
D
Z = 0
t= 0
,
s D S D

gdje je s D standarna greka razlike parametara dva skupa, a s D ocijenjena standardna


greka razlike.
Hipotetina vrijednost razlike, D0 = (1 2)0, moe biti bilo koja numerika
vrijednost. U praksi se najee uzima nula. U tom sluaju nulta hipoteza oblika (A) se
svodi na H0 : D = 1 2 = 0, odnosno,
H0 : 1 = 2.
U tom sluaju testiranjem hipoteze oblika A ispitujemo jednakost parametara dva skupa,
dok pri testiranju hipoteza oblika (B) ili (C) utvrujemo u kom skupu je vrijednost
posmatranog parametra vea:
248 STATISTIKA ANALIZA Metodi i primjena

A) H0 : 1 = 2 H1 : 1 2
B) H0 : 1 2 H1 : 1 > 2

C) H0 : 1 2 H1 : 1 < 2
Ograniiemo se samo na sluaj kada su oba sluajna uzorka meusobno nezavisna,
odnosno kada nijedan elemenat prvog uzorka nije ni u kakvoj povezanosti sa bilo kojim
elementom drugog uzorka.

8.4.1 Testiranje hipoteze o jednakosti aritmetikih sredina dva skupa

Z test
Osnovne informacije vezane za primjenu Z testa u sluaju testiranja jednakosti aritmetikih
sredina dva skupa prikazane su u Tabeli 8.6.
Tabela 8.6 Testiranje hipoteze o razlici aritmetikih sredina dva skupa primjenom Z testa

Uslovi za primjenu Z testa:

1) Osnovni skupovi imaju normalan raspored ili moe da se primijeni


Centralna Granina Teorema, odnosno oba uzorka imaju vie od 30
elemenata.

2) Standardne devijacije oba osnovna skupa su poznate.

Izbor oblika nulte i alternativne hipoteze:

A) H0 : D = D0 H1 : D D0

B) H0 : D D0 H1 : D > D0

C) H0 : D D0 H1 : D < D0

gdje je D = 1 - 2, a D0 hipotetina razlika (najee D0 = 0).

(X 1 - X 2 ) - ( m 1 - m 2 ) 0 (8.6)
Z =
Statistika testa: s 2
s 2
1
+ 2
n1 n2

pod uslovom da je H0 istinita ima standardizovan normalan

raspored Z : N (0, 1).

Identina ogranienja vezana za primjenu Z i t-testa pri testiranju aritmetike


sredine jednog skupa vae i ovdje. Dakle, Z test se zasniva na nerealnoj pretpostavci da
su standardne devijacije oba skupa poznate, pa u praksi preporuujemo primjenu t
testa.
Zadraemo se na obliku (A) i posmatrati samo sluaj kada je hipotetina
vrijednost razlike aritmetikih sredina dva skupa jednaka nuli (D0 = (1 - 2 )0 = 0), tj:
H0 : 1 = 2 H1 : 1 2.
Testiranje hipoteze o jednakosti aritmetikih sredina dva skupa sprovodimo
POGLAVLJE 8 Testiranje statistikih hipoteza 249

analogno testiranju u sluaju jednog uzorka. Iz oba skupa uzeemo po jedan prost
sluajan uzorak, kao na Slici 8.3.
Ideja testiranja je u sljedeem: ako su razlike izmeu aritmetikih sredina uzoraka
male, neemo imati dovoljno razloga da tvrdimo da zaista postoje razlike izmeu
aritmetikih sredina skupova kojima uzorci pripadaju. Drugim rijeima, takva razlika
pojavila bi se zbog sluajnog kolebanja uzoraka. U suprotnom, ako su razlike izmeu
aritmetikih sredina uzoraka relativno velike, imaemo dovoljno argumenata da
odbacimo nultu hipotezu.

Slika 8.3 Grafiki prikaz logike testiranja jednakosti aritmetike sredine dva skupa

Ve smo vidjeli da ako osnovni skup ima normalan raspored, i aritmetike sredine
uzoraka iz tog skupa e slijediti normalan raspored.
Zakljuujemo da e i razlika aritmetikih sredina dva uzorka imati normalan raspored.
Poto razlika aritmetikih sredina uzoraka slijedi normalan raspored, testiranje
emo sprovesti primjenom Z testa. Statistika Z testa glasi:

X2 - X2
Z = ,
s X1 -X2

gdje je s X 1 -X 2 standardna greka razlike dvije aritmetike sredine. Moe se pokazati da


njena formula glasi slino formuli u sluaju jednog skupa ( s X = s / n ):

s 12 s2 (8.7)
s X1 -X 2 = + 2 (8.7)
n1 n2

Statistiku Z moemo napisati u sljedeem obliku:

X1 - X2 (8.8)
Z =
Statistika Z testa s / n 1 + s 22 / n 2
2
1

Pod uslovom da je H0 istinita, statistika Z ima standardizovan normalan raspored.


250 STATISTIKA ANALIZA Metodi i primjena

Studentov t test
Osnovne informacije vezane za primjenu t testa u sluaju testiranja jednakosti aritmetikih
sredina dva skupa prikazane su u Tabeli 8.7.
Tabela 8.7 Testiranje hipoteze o jednakosti aritmetikih sredina dva skupa primjenom t testa (nepoznate
varijanse skupova su meu sobom jednake)

Uslovi za primjenu t testa:

1) Oba osnovna skupa imaju normalan raspored ili moe da


se primjeni Centralna Granina Teorema (oba uzorka
imaju vie od 30 elemenata).

2) Varijanse oba skupa su meusobom jednake ( 12 = 22 ).

Izbor oblika nulte i alternativne hipoteze:

A) H0 : D = D0, H1 : D D0

B) H0 : D D0, H1 : D > D0

C) H0 : D D0, H1 : D < D0

gdje je D = 1 - 2 , a D0 hipotetina razlika (najee


D0 = 0).

(X 1 - X 2 ) - ( m 1 - m 2 ) 0 (8.9)
Statistika testa: t =
S X 1 -X 2

1 1 (8.10)
S X 1 -X 2 = S P +
n1 n2
(n 1 - 1) S 12 + ( n 2 - 1) S 22
SP = ,
n1 + n2 - 2

pod uslovom da je H0 istinita ima Studentov raspored sa


n 1 + n 2 - 2 stepeni slobode.

Kao i kod Z testa zadraemo se samo na sluaju ispitivanja da li su aritmetike


sredine dva skupa meu sobom jednake, odnosno na hipotezama postavljenim u vidu:

H0 : 1 = 2 H1 : 1 2.
Prije nego to razmotrimo logiku statistike t testa u sluaju dva uzorka podsjetimo
se t testa u sluaju jednog uzorka.
Statistika t testa kod jednog uzorka ima skoro isti oblik kao ona kod Z testa:

X - m0 X - m0 X - m0 X - m0
Z= = t= = .
sX s/ n SX S/ n
POGLAVLJE 8 Testiranje statistikih hipoteza 251

Jedina je razlika u tome to se kod t testa standardna greka ocjenjuje tako to se


umjesto standardne devijacije skupa uzima standardna devijacija uzorka. Postavlja se
pitanje, da li kod dva uzorka moemo primijeniti istu logiku, i u izrazu za Z statistiku
testa (8.8) umjesto nepoznatih varijansi skupova staviti varijanse uzoraka?
Odgovor je, naalost, negativan, jer rezultirajui izraz ne slijedi egzaktno t
raspored. Da bi takva statistika zaista imala t raspored mora da se uvede dodatna
pretpostavka: oba skupa imaju jednake varijanse. Ova pretpostavka u statistici se
naziva pretpostavkom homogenosti varijansi. Ako smo spremni da usvojimo ovu
pretpostavku, tada se takav t test naziva ponderisani t test (pooled t test).
Problem sa praktinom primjenom ovakvoga testa je u tome to ne postoje
pouzdani naini da se ispita ispunjenost pretpostavke homogenosti varijansi 1. Brojni
radovi koji su sprovedeni u drugoj polovini XX-og vijeka ipak su pokazali da se ponderisani t
test moe koristiti u praksi kada su naruene njegove pretpostavke, ali pod uslovom da oba
uzorka imaju jednaki broj elemenata.
Usljed svega navedenog, preporuujemo da istraiva tako planira svoje
istraivanje da obezbijedi podjednaku veliinu oba uzorka. Ako, pak, imamo nejednake
uzorke, bolje je koristiti t test koji ne zahtijeva homogenost varijansi.
Iako je trend u statistikoj literaturi u posljednjih 5 godina da se ponderisani t test
polako naputa, mi emo ipak samo njega prikazati, i to iz dva razloga.
Prvo, aproksimativan izraz za broj stepeni slobode je suvie komplikovan. Drugo,
svaki korisnik 3BStata moe jednostavno da primijeni neponderisani t test, uporedi
rezultat sa ponderisanim t testom i vidi da li postoje neke bitne razlike.
Ponderisani t test je dobio naziv po tome to se standardna greka rauna na
osnovu ponderisanih varijansi oba uzorka. Takva, ponderisana, varijansa S P2
izraunava se po formuli:

(n 1 - 1) S 12 + ( n 2 - 1) S 22
S P2 =
n1 + n 2 - 2

(indeks p ukazuje da se radi o ponderisanoj ocjeni varijanse i ne treba je dovoditi


2
u vezu sa ocjenom varijanse proporcije uzorka S p ).

Usljed toga, statistika ponderisanog t testa glasi:

Statistika X1 -X2 (8.11)


t=
t testa SP (1/ n 1 + 1/ n 2 )

Pod pretpostavkom da je H0 istinita, statistika testa (8.11) ima Studentov raspored sa n1 + n2 -


2 stepeni slobode.

1
Testovi koji ispituju jednakost varijansi dva skupa (recimo F test) su neprecizni, jer strogo zahtijevaju da oba skupa imaju
normalan raspored.
252 STATISTIKA ANALIZA Metodi i primjena

8.4.2 Testiranje hipoteze o jednakosti proporcija dva skupa


Tabela 8.8 Testiranje hipoteze o jednakosti proporcija dva skupa
primjenom Z testa

Uslovi za primjenu Z testa:

(n 1p 1 > 5 i n 1 (1 - p 1 ) > 5) i (n 2 p 2 > 5 i n 2 (1 - p 2 ) > 5).

Izbor oblika nulte i alternativne hipoteze:

A) H0 : D = D0 H1 : D D0

B) H0 : D D0 H1 : D > D0

C) H0 : D D0 H1 : D < D0

gdje su 1 i 2 hipotetika proporcija prvog i drugog skupa,


respektivno, D = 1 2 , a D0 hipotetina razlika izmeu
proporcija dva skupa (najee D0 = 0).

( p 1 - p 2 ) - (p 1 - p 2 ) 0
Z =
Statistika testa: p 1 (1 - p 1 ) p 2 (1 - p 2 ) ,
+
n1 n2

pod uslovom da je H0 istinita ima standardizovan

normalan raspored, Z : N (0, 1).

Testiranje hipoteze o razlici proporcija dva skupa, 1 2 = D, zasniva se na razlici


.
proporcija uzoraka izabranih iz ovih skupova, ( p 1 - p 2 ) = D

Za potrebe testiranja hipoteze moramo da znamo raspored vjerovatnoe ocjene D .


Ako iz skupova biramo velike uzorke (tj, ako vae nejednakosti i n p i 5 i
n i ( 1 - p i ) 5 , za i = 1,2), onda raspored razlike ( p 1 - p 2 ) moemo aproksimirati
normalnim rasporedom.
Kao i kod prethodna dva testa zadraemo se samo na sluaju ispitivanja
jednakosti proporcija dva skupa i na dvosmjernom testu.
Nulta i alternativna hipoteza date su sa:
H0 : p 1 = p 2 H 0 : p 1 p 2 .

Pod uslovom da je H0 istinita, jedinstvenu vrijednost proporcije u oba skupa


moemo da obiljeimo sa (tj. 1 = 2 = ).
Tada uzorke iz ova dva skupa moemo da tretiramo kao uzorke koji potiu iz istog
osnovnog skupa sa proporcijom . Logika testiranja je slina kao kod ponderisanog t
testa. Dakle, kombinovaemo informacije o proporciji skupa na osnovu dobijenih
informacija iz oba uzorka.
Izraz za takvu kombinovanu, odnosno ponderisanu, ocjenu proporcije oznaiemo
sa ( P ) i on glasi:
POGLAVLJE 8 Testiranje statistikih hipoteza 253

n1p1 + n 2 p 2 f + f2
P = = 1 (8.12)
n1 + n 2 n1 + n2

Ocjenu standardne greke formulisaemo generalizacijom formule za ocjenu


proporcije jednog skupa:

p 0 (1 - p 0 )
Sp = .
n

Dakle, vodei rauna da sada imamo dva skupa izraz za ocjenjenu standardnu
greku razlike dvije proporcije glasi:

p(1 - p ) p(1 - p ) 1 1
S p1 - p2 = + = p ( 1 - p) + ,
n1 n2 n 1 n2

pa statistika Z testa glasi:

Statistika p1 - p2 (8.13)
Z =
Z testa p(1 - p )(1/n 1 + 1/n 2 )

8.5 VEZA IZMEU TESTIRANJA HIPOTEZA I INTERVALA


POVJERENJA
Sumirajmo kljune razlike izmeu intervala povjerenja i testiranja hipoteza.
Intervali povjerenja:

bira se koeficijent povjerenja (najee 95% ili 99%);

uz odabrani koeficijent formira se interval moguih vrijednosti koje parametar moe


da ima, a koje su konzistentne podacima uzorka.
Statistiki test:

Samo jedna mogua vrijednost parametra, nazvana hipotetina vrijednost, se testira.


Utvruje se jaina argumenata protiv postavke da je parametar stvarno jednak toj
hipotetinoj vrijednosti.
Iako na prvi pogled izgleda da su ova dva osnovna metoda inferencijalne statistike
nepovezana, pokazaemo da izmeu njih postoji veoma bliska veza. Zadraemo se
samo na dvosmjernim testovima.
Na osnovu ovoga formulisaemo sljedeu povezanost izmeu intervala povjerenja i
statistikog testiranja.
Ako se hipotetina vrijednost dvosmjerne hipoteze nalazi unutar (1 )100%
intervala povjerenja (recimo 95%), ona nee biti odbaena pri nivou znaajnosti
(recimo 0,05).
Ako se hipotetina vrijednost dvosmjerne hipoteze nalazi izvan (1 )100% intervala
povjerenja (recimo 95%), nulta hipoteza e biti odbaena pri nivou znaajnosti (recimo
0,05).
254 STATISTIKA ANALIZA Metodi i primjena

Navedenu vezu moemo grafiki ilustrovati na Slici 8.4.

Donja granica Gornja granica


intervala povjerenja intervala povjerenja

Odbacuje se H0

Odbacuje se H0
Svaka nulta hipoteza koja se bazira na
bilo kojoj vrijednosti unutar intervala
nee biti odbaena

Slika 8.4 Grafiki prikaz povezanosti izmeu intervala povjerenja i statistikog testiranja

Moemo zakljuiti da interval povjerenja sadri daleko veu i vaniju informaciju


od odgovarajueg statistikog testa, jer se sastoji od svih hipotetinih vrijednosti koje ne
bi bile odbaene pri testiranju. Istovremeno, ukazuje na sve hipotetine vrijednosti koje
bi bile odbaene statistikim testom.

8.6 ESTE GREKE U PRAKSI I PREPORUKE PRI


TESTIRANJU HIPOTEZA
U velikom broju radova koji su objavljeni tokom posljednjih desetak godina sa
pravom se istie da veoma mali broj korisnika statistike korektno tumai rezultate
statistikih testova. Usljed toga, naveemo tipina pogrena tumaenja zakljuaka, kao
i preporuke koje bi trebalo usvojiti da bi se minimiziralo pogreno shvatanje rezultata
testiranja.
1. Tumaenje nesignifikantnog rezultata na nain da se "nulta hipoteza usvaja".
Ne zaboravite nultu hipotezu nikada ne usvajamo. Testiranjem hipoteza nikada se
ne moe dokazati da je nulta hipoteza zaista tana. Nesignifikantan rezultat iskljuivo implicira
da nemamo dovoljno argumenata da tvrdimo da je nulta hipoteza pogrena.
2. Pri odbacivanju nulte hipoteze kazati da se "parametar znaajno razlikuje od
hipotetine vrijednosti".
Ovakve izjave se veoma esto mogu sresti u literaturi i u lancima. One su jako
tetne, jer navode onoga ko ne poznaje statistiku na pogreno uvjerenje da je dokazana
vana (itaj velika) razlika izmeu hipotetine i stvarne vrijednosti parametra. Ako
elite da procijenite tu razliku konstruiite interval povjerenja.
3. "p vrijednost je vjerovatnoa da je nulta hipoteza tana ili pogrena".
p vrijednost je neto drugo, to je vjerovatnoa koja se odnosi na realizaciju naih
podataka, pod pretpostavkom da je nulta hipoteza tana.
POGLAVLJE 8 Testiranje statistikih hipoteza 255

4. " = 0,05 je standard koji je zasnovan na nekom objektivnom kriterijumu".


= 0,05 je samo opte usvojena konvencija koja nema nikakvu objektivnu
podlogu.
5. "Veoma male p vrijednosti ukazuju na veliki efekat, odnosno na veliku razliku
izmeu hipotetine i stvarne vrijednosti parametra".
Pogreno: p-vrijednost nita ne govori o veliini efekta, odnosno razlike izmeu
hipotetine i stvarne vrijednosti parametra.
6. "Statistika znaajnost rezultata ukazuje da je rezultat praktino vaan".
Ovo je pogreno, jer statistika znaajnost samo ukazuje da smo nali dovoljno
argumenata da tvrdimo da je nulta hipoteza pogrena, a to nikako ne znai da taj rezultat ima
neku praktinu vanost.
7. "Odbacivanje nulte hipoteze znai da smo sa sigurnou dokazali da je nulta
hipoteza pogrena".
Ovakav stav je pogrean iz prostog razloga to se testiranje zasniva na uzorku i usljed
toga uvijek postoji mogunost da smo napravili greku. Konkretno, kad god odbacimo H0
uvijek postoji mogunost da smo napravili greku I vrste. Zato zakljuak uvijek mora da se
interpretira rijeima: uz dati rizik greke (recimo 0,05) tvrdimo da je alternativna hipoteza
tana.

Zbog svih prethodno navedenih kontroverzi, kao i estih nekorektnih tumaenja


rezultata, preporuujemo sljedee:

1. Nikada ne koristite rije "znaajan" kod testiranja hipoteza, ve samo "statistiki znaajan".

2. Kad god je to mogue, rezultatima testiranja pridruite i odgovarajui interval povjerenja.

3. Nikada ne koristite suvie veliki uzorak pri testiranju dvosmjernih hipoteza zasnovanih na
jednom uzorku, jer ete uvijek dokazati da je nulta hipoteza pogrena.

4. Prilikom testiranja dvosmjernih hipoteza zasnovanih na dva uzorka preporuujemo da


specifikujete odreenu, hipotetinu, razliku izmeu parametara i zatim nultu hipotezu
postavite u vidu da izmeu parametara dva skupa postoji ta razlika. Na primjer, ako testiramo
aritmetike sredine dva skupa, umjesto da H0 postavimo u vidu H0: 1 = 2, bolje je postaviti u
256 STATISTIKA ANALIZA Metodi i primjena

vidu H0: 1 2 = D0, gdje je D0 hipotetina razlika. U suprotnom, sa suvie velikim uzorkom
uvijek ete odbaciti nultu hipotezu, ak i kada su razlike izmeu parametara besmisleno male.
Smatramo da ovakav nain postavljanja hipoteza daje puno opravdanje korienju statistikih
testova.

8.6.1 Berksonov paradoks kod testiranja hipoteza


Postavimo sebi sljedee pitanje: kakvo je obiljeje (ili promjenljiva) teina? To je
numeriko neprekidno obiljeje ili neprekidna sluajna promjenljiva. Koliko ona moe
uzeti razliitih vrijednosti? Odgovor je naravno: beskonano mnogo. Pa kolika je onda
vjerovatnoa da e od tih beskonano mnogo vrijednosti promjenljiva imati prosjenu
vrijednost ba 1? Teorijski, vjerovatnoa je nula, to smo i vidjeli pri objanjavanju
neprekidne sluajne promjenljive.
Dakle, mi unaprijed znamo da je nemogue da e prosjena teina iznositi egzaktno 1kg. Pa,
zato onda testiramo nultu hipotezu kada unaprijed znamo da emo je odbaciti?
Ovaj nain rezonovanja nazivamo Berksonov paradoks.
Kod malih uzoraka jo i postoji ansa da ne odbacimo nultu hipotezu, ali sa poveanjem
veliine uzorka na test e imati sve veu jainu i konano e odbaciti nultu hipotezu
ak i u sluaju da se prosjena teina razlikuje i na milionitoj decimali od 1 kg. Usljed
toga smo i u preporukama pod c sugerisali da nikada ne koristite suvie veliki uzorak.2

2
Ovakva preporuka moe izgledati kontradiktorna standardnom nainu razmiljanja, jer se sa poveanjem uzorka dobija
preciznija informacija o skupu.

You might also like