Download as pdf or txt
Download as pdf or txt
You are on page 1of 8

Testiranje statisti ckih hipoteza (statisti cki testovi)

Osnovna zada ca Statistike je na temelju uzorka ocijeniti kakvu razdiobu ima promatrano (populacijsko) statisti cko obilje zje X . Svaka pretpostavka koja se odnosi na tu razdiobu je (statisti cka) hipoteza, a provjera istinitosti te hipoteze je testiranje (statisti cki test). Hipotezu koju testiramo zovemo nulta hipoteza ili nul-hipoteza i obilje zavamo s H0 , a njoj alternativnu hipotezu obilje zavamo s H1 . Ako se testira hipoteza koja se odnosi na parametar pretpostavljene razdiobe, onda govorimo o parametarskom testu, a ako se hipoteza odnosi na tip razdiobe govorimo o neparametarskom testu. Hipoteza je jednostavna ako jednozna cno ckog obilje zja X , u protivnom je slo zena. Priodreduje razdiobu satatisti bli zimo navedene pojmove primjerima. Primjer 1. c nekog uredaja tvrdi da je uvodenjm nove tehnologije prosje cno Proizvoda vrijeme potrebno za izradu uredaja smanjeno u odnosu na dotada snje, koje je bilo 10 sati. U ovom primjeru promatrano statisti cko obilje zje je X vrijeme izrade uredaja. Pretpostavimo da vrijeme izrade svih uredaja proizvedenih uz odredenu tehnologiju ima normalnu razdiobu. Mogu ce hipoteze su : Proizvoda c je u pravu ili Proizvoda c nije u pravu. Hipoteze su alternative tj. to cnost jedne povla ci neto cnost druge i obratno. Pretpostavimo da je hipoteza c nije u pravu to cna. Dakle, nulta hipoteza je H0 : X = 10 Proizvoda sati, a alternativna H1 : X < 10 sati, gdje je X populacijsko o cekivanje. Prema tome radi se o parametarskom testu. Hipoteza H0 je jednostavna hipoteza, jer jednozna cno odreduju vrijednost parametra X , a time i pretpostavljenu razdiobu (ako je varijanca poznata) , dok je hipoteza H1 slo zena jer jednozna cno ne odreduje razdiobu Primjer 2. Kocka se baca 60 puta. Rezultati su dani u tablici:

Broj na kocki 1 2 Broj pojavljivanja 13 19 Da li je kocka ispravna?

3 4 5 6 11 8 5 4

U ovom primjeru su mogu ce dvije hipoteze: Kocka je ispravna. i njoj suprotna Kocka nije ispravna. Za nultu hipotezu se naj ce s ce uzima suprotno od onoga sto zelimo dokazati. Iz tablice naslu cujemo da kocka nije ispravna, pa hipoteze deniramo ovako: H0 : kocka je ispravna i H1 : kocka nije ispravna. Statisti cko obiljezje je X broj na kocki. Prirodno je ispitati da li se iz tablice frekvencija mo ze zaklju citi da empirijska razdioba bitno ne odstupa od teorijske diskretne uniformne razdiobe (vjerojatnosti pojavljivanja svakog broja na kocki su jednake, tj. broj pojavljivanja -frekvencija svakog broja u 60 bacanja je 10). Stoga deniramo hipoteze: H0 : X ima diskretnu uniformnu razdiobu i H1 : X nema diskretnu uniformnu razdiobu. Dakle, treba testirati hipotezu o tipu razdiobe, sto spada u neparametarske testove. U oba primjera treba na temelju uzorka donijeti odluku o prihva canju ili odbacivanju nulte hipoteze. Teorijski gledano, rije c je o tome da se iz n mjerenja slu cajne varijable X , odnosno na temelju vrijednosti (x1 , . . . , xn ) slu cajnog uzorka (X1 , . . . , Xn ), donese odluka o prihva canju ili odbacivanju cki zaklju cak o populaciji na bazi odredene hipoteze. Kako niti jedan statisti uzorka nije stopostotno siguran, tako i prihva cnje neke hipoteze na temelju uzorka ne zna ci da je ta hipoteza to cna. Stoga je umjesto hipotezu prihva camo ispravnije re ci na osnovi uzorka ne postoji razlog za odbacivanje hipoteze. Prilikom dono senja odluke o istinitosti hipoteze postoje dvije vrste mogu cih pogre saka : pogre ska 1. vrste: odbacili smo nultu hipotezu ako je ona istinita pogre ska 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita. Mogu ce situacije su prikazane tablicom: H0 je to cna pogre ska 1. vrste H0 je neto cna pogre ska 2. vrste

prihva camo H0 odbacujemo H0

Vjerojatnosti tih pogre saka ozna cavamo s: = P(pogre ska 1. vrste)= P(odbacujemo H0 | H0 to cna) i 2

= P(pogre ska 2. vrste)= P(prihva camo H0 | H0 neto cna). Sljede ca tablica prikazuje vjerojatnosti mogu cih situacija H0 je to cna H0 je neto cna 1 1

prihva camo H0 odbacujemo H0

je nivo signikantnosti ili razina zna cajnosti, a 1- =P(odbacujemo H0 | H0 neto cna) snaga testa. Pitanje da li je neki test najbolji u smislu da su vjerojatnosti pogre saka minimalne cemo izostaviti! Naime, smanjenje vjerojatnosti jedne pogre ske ima za posljedicu pove canje vjerojatnosti druge. Naj ce s ce se problem rje sava tako da se zada vjerojatnost pogre ske prve vrste 0, 1 (naj ce s ce 0,01 i 0,05, ali to nije pravilo!) U tom slu caju u mnogim testovima je mogu ce posti ci da vjerojatnost pogre ske 2. vrste bude minimalna. Opseg uzorka utje ce na vjerojatnosti pogre saka. Naime, pove canjem veli cine uzorka smanjuju se vjerojatnosti pogre saka. Za testiranje hipoteze treba: (1 ) Denirati H0 i H1 ; (2 ) Denirati test-statistiku na osnovi cijih vrijednosti se donose odluke; (3 ) Za zadanu razinu zna cajnosti odrediti kriti cno podru cje - skup svih mogu cih vrijednosti test-statistike za koje se odbacuje nulta hipoteza u korist alternativne; (4 ) Ispitati da li se vrijednost test-statistike izra cunate iz uzorka nalazi u kriti cnom podro cju; (5 ) Zaklju citi: Ako je izra cunata vrijednost test-statistike u kriti cnom podru ju hipoteza H0 se odbacuje u korist alternativne hipoteze H1 . U suprotnom se H0 prihva ca, tj. na osnovi uzorka hipotezu ne mo zemo odbaciti. Napomena. U pravilu, za nul-hipoteze se uzimaju jednostavne hipoteze. Parametarski testovi Neka je nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Tada mo zemo testirati slijede ce hipoteze: (i) H : = 0 (ii) H : = 0 (iii) H : > 0 (iv ) H : < 0 (v ) H : 0 (vi) H : 0 . 3

Uz svaku od od navedenih hipoteza deniramo alternativnu iz iste skupine, ovisno o zadatku koji rje savamo. Ako je hipotezu tipa (ii) govorimo o dvostranoj hipotezi tj. o dvostranom testu, a za slu cajeve (iii), (iv ), (v ), ili (vi) o jednostranoj hipotezi tj.o jednostranom testu. Testovi o parametrima normalne razdiobe N (, 2 ) Nulta hipoteza H0 : = 0 2 poznato Test statistika
Z = X n Z N (0, 1)

Alternativna hipoteza H1 : = 0 H1 : > 0 H1 : < 0 H1 : = 0 H1 : > 0 H1 : < 0 2 H1 : 2 = 0

Kriti cno podru cje C0 = , z 2 ] [z , 2 C0 = [z , C0 = , z ] ] [t , C0 = , t 2 2 C0 = [t , C0 = , t ] C0 = [0, 2 [2 , 1 ]


2 2

H0 : = 0 2 nije poznato

T = XS n T (n 1)

2 H0 : 2 = 0 2 0 >0

1 2 U = n 2 S U 2 (n 1)

2 H1 : 2 > 0 2 H1 : 2 < 0

C0 = [2 , C0 = [0, 2 1 ]

Test o proporciji (vjerojatnosti) Kao sto smo ve c rekli, bez obzira kakvu razdiobu ima statisti cko obilje zje, sredina X , za dovoljno velike uzorke, ima pribli zno normalnu razdiobu. Promatramo statisti cko obilje zje koje ima binomnu razdiobu : X B (n, p). Testiramo hipotezu H0 : p = p0 . Za alternativnu uzimamo jednu od H1 : p = p0 ili H1 : p < p0 ili H1 : p < p0 . U sva tri slu caja koristimo test- statistiku: Z= Nulta hipoteza H0 : p = p0 H1 : p > p0 H1 : p < p0 4 C0 = [z , C0 = , z ] X p0 p0 (1 p0 ) n N (0, 1). Kriti cno podru cje ] [z , C0 = , z 2 2

Alternativna hipoteza H1 : p = p0

Primjer Proizvoda c tvrdi da njegove po siljke sadr ze najvi se 7% defektnih proizvoda. Uzet je slu cajni uzorak od 200 komada iz jedne po siljke i bilo je 11 defektnih. Da li biste prihvatili tvrdnju proizvoda ca uz razinu zna cajnosti 0.05? Rje senje. Postavljamo hipoteze: H0 : p = 0.07 H1 : p < 0.07 Kada bi za alternativnu hipotezu postavili H1 : p = 0.07, u slu caju odbacivanja nulte hipoteze mogli bi zaklju citi samo da proporcija defektnih nije 0.07, a to mo ze zna citi da je ve ca, ali i da je manja od te vrijednosti sto je jo s bolje.Odredimo kriti cno podru cje:

z = z0.05 = (tablice) = 1.65 = C0 = , 1.65] Izra cunajmo vrijednost odgovaraju ce test-statistike: x =p = 0.055 0.07 11 = 0.055 = z = 200 = 0.83. 200 0.07 0.93

Kako izra cunata vrijednost nije u kriti cnom podru cju tj. z < z0.05 nultu hipotezu H0 ne mo zemo odbaciti, tj. mo zemo zaklju citi da po siljke sadr ze najvi se 7% defektnih proizvoda. Usporedba o cekivanja dviju normalno distribuiranih populacija (t-test) Promatramo statisti cko obilje zje X na dvije razli cite populacije. Uz to pretpostavimo da u obje populacije promatrano obilje zje ima normalnu razdiobu. Ako s X1 i X2 ozna cimo obilje zje na prvoj, odnosno drugoj populaciji, onda su pretpostavke: 2 2 X1 N (1 , 1 ) i X2 N (2 , 2 ). Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1 i n2 redom. Testiramo hipotezu H0 : 1 = 2 uz jednu od alternativnih: H1 : 1 = 2 , H1 : 1 > 2 , H1 : 1 < 2 .

Ovisno o tome da li su varijance poznate i jednake ili ne, imamo razli cite test statistike, sto je prikazano u tablici:

Nulta hipoteza

Test statistika

Alternativna hipoteza H1 : 1 = 2

Kriti cno podru cje C0 = , z ] 2 , [z 2 C0 = [z , C0 = , z ] C0 = , t (n1 + n2 2)] 2 [t 2 (n1 + n2 2), C0 = [t (n1 + n2 2), C0 = , t (n1 + n2 2)]

H0 : 1 = 2
2 2 1 i 2 poznato

Z=

1 X 2 X
2 1 2 + n2 n1 2

Z N (0, 1)

H1 : 1 > 2 H1 : 1 < 2 H1 : 1 = 2

H0 : 1 = 2
2 2 1 = 2 = 2 nije poznato

T = S2 =

1 X 2 X 1 1 + n n
1

2 +(n 1)S 2 (n1 1)S1 2 2 n1 +n2 2

H1 : 1 > 2 H1 : 1 < 2

T t(n1 + n2 2)

Usporedba varijanci dviju normalno distribuiranih populacija (F-test) Promatramo statisti cko obilje zje X na dvije razli cite populacije. Uz to pretpostavimo da u obje populacije promatrano obilje zje ima normalnu razdiobu. Ako s X1 i X2 ozna cimo obilje zje na prvoj, odnosno drugoj populaciji, onda su pretpostavke:
2 2 X1 N (1 , 1 ) i X2 N (2 , 2 ).

Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n1 i n2 redom. Testiramo hipotezu
2 2 H0 : 1 = 2

u odnosu na jednu od alternativnih:


2 2 H1 : 1 = 2 , 2 2 > 2 , H1 : 1 2 2 . H1 : 1 < 2

Test statistika je: F =


2 S1 2 S2

koja (ako je H0 to cna hipoteza) ima F (Fisherovu) razdiobu s parom stupnjeva slobode (n1 1, n2 1) . Kriti cna podru cja su prikazana u tablici:

Nulta hipoteza
2 2 H0 : 1 = 2

Alternativna hipoteza 2 2 = 2 H1 : 1
2 2 H1 : 1 > 2 2 2 H1 : 1 < 2

Kriti cno podru cje C0 = 0 , f1 ( n 1 , n2 1)] 1 2 [f (n1 1, n2 1), 2 C0 = [f (n1 1, n2 1), C0 = 0, f1 (n1 1, n2 1)]

Vrijednosti f (n1 1, n2 1) i f1 (n1 1, n2 1) citamo iz tablica za F razdiobu. Vrijedi: 1 f1 (n1 , n2 ) = f (n2 , n1 ) Usporedba proporcija Promatramo dvije populacije i Bernoullijevo statisti cko obilje zje X . Ozna cimo sa X1 i X2 vrijednosti obilje zja X, a sa p1 , i p2 vjerojatnosti uspjeha na prvoj, odnosno na drugoj populaciji. Neka su p 1 i p 2 procjenitelji za p1 i p2 , a n1 i n2 duljine (nezavisnih) uzoraka. Tada je p = n1 p 1 + n2 p 2 n1 + n2

procjena zajedni cke vjerojatnosti. Test-statistika je: Z= p 1 p 2 p (1 p ) 1


1 n1

1 n2

Za velike uzorke, tj. kada min(n1 , n2 ) +, vrijedi Z N (0, 1). Kriti cna podru cja su prikazana u tablici: Nulta hipoteza Alternativna Kriti cno podru cje hipoteza H1 : p 1 = p 2 C0 = , z ] 2 , [z 2 H1 : p 1 > p 2 C0 = [z , H1 : p 1 < p 2 C0 = , z ]

H0 : p 1 = p 2

Primjer. Anketirano je 300 radnika iz tvornice A i 200 radnika iz tvornice B o uvjetima rada . 56% radnika iz tvornice A i 48% radnika iz tvornice B su zadovoljni uvjetima rada. S razinom zna cajnosti 0.05, testirati hipotezu da 7

a) su radnici podjednako zadovoljni uvjetima rada; su zadovoljniji uvjetima rada.

b) radnici iz tvornice A

n1 = 300,

p 1 = 0.56,

n2 = 200,

p 2 = 0.48

a) H0 : p1 = p2 , H1 : p1 = p2 Procijenjena vjerojatnost je: p = 300 0.56 + 200 0.48 n1 p 1 + n2 p 2 = = 0.528. n1 + n2 500

Vrijednost test statistike je: 0.56 0.48 z= 0.528 0.472 Kriti no podru cje je : C0 = , z ] 2 z = z0.025 = (tablice) = 1.96, 2 [z , 2 [1.96, . 1
1 300

= 1.75.
1 200

C0 = , 1.96]

Vrijednost test statistike nije u kriti cnom podru cju, tj. 1.75 < z0.025 pa ne mo zemo odbaciti nultu hipotezu, tj. ne mo zemo zaklju citi da postoji razlika medu tvornicama. b) H0 : p1 = p2 , H1 : p1 > p2 z = (tablice) = z0.05 = 1.64 C0 = [1.64,

Vrijednost test statistike z = 1.75 pripada kriti cnom podru cju pa odbacujemo nultu hipotezu, tj. mo zemo zaklju citi da su radnici iz tvornice A zadovoljniji uvjetima rada.

You might also like