Download as pdf or txt
Download as pdf or txt
You are on page 1of 48

4 Testiranje statistickih

hipoteza
1
4.1. Statisticka hipoteza
Promatramo statisticko obiljezje X.
Statisticka hipoteza je (bilo koja) pretpostavka o
(populacijskoj) razdiobi od X.
Kazemo da je statisticka hipoteza jednostavna uko-
liko jednoznacno odreduje razdiobu od X. U suprot-
nom kazemo da je slozena.
2
Primjeri.
H
1
: X ima normalnu razdiobu
slozena hipoteza
H
2
: X N(170, 64)
jednostavna hipoteza
3
4.2. Statisticki test
Neka je = E[X].
Na primjer, pretpostavimo da nas zanima je li tocna
hipoteza:
H
0
: 50.
Preciznije, zelimo na osnovi realizacije slucajnog u-
zorka za X donijeti odluku hocemo li odbaciti ili ne
odbaciti tu hipotezu.
4
Postupak donosenja odluke o odbacivanju ili ne odbaci-
vanju statisticke hipoteze zove se testiranje statistickih
hipoteza.
Primijetimo da uz osnovnu ili nul - hipotezu, npr.:
H
0
: 50,
postoji njoj alternativna hipoteza:
H
1
: > 50.
5
Buduci da sve odluke bazirane na uzorcima iz po-
pulacije nisu 100% pouzdane, ni zakljucak (odluka)
statistickog testa nije 100% pouzdan.
Dakle, moze se dogoditi da je zakljucak testa pogresan.
Prema tome, imamo sljedecu situaciju:
6
zakljucak
tocno je ne odbaciti H
0
odbaciti H
0
H
0

pogresno! (I)
H
1
pogresno! (II)

Pogreska koju cinimo kada odbacujemo H
0
, a ona
je istinita, je pogreska prve vrste.
Pogreska koju cinimo kada ne odbacujemo H
0
, a
istinita je H
1
, je pogreska druge vrste.
7
Test ce u potpunosti biti sproveden ako mozemo
procijeniti vjerojatnosti mogucih pogresaka u za-
kljucku testa.
Razumno je zahtjevati test kojemu se mogu kontroli-
rati vjerojatnosti obiju pogresaka. To nije moguce
jer smanjivanjem vjerojatnosti pogreske prve vrste
povecava se vjerojatnost pogreske druge vrste i o-
bratno.
8
S druge strane, u velikoj vecini slucajeva moguce je
za zadanu razinu znacajnosti testa ( 0, 1))
medu testovima kojima vjerojatnost pogreske prve
vrste ne prelazi broj naci (konstruirati) test s naj-
manjom vjerojatnosti pogreske druge vrste.
9
Neka je X
1
, X
2
, . . . , X
n
slucajni uzorak za X i
X := (X
1
, X
2
, . . . , X
n
).
Tada su realizacije x = (x
1
, x
2
, . . . , x
n
) tog uzorka
elementi od R
n
.
Denicija. Test (hipoteze H
0
u odnosu na alterna-
tivu H
1
) je preslikavanje : R
n
0, 1.
Interpretacija. Ako je za realizaciju x uzorka X
(x) = 1, tada odbacujemo H
0
u korist H
1
, a ako je
(x) = 0, tada ne odbacujemo H
0
u korist H
1
.
10
Tada je
C :=
1
(1) = x R
n
: (x) = 1
podrucje realizacija uzoraka za koje se H
0
odbacuje
u korist H
1
.
C se naziva kriticno podrucje za test .
11
Populacijska razdioba: X f(x[),
Vjerodostojnost od : L([x) =

n
i=1
f(x
i
[)
Preslikavanje : [0, 1] def. sa:
() := E

[(X)] = P

(X C) =

C
L([x) dx
zove se jakost testa .
Interpretacija. Ukoliko je
1
vrijednost parametra za
koju je H
1
istinito, jakost testa (
1
) je sposobnost
testa da odbaci H
0
ako je H
0
neistinita hipoteza.
12
Neka su:
H
0
:
0
H
1
:
1
.
Preslikavanje :
0
[0, 1] def. sa:
() := () = P

(X C)
je vjerojatnost pogreske 1. vrste.

:= sup

0
()
je znacajnost testa . Kazemo da test ima razinu
znacajnost ukoliko mu je znacajnost manja ili jed-
naka .
13
H
0
:
0
H
1
:
1
.
Preslikavanje :
1
[0, 1] def. sa:
() := 1 () = P

(X / C)
je vjerojatnost pogreske 2. vrste.
14
Denicija. Kazemo da je test uniformno najjaci
ako za svaki drugi test
t
takav da je

, vrijedi
da je

t()

() za sve .
Ukoliko postoji, kako naci uniformno najjaci test?
15
Pretpostavimo da zelimo testirati:
H
0
: =
0
H
1
: =
1
gdje su
0
,=
1
dvije vrijednosti parametra.
Nadalje, neka su
L(
0
[x) =
n

i=1
f(x
i
[
0
), L(
1
[x) =
n

i=1
f(x
i
[
1
)
vjerodostojnosti od
0
i
1
.
16
Lema. (Neyman, Pearson)
Neka je k > 0 takav broj da za skup
C = x R
n
: L(
0
[x) kL(
1
[x)
vrijedi da je

C
L(
0
[x) dx = za zadani 0, 1).
Ako za neki drugi B R
n
vrijedi da je

B
L(
0
[x) dx ,
tada je nuzno

B
L(
1
[x) dx

C
L(
1
[x) dx.
(Dokaz.)
17
Interpretacija.
Test (x) := 1
C
(x) za C iz N-P leme je uniformno
najjaci test za testiranje jednostavne hipoteze H
0
u
odnosu na jednostavnu alternativu H
1
.
18
Primjer 4.1. Za varijablu X poznato je da je
X N(, 9) i 13.8, 15.0.
Na osnovi uzorka za X duljine n = 70 treba testirati
nul-hipotezu
H
0
: = 15.0
u odnosu na alternativu
H
1
: = 13.8
uz razinu znacajnosti od = 5%.
19
Konstrukcija testa sastoji se od odredivanja testne
statistike na osnovi cijih vrijednosti se donose od-
luke, i (slike) kriticnog podrucja koji je skup onih
mogucih vrijednosti testne statistike za koje se od-
bacuje H
0
u korist H
1
. Takav skup takoder zovemo
kriticnim podrucjem.
(Izvod optimalnog (tj. uniformno najjaceg testa).)
20
Dakle, za ovaj primjer, testna statistika (optimalnog)
testa je
Z =
X 15.0
3

70.
Kriticno podrucje uz uvjet da vjerojatnost pogreske
prve vrste bude jednaka = 0.05:
P(Z u[ H
0
) = 0.05
Z
H
0
N(0, 1) u = z
0.05
= (tablice) = 1.64
kriticno podrucje je interval , 1.64]
Dakle, H
0
odbacujemo ako je z 1.64.
21
Ako je z > 1.64 ne odbacujemo H
0
. U tom slucaju
je vjerojatnost pogreske druge vrste
= P(Z > 1.64[ H
1
) =
= P(
X 13.8
3

70 >
15.0 13.8
3

70 1.64[ H
1
) =
= P(X

> 1.71) =
= 1 (1.71) =
= 0.5
0
(1.71) =
= 0.0436.
22
Jakost testa je
= P(Z 1.64 [ H
1
) =
= 1 P(Z > 1.64 [ H
1
) =
= 1 = 1 0.0436 =
= 0.9564.
23
Zadatak 1. (jednostrani z-test)
Pokazite da je za X N(,
2
0
), gdje je
2
0
poznato,
uniformno najjaci test za testiranje hipoteza
H
0
: =
0
H
1
: <
0
,
na razini znacajnosti , dan testnom statistikom
Z =
X
0

n
i kriticnim podrucjem z z

.
(
0
je zadani broj, z je vrijednost od Z)
24
Zadatak 2. (jednostrani z-test, 2. put)
Pokazite da je za X N(,
2
0
), gdje je
2
0
poznato,
uniformno najjaci test za testiranje hipoteza
H
0
: =
0
H
1
: >
0
,
na razini znacajnosti , dan testnom statistikom
Z =
X
0

n
i kriticnim podrucjem z z

.
(
0
je zadani broj, z je vrijednost od Z)
25
Zadatak 3. (dvostrani z-test)
Neka je X N(,
2
0
), gdje je
2
0
poznato. Je li test
hipoteza
H
0
: =
0
H
1
: ,=
0
,
dan testnom statistikom
Z =
X
0

n
i kriticnim podrucjem[z[ z
/2
(na razini znacajnosti
), uniformno najjaci?
(
0
je zadani broj, z je vrijednost od Z)
26
Primijetimo da nam je u primjeru 4.1. racun bio
olaksan jer su obje hipoteze (osnovna i alternativna)
bile jednostavne. U praksi to nije slucaj.
Na primjer, ako za X N(, 9) zelimo testirati
H
0
: 15
H
1
: < 15,
onda su obje hipoteze slozene.
Pretpostavimo da je testna statistika ista kao u pri-
mjeru 4.1:
Z =
X 15
3

n.
27
I kriticno podrucje je istoga oblika kao u primjeru
4.1: , u]. Odredimo u > 0 t.d. je za zadanu
razinu znacajnosti
P(Z u[ = 15 +) za sve 0
P(
X
3

n u

3

n) za sve 0
(u

3

n) za sve 0.
Buduci da je za sve 0, (u

3

n) (u),
u odredimo tako da je (u) = 0.5
0
(u) = .
28
Dakle, konstrukcija kriticnog podrucja je ista ako
originalnu (slozenu) hipotezu H
0
zamijenimo sa (jed-
nostavnom) hipotezom
H
0
: = 15,
odnosno, ako testiramo
H
0
: = 15
H
1
: < 15.
Dakle, sada smo problem testiranja sveli na z-test
opisan u zadatku 1.
29
U pravilu, za nul-hipotezu uvijek se uzimaju jednos-
tavne hipoteze ili hipoteze koje jednoznacno odreduju
razdiobu testne statistike.
U interpretaciji, za nul-hipoteze uzimamo one hipoteze
za koje zelimo kontrolirati vjerojatnost da cemo ih
odbaciti ako su istinite, odn. vjerojatnost pogresaka
prve vrste.
30
Primjer 4.2. (Primjer 1.4.) Kockar je optuzen da je
koristio namjestenu kocku. Koju osnovnu hipotezu
koristi statisticar kada sprovodi odgovarajuci test za
sud?
31
H
0
: Kocka je simetricna.
Trebamo kontrolirati vjerojatnost da cemo pogrijesiti
ako odbacimo H
0
, tj. da se proglasi krivim nevini
covjek.
32
Primjer 4.3. Tvornica je proizvela novu seriju pado-
brana. Kontrolor kvalitete mora statistickim meto-
dama (statisticki test) odluciti hoce li padobrane
propustiti na trziste ili ne. Koju hipotezu treba uzeti
za osnovnu?
33
H
0
: Padobran nije ispravan.
34
4.3 Testovi omjera vjerodostojnosti
Neka je X
1
, X
2
, . . . , X
n
slucajni uzorak za X i neka
je populacijska gustoca od X: f(x[), .
Cilj: konstrirati test za testiranje
H
0
:
0
H
1
:
1
.
35
Neka je x = (x
1
, x
2
, . . . , x
n
) opazeni uzorak.
Vjerodostojnost:
L([x) =
n

i=1
f(x
i
[),
Pretpostavimo da postoje:

0
=

0
(x)
0
i

=

(x)
t.d. da vrijedi
L(

0
[x) = max

0
L([x), L(

[x) = max

L([x).
36
Denicija. Omjer vjerodostojnosti je funkcija:
x (x) :=
L(

0
[x)
L(

[x)
.
Test za testiranje nevedenih hipoteza kojemu je kri-
ticno podrucje oblika
C = x R
n
: (x) c,
za neku realnu konstanu c < 1, zovemo testom om-
jera vjerodostojnosti (engl. likelihood ratio test ili
LR-test).
37
Zadatak 4. (dvostrani z-test)
Neka je X
1
, X
2
, . . . , X
n
slucajni uzorak za X s nor-
malnom populacijskom distribucijom N(,
2
0
) (
2
0
je
poznato). Odredite test omjera vjerodostojnosti za
testiranje nul-hipoteze H
0
: =
0
u odnosu na
dvostranu alternativu H
1
: ,=
0
.
38
Zadatak 5. (t-test) Neka je X
1
, X
2
, . . . , X
n
slucajni
uzorak za X s normalnom populacijskom distribuci-
jom N(,
2
) (oba parametra su nepoznata). Odre-
dite test omjera vjerodostojnosti za testiranje nul-
hipoteze H
0
: =
0
u odnosu na
(a) jednostranu alternativu H
1
: <
0
;
(b) jednostranu alternativu H
1
: >
0
;
(c) dvostranu alternativu H
1
: ,=
0
.
39
4.4 Test o ocekivanju normalno distribuirane
populacije (t-test)
Neka je X
1
, . . . , X
n
slucani uzorak za X N(,
2
).

Zelimo testirati hipoteze o parametru (


2
je nepoz-
nat).
Od sada pa nadalje, neka
0
oznacava neki unaprijed
zadani broj.
40
Razlikujemo tri slucaja:
(1) : (2) : (3) :
H
0
: =
0
H
0
: =
0
H
0
: =
0
H
1
: >
0
H
1
: <
0
H
1
: ,=
0
Alternative u (1) i (2) su jednostrane
jednostrani testovi
dok je alternativa u (3) dvostrana
dvostrani test.
41
U sva tri slucaja, testna statistika je jednaka:
T =
X
0
S

n
H
0
t(n 1)
Kriticna podrucja se razlikuju.
Neka je zadana razina znacajnosti.
42
(1):
H
0
: =
0
H
1
: >
0
P(T t

(n 1) [ H
0
) =
kriticno podrucje:
[t

(n 1), +)
43
(2):
H
0
: =
0
H
1
: <
0
P(T t

(n 1) [ H
0
) =
kriticno podrucje:
, t

(n 1)]
44
(3):
H
0
: =
0
H
1
: ,=
0
P([T[ t
/2
(n 1) [ H
0
) =
kriticno podrucje:
, t
/2
(n 1)] [t
/2
(n 1), +)
45
Primjer 4.4. (Primjer 3.13)
U svrhu istrazivanja toksicnosti jedne vrste plijesni
na urod kukuruza, mjeri se kolicina toksicne tvari u
mg. Uzorak od 9 ekstrakata te plijesni:
1.2, 0.8, 0.6, 1.1, 1.2, 0.9, 1.5, 0.9, 1.0
Pretpostavka je da mjereno obiljezje ima normalnu
razdiobu.
Iz uzorka je izracunano: x = 1.02 i s = 0.28.
Uz 5% znacajnosti testirajte
H
0
: = 1.00
H
1
: > 1.00.
46
Jednostrani t-test:
Testna statistika: T =
X1.00
S
3
Kriticno podrucje: [t
0.05
(8), +) = [1.86, +)
Vrijednost testne statistike:
t =
x 1.00
s
3 =
1.02 1.00
0.28
3 = 0.214
47
Buduci da je t = 0.214 < 1.86, tj. t ne pripada
kriticnom podrucju, ne odbacujemo H
0
u korist al-
ternative.
Preciznije, uz znacajnost od 5%, ne odbacujemo
pretpostavku da je manje ili jednako od 1.00, odn.
ne mozemo tvrditi da je ocekivana kolicina toksicne
tvari u ekstraktu plijesni veca od 1.00.
48

You might also like