Download as pdf or txt
Download as pdf or txt
You are on page 1of 23

TESTIRANJE HIPOTEZA

Testiranje statističkih hipoteza o razdiobi u


osnovnom skupu
UVODNI PRIMJER
Kockar je optužen da upotrebljava namještenu kocku.
Zabilježeni su podaci o realizacijama 60 bacanja
kockarove kocke:

Kako biste „ispitali” ispravnost kocke?

Ako je kocka pravilna, koje frekvencije očekujete?

Jesu li odstupanja opaženih frekvencija od očekivanih


prevelika?
STATISTIČKA HIPOTEZA
 Statistička hipoteza je tvrdnja koja se odnosi na
osnovni skup
 Postupak ili pravilo kojim se donosi odluka o
odbacivanju ili neodbacivanju tvrdnje (hipoteze)
na temelju podataka iz slučajnog uzorka naziva
se testiranjem statističkih hipoteza
 Razlikujemo :
Nul-hipotezu H0
Alterniativnu hipotezu H1
Sadržaj alternativne hipoteze uvijek proturječi
sadržaju nulte hipoteze!!!

Ako se ne dokaže suprotno, nemamo dovoljno


dokaza za odbacivanje nulte hipoteze.
TESTIRANJE HIPOTEZA
Odluku o odbacivanju ili neodbacivanju nulte
hipoteze donosimo na temelju uzorka, stoga se
može pojaviti pogreška!

Nul-hipoteza je Nul-hipoteza je
prihvaćena odbačena
Nul-hipoteza je Odluka je
Pogreška tipa I
istinita ispravna
Nul-hipoteza je Odluka je
Pogreška tipa II
lažna ispravna

Pogreška tipa I predočuje se vjerojatnosšću


odbacivanja istinite nul –hipoteze. Nazivamo ju
još razinom značajnosti (signifikantnosti).
TESTIRANJE STATISTIČKIH HIPOTEZA O
RAZDIOBI U OSNOVNOM SKUPU

 Testiranje provodimo koristeći HI-KVADRAT TEST

H0 : F(x)=F0(x)
H1 : F(x) ≠ F0(x)

Tj.

𝐻0 : 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎 𝑜𝑠𝑛𝑜𝑣𝑛𝑜𝑔 𝑠𝑘𝑢𝑝𝑎 𝑗𝑒 𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑟𝑎𝑛𝑜𝑔 𝑜𝑏𝑙𝑖𝑘𝑎

𝐻1 : 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑗𝑎 𝑜𝑠𝑛𝑜𝑣𝑛𝑜𝑔 𝑠𝑘𝑢𝑝𝑎 𝑛𝑖𝑗𝑒 𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑟𝑎𝑛𝑜𝑔 𝑜𝑏𝑙𝑖𝑘𝑎


TESTIRANJE STATISTIČKIH HIPOTEZA O
RAZDIOBI U OSNOVNOM SKUPU

Izračunavamo vrijednost testne statistike:



k * 2
( f f )
 02   i * i
i 1 fi

I ako je  02 > c hipoteza H0 se odbacuje. Pri tome su

fi empirijske apsolutne frekvencije (iz uzorka)


fi* teorijske apsolutne frekvencije (određuju se na
temelju pretpostavljene razdiobe)
c je konstanta koja se određuje iz  razdiobe
2

(tablice) uz k-r-1 stupnjeva slobode (k je broj


razreda, r je broj broj parametara pretpostavljene
razdiobe)
HI KVADRAT DISTRIBUCIJA - TABLICE
2
𝜒0.05 (2)=0.5992
2
𝜒0.05 (3)=7.815
2
𝜒0.05 (4)=9.488
𝜒0.01 (2)=9.210
2
2
𝜒0.01 (3)=11.34
TESTIRANJE STATISTIČKIH HIPOTEZA O
RAZDIOBI U OSNOVNOM SKUPU

Konstanta c određuje se iz uvjeta


F(c)=1-α
Gdje je α zadani nivo značajnosti.

Nap. Ako ima razreda s teorijskom frekvencijom fi*


manjom od 5 onda se spajaju razredi tako da
frekvencije budu veće ili jednake 5 (najčešće su to
krajnji razredi)
POVRATAK NA UVODNI PRIMJER
DISKRETNE RAZDIOBE:
Provedimo test na razini značajnosti 5%

i f i* fi* (fi-fi*)2/fi*

χ2=14.2, c=11.07 .
Odbacuje se nulta hipoteza.
TESTIRANJE STATISTIČKIH HIPOTEZA O RAZDIOBI U
OSNOVNOM SKUPU -NEPREKIDNE RAZDIOBE

 Empirijske frekvencije dobivaju se iz uzorka, a


teorijske frekvencije se računaju na temelju
pretpostavljene razdiobe.

 U slučaju neprekidne razdiobe:


xi x1-x2 x2-x3 … xs- xs+1
fi f1 f2 … fs

Tada je fi*= n*P(xi ≤ X ≤ xi+1) = n*[F(xi+1) – F(xi)]


Gdje je F(x) pretpostavljena funkcija razdiobe

Ako je fi* ≤ 5 spajaju se razredi i ima ih manje od s


ZADATAK 1

Mjerenjem brzine vozila na jednoj dionici prometnice


dobiveni su sljedeći podaci

xi fi
40 – 60 8
60 – 80 35
80 – 100 27
100 – 120 6
120 – 140 2
 27

Testirajmo hipotezu naormalne razdiobe uz α=5%.


Ako je ograničenje na dionici 90 km/h kolika je
vjerojatnost da vozač čini prometni prekršaj?
RJEŠENJE 1
Računamo očekivanje i standardnu devijaciju
xi fi xi xi f i xi  x ( xi  x ) 2 f i
40 – 60 8 50 400 -29,4872 6955,95

60 – 80 35 70 2450 -9,48718 3150,23

80 – 100 27 90 2430 10,51282 2984,024

100 – 120 6 110 660 30,51282 5586,193

120 – 140 2 130 260 50,51282 5103,09


 27 6200 23779,49

s
xi f i
x  6200 / 78  79.5
i 1 n
( x  x ) 2
fi 23779.5
S2  i   308.82
n 1 77
S  17.6
RJEŠENJE 1
Teorijske frekvencije dobivamo iz
fi*=n*pi
fi*= P(xi ≤ X ≤ xi+1) = F(xi+1) – F(xi)

60  79.5 40  79.5
p1  F ( )  F( )  F (1.11)  F (2.24)  0.1335  0.0125  0.121
17.6 17.6
80  79.5 60  79.5
p2  F ( )  F( )  F (0.03)  F (1.11)  0.512  0.1335  0.0.3785
17.6 17.6

Analogno dobivamo
p3 = 0.365
p4 = 0.1123
p5 = 0.0107
RJEŠENJE 1
Računamo teorijske frekvencije i vrijednost testne
statistike
xi fi pi fi* fi-fi* (fi-fi*)2/fi*
40 – 60 8 0,121 9,4 -1,4 0,21
60 – 80 35 0,3785 29,5 5,5 1,02
80 – 100 27 0,365 28,5 -1,5 0,08
100 – 120 6 0,1123 8,8
-1,6 0,27
120 – 140 2 0,0107 0,8
 27 1,58

Broj stupnjeva slobode jednak je k-r-1=4-2-1=1


(broj razreda je 4 zbog spajanja razreda!)
Slijedi c = 3,84

Budući da je 1,58<3,84 ( < c ) ne odbacujemo nul-
2
0

hipotezu o normalnoj razdiobi brzina automobila


na promatranoj dionici
ZADATAK 2
Provedeno je ispitivanje tjelesne mase na uzorku od
94 studenta. Dobiveni rezultati prikazani su u
sljedećoj tablici
Tjelesna masa Broj ispitanika
50 – 55 7
55 – 60 13
60 – 65 21
65 – 70 24
70 – 75 18
75 – 80 11
Ukupno 94

Testirajte hipotezu da je distribucija ispitanika


normalnog oblika. Testiranje provedite na razini
značajnosti 1% i 5%.
RJEŠENJE
Moramo procijeniti očekivanje i standardnu
devijaciju. Dobivamo
x  66,01
s  7,10
Dalje, računamo teorijske frekvencije i vrijednost
testne statistike
Tjelesna Broj pi fi* fi* (fi-fi*)2 (fi-fi*)2/fi*
masa ispitanika Spajamo
fi
razrede!

50 – 55 7 0,0484 4,5496
55 – 60 13 0,1399 13,1506 17,70 5,29 0,30
60 – 65 21 0,2438 22,9172 22,92 3,68 0,16
65 – 70 24 0,268 25,192 25,19 1,42 0,06
70 – 75 18 0,1839 17,2866 17,29 0,51 0,03
75 – 80 11 0,0794 7,4636 7,46 12,51 1,68
Ukupno 94 0,9634 90,5596 90,56 2,22
RJEŠENJE
Broj stupnjeva slobode je 5-2-1=2
Na razini značajnosti 1% je c = 9.21 pa kako je
2,22 < 9.21 nemamo dovoljno dokaza za
odbacivanje nul hipoteze. Dakle, ne odbacujemo
nultu hipotezu o normalnoj distribuiranosti
podataka.
ZADATAK
 Testiranjem dobiveni su podaci
Broj 50-62 62-66 66-70 70-74 74-78 78-82 82-86 86-94 94-96 96-100
bodova
Broj 2 8 13 18 21 16 17 17 9 4
ispitanika

 Može li se prihvatiti pretpostavka da mjerenja potječu


iz normalno distribuiranog skupa? Testira se na
razini 1% signifikantnosti.

Rješenje: χ2=8.72, c=18.47 .


Ne odbacuje se nulta hipoteza.
ZADATAK

Mjerenjem mase tereta vozila na jednoj dionici


prometnice dobiveni su podaci
Masa/tona 0–5 5 – 10 10 – 15 15 – 20 20 - 25
Broj vozila 20 20 30 10 5

Testirajte hipotezu o normalnoj razdiobi N(10.5, 5.72)


uz nivo signifikantnosti 5% .

Koji biste zaključak donijeli na temelju grafa?

Broj tereta
40

30

20

10

0
0–5 5 – 10 10 – 15 15 – 20 20 - 25
RJEŠENJE
Zadatak 1.

Mjerenjem mase vozila na jednoj dionici prometnice dobiveni su podaci

Masa/tona 0–5 5 – 10 10 – 15 15 – 20 20 - 25
Broj vozila 20 20 30 10 5

Testitirajte hipotezu o normalnoj razdiobi N(10.5, 5.72) uz nivo signifikantnosti 5% .

mi 10,5
sigma 5,7

granica
razreda zi pi
-
0 1,78018576 0,03273
-
5 0,90299278 0,167294
-
10 0,02579979 0,46505
15 0,85139319 0,785082
20 1,72858617 0,95221
25 2,60577915 0,994518

razred pi fi* fi fi*-fi (fi*-fi)2 (fi*-fi)2/fi*


0–5 0,1345645 11,43798 20 -8,5620177 73,30815 6,409185
5 – 10 0,29775552 25,30922 20 5,3092188 28,1878 1,113737
10 – 15 0,32003251 27,20276 30 -2,7972369 7,824534 0,287637
15 – 20 0,16712725 14,20582 10 4,2058163 17,68889 1,245186
20 - 25 0,0423086 3,596231 5 -1,4037693 1,970568 0,547954
sum 9,6037

spajanje
razreda
(fi*-
razred pi fi* fi fi*-fi (fi*-fi)2 fi)2/fi*
-
0–5 20
0,1345645 11,43798 8,5620177 73,30815 6,409185
5 – 10 0,29775552 25,30922 20 5,3092188 28,1878 1,113737
-
10 – 15 30
0,32003251 27,20276 2,7972369 7,824534 0,287637
15-25 17,80205 15 2,8020469 7,851467 0,441043
8,251602
ZADATAK DZ
 Tvornica proizvodi 4 modela strojeva: A, B, C i D.
Pretpostavka je da u ukupnoj prodaji prednjače
modeli A i B sa 30% udjela svaki, dok su modeli C
i D manje popularni i u ukupnoj prodaju
sudjeluju s udjelima po 20%. Zabilježeni su
podaci o broju prodanih odijela:

A B C D
60 70 40 30

 Na razini značajnosti 1% testirajte hipotezu da se


stvarna prodaja kreće prema pretpostavljenoj.
RJEŠENJE
Postavljamo hipoteze:
H0: stvarna prodaja kreće se prema pretpostavljenoj
H0: stvarna prodaja ne kreće se prema pretpostavljenoj

(fi-f*i
(fi-f*i
fi f*i )^2
)^2/f*i
70 80 1001,25
85 80 25
0,3125
25 20 25
1,25
20 20 0 0
Ukupno 200 200 2,8125
Granična vrijednost hi kvadrata uz 3 stupnja slobode i razinu
značajnosti 0,01 je 11.34
Empirijski χ2 < granične vrijednosti → Ho
Na razini 1% signifikantnosti ne odbacuje se H0 kao moguća, tj. ne
odbacuje se moguća pretpostavka da se stvarna prodaja kreće prema
pretpostavljenoj
ZADATAK - DZ
Četiri novčića se bacaju 200 puta i broji se broj
glava koje su pale. Dobiveni su sljedeći
podaci:

Br pisama 0 1 2 3 4
Frekvencija 10 60 80 45 5

Na razini značajnosti 5% testirajte hipotezu o


simetričnosti novčića.

You might also like