5 Normalna

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 36

SVEUILITE U ZAGREBU

PRIRODOSLOVNO-MATEMATIKI FAKULTET

Elvir Balti

Slavko Davidovi

Daria Grozdek

Ilija Markovi

Josip Peri

Normalna razdioba, intervali pouzdanosti i


veliina uzorka

Seminarski rad

Zagreb, 2014.
Sadraj

Uvod 2

1. Osnovno o normalnoj razdiobi 3

2. Koritenje tablice normalne razdiobe 10

3. Primjena normalne razdiobe u praksi 15

4. Centralni granini teorem 18

5. Intervali pouzdanosti i veliina uzorka 22

6. T-distribucija 29

Zakljuak 34

Literatura 35

1
Uvod

Prema novom nacionalnom kurikulumu normalna distribucija (razdioba ili raspodjela) i


intervali pouzdanosti uvest e se u nastavni program srednjih kola. U ovom seminaru emo
vas upoznat sa pojmom normalne razdiobe koji je prirodan i javlja se u mnogim ivotnim
okolnostima. Navest emo nekoliko zornih primjera iz svijeta i pokazati koja obiljeja
normalne distribucije oni imaju. Definirati emo funkciju normalne razdiobe (tzv. Gaussovu
krivulju) i navesti neka njena obiljeja. Osim same teorije navest emo nekoliko primjera i
pokazati kako se oni rjeavaju. Objasnit emo kako se koristi tablica normalne distribucije i
njenu primjenu u zadacima u kojima raunamo vjerojatnost pojave nekog podatka u razdiobi
koja podsjea na normalnu. Objasnit emo i to su to intervali pouzdanosti i kako se oni
odreuju. Osim pitanja raunanja vjerojatnosti pojave nekog podatka u normalnoj razdiobi
nekog uzorka populacije odgovorit emo i na obrnuto pitanje: kolika je veliina uzorka
populacije potrebna da bi bili sigurni s odreenim stupnjem pouzdanosti u procjeni neke
vrijednosti koja se normalno distribuira? Osim normalne razdiobe ponekad zbog nedovoljno
podataka moramo koristiti malo drugaiju vrstu razdiobe tzv. T- razdiobe. Kao i kod
normalne distribucije ukratko emo navesti njena obiljeja i pokazati njenu primjenu u
praktinim problemima iz svijeta.

2
1. Osnovno o normalnoj razdiobi
Sluajne varijable mogu biti ili diskretne ili neprekidne. Diskretna varijabla ne moe
poprimiti sve vrijednosti
sti izmeu bilo koje dvije dane vrijednosti varijabli. Meutim,
neprekidna varijabla moe poprimiti sve vrijednosti izmeu bilo koje dvije dane vrijednosti
varijabli. Primjeri neprekidnih varijabli su visina odraslog ovjeka, tjelesna temperatura
takora i razine kolesterola u odraslih.
odraslih. Mnoge neprekidne varijable, poput navedenih
primjera, imaju zvonolike razdiobe i nazivaju se priblino normalno podijeljene varijable.

Na primjer,, ako istraivai izaberu sluajan uzorak od 100 odraslih ena, izmjere im visine i
naprave histogram, dobivaju graf slian onome na slici 1 a). Dalje, ako istraivai poveaju
veliinu uzorka i smanje veliinu razreda, histogrami e izgledati kao oni na slikama 1 b) i 1 c).
Napokon, kad bi bilo mogue izmjeriti visine svih odraslih ena u Hrvatskoj,
Hrvatskoj, histogram bi se
razdiobi, kao to pokazuje slika 1 d). Ova razdioba je takoer
pribliio takozvanoj normalnoj razdiobi,
poznata pod nazivom zvonolika krivulja ili Gaussova razdioba,, nazvana po njemakom
matematiaru Carlu Friedrichu Gaussu, koji je izveo njenu jednadbu.

3
Nijedna varijabla se ne uklapa savreno u normalnu razdiobu budui da je normalna razdioba
teoretska razdioba. Ipak, normalna razdioba moe se koristiti kako bi opisala mnoge varijable
jer su odstupanja od normalne razdiobe jako mala.

U praktinoj
tinoj nastavi statistike postoje razliita zorna pomagala kojima se moe doarati
normalna raspodjela, a jedno od najpoznatijih sastoji se od jedne koso poloene plitke kutije,
koja na gornjoj strani u sredini ima lijevak u koji se sipaju kuglice; ispod toga
toga nalaze se
zakucani avlii koji sprjeavaju da se kuglice bez smetnje sputaju prema dnu kutije, a na
dnu kutije su ogradice koje nam omoguuju kontrolu kamo je pojedina kuglica pala. Kuglice
se slau na karakteristian nain, tj. u obliku normalne razdiobe,
razdiobe, kao to se moe vidjeti na
slici ispod.

4
Kad su vrijednosti podataka ravnomjerno rasporeene oko aritmetike sredine, za razdiobu
se kae da je simetrina. Slika 2 a) prikazuje simetrinu razdiobu. Kad veina podataka padne
lijevo od aritmetike sredine, za razdiobu se kae da je negativno iskrivljena, aritmetika
sredina je lijevo od standardne devijacije (toke infleksije), te aritmetika sredina i
standardna devijacija su lijevo od moda (globalni ekstrem) (slika 2 b)). Kad veina podataka
padne desno od aritmetike sredine, za razdiobu se kae da je pozitivno iskrivljena,
aritmetika sredina je desno od standardne devijacije, te aritmetika sredina i medijan su
desno od moda (slika 2 c)).

U matematici krivulje se mogu prikazati pomou jednadbi. Na primjer, jednadba kruga


moe biti         , gdje je  radijus. Iako u stvarnom svijetu nije mogue proizvesti
savreno okrugao kota, jednadba i svojstva kruga mogu se koristiti za prouavanje mnogih
svojstava kotaa, kao povrina, brzina i akceleracija. Slino tako, teoretska krivulja, tzv.
krivulja normalne razdiobe, moe se koristiti za prouavanje mnogih varijabli koje nisu
savreno normalno podijeljene, ali ipak su priblino normalne.

Jednadba grafa normalne razdiobe je

 /^
 

 2

gdje su

 2.718
3.14

  artimetika sredina populacije,   standardna devijacija populacije.

Ova jednadba moda izgleda komplicirano, ali u primijenjenoj statistici za posebne


probleme koriste se tablice umjesto jednadbe.

Oblik i poloaj krivulje normalne distribucije ovisi o dva parametra: aritmetikoj sredini i
standardnoj devijaciji. Svaka varijabla normalne razdiobe ima svoju vlastitu krivulju normalne
razdiobe. Slika 4a) prikazuje dvije normalne distribucije s istim vrijednostima aritmetikih
sredina, ali razliitim standardnim devijacijama. to je vea standardna devijacija, krivulja je
rairenija.

5
Slika 4b) pokazuje dvije krivulje normalne distribucije s istom standardnom devijacijom, ali
razliitim aritmetikim sredinama. Ove krivulje imaju isti oblik, ali se nalaze na razliitim
stranama x-osi.

Slika 4c)) pokazuje dvije krivulje normalne distribucije


distribucije s razliitom standardnom devijacijom i
razliitim aritmetikim sredinama.

6
Definicija. Normalna razdioba je neprekidna, simetrina, zvonolika razdioba varijabli.

Kratak pregled svojstava normalne razdiobe

1. Krivulja normalne razdiobe je zvonolika.


zvonolik
2. Aritmetika sredina, medijan i mod su jednaki i nalaze se u sredini razdiobe.
3. Normalna razdioba je unimodalna (ima samo jedan mod, odnosno globalni ekstrem).
4. Krivulja je simetrina s obzirom na aritmetiku sredinu to je ekvivalentno tome da je
njen oblik
ik jednak s obje strane okomite linije koja prolazi kroz sredinu.
5. Krivulja je neprekidna.
6. Krivulja nikad ne dira x-os.
os.
7. Ukupna povrina pod krivuljom normalne
n razdiobe je jednaka 1, tj. . Ova
injenica se moda ini neobinom budui da krivulja nikad ne dira x-os,
os, ali moe se
matematiki dokazati raunanjem.
8. Povrina pod krivuljom normalne razdiobe koja lei unutar jedne standardne
devijacije aritmetike sredine je priblino 0.68, tj. ; unutar dvije standardne
devijacije aritmetike sredine oko 0.95, tj. ; i unutar tri standardne devijacije oko
0.997, tj. . Pogledajte sliku 5.

7
razdiobu
Statistiari koriste takozvanu standardnu normalnu razdiobu.

Definicija. Standardna normalna razdioba


razdioba je normalna razdioba s aritmetikom sredinom 0 i
standardnom devijacijom 1 (slika 6).

Vrijednosti ispod krivulje ukazuju na razmjer povrine u svakom odsjeku. Na primjer,


povrina izmeu aritmetike sredine i jedne standardne devijacije iznad ili ispod te iste
aritmetike sredine je oko 0.3413, odnosno

8
Jednadba za standardnu normalnu distribuciju glasi



 /
 .


Sve varijable normalne razdiobe mogu se pretvoriti u varijablu standardne normalne


razdiobe koristei formulu za standardni proraun:


.
 
 ili  .
.


Jednom kad su vrijednosti X pretvorene koristei ovu formulu, nazivamo ih  vrijednosti.


Vrijednost  je zapravo broj standardnih devijacija koliko je pojedina vrijednost X udaljena od
aritmetike sredine.

Sljedea tablica pokazuje povrine ispod grafa jedinine normalne razdiobe (integral)
omeene nulom (aritmetika sredina) i pojedinom tokom desno udaljenom od nule. Za sve
toke udaljene od nule za vie od 5, povrina iznosi priblino 0.5.

9
2.Koritenje
Koritenje tablice normalne razdiobe
razdiobe

Tablica A

10
Primjer 1. Pronai povrinu ispod krivulje normalne razdiobe izmeu z = 0 i z = 2.34.

Rjeenje:

Nacrtaj skicu i oznai povrinu kao na slici 7.

Budui da tablica A daje povrinu izmeu 0 i bilo koje vrijednosti z desno od 0, treba samo
potraiti vrijednost z u tablici. Pronai 2.3 u lijevom stupcu i 0.04 u gornjem redu. Vrijednost
gdje se redak i stupac susreu
reu je odgovor, 0,4904 . Otuda
uda povrina je 0.4904, odnosno
49.04%.

Primjer 2. Pronai povrinu izmeu z = 0 i z = - 1.75.

Rjeenje:

Oznai povrinu kao na slici 9.

11
Tablica A nam ne daje povrine za negativne vrijednosti z.. Meutim, kako je normalna
razdioba simetrina s obzirom na aritmetiku sredinu, povrina lijevo je jednaka povrini
desno od nje. Stoga treba potraiti povrinu za z = 1.75, koja je jednaka 0.4599, odnosno
45.99%.

Primjer 3. Pronai povrinu desno od z = 1.11.

Rjeenje:

Nacrtaj sliku i oznai povrinu kao na slici 10.

Traena povrina nalazi se na repu


pu krivulje. Budui da tablica A daje povrine izmeu z = 0 i z
= 1.11, prvo pronaimo tu povrinu, zatim oduzmimo tu vrijednost od 0.5000 budui da se
polovica
ovica povrine ispod krivulje nalazi desno od z = 0. Povrina izmeu z = 0 i z = 1.11
jednaka je 0.3665, a povrina desno od z = 1.11 iznosi 0.1335, tj. 13.35%, dobiveno
oduzimanjem 0.3665 od 0.5000.

12
Primjer 4. Pronai povrinu izmeu .

Rjeenje.

U ovoj situaciji potraimo povrinu od 0 do i povrinu od 0 do 2.00, zatim oduzmemo te


dvije povrine te dobivamo traenu povrinu: , tj. .

Primjer 5. Pronai povrinu izmeu i .

Rjeenje.

Budui da se dvije povrine nalaze na suprotnim stranama od z = 0, moramo pronai obje


povrine i zbrojiti. Povrina izmeu 0 i je jednaka , a povrina izmeu 0 i
iznosi . Traena povrina jednaka je , odnosno

13
Primjer 6. Pronai povrinu lijevo od .

Rjeenje.

Budui da tablica A daje povrinu samo izmeu 0 i , moramo joj dodati budui da
(polovica) ukupne povrine lei lijevo od 0. Povrina izmeu 0 i 1.99 jednaka je , pa
tako imamo traenu povrinu jednaku , odnosno 97.67%.

Krivulja normalne razdiobe kao vjerojatnosna krivulja

Krivulja normalne razdiobe moe se


se koristiti kao krivulja vjerojatnosne razdiobe za varijable
vjerojatnosti. To znai, kada bi bilo
normalne razdiobe. Povrina ispod krivulje odgovara vjerojatnosti.
mogue nasumino odabrati bilo koju vrijednost z, vjerojatnost odabira, na primjer izmeu 0
i 2, bila bi jednaka kao povrinaa ispod krivulje izmeu 0 i 2.
2. U ovom sluaju povrina iznosi
. Dakle, vjerojatnost odabiranja bilo koje vrijednosti z izmeu 0 i 2 iznosi .

14
3. Primjena normalne razdiobe u praksi
Standardna krivulja normalne razdiobe moe se koristiti za rjeavanje razliitih
praktinih problema. Jedini zahtjev je da varijable imaju normalnu ili priblino normalnu
razdiobu. Postoji vie matematikih metoda za utvrivanje je li varijabla normalno
rasporeena . Za sve probleme prikazane u ovom poglavlju moe se pretpostaviti da
varijabla ima normalnu ili priblino normalnu razdiobu.

Za rjeavanje problema primjenom standardne normalne razdiobe, potrebno je


transformirati izvornu varijablu u varijablu standardne normalne razdiobe koristei formulu

   



 

ili





To je ista formula koja je predstavljena u poglavlju. Ova formula transformira vrijednosti


varijable u standardne jedinice ili z vrijednosti.

Primjerice, pretpostavimo da rezultati standardiziranog ispita imaju normalnu


razdiobu, srednju vrijednost 100 i standardnu devijaciju 15. Kada se rezultate transformira u
z vrijednosti, dvije distribucije se podudaraju. (prisjetimo se da z distribucija ima srednju
vrijednost 0 i standardnu devijaciju 1).

Za rjeavanje problema primjene u ovom poglavlju, transformirajte vrijednosti


varijable u z vrijednosti i koristite tablicu A, kao to je prikazano u sljedeim primjerima.

15
Primjer 1.

Ako rezultati ispita imaju srednju vrijednost 100 i standardnu devijaciju 15, pronaite
postotak rezultata koji e biti ispod 112.

Rjeenje:

Korak 1: Napravite skicu i oznaite podruje.


Korak 2: Pronaite vrijednost z koja se podudara sa rezultatom 112. Dakle, 112 je
0,8 standardnih devijacija iznad srednje vrijednosti 100.
Pronaite podruje koristei tablicu A. Podruje izmeu   0 i   0,8 je 0,2881.
Budui je podruje unutar krivulje lijevo od   0,8 eljeno, dodajte 0,5 na 0,2881
0,5  0,2881  0,7881.
Dakle, 78,81% rezultata biti e ispod 112.

Primjer 2.

Svakog mjeseca amerika kuanstva generiraju otprilike 28 funti (masa) novina za


otpad ili recikliranje. Pretpostavimo da je standardnu devijaciju dvije funte. Ako se nasumice
odabere kuanstvo, pronaite vjerojatnost da e generirati:

a) izmeu 27 i 31 funtu otpada mjeseno,


b) vie od 30,2 funti mjeseni.

Pretpostavite da je varijabla otprilike normalno distribuirana.

Rjeenje: a)

Korak 1: Napravite skicu i prikaite to podruje.


Korak 2: Naite dvije z vrijednosti
Korak 3: Naite pripadajue podruje koristei tablicu A. Podruje izmeu   0 i
  0,5 je 0,1915. Podruje izmeu   0 i   1,5 je 0,4332. Zbrojite 0,1915 i
0,4332 0,1915  0,4332  0,6247. Dakle, ukupna povrina je 62,47%.
Dakle, vjerojatnost da e nasumce odabrano domainstvo generirati izmeu 27 i 31
funtu novina (otpada) mjeseno je 62,47%

b)

16
Korak 1: Nacrtajte skicu i prikaite podruje.
Korak 2: Naite vrijednost z za 30,2.
Korak 3: Pronaite primjereno podruje. Podruje izmeu   0    1.1 prema
tablici je 0,3643. Budui je eljeno podruje na pravilnoj stranim oduzmite 0,3643
od 0,5
0,5 - 0,3643 = 0,1357 .

Dakle, vjerojatnost da e nasumce odabrano domainstvo akumulirati vie od 30,2


funti novinskog otpada je 0,1357 ili 13,57%.

Normalna distribucija moe se koristiti kako bi se odgovorilo na pitanje Koliko?. Ova


primjena prikazana je na sljedeem primjeru.

Primjer 3.

Amerika automobilsko udruenje izvjetava kako je prosjeno vrijeme potrebno za


odgovoriti na hitan poziv 25 minuta. Pretpostavimo da je varijabla priblino normalno
rasporeena i da je standardna devijacija 4.5 minuta. Ako nasumice odaberemo 80 poziva,
otprilike na koliko njih e biti odgovoreno za manje od 15 minuta?

Rjeenje:

Korak 1: Nacrtajte skicu i prikaite podruje.


Korak 2: Naite vrijednost z za 15.
Korak 3: Pronaite odgovarajue podruje. Podruje dobiveno iz tablice A je 0,4868,
to odgovara podruju izmeu   0 i   2,22 .
Korak 3: Oduzmite 0,4868 od 0,5 kako bi ste dobili 0,0132.
Za pronalaenje broja poziva koji na koje e biti odgovoreno u manje od 15 minuta
pomnoite veliinu uzorka (80) sa povrinom (0,0132), ime se dobije 1,056. Dakle,
na 1,056 ili otprilike jedan poziv biti e odgovoreno unutar 15 minuta.

17
4.Centralni
Centralni granini teorem
Primjer 1:: Profesor je grupi od 4 studenta zadao kviz s 8 pitanja. Rezultati kviza su: jedan
student je tono rijeio 2 pitanja, drugi 6, trei 4 i etvrti student je rijeio svih 8 pitanja.

Tada je srednja vrijednost dobivenih rezultata

Sada moemo izraunati i standardnu devijaciju

Ako grupiramo podatke po dva i odredimo njihove srednje vrijednosti dobivamo sljedeu
tablicu.

Dobivene podatke moemo prikazati pomou histograma.

18
Iako je histogram, graf nas asocira na Gaussovu krivulju.

Srednja vrijednost svih uzoraka je ista kao i srednja vrijednost poetnih rezultata

Izraunajmo i standardnu devijaciju.

U ovom primjeru populacija ine 4 studenta, koji su rjeavali zadani kviz.


kviz. U opem sluaju
populacija e biti skup pojedinaca (jedinki) koji imaju neku zajedniku osobinu (svojstvo). U
primjeru uzorak je mogui rezultat kviza dvaju studenata. Openito uzorak e biti dio
populacije odreene veliine. Ovdje imamo uzorak veliine
veliin 2.

Zakljuujemo da je srednja vrijednost uzoraka veliine n dobivena grupiranjem podataka


populacije jednaka srednjoj vrijednosti populacije . Standardna devijacija srednjih vrijednosti
svih moguih uzoraka je jednaka standardnoj devijaciji populacije podijeljenoj
podijeljenoj s
.Standardnu devijaciju srednjih vrijednosti uzoraka nazivamo standardna greka srednje
vrijednosti.

19
Teorem (centralni granini): Ako uzorci veliine n neogranieno rastu, oblik razdiobe srednjih
vrijednosti uzoraka populacije sa srednjom vrijednosti i standardnom devijacijom e se
pribliavati normalnoj razdiobi. Ta razdioba e imati srednju vrijednost i standardnu
devijaciju / .

Neemo dokazivati teorem. Spomenimo samo da pripada u skupinu graninih teorema u


Bernoullijevoj shemi, koji se obrauju u vjerojatnosti i statistici.

Imamo sljedeu formulu za odreivanje varijable standardne normalne razdiobe srednjih


vrijednosti

Primjer 2: Prosjena dob odvjetnika je 43.6 godina, sa standardnom devijacijom od 5.1


godinu. Ako odvjetnika tvrtka zapoljava 50 odvjetnika, kolika je vjerojatnost da je
prosjena dob u tvrtki vea od 44.2 godine?

Rjeenje:

Standardna devijacija srednjih vrijednosti uzoraka je

20
Iz tablice oitamo kolika je povrina izmeu z = 0 i z = 0.83. Ta povrina iznosi 0.2967, pa je
traena povrina u primjeru 0.5 0.2967 = 0.2033. Dakle, vjerojatnost da prosjena dob
odvjetnika
tnika u tvrtki bude vea od 44.2 godine je 20.33 %.

Primjer 3: Prosjena zarada za jedan sat, radnika koji priprema brzu hranu, je 5.55 dolara.
Standardna devijacija iznosi 1.15 dolara. Ako je odabran uzorak od 50 radnika, kolika je
vjerojatnost da e srednja
nja vrijednost uzorka biti izmeu 5.25 i 5.90 dolara?

Rjeenje:

Povrina izmeu z = 0 i z = -1.84


1.84 iznosi isto kao i povrina izmeu z = 0 i z = -1.84, jer je
krivulja normalne razdiobe simetrina. Ta povrina iznosi 0.4671. Povrina izmeu z = 0 i z =
2.15 iznosi 0.4842. Dakle, ukupna povrina je 0.4671 + 0.4842 = 0.9513. Prema tome
vjerojatnost srednje vrijednosti zarade za jedan sat izmeu 5.25 i 5.90 dolara iznosi 95.13%.

21
5. Intervali pouzdanosti i veliina uzorka
Uvod

Jedan aspekt statistike je procjena, to je proces odreivanja vrijednosti nekog parametra


uzetog iz nekog uzorka. Pogledajmo neke statistike primjere:

25% korisnika smartphone-a se ne sjea kada zadnji put nisu imali smartphone pri ruci.
(marketingprofs.com)

25% korisnika Facebook-a se ne zamara sa postavkama privatnosti.

(velocitydigital.co.uk)

85% studenata tijekom studiranja na javnim fakultetima nije primalo nikakvu stipendiju.
(EduCentar.net)

S obzirom na velike populacije od kojih su ove vrijednosti uzete , ovi rezultati su samo
procjena pravih vrijednosti i izvuene su iz podataka prikupljenih iz uzoraka populacije.
Objasnit emo statistike procedure za procjenu prosjeka populacije, proporcija, varijance i
standardne devijacije.

Pretpostavimo da profesor na fakultetu eli odrediti prosjenu dob studenata koji pohaaju
ovaj semestar. Profesor je nasumino odabrao 100 studenata i izraunao da je njihova
prosjena dob 22.3 godine. Profesor je uinio procjenu (eng. point estimate).

Dakle procjena je specifina numerika vrijednost procjene nekog parametra. Najbolja je za


procjenu nekog parametra uzeti srednju vrijednost tj. aritmetiku sredinu parametra iz
uzorka populacije.

Za procjenu populacije se ponekad koriste i druge mjere kao medijan (vrijednost izmeu
prve i druge polovice podataka poredanih po redu) i mod (najei podatak) ali je srednja
vrijednost pouzdanija mjera tj. manje odstupa kada se uzima puno uzoraka iz iste populacije.

Mjere uzoraka (statistike) se koriste za procjenu mjera populacije (parametri) . Te mjere se


zovu procjenitelji. Dobar procjenitelj treba zadovoljiti tri svojstva:

1. Procjenitelj mora biti nepristran. Oekivana ili srednja vrijednost procjena uzetih iz
uzoraka je jednaka parametru koji se procjenjuje.

22
konzistentan Dakle, ako se veliina
2. Procjenitelj mora biti konzistentan. ina uzorka poveava tada se
vrijednost procjene pribliava stvarnoj vrijednosti parametra koji se procjenjuje.
3. Procjenitelj mora biti relativno efektivan
efektivan. Tj. od svih ostalih statistikih
kih mjera mora
imati najmanju vrijednost odstupanja.
Prosjek uzorka e biti poneto drugaiji od prosjeka populacije zbog greke pri odabiru
uzoraka. Dakle, pitanje je koliko je srednja vrijednost uzorka precizan pokazatelj prosjeka
populacije? Zbog navedenog razloga, statistiari preferiraju drugaiju procjenu zvanu
intervalna procjena.

Intervali pouzdanosti
p i veliine uzorka

Intervalna procjena parametra je procjena intervalom ili rangom , tj. izmeu dvije
vrijednosti.

Ova procjena ne mora nuno u svom intervalu sadravati vrijednost parametra koji se
procjenjuje. Dakle interval ili sadri ili ne sadri procijenjeni parametar. Prije nego se odredi
interval moe mu se odabrati odreeni stupanj pouzdanosti (najee u obliku postotka).
Tako odabran interval zovemo intervalom pouzdanosti.

Maksimalna greka procjene je najvea vjerojatna razlika izmeu


izmeu vrijednosti procjene
parametra i stvarne vrijednosti parametra. Rauna se po formuli:

Formula za odreivanje intervala pouzdanosti lagano se izvodi iz formule za maksimalnu


greku procjene:

Na slijedeem primjeru emo pokazati kako se odreuje interval pouzdanosti.

23
Primjer 1.

Rektor sveuilita eli procijeniti prosjenu dob studenata upisanih u tekuu akademsku
godinu. Iz prethodnih studija se pokazalo da je standardna devijacija 2 godine. Na uzorku od
50 studenata je izraunata
ata prosjena dob studenata od 23.2 godine. Pronai 95% interval
pouzdanosti prosjene dobi studenata upisnih u akademsku godinu.

Rjeenje:

Povrina ispod krivulje (vjerojatnost) je smjetena oko aritmetike sredine . Za 95% interval
pouzdanosti Dakle, . Koliki je traimo tako da gledamo

povrinu ispod krivulje koja iznosi ili odnosno povrinu izmeu

aritmetike sredine do traene zz jedinice. U ovom primjeru je to 0.45. Iz tablice A iitavamo


da je za traeni =1.96. Iz formule za odreivanje intervala pouzdanosti:

Uvrtavanjem dobivamo:

Dakle, rektor moe s 95% sigurnosti izjaviti da je prosjena dob studenata izmeu 22.6 i 23.8
godina.
24
Primjer 2.

Nuspojava odreenog lijeka je da ubrzava rad srca pacijenata. Standardna devijacija je 5


otkucaja u minuti. Prosjean rad srca od 104 otkucaja u minuti je odreen na uzorku od 30
pacijenata. Pronai 99% interval pouzdanosti stvarnog prosjeka otkucaja u minuti.

Rjeenje:

Za 99% interval pouzdanosti analogno prethodnom primjeru izraunamo i


iz tablice A iitamo =2.58. Iz formule:

Uvrtavanjem dobivamo:

Zaokruimo:

Dakle, 99% smo sigurni da je prosjean broj otkucaja srca pacijenata koji koriste lijek izmeu
102 i 106 otkucaja u minuti.

25
Primjer 3.

Naveden je uzorak od 30 filmova prikazanih u 2013. godini s budetom veim od 10 milijuna


dolara i njihova ukupna zarada :

Ime filma Godinja zarada (u mil. $)


Posljednji preivjeli 149
Vuk s Wall Streeta 389
Prizivanje 259
Hobbit: Smaugova pusto 847
Enderova igra 125
Zatvorenici 122
ovjek od elika 291
Thor: Mrani svijet 479
Rush 90
Igre gladi 864
Pacific Rim 414
Iron man 3 1214
Brzi i estoki 788
Zvjezdane Staze : U tami 467
Oblivion 286
Ovo je kraj 126
Gravitacija 700
47 Ronina 407
Elysium 232
Riddick 93
Plan bijega 137
Usamljeni ratnik 260
Kapetan Philips 218
Vruina 229
G.I.Joe Osveta 375
Amerike varalice 251
12 godina rob 178
Svjetski rat Z 536
Kick Ass 2 67
Frozen 1000

Odredi 90 % interval pouzdanosti prosjene ukupne zarade visokobudetnih filmova iz 2013


godine.

26
Rjeenje:

Izraunajmo prvo aritmetiku sredinu i standardnu devijaciju ovog niza podataka.

Aritmetiku sredinu raunamo po formuli:

   . . . 
 


Aritmetika sredina je 386.43 milijuna dolara.

Standardnu devijaciju raunamo po formuli:

  



Standardna devijacija je 239.87 milijuna dolara.

Za interval od 90% sigurnosti   1 0.9  0.1 pa   0.05.




 /  0.5 0.05  0.45 Iz tablice A iitamo /  1.65.

Iz formule :
 
 /        /  
 

Uvrtavanjem dobivamo:

239.87 239.87
386.43 1.65      386.43  1.65  
30 30

Odnosno:

314.17    458.7

Dakle prosjena ukupna zarada visokobudetnih filmova prikazanih u 2013.godini sa


sigurnou od 90% je izmeu 314.17 i 458.7 milijuna dolara.

27
Veliina uzorka

Odreivanje veliine uzorka je usko povezano s statistikom procjenom. Moemo se esto


zapitati : Koliko velik uzorak ukupne populacije mora biti da se napravi precizna procjena?
Odgovor nije jednostavan jer ovisi o tri stvari: maksimalna greka procjena, standardna
devijacija populacije i stupanj pouzdanosti.

Formula za veliinu uzorka se izvodi iz formule za maksimalnu greku procjene:


 
  /  ,   /2  ,   /2 


Rjeavanjem po n dobivamo:



  /  


Primjer 4:

Profesor nekog fakulteta eli izraunati prosjenu dob studenata upisanih na fakultet sa
sigurnou od 99% i maksimalnom grekom procjene unutar 1 godine. Iz prethodnih
istraivanja je utvreno da je standardna devijacija 3 godine. Koliki uzorak studenata
profesor mora uzeti?

Rjeenje:

Iz primjera imamo da je   1 0.99  0.01 pa  0.005.  /  0.5 0.005 





0.495 Dakle /  2.58. Maksimalna greka procjene E = 1. Iz formule:



  /  


Uvrtavanjem dobivamo:



  /    59.9  60


Dakle, da bi bio 99% siguran, profesor mora uzeti uzorak od 60 studenata.

28
6.T-distribucija
Intervali pouzdanosti srednje vrijednosti ( nepoznata i n < 30)

Ako je poznata i varijabla normalno distribuirana, ili ako je nepoznata i n 30, koristimo
standardnu normalnu distribuciju kako bismo pronali intervale pouzdanosti za srednju
vrijednost. Ipak, u veini sluajeva standardna devijacija populacije je nepoznata i n < 30. U
takvim sluajevima umjesto standardne devijacije populacije () moemo koristiti
standardnu devijaciju uzorka (s) pri raunanju intervala pouzdanosti. Malo drugaiju
distribuciju, takozvanu t distribuciju, moramo koristiti kada je n < 30 i kada je varijabla
normalno ili priblino normalno distribuirana. Derivirao ju je W.S.Gosset, engleski statistiar
poznatiji pod pseudonimom Student, pa se distribucija naziva i Studentova t - distribucija.

t - distribucija se u nekim obiljejima razlikuje, a u nekima podudara s normalnom


distribucijom:

SLINOSTI RAZLIKE
varijanca je uvijek vea od 1
zvonolik oblik grafa
t distribucija je zapravo familija
simetrinost obzirom na srednju
krivulja bazirana na konceptu
vrijednost
stupnjeva slobode, to je zapravo
srednja vrijednost, medijan i mod
povezano s veliinom uzorka
iznose 0, i nalaze se u sredini
kako se veliina uzorka poveava, t
distribucije
distribucija se pribliava standardnoj
krivulja nikada ne dira x - os
normalnoj distribuciji

Tablica 1.1. Slinosti i razlike normalne i t - distribucije

29
Slika 1.1. Graf normalne i graf t distribucije (http://chelskov.org/picqyn/normal-
distribution-calculator-t-test)

Mnoge statistike distribucije koriste pojam stupanj slobode, a formula za pronalaenje


stupnjeva slobode varira za razliite statistike testove. Stupnjevi slobode su broj varijabli
koje moemo slobodno mijenjati, a govore nam koju krivulju koristiti kada se distribucija
sastoji od familije krivulja. Na primjer, ako imamo 5 vrijednosti i njihova srednja vrijednost je
10, tada 4 od 5 vrijednosti mogu varirati. No, jednom kada odaberemo 4 vrijednosti, peta
vrijednost mora biti samo jedan odreen broj kako bi suma vrijednosti bila 50, jer je 50 : 5 =
10. Stoga su stupnjevi slobode 5 1 = 4, i ta vrijednost nam govori koju t krivulju koristiti.

Stupnjeve slobode u zadacima emo oznaavati sa d.f. (degrees of freedom).

Kod raunanja intervala pouzdanosti za srednju vrijednost, stupanj slobode raunamo tako
da od veliine uzorka (n) oduzmemo 1.

Formula za pronalaenje intervala pouzdanosti kada je nepoznata i n < 30 :

# #
 "        "  
 

Stupanj slobode je n-1. Vrijednosti za " nalazimo u t tablici.

30
Na primjer, elimo li pronai vrijednost " za 95% interval pouzdanosti kada je veliina
uzorka jednaka 22, uinit emo to na sljedei nain:

d.f. = 22 1 = 21

U lijevom stupcu pronaemo vrijednost 21, a u najdonjem retku vrijednost 95%. Vrijednost
koja se nalazi u eliji u kojoj se taj redak i stupac sijeku je vrijednost od " , a iznosi 2.080.

Primjer 1.

Zaustavljeno je 10 nasumce izabranih automobila, te im je izmjerena dubina utora desne


prednje gume. Srednja vrijednost bila je 0,32 ina, a standardna devijacija iznosila je 0,08
ina. Naite 95% interval pouzdanosti srednje vrijednosti dubine. Pretpostavimo da je
varijabla priblino normalno distribuirana.

31
Rjeenje:

Poto je nepoznata i moramo ju supstituirati sa s, gledamo t-distribuciju za 95%. Stoga, s 9


stupnjeva slobode, " =2.262.

95-postotni interval pouzdanosti nalazimo uvrtavanjem u formulu:

# #
 "        "  
 

& <  < 0.32 + (2.262) % &



.

.

0.32 (2.262)%



0.32 0.057 <  < 0.32 + 0.057

0.26 <  < 0.38

Stoga, moemo biti 95% sigurni da je srednja vrijednost dubina utora svih prednjih desnih
guma izmeu 0.26 i 0.38 ina, gledano na uzorku od 10 guma.

Primjer 2.

Podaci prikazuju uzorak broja kunih poara uzrokovanih svijeama u zadnjih 7 godina.
Pronaite 99% interval pouzdanosti srednje vrijednosti populacije kunih poara
uzrokovanih svijeama svake godine .

5460 5900 6090 6310 7160 8440 9930

Rjeenje:

= 7041.4

#  1610.3

d.f. = 6

" = 3.707

Sada podatke ubacujemo u formulu i izraunavamo traeni interval:

# #
 "        "  
 

32
& <  < 7041.4 + 3.707% &

. 
.
7041.4 3.707%
 

7041.4 2256.2 <  < 7041.4 + 2256.2

4785.2 <  < 9297.6

Moemo biti 99% sigurni da je srednja vrijednost populacije kunih poara uzrokovanih
svijeama svake godine izmeu 4785.2 i 9297.6.

Studenti ponekad imaju potekoa pri odluivanju koristiti li  ili " vrijednosti pri
izraunavanju intervala pouzdanosti srednje vrijednosti. Kao to je istaknuto ranije, kada je
poznata,  vrijednosti mogu se koristiti bez obzira na veliinu uzorka, dokle god je
varijabla normalno distribuirana ili n 30. Kada je nepoznata i n 30, u formuli moemo
koristiti s i  vrijednosti, a kada je nepoznata i n < 30, u formuli koristimo s i "
vrijednosti, dokle god je varijabla priblino normalno distribuirana.

No, potrebno je istaknuti da neki statistiari imaju drugaije stajalite. Oni koriste 
vrijednosti kada je poznata i " vrijednosti kada je nepoznata. U tom sluaju potrebna
im je t tablica koja sadri t vrijednosti za n 30.

33
Zakljuak

Normalna distribucija je vrlo vana distribucija vjerojatnosti u mnogim podrujima, posebice


u statistici. Koristi se u mnogim prirodnim znanostima ali treba napomenuti da se koristi i u
mnogim psiholokim i drutvenim testovima. Mnoge prirodne fenomene je mogue objasniti
normalnom distribucijom. Prvi matematiar koji ju je detaljno prouavao bio je Gauss pa se
krivulja normalne razdiobe jo naziva i Gaussova krivulja. Za raunanje povrina ispod
krivulje normalne razdiobe, tj. raunanja vjerojatnosti, potrebna su znanja integralnog
rauna pa se u praksi koriste tablice s ve izraunatim vrijednostima. U ovom seminaru su
prikazana osnovna svojstva normalne razdiobe i neke njene primjene. Objanjeno je i kako
se koriste tablice za rjeavanje praktinih problema. Seminar moe posluiti kao materijal za
srednju kolu gdje se planira uvesti normalnu razdiobu u nastavni program. Seminar je za
razliku od postojeih statistikih knjiga na hrvatskom gdje se obrauje normalna razdioba,
vrlo razumljiv i lagan za koritenje.

34
Literatura

Bluman, Allan G. , Elementary statistics: a step by step approach 4th edition,


McGraW-Hill, Boston, 2001.
Pavli Ivo, Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1988.

35

You might also like