Professional Documents
Culture Documents
5 Normalna
5 Normalna
5 Normalna
PRIRODOSLOVNO-MATEMATIKI FAKULTET
Elvir Balti
Slavko Davidovi
Daria Grozdek
Ilija Markovi
Josip Peri
Seminarski rad
Zagreb, 2014.
Sadraj
Uvod 2
6. T-distribucija 29
Zakljuak 34
Literatura 35
1
Uvod
2
1. Osnovno o normalnoj razdiobi
Sluajne varijable mogu biti ili diskretne ili neprekidne. Diskretna varijabla ne moe
poprimiti sve vrijednosti
sti izmeu bilo koje dvije dane vrijednosti varijabli. Meutim,
neprekidna varijabla moe poprimiti sve vrijednosti izmeu bilo koje dvije dane vrijednosti
varijabli. Primjeri neprekidnih varijabli su visina odraslog ovjeka, tjelesna temperatura
takora i razine kolesterola u odraslih.
odraslih. Mnoge neprekidne varijable, poput navedenih
primjera, imaju zvonolike razdiobe i nazivaju se priblino normalno podijeljene varijable.
Na primjer,, ako istraivai izaberu sluajan uzorak od 100 odraslih ena, izmjere im visine i
naprave histogram, dobivaju graf slian onome na slici 1 a). Dalje, ako istraivai poveaju
veliinu uzorka i smanje veliinu razreda, histogrami e izgledati kao oni na slikama 1 b) i 1 c).
Napokon, kad bi bilo mogue izmjeriti visine svih odraslih ena u Hrvatskoj,
Hrvatskoj, histogram bi se
razdiobi, kao to pokazuje slika 1 d). Ova razdioba je takoer
pribliio takozvanoj normalnoj razdiobi,
poznata pod nazivom zvonolika krivulja ili Gaussova razdioba,, nazvana po njemakom
matematiaru Carlu Friedrichu Gaussu, koji je izveo njenu jednadbu.
3
Nijedna varijabla se ne uklapa savreno u normalnu razdiobu budui da je normalna razdioba
teoretska razdioba. Ipak, normalna razdioba moe se koristiti kako bi opisala mnoge varijable
jer su odstupanja od normalne razdiobe jako mala.
U praktinoj
tinoj nastavi statistike postoje razliita zorna pomagala kojima se moe doarati
normalna raspodjela, a jedno od najpoznatijih sastoji se od jedne koso poloene plitke kutije,
koja na gornjoj strani u sredini ima lijevak u koji se sipaju kuglice; ispod toga
toga nalaze se
zakucani avlii koji sprjeavaju da se kuglice bez smetnje sputaju prema dnu kutije, a na
dnu kutije su ogradice koje nam omoguuju kontrolu kamo je pojedina kuglica pala. Kuglice
se slau na karakteristian nain, tj. u obliku normalne razdiobe,
razdiobe, kao to se moe vidjeti na
slici ispod.
4
Kad su vrijednosti podataka ravnomjerno rasporeene oko aritmetike sredine, za razdiobu
se kae da je simetrina. Slika 2 a) prikazuje simetrinu razdiobu. Kad veina podataka padne
lijevo od aritmetike sredine, za razdiobu se kae da je negativno iskrivljena, aritmetika
sredina je lijevo od standardne devijacije (toke infleksije), te aritmetika sredina i
standardna devijacija su lijevo od moda (globalni ekstrem) (slika 2 b)). Kad veina podataka
padne desno od aritmetike sredine, za razdiobu se kae da je pozitivno iskrivljena,
aritmetika sredina je desno od standardne devijacije, te aritmetika sredina i medijan su
desno od moda (slika 2 c)).
/^
2
gdje su
2.718
3.14
Oblik i poloaj krivulje normalne distribucije ovisi o dva parametra: aritmetikoj sredini i
standardnoj devijaciji. Svaka varijabla normalne razdiobe ima svoju vlastitu krivulju normalne
razdiobe. Slika 4a) prikazuje dvije normalne distribucije s istim vrijednostima aritmetikih
sredina, ali razliitim standardnim devijacijama. to je vea standardna devijacija, krivulja je
rairenija.
5
Slika 4b) pokazuje dvije krivulje normalne distribucije s istom standardnom devijacijom, ali
razliitim aritmetikim sredinama. Ove krivulje imaju isti oblik, ali se nalaze na razliitim
stranama x-osi.
6
Definicija. Normalna razdioba je neprekidna, simetrina, zvonolika razdioba varijabli.
7
razdiobu
Statistiari koriste takozvanu standardnu normalnu razdiobu.
8
Jednadba za standardnu normalnu distribuciju glasi
/
.
.
ili .
.
Sljedea tablica pokazuje povrine ispod grafa jedinine normalne razdiobe (integral)
omeene nulom (aritmetika sredina) i pojedinom tokom desno udaljenom od nule. Za sve
toke udaljene od nule za vie od 5, povrina iznosi priblino 0.5.
9
2.Koritenje
Koritenje tablice normalne razdiobe
razdiobe
Tablica A
10
Primjer 1. Pronai povrinu ispod krivulje normalne razdiobe izmeu z = 0 i z = 2.34.
Rjeenje:
Budui da tablica A daje povrinu izmeu 0 i bilo koje vrijednosti z desno od 0, treba samo
potraiti vrijednost z u tablici. Pronai 2.3 u lijevom stupcu i 0.04 u gornjem redu. Vrijednost
gdje se redak i stupac susreu
reu je odgovor, 0,4904 . Otuda
uda povrina je 0.4904, odnosno
49.04%.
Rjeenje:
11
Tablica A nam ne daje povrine za negativne vrijednosti z.. Meutim, kako je normalna
razdioba simetrina s obzirom na aritmetiku sredinu, povrina lijevo je jednaka povrini
desno od nje. Stoga treba potraiti povrinu za z = 1.75, koja je jednaka 0.4599, odnosno
45.99%.
Rjeenje:
12
Primjer 4. Pronai povrinu izmeu .
Rjeenje.
Rjeenje.
13
Primjer 6. Pronai povrinu lijevo od .
Rjeenje.
Budui da tablica A daje povrinu samo izmeu 0 i , moramo joj dodati budui da
(polovica) ukupne povrine lei lijevo od 0. Povrina izmeu 0 i 1.99 jednaka je , pa
tako imamo traenu povrinu jednaku , odnosno 97.67%.
14
3. Primjena normalne razdiobe u praksi
Standardna krivulja normalne razdiobe moe se koristiti za rjeavanje razliitih
praktinih problema. Jedini zahtjev je da varijable imaju normalnu ili priblino normalnu
razdiobu. Postoji vie matematikih metoda za utvrivanje je li varijabla normalno
rasporeena . Za sve probleme prikazane u ovom poglavlju moe se pretpostaviti da
varijabla ima normalnu ili priblino normalnu razdiobu.
ili
15
Primjer 1.
Ako rezultati ispita imaju srednju vrijednost 100 i standardnu devijaciju 15, pronaite
postotak rezultata koji e biti ispod 112.
Rjeenje:
Primjer 2.
Rjeenje: a)
b)
16
Korak 1: Nacrtajte skicu i prikaite podruje.
Korak 2: Naite vrijednost z za 30,2.
Korak 3: Pronaite primjereno podruje. Podruje izmeu 0 1.1 prema
tablici je 0,3643. Budui je eljeno podruje na pravilnoj stranim oduzmite 0,3643
od 0,5
0,5 - 0,3643 = 0,1357 .
Primjer 3.
Rjeenje:
17
4.Centralni
Centralni granini teorem
Primjer 1:: Profesor je grupi od 4 studenta zadao kviz s 8 pitanja. Rezultati kviza su: jedan
student je tono rijeio 2 pitanja, drugi 6, trei 4 i etvrti student je rijeio svih 8 pitanja.
Ako grupiramo podatke po dva i odredimo njihove srednje vrijednosti dobivamo sljedeu
tablicu.
18
Iako je histogram, graf nas asocira na Gaussovu krivulju.
Srednja vrijednost svih uzoraka je ista kao i srednja vrijednost poetnih rezultata
19
Teorem (centralni granini): Ako uzorci veliine n neogranieno rastu, oblik razdiobe srednjih
vrijednosti uzoraka populacije sa srednjom vrijednosti i standardnom devijacijom e se
pribliavati normalnoj razdiobi. Ta razdioba e imati srednju vrijednost i standardnu
devijaciju / .
Rjeenje:
20
Iz tablice oitamo kolika je povrina izmeu z = 0 i z = 0.83. Ta povrina iznosi 0.2967, pa je
traena povrina u primjeru 0.5 0.2967 = 0.2033. Dakle, vjerojatnost da prosjena dob
odvjetnika
tnika u tvrtki bude vea od 44.2 godine je 20.33 %.
Primjer 3: Prosjena zarada za jedan sat, radnika koji priprema brzu hranu, je 5.55 dolara.
Standardna devijacija iznosi 1.15 dolara. Ako je odabran uzorak od 50 radnika, kolika je
vjerojatnost da e srednja
nja vrijednost uzorka biti izmeu 5.25 i 5.90 dolara?
Rjeenje:
21
5. Intervali pouzdanosti i veliina uzorka
Uvod
25% korisnika smartphone-a se ne sjea kada zadnji put nisu imali smartphone pri ruci.
(marketingprofs.com)
(velocitydigital.co.uk)
85% studenata tijekom studiranja na javnim fakultetima nije primalo nikakvu stipendiju.
(EduCentar.net)
S obzirom na velike populacije od kojih su ove vrijednosti uzete , ovi rezultati su samo
procjena pravih vrijednosti i izvuene su iz podataka prikupljenih iz uzoraka populacije.
Objasnit emo statistike procedure za procjenu prosjeka populacije, proporcija, varijance i
standardne devijacije.
Pretpostavimo da profesor na fakultetu eli odrediti prosjenu dob studenata koji pohaaju
ovaj semestar. Profesor je nasumino odabrao 100 studenata i izraunao da je njihova
prosjena dob 22.3 godine. Profesor je uinio procjenu (eng. point estimate).
Za procjenu populacije se ponekad koriste i druge mjere kao medijan (vrijednost izmeu
prve i druge polovice podataka poredanih po redu) i mod (najei podatak) ali je srednja
vrijednost pouzdanija mjera tj. manje odstupa kada se uzima puno uzoraka iz iste populacije.
1. Procjenitelj mora biti nepristran. Oekivana ili srednja vrijednost procjena uzetih iz
uzoraka je jednaka parametru koji se procjenjuje.
22
konzistentan Dakle, ako se veliina
2. Procjenitelj mora biti konzistentan. ina uzorka poveava tada se
vrijednost procjene pribliava stvarnoj vrijednosti parametra koji se procjenjuje.
3. Procjenitelj mora biti relativno efektivan
efektivan. Tj. od svih ostalih statistikih
kih mjera mora
imati najmanju vrijednost odstupanja.
Prosjek uzorka e biti poneto drugaiji od prosjeka populacije zbog greke pri odabiru
uzoraka. Dakle, pitanje je koliko je srednja vrijednost uzorka precizan pokazatelj prosjeka
populacije? Zbog navedenog razloga, statistiari preferiraju drugaiju procjenu zvanu
intervalna procjena.
Intervali pouzdanosti
p i veliine uzorka
Intervalna procjena parametra je procjena intervalom ili rangom , tj. izmeu dvije
vrijednosti.
Ova procjena ne mora nuno u svom intervalu sadravati vrijednost parametra koji se
procjenjuje. Dakle interval ili sadri ili ne sadri procijenjeni parametar. Prije nego se odredi
interval moe mu se odabrati odreeni stupanj pouzdanosti (najee u obliku postotka).
Tako odabran interval zovemo intervalom pouzdanosti.
23
Primjer 1.
Rektor sveuilita eli procijeniti prosjenu dob studenata upisanih u tekuu akademsku
godinu. Iz prethodnih studija se pokazalo da je standardna devijacija 2 godine. Na uzorku od
50 studenata je izraunata
ata prosjena dob studenata od 23.2 godine. Pronai 95% interval
pouzdanosti prosjene dobi studenata upisnih u akademsku godinu.
Rjeenje:
Povrina ispod krivulje (vjerojatnost) je smjetena oko aritmetike sredine . Za 95% interval
pouzdanosti Dakle, . Koliki je traimo tako da gledamo
Uvrtavanjem dobivamo:
Dakle, rektor moe s 95% sigurnosti izjaviti da je prosjena dob studenata izmeu 22.6 i 23.8
godina.
24
Primjer 2.
Rjeenje:
Uvrtavanjem dobivamo:
Zaokruimo:
Dakle, 99% smo sigurni da je prosjean broj otkucaja srca pacijenata koji koriste lijek izmeu
102 i 106 otkucaja u minuti.
25
Primjer 3.
26
Rjeenje:
. . .
Iz formule :
/ /
Uvrtavanjem dobivamo:
239.87 239.87
386.43 1.65 386.43 1.65
30 30
Odnosno:
314.17 458.7
27
Veliina uzorka
Rjeavanjem po n dobivamo:
/
Primjer 4:
Profesor nekog fakulteta eli izraunati prosjenu dob studenata upisanih na fakultet sa
sigurnou od 99% i maksimalnom grekom procjene unutar 1 godine. Iz prethodnih
istraivanja je utvreno da je standardna devijacija 3 godine. Koliki uzorak studenata
profesor mora uzeti?
Rjeenje:
/
Uvrtavanjem dobivamo:
/
59.9 60
28
6.T-distribucija
Intervali pouzdanosti srednje vrijednosti ( nepoznata i n < 30)
Ako je poznata i varijabla normalno distribuirana, ili ako je nepoznata i n 30, koristimo
standardnu normalnu distribuciju kako bismo pronali intervale pouzdanosti za srednju
vrijednost. Ipak, u veini sluajeva standardna devijacija populacije je nepoznata i n < 30. U
takvim sluajevima umjesto standardne devijacije populacije () moemo koristiti
standardnu devijaciju uzorka (s) pri raunanju intervala pouzdanosti. Malo drugaiju
distribuciju, takozvanu t distribuciju, moramo koristiti kada je n < 30 i kada je varijabla
normalno ili priblino normalno distribuirana. Derivirao ju je W.S.Gosset, engleski statistiar
poznatiji pod pseudonimom Student, pa se distribucija naziva i Studentova t - distribucija.
SLINOSTI RAZLIKE
varijanca je uvijek vea od 1
zvonolik oblik grafa
t distribucija je zapravo familija
simetrinost obzirom na srednju
krivulja bazirana na konceptu
vrijednost
stupnjeva slobode, to je zapravo
srednja vrijednost, medijan i mod
povezano s veliinom uzorka
iznose 0, i nalaze se u sredini
kako se veliina uzorka poveava, t
distribucije
distribucija se pribliava standardnoj
krivulja nikada ne dira x - os
normalnoj distribuciji
29
Slika 1.1. Graf normalne i graf t distribucije (http://chelskov.org/picqyn/normal-
distribution-calculator-t-test)
Kod raunanja intervala pouzdanosti za srednju vrijednost, stupanj slobode raunamo tako
da od veliine uzorka (n) oduzmemo 1.
# #
" "
30
Na primjer, elimo li pronai vrijednost " za 95% interval pouzdanosti kada je veliina
uzorka jednaka 22, uinit emo to na sljedei nain:
d.f. = 22 1 = 21
U lijevom stupcu pronaemo vrijednost 21, a u najdonjem retku vrijednost 95%. Vrijednost
koja se nalazi u eliji u kojoj se taj redak i stupac sijeku je vrijednost od " , a iznosi 2.080.
Primjer 1.
31
Rjeenje:
# #
" "
Stoga, moemo biti 95% sigurni da je srednja vrijednost dubina utora svih prednjih desnih
guma izmeu 0.26 i 0.38 ina, gledano na uzorku od 10 guma.
Primjer 2.
Podaci prikazuju uzorak broja kunih poara uzrokovanih svijeama u zadnjih 7 godina.
Pronaite 99% interval pouzdanosti srednje vrijednosti populacije kunih poara
uzrokovanih svijeama svake godine .
Rjeenje:
= 7041.4
# 1610.3
d.f. = 6
" = 3.707
# #
" "
32
& < < 7041.4 + 3.707% &
.
.
7041.4 3.707%
Moemo biti 99% sigurni da je srednja vrijednost populacije kunih poara uzrokovanih
svijeama svake godine izmeu 4785.2 i 9297.6.
Studenti ponekad imaju potekoa pri odluivanju koristiti li ili " vrijednosti pri
izraunavanju intervala pouzdanosti srednje vrijednosti. Kao to je istaknuto ranije, kada je
poznata, vrijednosti mogu se koristiti bez obzira na veliinu uzorka, dokle god je
varijabla normalno distribuirana ili n 30. Kada je nepoznata i n 30, u formuli moemo
koristiti s i vrijednosti, a kada je nepoznata i n < 30, u formuli koristimo s i "
vrijednosti, dokle god je varijabla priblino normalno distribuirana.
No, potrebno je istaknuti da neki statistiari imaju drugaije stajalite. Oni koriste
vrijednosti kada je poznata i " vrijednosti kada je nepoznata. U tom sluaju potrebna
im je t tablica koja sadri t vrijednosti za n 30.
33
Zakljuak
34
Literatura
35