Normalna Raspodela

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

4.

Normalna raspodela
Raspodele podataka se javljaju u razliitim oblicima i mogu biti asimetrine na desnu ili levu stranu ili simetrine.

Raspodela asimetrina na desno raspodela

Raspodela asimetrina na levo

Simetrina

Poseban oblik simetrine raspodele verovatnoe je normalna raspodela ili Gauss-ova raspodela ili kako se jo naziva zvonasta kriva, jer ima simetrian oblik zvona. Normalna raspodela ima primenu kako u teoriji tako i u praksi, a razlog za to je to mnoga fizika merenja, kao i prirodni procesi imaju raspodelu ovog oblika. Normalna raspodela, ija je elementarna jedinica promenljiva x, moe da se definie sledeom jednainom:

y=

1 2

(x )2
2 2

gde su: - srednja vrednost, - standardna devijacija, = 3,14159..., e = 2,71828...

Sl. 1. Normalna raspodela Osobine normalne raspodele su da je simetrina, unimodalna, srednja vrednost, medijana i modus su jednaki i krajevi joj se asimptotski pribliavaju x-osi. Normalnu raspodelu definiu srednja vrednost i standardna devijacija . Srednja vrednost kontrolie centar, a standardna devijacija irinu raspodele. Standardna devijacija je rastojanje od srednje vrednosti do take gde kriva menja

4-2

Statistika u farmaciji

oblik od konkavne na dole u konkavnu na gore. Promenom parametara i , dobijaju se razliite normalne raspodele i postoji beskonano mnogo normalnih raspodela.

4.1. Standardizovano odstupanje (z-score) Kao to je poznato standardna devijacija je mera disperzije, odnosno deskriptivna mera koja pokazuje veliinu varijacije meu podacima. Dakle, to je vea varijacija meu podacima to je vea i standardna devijacija. U tabeli su prikazane dve grupe podataka i prostim pregledanjem podataka uoava se da u grupi 2 postoji vea varijacija nego u grupi 1. To se potvruje i izraunavanjem standardnih devijacija. grupa 1 grupa 2 grupa 1: grupa 2: 51 37 44 61 41 49 58 20 48 70 47 53 53 48 47 48 45 50 66 64

x = 50,0, Sd = 7,4 x = 50,0, Sd = 14,2

Da bismo mogli vizuelno da uporedimo varijacije u obe grupe, podaci su prikazani grafiki na slici, sa obeleenom srednjom vrednou i podelom u intervalima koji su jednaki standardnim devijacijama: 7,4 za grupu 1 i 14,2 za grupu 2.

Slika ilustruje da u drugoj grupi podataka postoji vea varijacija nego u prvoj, kao i da u obe grupe podaci lee izmeu nekoliko standardnih devijacija sa obe strane srednje vrednosti. To nije sluajno i moe se rei da e se svi podaci u bilo kojoj grupi podataka nalaziti izmeu tri standardne devijacije sa obe strane srednje vrednosti. U odnosu na ovo pravilo, razlika izmeu dve grupe podataka koje imaju razliite standardne devijacije je samo u tome to e kod grupe sa veom standardnom devijacijom granica od 3Sd biti dalje od srednje vrednosti, nego kod grupe sa manjom standardnom devijacijom, to se vidi i na slici. Standardizovano (normalizovano) odstupanje ili z-score je jedinica koja se vrlo esto koristi u statistikoj analizi, a predstavlja odstupanje posmatrane vrednosti od srednje vrednosti izraeno u broju standardnih devijacija. Izraunava se prema izrazu:

z=

x-x Sd

S. Spasi: Predavanja 2009/2010.

4-3

Pozitivna vrednost z govori da je posmatrana vrednosti vea od srednje vrednosti i obrnuto, negativna vrednost z govori da je posmatrana vrednost manja od srednje vrednosti. PRIMER 1.: Praenjem dnevnog unosa proteina kod 500 osoba dobijena je srednja vrednost 77 g i standardna devijacija 8 g. Ako elimo da procenimo osobu koja dnevno unosi 93 g proteina u odnosu na srednju vrednost izraunaemo z-score:

z=

93 - 77 16 = =2 8 8

Vrednost 93 g vea je za 16 g od srednje vrednosti, odnosno za 2 standardne devijacije.

z-Score moe da se koristi i kao mera relativnog odstupanja, jer ako neka vrednost ima veliki pozitivan z-score, znai da je vea od veine vrednosti u tom skupu, odnosno ako ima veliki negativan z-score znai da je manja od veine vrednosti u tom skupu. Na primer, ako elimo da procenimo relativno odstupanje vrednosti unosa proteina od 51 g u odnosu na srednju vrednost 77 g i standardnu devijaciju 8 g, izraunaemo prvo z-score: z = (51 77)/8 = -3,25. Dobijeni z-score pokazuje da je vrednost 51 g za 3,25 standardnih devijacija manja od srednje vrednosti. 4.2. Standardizovana normalna raspodela U stvarnosti postoji beskonano mnogo normalnih raspodela, a poseban oblik normalne raspodele je standardizovana normalna raspodela ili z-raspodela (sl. 2). Standardizovana normalna raspodela je raspodela z-scora sa srednjom vrednou 0 i standardnom devijacijom 1.

Sl. 2. Standardizovana normalna raspodela Osnovne osobine standardizovane normalne raspodele su sledee: 1. Ukupna povrina ispod standardizovane normalne krive je jednaka 1 (ovo vai i za sve druge normalne krive); 2. Krajevi standardizovane normalne krive asimptotski se pribliavaju x-osi; 3. Standardizovana normalna kriva je simetrina oko nule; to znai de je deo krive levo od isprekidane linije lik u ogledalu za deo krive desno od iste linije.

4-4 4. Najvei deo povrine ispod krive lei izmeu -3 i 3.

Statistika u farmaciji

Ve je ranije reeno da se vrednost z izraunava prema izrazu z = (x - x )/Sd, odnosno kod normalne raspodele je z = (x - )/, pa jednaina za standardizovanu normalnu raspodelu glasi:

y=

1 2

z2 2

Svaka normalna raspodela moe da se prevede u standardizovanu normalnu raspodelu.


PRIMER 2. Ako je varijabla x normalno distribuirana sa srednjom vrednou = 5 i standardnom devijacijom = 2, z vrednost za x = 6,2 je
z= x 6,2 5 = = 0,6 2

Ovo znai da se vrednost x = 6,2 nalazi 0,6 standardnih devijacija (0,6 inkremenata od 2 jedinice) iznad srednje vrednosti).
Normalna raspodela Standardizovana normalna raspodela

6,2

0,6

=5

z = 0

PRIMER 3. Ako je varijabla x normalno distribuirana sa srednjom vrednou = 5 i standardnom devijacijom = 2, z vrednost za x = 2,5 je
z= x 2,5 5 = = 1,25 2 x 7,5 5 = = 1,25 2
Normalna raspodela Standardizovana normalna raspodela

a z vrednost x = 7,5 je
z=

2,5

7,5

-1,25

1,25

=5

z = 0

Ve je ranije reeno da je ukupna povrina ispod krive jednaka 1 i ona je simetrino rasporeena oko srednje vrednosti . Ova povrina istovremeno predstavlja i verovatnou.

S. Spasi: Predavanja 2009/2010.

4-5

f(x f(x)

P( < x < ) = 0,5

P( < x < ) = 0,5

0 ,5

0 ,5

P( < x < ) = 1,0


Odreivanje povrine (verovatnoe) levo od z

Tablica standardizovane normalne raspodele daje verovatnou, odnosno povrinu za vrednosti manje od eljene vrednosti z (od - do z), odnosno za vrednosti levo od z. Na primer, ako elimo da odredimo povrinu (verovatnou) za vrednosti z 2, iz tablica dobijamo vrednost P = 0,9772. U redovima su vrednosti z do prvog decimalnog mesta, a u kolonama su vrednosti z na drugom decimalnom mestu.
z 0,0 0,1 0,2 0,00 0,01 ..... 0,06 0,07 0,08 0,09

0,5000 0,5398 0,5793

0,5040 0,5438 0,5832

0,5239 0,5636 0,6026

0,5279 0,5675 0,6064

0,5319 0,5714 0,6103

0,5359 0,5753 0,6141

1,7 1,8 1,9 2,0 2,1 2,2

0,9554 0,9641 0,9713


0,9772

0,9564 0,9649 0,9719 0,9778 0,9826 0,9864

0,9608 0,9686 0,9750 0,9803 0,9846 0,9881

0,9616 0,9693 0,9756 0,9808 0,9850 0,9884

0,9625 0,9699 0,9761 0,9812 0,9854 0,9887

,9633 0,9706 0,9767 0,9817 0,9857 0,9890

0,9821 0,9861

0.9772

2,00

Svaka normalna raspodela moe da se prevede u standardizovanu normalnu raspodelu, a za odreivanje P(x b) kada je varijabla x normalno distribuirana varijabla x se prevede u z a iz tablica standardizovane normalne raspodele dobija se vrednost verovatnoe za vrednosti z koje su manje od izraunate vrednosti z (povrina ispod krive levo od izraunate vrednosti z).
PRIMER 4. Broj poena na ispitu, koji je polagalo 250 studenata, ima normalnu raspodelu sa srednjom vrednou 8,0 i standardnom devijacijom 2,5. Ako je potrebno 8,6 poena da se ispit poloi,

4-6

Statistika u farmaciji

koji procenat studenata nije poloio ispit? Ako je ispit je polagalo 250 studenata, koji broj studenata nije poloio ispit? Reenje: Prvo se izrauna vrednost z za 8,6 poena, zatim se iz tablica odredi verovatnoa levo od z i izrazi se u procentima i na kraju se izrauna broj studenata iz dobijenog procenta.

z=

x 8,6 8,0 = = 0,64 2,5

Iz tablica z standardizovanu normalnu raspodelu vidimo da je povrina za z < 0,64 jednaka 0,7389, odnosno 73,89%, to znai da je 73,89% studenata imalo manje od 8,6 poena. Poto je ispit polagalo 250 studenata, 185 ih nije imalo 8,6 poena koliko je bilo potrebno za prolazak.
0,7389 =8 = 2,5 =0 =1

8 8,6 P(x 8,6)

0,64

P(z 0,64)

Odreivanje povrine (verovatnoe) desno od z

U tablicama za standardizovanu normalnu raspodelu date su vrednosti verovatnoe za vrednosti z manje od eljene vrednosti z (povrina ispod krive levo od z). Za izraunavanje verovatnoe za vrednosti z vee od eljene vrednosti z (povrina ispod krive desno od z), oitana vrednost iz tablice oduzima se od ukupne verovatnoe (koja je jednaka 1).
PRIMER 5. Broj poena na ispitu, koji je polagalo 250 studenata, ima normalnu raspodelu sa srednjom vrednou 8,0 i standardnom devijacijom 2,5. Ako je potrebno 8,6 poena da se ispit poloi, koji procenat studenata je poloio ispit? Ako je ispit je polagalo 250 studenata, koji broj studenata je poloio ispit?

Rreenje: Prvo se izrauna vrednost z za 8,6 poena, zatim se iz tablica odredi verovatnoa levo od z i oduzme od ukupne verovatnoe koja je jednaka 1. Dobijena vrednost se izrazi u procentima i iz dobijenog procenta se izrauna broj studenata.

z=

x 8,6 8,0 = = 0,64 2,5

0,7389 =8 = 2,5

1,0 0,7389 = 0,2611 =0 =1

8,6

0 0,64 P(z 0,64)

P(x 8,6)

Iz tablica z standardizovanu normalnu raspodelu vidimo da je povrina za z 0,64 jednaka 0,7389 i oduzimamo je od ukupne verovatnoe 1. Tako dobijamo vrednost 1 0,7389 = 0,2611 ili 26,11%, to znai da je 26,11% studenata imalo vie od 8,6 poena. Poto je ispit polagalo 250 studenata, 65 studenata je imalo 8,6 poena koliko je bilo potrebno za prolazak.

S. Spasi: Predavanja 2009/2010.

4-7

Odreivanje povrine (verovatnoe) izmeu dve vrednosti z

Za svaku od dve zadate vrednosti z u tablicama se pronae vrednost verovatnoe levo od z (povrina levo od z), a zatim se izrauna razlika izmeu te dve vrednosti. Dobijeni rezultat predstavlja vrednost verovatnoe izmeu te dve vrednosti z (vrednost povrine ispod krive izmeu dve vrednosti z).
PRIMER 6. Broj poena na ispitu, koji je polagalo 250 studenata, ima normalnu raspodelu sa srednjom vrednou 8,0 i standardnom devijacijom 2,5. Koji procenat studenata ima izmeu 8,0 i 8,6 poena? Ako je ispit je polagalo 250 studenata, koji broj studenata ima izmeu 8,0 i 8,6 poena?

Rreenje: Prvo se izraunaju vrednosti z za 8,0 i 8,6 poena, zatim se iz tablica odredi verovatnoa levo za svaku od ove dve vrednosti z. Od vee vrednosti se oduzme manja, a dobijeni rezultat izrazi u procentima i iz dobijenog procenta se izrauna broj studenata.

z= z=

x 8,0 8,0 = =0 2,5 x 8,6 8,0 = = 0,64 2,5

Povrina levo od z 0 je 0,5, a povrina levo od z 0,64 je 0,7389. Razlika je 0,7389 0,5 = 0,2389, odnosno 23,89%. Od 250 studenata, 60 studenata je imalo izmeu 8,0 i 8,6 poena.

Vane povrine ispod standardizovane normalne raspodele

Normalna raspodela ima odreene take u kojima raspodela menja pravac i koje imaju specifino znaenje. U samom vrhu raspodele nalazi se srednja vrednost.

Prva taka sa desne strane u kojoj kriva menja pravac je od srednje vrednosti udaljena za jednu standardnu devijaciju, a druga taka je udaljena za dve standardne devijacije.

+2

Karakteristine take levo od srednje vrednosti u kojima kriva menja pravac su takoe udaljene od srednje vrednosti za jednu, odnosno za dve standardne devijacije.

4-8

Statistika u farmaciji

-2 -

+2

Jedna od osobina standardizovane normalne raspodele je da najvei deo povrine ispod raspodele lei izmeu -3z i 3z, odnosno -3 i 3. Koristei tablice za standardizovanu normalnu raspodelu moe taj deo povrine i da se izrauna. Iz tablice se vidi da je povrina levo od 1z jednaka 0,8413, a levo od -1z je 0,1587, pa je prema tome povrina izmeu -1z i 1z (odnosno izmeu 1) jednaka 0,8413 - 0,1587 = 0,6826 ili 68,26% od ukupne povrine ispod krive.
f(x f(x)

f(x f(x)

0,68 26 0,6826

0,68 26 0,6826

-1 z

+1z +1z

-1

+1

Povrina levo od 2z jednaka 0,9772, a levo od -2z je 0,0228, pa je prema tome povrina izmeu -2z i 2z (odnosno izmeu 2) jednaka 0,9772 - 0,0228 = 0,9544 ili 95,44% od ukupne povrine ispod krive.
f(x f(x)

f(x f(x)

0,9544

0,9544

-2z

+2 z

-2

+2

Povrina levo od 3z jednaka 0,9987, a levo od -3z je 0,0013, pa je prema tome povrina izmeu -3z i 3z (odnosno izmeu 3) jednaka 0,9987 - 0,0013 = 0,9974 ili 99,74% od ukupne povrine ispod krive.
f(x f(x)

f(x f(x)

0,9974

0,9974

-3z

+3 z

-3

+3 x

Nalaenje vrednosti z za odreenu povrinu ispod krive

Tablice za standardizovanu normalnu raspodelu mogu da se koriste i da se izrauna vrednost z ako je poznata povrina sa leve strane od z i to obrnutim postupkom od onog koji je prikazan u prethodnim primerima. Drugim reima, u tablici za standardizovanu normalnu raspodelu pronaemo

S. Spasi: Predavanja 2009/2010.

4-9

povrinu iju vrednost znamo i oitamo kojoj vrednosti z ta povrina odgovara. Dobijena vrednost z je ona sa ije leve strane se nalazi poznata povrina. Ako elimo da iz poznate povrine odredimo z sa ije desne strane se ta povrina nalazi postupak je neto drugaiji, a dobijeno z oznaavamo kao z gde predstavlja poznatu povrinu.
PRIMER 7. Odrediti z0,025, odnosno z sa ije desne strane se nalazi povrina 0,025.

Poto je povrina desno od z jednaka 0,025, to znai da je povrina levo od z jednaka 1 - 0,025 = 0,975, to je prikazano na slici. Iz tablica za standardizovanu normalnu raspodelu dobijamo da povrini 0,975 odgovara z = 1,96, dakle z0,025 = 1,96.

Na slian nain moemo da odredimo i dve vrednosti z izmeu kojih se nalazi povrina ija je vrednost poznata.
PRIMER 8. Odrediti vrednost z koja deli povrinu ispod standardizovane normalne krive u sredini deo ija je vrednost 0,95 i dva spoljanja dela od kojih svaki ima vrednost 0,025.

Sa slike se vidi da je osenena povrina sa desne strane jednaka 0,025, to znai da joj odgovara z0,025. U jednom od ranijih primera smo pokazali da je z0,025 = 1,96, to znai da je z sa desne strane 1,96. Poto je standardizovana normalna kriva simetrina oko nule, onda je za istu povrinu sa leve strane z = -1,96, to smo mogli da pronaemo i u tablicama. Dakle, dve traene vrednosti z izmeu kojih se nalazi povrina 0,95 su z = 1,96.

Nalaenje vrednosti x iz poznate povrine ispod normalne krive

Kada smo izraunavali povrinu ispod normalne krive prevodili smo je u stndardnu krivu izraunavanjem z-scora i taj se proces naziva standardizacija. z-Score se izraunava prema izrazu z = (x - )/, koji moe da se rei po x: x = + z

4-10

Statistika u farmaciji

Ovaj proces se naziva destandardizacija. Kako se iz date povrine ispod normalne krive izraunava odgovarajua vrednost x pokazaemo na primeru.
PRIMER 9. Za normalnu raspodelu sa parametrima = 100 i = 16 odrediti vrednost x sa ije leve strane je povrina ispod krive jednaka 0,04.

Poto je postupak nalaenja x vrednosti oznaen kao destandardizacija, znai da idemo od standardizovane normalne krive ka normalnoj krivoj iji su parametri poznati. Prvi korak je da u tablicama za standardizovanu normalnu raspodelu naemo z-vrednost sa ije leve strane je povrina jednaka 0,04, a to je z = 1,75. Ovu vrednost destandardizujemo koristei formulu za x i dobijamo: x = + z = 100 + (-1,75) 16 = 100 - 28 = 72. Dakle, za normalnu raspodelu sa parametrima = 100 i = 16 levo od x = 72 nalazi se povrina 0,04.

Zadaci za vebanje

1. Odrediti povrinu ispod standardne normalne krive koja lei levo od: a. 2,24 b. -1,56 c. 0 d. -4 2. Odrediti povrinu ispod standardne normalne krive koja lei desno od: a. -1,07 b. 0,6 c. 0 d. 4,2 3 Odrediti povrinu ispod standardne normalne krive koja lei izmeu: a. -2,18 i 1,44 b. -2 i -1,5 c. 0,59 i 1,51

4. Odrediti z-vrednost sa ije leve strane je povrina ispod standardne normalne krive jednaka: a. 0,01 b. 0,75 c. 0,8 d. 0,25 5. Odrediti z, odnosno povrinu sa desne strane ispod standardne normalne krive: a. z0,95 b. z0,7

S. Spasi: Predavanja 2009/2010.

4-11

c.

z0,33

d. z0,015 6. Odrediti dve z vrednosti koje dele povrinu ispod standardne krive na: a. srednji deo jednak 0,9 i spoljanje delove od 0,05 b. srednji deo jednak 0,99 i spoljanje delove od 0,005 c. srednji deo jednak 0,7 i spoljanje delove od 0,15 7. Odrediti povrinu ispod normalne krive sa parametrima =1 i =2,5 koja lei: a. desno od 0 b. levo od -1,5 c. izmeu -2 i 2

8. U populacionom istraivanju kojim je obuhvaeno 2760 ena puaa utvreno je da je njihova prosena starost 38,7 g sa standardnom devijacijom 12,6 g. Odrediti z-score za ene puae ija je starost 58, 29 i 73 g 9. Prosena povrina 250 laboratorija u zdravstvenim ustanovama je 64,3 m2 sa standardnom 2 2 2 2 devijacijom 24,7 m . Odrediti z-score za laboratorije ija je povrina 163,1 m , 21,1 m i 61,8 m . 10. Na prijemnom ispitu za fakultet mogui raspon bodova je od 0 do 100. Srednji broj bodova na smeru A je 49,3 sa standardnom devijacijom 10,5, a na smeru B srednji broj bodova je 42 sa standardnom devijacijom 9,8. Pokazati koji student ima relativno bolji uspeh: onaj koji je na smeru A dobio 70,3 boda ili onaj koji je na smeru B imao 66,5 bodova. 11. Prosena cena 25 stanova sline veliine je 110258 eura sa standardnom devijacijom 5237 eura. Ako takav stan moe da se kupi za 95500 eura, da li moemo rei da je cena povoljna? Objasniti odgovor uz pomo z-scora. 12. Maksimalan broj bodova na ispitu je 40, a u jednom roku je postignuta srednja vrednost 28 sa standardnom devijacijom 2. Pokazati kakav je uspeh u odnosu na ostale postigao student koji je dobio 35 poena. 13. Pacijent ima z-score 1,2 iznad srednje vrednosti u populaciji kojoj pripada. Ako je srednja vrednost te populacije 6,2 mmol/L i standardna devijacija 1,1 mmol/L, koju vrednost holesterola ima pacijent? 14. Devojka je visoka 160 cm i ima z-score 0,7 u odnosu na srednju vrednost visine grupe koja iznosi 168 cm. Kolika je standardna devijacija?

You might also like