Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 32

DRŽAVNI UNIVERZITET U NOVOM PAZARU

Mere varijabilnosti

prof. dr Dragan Bogdanović


Mere varijabilnosti
 Svako živo biće je jedinstveno, odnosno razlikuje se
od svih drugih bića.
 I ne samo da se razlikuje od drugih bića, nego se i
ono samo tokom života neprestano menja.
 Upravo su te razlike i promene, odnosno
varijabilnost, predmet interesovanja statistike.
 Da bi opis numeričkih podataka bio potpun potrebno
je pored mera centralne tendencije prikazati i mere
varijabilnosti, odnosno statističke parametre koji
ukazuju na stepen razlika koje postoje između
vrednosti ispitivanih obeležja.
Interval varijacije

 Najjednostavnija mera varijabilnosti


 Jednak je razlici između najveće (maksimalne) i najmanje
(minimalne) vrednosti niza numeričkih podataka
 Može biti korisna mera varijabilnosti jer je lako razumljiv
 Najveći nedostatak je taj što zavisi samo od dve vrednosti
niza
 Ne koristi se samostalno već se uz njega prikazuje još
neka od mera varijabilnosti
 Primer: Interval varijacije za vrednosti 1, 4, 6, 12, 15, 19 i
26 iznosi: 26-1=25.
Kvartili
 Vrednosti koje dele niz podataka sređenih po veličini na četiri
jednaka dela nazivaju se kvartili
 Obeležavaju se sa Q1, Q2, Q3 i Q4
 Medijana predstavlja drugi kvartil, a najviša vrednost niza
predstavlja četvrti kvartil.
 Mesta prvog i trećeg kvartila određuju se po formulama:

N 1 3  N  1
Mesto Q1  Mesto Q3 
4 4
Kvartili
 Ukoliko primenom formule za utvrđivanje mesta kvartila
dobijemo ceo broj, onda je kvartil jednak vrednosti čiji je to
redni broj.

 U slučaju da je rezultat formule decimalni broj, izračunava se


aritmetička sredina dve susedne vrednosti čiji su redni brojevi
oni celi brojevi koji okružuju taj decimalni broj.

 Na primer za mesto Q1=5,3 vrednost Q1 je aritmetička sredina


pete i šeste vrednosti u nizu.
Kvartili
 Prikazivanje vrednosti Q1 i Q3 daje korisnu informaciju u
slučajevima kada između vrednosti obeležja postoji velika
varijabilnost, odnosno kada se kao mera centralne tendencije
koristi medijana, jer se između Q1 i Q3 nalazi 50% središnjih
vrednosti niza.

 Interkvartilna razlika je mera varijabilnosti koja predstavlja


razliku između vrednosti trećeg i prvog kvartila: Q3 - Q1, ali
njena upotreba nije česta.
Kvartili
 U primeru programa vežbi za gubitak prekomerne telesne
težine kod 10 ispitanika vrednosti Q1 i Q3 i interkvartilnu razliku
bi uzračunali na sledeći način:
Gubitak
Ispitanik
težine (kg)
1 0
2 1 11
10  1 3 1 Vrednost Q1  1
Mesto Q1   2,75 2
4 4 1
5 1
3 4
3  10  1 6 2 Vrednost Q3   3,5
Mesto Q3   8, 25 7 2 2
4
8 3
9 4 Q3  Q1  3,5  1  2,5
10 5
Percentili
 Percentili dele niz podataka sređenih po veličini na sto jednakih
delova, odnosno na procente.
 Oni se koriste za određivanje položaja pojedinca u grupi, kao i
za kvantitativno klasifikovanje i kategorisanje ispitanika u grupi
ili populaciji.
 Percentili se obeležavaju sa Pk, gde je k ceo broj od 1 do 100.
Na primer, 25-ti percentil se označava sa P25.

 Pk se može definisati kao vrednost u seriji podataka, takva da


je k% vrednosti manje od vrednosti Pk, a (100 - k)% vrednosti
je veće od vrednosti Pk.
Percentili

 Na primer, P30 deli seriju na 30% vrednosti koje su


manje i 70% vrednosti koje su veće od vrednosti
P30.

 Medijana predstavlja P50, prvi kvartil predstavlja


P25, a treći kvartil predstavlja P75.
Percentili
 Kao i kod određivanja vrednosti kvartila, kod određivanja
vrednosti percentila neophodno je prvo odrediti mesto percentila,
odnosno redni broj ispitanika u sređenom nizu čija vrednost
ispitivanog obeležja predstavlja vrednost traženog percentila.
 Mesto k-tog percentila je:
k n
Mesto Pk 
100
gde je sa k označen broj percentila, a n predstavlja veličinu
uzorka. Odatle, približna vrednost Pk iznosi:

Pk = Vrednost -tog člana u rangiranoj seriji podataka


 kn
 
 100 
Percentili

 Primer: Procenjivan je kvalitet života kod 15 studenata


Flanaganovom skalom čiji se ukupan skor (zbir bodova) kreće
od 15 (najgori mogući kvalitet života) do 75 (najbolji mogući
kvalitet života) i dobijeni su sledeći rezultati:
72 70 65 52 71 58 66 68 64 70 69 67 63 60 65

 Želimo da znamo koja je vrednost 30. percentila (P30).


Percentili
 U prvom koraku sredimo niz podataka po veličini, od najmanje do
najveće vrednosti i svakoj vrednosti dodelimo redni broj:
R. br. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Skor 52 58 60 63 64 65 65 66 67 68 69 70 70 71 72

 U drugom koraku izračunamo mesto P30:

30  15
Mesto P30   4,5
100
 Kako se mesto P30 nalazi između četvrte i pete vrednosti skorova
koje iznose 63 i 64, vrednost P30 izračunavamo kao aritmetičku
sredinu ova dva skora:
Percentili

63  64
P30   63,5
2

 Prema tome, 30. percentil vrednosti skorova za procenu


kvaliteta života kod naših ispitanika iznosi 63,5.

 To znači da 30% svih skorova ima nižu vrednost od 63,5, a


70% skorova ima veću vrednost od 63,5.
Percentili
 Percentilni rang predstavlja mesto određene vrednosti u nizu
na procentnoj skali, odnosno mesto određenog ispitanika na toj
skali koje on zauzima na osnovu vrednosti obeležja.
 Percentilni rang za neku određenu vrednost x iz sređene serije
izračunavamo po formuli:

broj vrednosti koje su manje od x


PRx   100
n
gde je n veličina uzorka.
Percentili
 Koji je percentilni rang skora kvaliteta života koji iznosi 67 u
našem primeru?
R. br. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Skor 52 58 60 63 64 65 65 66 67 68 69 70 70 71 72
 Vrednost skora od 67 se nalazi pod rednim brojem 9, što znači
da 8 skorova ima manju vrednost. Uzorak broji 15 ispitanika.
Odatle:
8
PR67   100  53,33  53
15
 Možemo tvrditi da je oko 53% od ovih 15 studenata imalo skor
kvaliteta života manji od 67, dok je 47% studenata imalo skor od
67 ili više.
Standardna devijacija
 Zbir odstupanja svih pojedinačnih izmerenih vrednosti od
aritmetičke sredine jednak je nuli.
 Da bi odredili koliko iznosi prosečno odstupanje svih vrednosti
niza od aritmetičke sredine, neophodno je kvadrirati razlike
između svake pojedinačne vrednosti niza i aritmetičke sredine,
kako bi se izgubio negativni predznak kod onih razlika koje su
manje od nule.
 Zatim se svi kvadrati razlika podele brojem izmerenih vrednosti.
Na taj način izračunava se varijansa, koja predstavlja
prosečno kvadratno odstupanje svih vrednosti niza od
aritmetičke sredine:
 X X
2

SD 2


N
Standardna devijacija
 Kvadratni koren iz vrednosti varijanse predstavlja prosečno
odstupanje svih vrednosti niza od aritmetičke sredine i naziva
se standardna devijacija.

 Ona predstavlja najvažniju i najčešće korišćenu meru


varijabilnosti, označava se sa SD, a formula za njeno
izračunavanje glasi:

 X  X 
2

SD 
N
Standardna devijacija

 Kako bi se dobila preciznija procena, kod


malih uzoraka (N<100) varijansa i
standardna devijacija se računaju po
formulama:

 X X  X  X 
2
2

SD 2 
 SD 
N 1 N 1
Standardna devijacija
 Primer: Merena su vremena trčanja na 100 metara kod 5
atletičarki:
Vreme (sec)
 X X
2
Ispitanica
X X X
1 11,01 -0,15 0,0225
2 11,32 0,16 0,0256
3 11,09 -0,07 0,0049
4 11,25 0,09 0,0081
5 11,13 -0,03 0,0009

 X  X 
2

 X  55,8  0,062
55,8
 
2
X  11,16 XX 0,062
5 SD    0,12
N 1 5 1
Standardna devijacija
 Standardna devijacija u obzir uzima sve vrednosti niza.
 Iskazuje se u istim mernim jedinicama kao i izmerene
vrednosti.
 Prikazuje se obično odmah iza aritmetičke sredine i to sa
predznakom plus-minus (±).

 U našem primeru dobijene rezultate možemo prikazati


jednostavnim iskazom:

Pet ispitivanih atletičarki je 100 metara u proseku istrčalo za


11,16±0,12 sekundi.
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima

 Kada su podaci prikazani u obliku distribucije frekvencija sa


grupnim intervalima, primenjuju se sledeće formule za
izračunavanje varijanse i standardne devijacije:

f  X   f  X 
2 2

SD 2

 i X
SD 
i X
N N
Gde su:
f - frekvencija svakog pojedinačnog grupnog intervala,
Xi - sredina (aritmetička sredina) grupnog intervala,
- aritmetička sredina celog niza,
X
N - ukupan broj ispitanika.
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima

 Primer sa vremenom koje 25 zaposlenih u jednom preduzeću


svakodnevno provedu u putovanju od kuće do radnog mesta

X   
2 2
Vreme (X) Xi f Xi  f Xi  X i X f  Xi  X
0 do 9 5,0 4 20,0 -16,4 268,96 1075,84
10 do 19 15,0 9 135,0 -6,4 40,96 368,64
20 do 29 25,0 6 150,0 3,6 12,96 77,76
30 do 39 35,0 4 140,0 13,6 184,96 739,84
40 do 49 45,0 2 90,0 23,6 556,96 1113,92
 25 535,0 3376,00
535
X  21, 4
25
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima

 Sada imamo sve elemente potrebne za primenu formula:

f  X 
2

SD 2

 i X

3376,0
 140,67
N 1 24
 Varijansa iznosi 134,96 minuta, a standardna devijacija je:

SD  140,67  11,86
 Možemo da zaključimo da naših 25 ispitanika u proseku
svakodnevno provedu u putovanju od kuće do radnog mesta
21,40±11,86 minuta.
Koeficijent varijacije

 Koeficijent varijacije je relativna mera varijabilnosti


koja omogućava poređenje varijabilnosti kod
različitih obeležja.

 On predstavlja odnos između standardne devijacije i


aritmetičke sredine izražen u procentima:
SD
CV   100
X
Koeficijent varijacije

 Primer: U grupi od 10 ispitanika prosečna visina iznosi


174±8cm, a prosečna težina 70±6kg. Koje obeležje iskazuje
veću varijabilnost?
 Koeficijenta varijacije za visinu iznosi:
8
 100  4,60%
174
 Koeficijenta varijacije za težinu iznosi:

6
 100  8,57%
70
Koeficijent varijacije

 U slučajevima kada je vrednost koeficijenta varijacije


veći od 30% ispravnije je kao meru centralne
tendencije koristiti medijanu, a ne aritmetičku sredinu.

 Tada se u sažetom prikazivanju rezultata umesto


vrednosti aritmetičke sredine i standardne devijacije
koristi medijana, a odmah iza nje u zagradi
minimalna i maksimalna vrednost niza:
Med (Min-Max)
Standardizovano odstupanje
Z (zet) vrednost

 Odstupanje jedne pojedinačne vrednosti od


prosečne vrednosti nekog obeležja možemo
prikazati apsolutnom razlikom između te vrednosti i
aritmetičke sredine.
 U praksi se češće koristi relativna mera varijabilnosti
koja predstavlja odnos između apsolutne razlike i
standardne devijacije, a naziva se standardizovano
odstupanje i obeležava se kao Z vrednost:
XX
Z
SD
Standardizovano odstupanje
Z (zet) vrednost

 Standardizovano odstupanje pokazuje koliko iznosi


odstupanje vrednosti numeričkog obeležja jednog
ispitanika od prosečne vrednosti tog obeležja kod
svih ispitanika izraženo u jedinicama standardne
devijacije.

 Z vrednost može poslužiti za poređenje varijabilnosti


istog obeležja kod različitih ispitanika.
Standardizovano odstupanje
Z (zet) vrednost

 Standardizovano odstupanje svodi pojedinačna


odstupanja svih obeležja na istu mernu jedinicu, tj.
standardnu devijaciju i zbog toga se može koristiti za
poređenje varijabilnosti različitih obeležja kod jednog
ispitanika.
 Z vrednosti za različita obeležja kod jednog
ispitanika se mogu sabrati. Na taj način se jednom
kumulativnom Z vrednošću prikazuje varijabilnost
različitih obeležja.
Standardizovano odstupanje
Z (zet) vrednost

 Primer: U grupi od 10 ispitanika koji imaju skoliozu vrednost


testa stajanja je u proseku iznosila 4510 minuta, a testa
hodanja 1500300 metara.
 Jedan od ispitanika je imao vrednost testa stajanja od 50 min,
a testa hodanja od 1300 m. Drugi ispitanik je imao vrednost
testa stajanja od 40 min, a testa hodanja od 1400 m.
 Koliko su vrednosti testova kod svakog od ovih ispitanika
odstupale od prosečnih vrednosti kod svih ispitanika?
 Koje obeležje je iskazalo veće odstupanje od prosečne
vrednosti kod svakog od ovih ispitanika?
 Koji ispitanik je imao povoljnije rezultate?
Standardizovano odstupanje
Z (zet) vrednost

I ispitanik II ispitanik
Test stajanja
50  45 40  45
Z  0,50 Z  0,50
10 10
Test hodanja
1300  1500 1400  1500
Z  0,67 Z  0,33
300 300
Kumulativna vrednost oba testa
 Z  (0,50)  (0,67)  0,50  0,67  0,17  Z  (0,50)  (0,33)  0,50  0,33  0,83
HVALA NA PAŽNJI

You might also like