Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 48

Mere varijabilnosti

prof. dr Dragan Bogdanović


Mere varijabilnosti
 Svako živo biće je jedinstveno, odnosno razlikuje se od
svih drugih bića.
 I ne samo da se razlikuje od drugih bića, nego se i ono
samo tokom života neprestano menja.
 Upravo su te razlike i promene, odnosno varijabilnost,
predmet interesovanja statistike.
 Da bi opis numeričkih podataka bio potpun potrebno je
pored mera centralne tendencije prikazati i mere
varijabilnosti, odnosno statističke parametre koji ukazuju
na stepen razlika koje postoje između vrednosti
ispitivanih obeležja.
Interval varijacije
 Najjednostavnija mera varijabilnosti
 Jednak je razlici između najveće (maksimalne) i najmanje
(minimalne) vrednosti niza numeričkih podataka
 Može biti korisna mera varijabilnosti jer je lako razumljiv
 Najveći nedostatak je taj što zavisi samo od dve vrednosti
niza
 Ne koristi se samostalno već se uz njega prikazuje još neka
od mera varijabilnosti
 Primer: Interval varijacije za vrednosti 1, 4, 6, 12, 15, 19 i 26
iznosi: 26-1=25.
Kvartili
 Vrednosti koje dele niz podataka sređenih po veličini na četiri
jednaka dela nazivaju se kvartili
 Obeležavaju se sa Q1, Q2, Q3 i Q4
 Medijana predstavlja drugi kvartil, a najviša vrednost niza
predstavlja četvrti kvartil.
 Mesta prvog i trećeg kvartila određuju se po formulama:

N 1 3  N  1
Mesto Q1  Mesto Q3 
4 4
Kvartili
 Ukoliko primenom formule za utvrđivanje mesta kvartila dobijemo
ceo broj, onda je kvartil jednak vrednosti čiji je to redni broj.

 U slučaju da je rezultat formule decimalni broj, izračunava se


aritmetička sredina dve susedne vrednosti čiji su redni brojevi oni
celi brojevi koji okružuju taj decimalni broj.

 Na primer za mesto Q1=5,3 vrednost Q1 je aritmetička sredina pete


i šeste vrednosti u nizu.
Kvartili
 Prikazivanje vrednosti Q1 i Q3 daje korisnu informaciju u
slučajevima kada između vrednosti obeležja postoji velika
varijabilnost, odnosno kada se kao mera centralne tendencije koristi
medijana, jer se između Q1 i Q3 nalazi 50% središnjih vrednosti
niza.

 Interkvartilna razlika je mera varijabilnosti koja predstavlja razliku


između vrednosti trećeg i prvog kvartila: Q3 - Q1, ali njena upotreba
nije česta.
Kvartili
 U primeru programa vežbi za gubitak prekomerne telesne težine
kod 10 ispitanika vrednosti Q1 i Q3 i interkvartilnu razliku bi
uzračunali na sledeći način:

Gubitak
Ispitanik
težine (kg)
1 0
2 1 11
10  1 3 1 Vrednost Q1  1
Mesto Q1   2,75 2
4 4 1
5 1
3 4
3 10  1 6 2 Vrednost Q3   3,5
Mesto Q3   8, 25 7 2 2
4
8 3
9 4 Q3  Q1  3,5  1  2,5
10 5
Percentili
 Percentili dele niz podataka sređenih po veličini na sto jednakih
delova, odnosno na procente.
 Oni se koriste za određivanje položaja pojedinca u grupi, kao i za
kvantitativno klasifikovanje i kategorisanje ispitanika u grupi ili
populaciji.
 Percentili se obeležavaju sa Pk, gde je k ceo broj od 1 do 100. Na
primer, 25-ti percentil se označava sa P25.

 Pk se može definisati kao vrednost u seriji podataka, takva da je k%


vrednosti manje od vrednosti Pk, a (100 - k)% vrednosti je veće od
vrednosti Pk.
Percentili
 Na primer, P30 deli seriju na 30% vrednosti koje su
manje i 70% vrednosti koje su veće od vrednosti P30.

 Medijana predstavlja P50, prvi kvartil predstavlja P25, a


treći kvartil predstavlja P75.
Percentili
 Kao i kod određivanja vrednosti kvartila, kod određivanja vrednosti
percentila neophodno je prvo odrediti mesto percentila, odnosno
redni broj ispitanika u sređenom nizu čija vrednost ispitivanog
obeležja predstavlja vrednost traženog percentila.
 Mesto k-tog percentila je: k n
Mesto Pk 
100
gde je sa k označen broj percentila, a n predstavlja veličinu
uzorka. Odatle, približna vrednost Pk iznosi:

kn
Pk = Vrednost   -tog člana u rangiranoj seriji podataka
 100 
Percentili
 Primer: Procenjivan je kvalitet života kod 15 studenata
Flanaganovom skalom čiji se ukupan skor (zbir bodova) kreće od 15
(najgori mogući kvalitet života) do 75 (najbolji mogući kvalitet života)
i dobijeni su sledeći rezultati:
72 70 65 52 71 58 66 68 64 70 69 67 63 60 65

 Želimo da znamo koja je vrednost 30. percentila (P30).


Percentili
 U prvom koraku sredimo niz podataka po veličini, od najmanje do
najveće vrednosti i svakoj vrednosti dodelimo redni broj:

R. br. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Skor 52 58 60 63 64 65 65 66 67 68 69 70 70 71 72

 U drugom koraku izračunamo mesto P30:


30  15
Mesto P30   4,5
100
 Kako se mesto P30 nalazi između četvrte i pete vrednosti skorova
koje iznose 63 i 64, vrednost P30 izračunavamo kao aritmetičku
sredinu ova dva skora:
Percentili
63  64
P30   63,5
2
 Prema tome, 30. percentil vrednosti skorova za procenu kvaliteta
života kod naših ispitanika iznosi 63,5.

 To znači da 30% svih skorova ima nižu vrednost od 63,5, a 70%


skorova ima veću vrednost od 63,5.
Percentili
 Percentilni rang predstavlja mesto određene vrednosti u nizu na
procentnoj skali, odnosno mesto određenog ispitanika na toj skali
koje on zauzima na osnovu vrednosti obeležja.
 Percentilni rang za neku određenu vrednost x iz sređene serije
izračunavamo po formuli:
broj vrednosti koje su manje od x
PRx   100
n
gde je n veličina uzorka.
Percentili
 Koji je percentilni rang skora kvaliteta života koji iznosi 67 u našem
primeru?
R. br. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Skor 52 58 60 63 64 65 65 66 67 68 69 70 70 71 72
 Vrednost skora od 67 se nalazi pod rednim brojem 9, što znači da 8
skorova ima manju vrednost. Uzorak broji 15 ispitanika. Odatle:
8
PR67   100  53,33  53
15
 Možemo tvrditi da je oko 53% od ovih 15 studenata imalo skor
kvaliteta života manji od 67, dok je 47% studenata imalo skor od 67
ili više.
Standardna devijacija
 Zbir odstupanja svih pojedinačnih izmerenih vrednosti od
aritmetičke sredine jednak je nuli.
 Da bi odredili koliko iznosi prosečno odstupanje svih vrednosti niza
od aritmetičke sredine, neophodno je kvadrirati razlike između
svake pojedinačne vrednosti niza i aritmetičke sredine, kako bi se
izgubio negativni predznak kod onih razlika koje su manje od nule.
 Zatim se svi kvadrati razlika podele brojem izmerenih vrednosti. Na
taj način izračunava se varijansa, koja predstavlja prosečno
kvadratno odstupanje svih vrednosti niza od aritmetičke sredine:

 X X
2

SD 2


N
Standardna devijacija
 Kvadratni koren iz vrednosti varijanse predstavlja prosečno
odstupanje svih vrednosti niza od aritmetičke sredine i naziva se
standardna devijacija.

 Ona predstavlja najvažniju i najčešće korišćenu meru varijabilnosti,


označava se sa SD, a formula za njeno izračunavanje glasi:

 X  X 
2

SD 
N
Standardna devijacija
 Kako bi se dobila preciznija procena, kod
malih uzoraka (N<100) varijansa i standardna
devijacija se računaju po formulama:

 X  X 
2

 X X
2

SD 2 
 SD 
N 1 N 1
Standardna devijacija
 Primer: Merena su vremena trčanja na 100 metara kod 5 atletičarki:

Vreme (sec)
X  X 
2
Ispitanica X X
X
1 11,01 -0,15 0,0225
2 11,32 0,16 0,0256
3 11,09 -0,07 0,0049
4 11,25 0,09 0,0081
5 11,13 -0,03 0,0009

 X  X 
2

 X  55,8  0,062
55,8
 
2
X  11,16 XX 0,062
5 SD    0,12
N 1 5 1
Standardna devijacija
 Standardna devijacija u obzir uzima sve vrednosti niza.
 Iskazuje se u istim mernim jedinicama kao i izmerene vrednosti.
 Prikazuje se obično odmah iza aritmetičke sredine i to sa
predznakom plus-minus (±).

 U našem primeru dobijene rezultate možemo prikazati jednostavnim


iskazom:

Pet ispitivanih atletičarki je 100 metara u proseku istrčalo za


11,16±0,12 sekundi.
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima
 Kada su podaci prikazani u obliku distribucije frekvencija sa
grupnim intervalima, primenjuju se sledeće formule za
izračunavanje varijanse i standardne devijacije:

f X   f X 
2 2

SD 2

 i X
SD 
i X
N N
Gde su:
f - frekvencija svakog pojedinačnog grupnog intervala,
Xi - sredina (aritmetička sredina) grupnog intervala,
X - aritmetička sredina celog niza,
N - ukupan broj ispitanika.
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima
 Primer sa vremenom koje 25 zaposlenih u jednom preduzeću
svakodnevno provedu u putovanju od kuće do radnog mesta

X   
2 2
Vreme (X) Xi f Xi  f Xi  X i X f  Xi  X
0 do 9 5,0 4 20,0 -16,4 268,96 1075,84
10 do 19 15,0 9 135,0 -6,4 40,96 368,64
20 do 29 25,0 6 150,0 3,6 12,96 77,76
30 do 39 35,0 4 140,0 13,6 184,96 739,84
40 do 49 45,0 2 90,0 23,6 556,96 1113,92
 25 535,0 3376,00
535
X  21, 4
25
Standardna devijacija za distribuciju
frekvencija sa grupnim intervalima
 Sada imamo sve elemente potrebne za primenu formula:

f X 
2

SD 2

 i X

3376,0
 140,67
N 1 24
 Varijansa iznosi 134,96 minuta, a standardna devijacija je:

SD  140,67  11,86
 Možemo da zaključimo da naših 25 ispitanika u proseku
svakodnevno provedu u putovanju od kuće do radnog mesta
21,40±11,86 minuta.
Koeficijent varijacije
 Koeficijent varijacije je relativna mera varijabilnosti koja
omogućava poređenje varijabilnosti kod različitih
obeležja.

 On predstavlja odnos između standardne devijacije i


aritmetičke sredine izražen u procentima:

SD
CV   100
X
Koeficijent varijacije
 Primer: U grupi od 10 ispitanika prosečna visina iznosi 174±8cm, a
prosečna težina 70±6kg. Koje obeležje iskazuje veću varijabilnost?
 Koeficijent varijacije za visinu iznosi:
8
 100  4,60%
174
 Koeficijent varijacije za težinu iznosi:
6
 100  8,57%
70
Koeficijent varijacije
 U slučajevima kada je vrednost koeficijenta varijacije
veći od 30% ispravnije je kao meru centralne tendencije
koristiti medijanu, a ne aritmetičku sredinu.

 Tada se u sažetom prikazivanju rezultata umesto


vrednosti aritmetičke sredine i standardne devijacije
koristi medijana, a odmah iza nje u zagradi minimalna i
maksimalna vrednost niza:
Med (Min-Max)
Standardizovano odstupanje
Z (zet) vrednost
 Odstupanje jedne pojedinačne vrednosti od prosečne
vrednosti nekog obeležja možemo prikazati apsolutnom
razlikom između te vrednosti i aritmetičke sredine.
 U praksi se češće koristi relativna mera varijabilnosti
koja predstavlja odnos između apsolutne razlike i
standardne devijacije, a naziva se standardizovano
odstupanje i obeležava se kao Z vrednost:

XX
Z
SD
Standardizovano odstupanje
Z (zet) vrednost
 Standardizovano odstupanje pokazuje koliko iznosi
odstupanje vrednosti numeričkog obeležja jednog
ispitanika od prosečne vrednosti tog obeležja kod svih
ispitanika izraženo u jedinicama standardne devijacije.

 Z vrednost može poslužiti za poređenje varijabilnosti


istog obeležja kod različitih ispitanika.
Standardizovano odstupanje
Z (zet) vrednost
 Standardizovano odstupanje svodi pojedinačna
odstupanja svih obeležja na istu mernu jedinicu, tj.
standardnu devijaciju i zbog toga se može koristiti za
poređenje varijabilnosti različitih obeležja kod jednog
ispitanika.
 Z vrednosti za različita obeležja kod jednog ispitanika se
mogu sabrati. Na taj način se jednom kumulativnom Z
vrednošću prikazuje varijabilnost različitih obeležja.
Standardizovano odstupanje
Z (zet) vrednost
 Primer: U grupi od 10 ispitanika koji imaju skoliozu vrednost testa
stajanja je u proseku iznosila 4510 minuta, a testa hodanja
1500300 metara.
 Jedan od ispitanika je imao vrednost testa stajanja od 50 min, a
testa hodanja od 1300 m. Drugi ispitanik je imao vrednost testa
stajanja od 40 min, a testa hodanja od 1400 m.
 Koliko su vrednosti testova kod svakog od ovih ispitanika odstupale
od prosečnih vrednosti kod svih ispitanika?
 Koje obeležje je iskazalo veće odstupanje od prosečne vrednosti
kod svakog od ovih ispitanika?
 Koji ispitanik je imao povoljnije rezultate?
Standardizovano odstupanje
Z (zet) vrednost

I ispitanik II ispitanik
Test stajanja
50  45 40  45
Z  0,50 Z  0,50
10 10
Test hodanja
1300  1500 1400  1500
Z  0,67 Z  0,33
300 300
Kumulativna vrednost oba testa
 Z  (0,50)  (0,67)  0,50  0,67  0,17  Z  (0,50)  (0,33)  0,50  0,33  0,83
PITANJA I ODGOVORI
Zadatak
11 studenata je na ispitu iz statistike dobilo sledeće ocene:
5, 6, 6, 7, 7, 7, 8, 8, 8, 9, 10
Izračunati:
aritmetičku sredinu,
medijanu,
interval varijacije,
interkvartilnu razliku,
vrednost 90-og percentila,
standardnu devijaciju i
koeficijent varijacije.
Rešenje
X 5  6  6  7  7  7  8  8  8  9  10 81
X     7,36
N 11 11

Mesto medijane = (N+1)/2 = 12/2 = 6


5, 6, 6, 7, 7, 7, 8, 8, 8, 9, 10
Med = 7

Interval varijacije = Max-Min = 10-5 = 5


N  1 11  1
Mesto Q1   3
4 4
3  ( N  1) 3  (11  1) 36
Mesto Q3    9
4 4 4

5, 6, 6, 7, 7, 7, 8, 8, 8, 9, 10

Interkvartilna razlika = Q3-Q1 = 8-6 = 2


90  11 990
Mesto P90    9,9
100 100

5, 6, 6, 7, 7, 7, 8, 8, 8, 9, 10

89
P90   8,5
2
X  X 
2
Redni broj Ocena X X
1 5 5-7,36=-2,36 5,57
2 6 6-7,36=-1,36 1,85
3 6 6-7,36=-1,36 1,85
4 7 7-7,36=-0,36 0,13
5 7 7-7,36=-0,36 0,13
6 7 7-7,36=-0,36 0,13
7 8 8-7,36=0,64 0,41
8 8 8-7,36=0,64 0,41
9 8 8-7,36=0,64 0,41
10 9 9-7,36=1,64 2,69
11 10 10-7,36=2,64 6,97
Σ 81 20,55

 
2
 X X 20,55
SD    2, 05  1, 41
N 1 10
SD 1, 41
Cv   100   100  0,19  100  19%
X 7,36
Zadatak
Na prijemnom ispitu za studije sporta i fizičkog vaspitanja 10 kandidata
je uradilo sledeći broj zgibova:
9, 11, 12, 10, 15, 20, 13, 14, 10, 18
Izračunati:
aritmetičku sredinu,
medijanu,
interval varijacije,
interkvartilnu razliku,
vrednost 20-og percentila,
standardnu devijaciju i
koeficijent varijacije.
Rešenje

X 9  11  12  10  15  20  13  14  10  18 132
X     13, 2
N 10 10
Mesto I centralnog člana = N/2 = 10/2 = 5
Mesto II centralnog člana = (N+2)/2 = 12/2 = 6
9, 10, 10, 11, 12, 13, 14, 15, 18, 20
Med = (12+13)/2 = 12,5

Interval varijacije = Max-Min = 20-9 = 11


N  1 10  1
Mesto Q1    2, 75
4 4

3  ( N  1) 3  (10  1)
Mesto Q3    8, 25
4 4

9, 10, 10, 11, 12, 13, 14, 15, 18, 20


Q1=(10+10)/2=10
Q3=(15+18)/2=16,5

Interkvartilna razlika = Q3-Q1 = 8,5-6 = 2,5


20  10 200
Mesto P20   2
100 100

9, 10, 10, 11, 12, 13, 14, 15, 18, 20


Broj
 
2
Redni broj X X X X
zgibova
1 9 9-13,2=-4,2 17,64
2 10 10-13,2=-3,2 10,24
3 10 10-13,2=-3,2 10,24
4 11 11-13,2=-2,2 4,84
5 12 12-13,2=-1,2 1,44
6 13 13-13,2=-0,2 0,04
7 14 14-13,2=0,8 0,64
8 15 15-13,2=1,8 3,24
9 18 18-13,2=4,8 23,04
10 20 20-13,2=6,8 46,24
Σ 132 117,6

 
2
 X X 117, 6
SD    13, 07  3, 6
N 1 9

SD 3, 6
Cv   100   100  0, 27  100  27%
X 13, 2
Zadatak
Na prijemnom ispitu za studije sporta i fizičkog
vaspitanja 25 prijavljenih kandidata je postiglo
sledeće prosečne rezultate:
Plivanje na 50 m Trčanje na 100 m
34±3 sec 12,6±0,5 sec
Koji od dva kandidata je imao bolje rezultate?

Kandidat Plivanje na 50 m Trčanje na 100 m


A 33 12,0
B 30 12,3
Rešenje

XX
Z
A SD
Z plivanje = (33-34)/3 = -0,33
Z trčanje = (12-12,6)/0,5 = -1,2
Z ukupno = -0,33-1,2 = -1,53

B
Z plivanje = (30-34)/3 = -1,33
Z trčanje = (12,3 -12,6)/0,5 = -0,6
Z ukupno = -1,33-0,6 = -1,93
Zadatak
Kada bi predhodnom zadatku pridodali i rezultat sa skoka u
dalj iz mesta, kako bi tada računali ukupnu Z vrednost za
kandidate?
Plivanje na 50 m Skok u dalj iz mesta Trčanje na 100 m
34±3 sec 252±12 cm 12,6±0,5 sec

Koji od dva kandidata je imao bolje rezultate?

Kandidat Plivanje na 50 m Skok u dalj iz mesta Trčanje na 100 m


A 33 255 12,0
B 30 253 12,3
Rešenje

X X
A Z
Z plivanje = (33-34)/3 = -0,33
SD
Z skok = (255-252)/12 = 0,25
Z trčanje = (12-12,6)/0,5 = -1,2
Z ukupno = -0,33-0,25-1,2 = -1,78

B
Z plivanje = (30-34)/3 = -1,33
Z skok = (253-252)/12 = 0,08
Z trčanje = (12,3 -12,6)/0,5 = -0,6
Z ukupno = -1,33-0,08-0,6 = -2,01
Zadatak
Prosečno vreme studiranja osnovnih studija na
nekom fakultetu iznosi 5,5±0,6 godina, a prosečna
ocena diplomiranih studenata je 7,5±0,8.
Naš prvi ispitanik je diplomirao posle 5,0 godina sa
prosečnom ocenom 8,0, dok je drugi ispitanik
diplomirao posle 6,0 godina sa prosečnom
ocenom 9,0.
Koji od dva ispitanika je bio bolji student?
Rešenje
X X
Z
SD
I
Z dužina studiranja = (5-5,5)/0,6 = -0,83
Z prosečna ocena = (8-7,5)/0,8 = 0,62
Z ukupno = 0,83+0,62 = 1,45

II
Z dužina studiranja = (6-5,5)/0,6 = 0,83
Z prosečna ocena = (9-7,5)/0,8 = 1,87
Z ukupno = -0,83+1,87 = 1,04

You might also like