Download as pdf or txt
Download as pdf or txt
You are on page 1of 33

STATISTIKA

Numeričke deskriptivne mere

Prof. Dr Slađana Spasić


E-mail: sladjana.spasic@singidunum.ac.rs

Predavanje 3
Numeričke deskriptivne mere
• Mere centralne tendencije podataka
(aritmetička, geometrijska, harmonijska sredina i
druge)

• Pozicione mere podataka (medijana, modus,


kvartili, percentili)

• Mere disperzije podataka (interval varijacije,


varijansa i standardna devijacija, koeficijent
varijacije)
Predavanje 3 / 1
Mere centralne tendencije
• Aritmetička sredina (prosek, srednja vrednost)
skupa je broj koji se izračunava kada se zbir svih
vrednosti obeležja podeli sa ukupnim brojem tih
vrednosti u skupu podataka.

• Definicija: Srednja vrednost (µ) skupa od N


elemenata: x1, x2, ..., xN , za posmatrano obeležje X je


x1  x2  ...  x N

1 N

x  N
x
i
N N i 1

Predavanje 3 / 2
Mere centralne tendencije
• Primer: Ako je na 5 ekonomskih fakulteta broj upisanih
studenata u prvu godinu studija bio 320, 360, 280, 450, 350 tada
je prosečan broj upisanih u prvu godinu EF

320  360  280  450  350 1760


N = 5,    352
5 5

Predavanje 3 / 3
Mere centralne tendencije
• Aritmetička sredina uzorka se označava sa x
• Srednja vrednost uzorka od n elemenata: x1, x2, ..., xn
za posmatrano obeležje X je

x
x1  x2  ...  xn 1 n
  xi 
 x
n n i 1 n
• Ovde je reč o aritmetičkoj sredini negrupisanih
podataka. Svaki podatak se javlja samo jedanput.
Predavanje 3 / 4
Mere centralne tendencije
•Primer: Ako je uzmemo uzorak od 3 ekonomska fakulteta, npr. u užoj Srbiji
broj upisanih studenata u prvu godinu studija bio 360, 450, 350 tada je
prosečan broj upisanih u prvu godinu EF
360  450  350
n = 3, x  386,67
3
• Ali, ako je uzmemo uzorak od 2 ekonomska fakulteta, izvan uže Srbije broj
upisanih studenata u prvu godinu studija bio 320, 280 tada je prosečan broj
upisanih u prvu godinu EF
320  280
n = 2, x  300   352
2
Primetimo da je vrednost µ konstantna, dok se vrednost aritmetičke sredine
uzorka razlikuje od uzorka do uzorka. Ona zavisi od vrednosti koje su
uključene u uzorak. Posebno je osetljiva na ekstremne (najveće i najmanje)
vrednosti i to joj je najveća mana.

Predavanje 3 / 5
Aritmetička sredina grupisanih podataka
• Neka su dati grupisani podaci u vidu tabele frekvencija
sa k grupnih intervala, gde su x1’, x2’, ..., xk’ njihove sredine,
a f1, f2, ..., fk odgovarajuće frekvencije grupnih intervala.
• Aritmetička sredina grupisanih podataka ili ponderisana
aritmetička sredina skupa je
' ' '
f1 x1  f 2 x2  ...  f k xk 1 k

fx
k
  i i
'
N   fi
N N i 1 i 1

• Aritmetička sredina uzorka biće


' ' '
f1 x1  f 2 x 2  ...  f k x k 1 k k
  f i xi n   fi
'
x
n n i 1 i 1

Predavanje 3 / 6
Broj porudžbina Broj dana
Primer: 10 - 12 4
Data je raspodela
frekvencija broja porudžbina 13 - 15 12
koje su pristizale svakog
dana, tokom 50 dana u 16 - 18 18
jedno preduzeće koje se
bavi porudžbinama. 19 - 21 14
22 - 24 2
Izračunati aritmetičku
sredinu broja porudžbina. n = 50

Predavanje 3 / 7 Uvod u teoriju unformacija


Broj Broj x’ x’f Rešenje:
porudžbina dana
Pošto se serija
10 - 12 4 11 44 odnosi na samo 50
dana to je reč o
13 - 15 12 14 168
uzorku.
16 - 18 18 17 306
1 k 844
x   f i xi 
'
 16,88
19 - 21 14 20 280 n i 1 50

22 - 24 2 23 46 Preduzeće je u 50
dana u proseku
n = 50 Σx’f=844 primalo 16,88
porudžbina dnevno.

Predavanje 3 / 8 Uvod u teoriju unformacija


Osobine aritmetičke sredine
1. Aritmetička sredine veća je od najmanje, a manja od
najveće vrednosti posmatranog obeležja: x1<µ<xk
2. Ako je x1=...=xk=a tada µ=a.
3. Zbir odstupanja aritmetičke sredine od vrednosti obeležja
jednak je nuli:
N

x    0
i1
i za negrupisane podatke

 f x '  0
i1
i i
za grupisane podatke

Predavanje 3 / 9
Mere centralne tendencije
• Geometrijska sredina izravnava relativne ili proporcionalne
promene između vrednosti podataka (aritmetička sredina
izravnava apsolutne vrednosti).

• Definicija: Geometrijska sredina (G) skupa od N elemenata:


x1, x2, ..., xN , za posmatrano obeležje X je

G  N x1  x2  ...  x N

Predavanje 3 / 10
Pozicione mere - medijana
• Medijana se odnosi se na poziciju vrednosti u seriji, pa je zato
poziciona mera.

• Medijana je jednaka vrednosti središnjeg člana serije podataka koji su


rangirani u rastućem poretku. Dakle, medijana deli grupisanu seriju
podataka na dva jednaka dela, tako da prva polovina čini manje vrednosti
od medijane, a druga veće.

• Poređajmo seriju podataka od najmanjeg ka najvećem i pronađemo


srednji član te serije. Vrednost tog člana će biti jednaka medijani ukoliko je
broj članova neparan, a ukoliko je paran vrednost medijane će biti
aritmetička sredina dva središnja podataka u seriji.

Predavanje 3 / 11
Pozicione mere - medijana
• Ako vrednosti obeležja X, od n elemenata, poređamo u
neopadajući niz
x1≤ x2 ≤ ... ≤ xn

• Medijana M e  x n 1 ako je n neparan broj


2

1 
M e   x n  x n  ako je n paran broj
2 2 1
2 

Predavanje 3 / 12
Pozicione mere - medijana
• Primer: Ako su podaci o starosti profesora na fakultetu dati sa
56, 63, 46, 48, 42, onda je medijana

42, 46, 48, 56, 63

Ako su podaci o starosti profesora na fakultetu dati sa 56, 63,


46, 48, 42, 52 onda je medijana

42, 46, 48, 52, 56, 63

(48 + 52) / 2 = 50

Predavanje 3 / 13
Pozicione mere - modus
Modus je obeležje u seriji koje ima najveću frekvenciju
pojavljivanja. Najčešće se javlja pa je natipičnija vrednost u seriji.

Serija može biti:


• bez modusa (Primer: 12.3, 23.7, 14.1, 67.8, 34.8)
• unimodalna (sa jednim modusom)
(Primer: Boja kose studenata iz grupe: plava, crna, smeđa, crna, smeđa,
riđa, smeđa, crna, plava, smeđa, smeđa; Mo=smeđa)
• bimodalna (sa dva modusa)
(Primer: Godine starosti studenata iz grupe: 19, 18, 19, 20, 20, 18, 19, 20, 18.5,
20, 19; Mo
su 19 i 20 jer se javljaju po 4 puta)
• multimodalna (sa više modusa)

Predavanje 3 / 14
Veza aritmetičke sredine,
medijane i modusa
35

Vrednosti 30

aritmetičke sredine, 25

medijane i modusa
Frekvencija
20

za simetričan 15

histogram i simetričnu
krivu raspodele
10

frekvencija se
5

poklapaju.
0
1
Promenljiva

aritmetička sredina = medijana = modus

Predavanje 3 / 15
Veza aritmetičke sredine,
medijane i modusa
12

Odnos vrednosti

Frekvenci
10

aritmetičke sredine,
ja
medijane i modusa 8

za histogram i krivu 6

raspodele frekvencija 4

asimetrične udesno.
2

Pažnja: Kod atributivnog 0

obeležja se može odrediti Promenljiva


1

jedino modus. aritmetička sredina


modus medijana

Predavanje 3 / 16
Mere disperzije negrupisanih
podataka
 Mere centralne tendencije, kao što su
aritmetička sredina, medijana i modus, ne
objašnjavaju u potpunosti raspodelu određene
serije podataka.

 Dve serije podataka sa istom aritmetičkom


sredinom mogu imati potpuno različite
raspodele frekvencije, tj. njihova raspršenost
može biti potpuno različita.
Mere disperzije negrupisanih
podataka
• Disperzija, raspršenost, ili rasturanje podataka
• Mere disperzije ukazuju na raspršenost
raspodele.
• To su:
– Interval varijacije
– Varijansa
– Standardna devijacija
– Koeficijent varijacije

Predavanje 3 / 18
Mere disperzije negrupisanih podataka
Interval varijacije je mera raspršenosti koja je jednaka razlici
najveće i najmanje vrednosti u seriji podataka: i = xmax-xmin
Varijansa
 
2  
x   2
Čita se: Sigma na kvadrat !
(disperzija)
N
skupa je
 
2
Varijansa uzorka je xx
2
s 
n 1
Standardna devijacija skupa (uzorka) je pozitivni kvadratni
koren varijanse skupa (uzorka).
Koeficijent varijacije je je odnos standardne devijacije i
aritmetičke sredine tj. V=σ/µ
Predavanje 3 / 19
Radne formule i osobine
Varijansa (disperzija) skupa je Varijansa uzorka je

 x
2
 x
2

x  N
2
 x  n 1
2

2  s 
2

N n 1
Standardna devijacija Standardna devijacija
skupa uzorka
  2 s s 2

Varijansa i standardna devijacija su uvek nenegativne (≥0).


Varijansa = 0 akko x1= x2= …= xN = const.
Koeficijent varijacije = 0 akko x1= x2= …= xN = const.
Predavanje 3 / 20
Mere disperzije
Primer: Izračunati interval varijacije, xi xi2
koeficijent varijacije, varijansu i
standardnu devijaciju za skup: -9 81
5, -7, 2, 0, -9, 16, 10, 7. -7 49
N =8 0 0
i = xmax-xmin = 16 - (-9) = 25
2 4
 x
2
576 5 25
x  N
2
564 
8  61,5
2   7 49
N 8
10 100
    61,5  7,84
2
16 256
V   /   7,84 / 3  2,61  x  2
576 564  x2

Predavanje 3 / 21
Mere disperzije
Primer: Izračunati interval varijacije, koeficijent varijacije,
varijansu i standardnu devijaciju za uzorak:
14, 18, -10, 8, 8, -16.
xi xi2
n =6
i = xmax-xmin = 18 - (-16) = 34 -16 256
-10 100
 x
2
484
 x  n 1
2
1006 
5  181 ,84 8 64
s2  
n 1 5 8 64
14 196
s  s  181,84  13,48
2
18 326
V  s / x  13,48/ 3,67  3,67  x  2
484 1006  x2

Predavanje 3 / 22
Mere disperzije grupisanih podataka
Varijansa grupisanog skupa je
 fx 
' 2

f x   
'2 i i
fx

2

'
i i
 2
 i i N
N N
Varijansa grupisanog uzorka je
 fx 
' 2

f x  
'2 i i
f i xi 

' 2
i i x n
s 2

n 1 n 1
gde je σ 2 varijansa skupa, s2 varijansa uzorka,
xi’ sredina intervala.
Predavanje 3 / 23
Primer

Primer: Data je tabela raspodele frekvencija vremena (min) koje


svi zaposleni jednog preduzeća provode u putu do posla.
Izračunati varijansu i standardnu devijaciju.

Vreme provedeno Broj zaposlenih


u putu (min)
0 – 10 4
10 – 20 9
20 – 30 6
30 – 40 4
40 – 50 2

Predavanje 3 / 24
Primer

xi - xi+1 f x’ f x’ f x’2
0 – 10 4 5 20 100
10 – 20 9 15 135 2025
20 – 30 6 25 150 3750
30 – 40 4 35 140 4900
40 – 50 2 45 90 4050
Σ N=25 Σ f x’= Σ f x’2=
535 14825

Varijansa  fx 
' 2
5352
fx '2
i i 
N
i i
14825 
25  3376  135,04
2  
N 25 25
Standardna
devijacija    2  135,04  11,62 min
Predavanje 3 / 25
Primer

Primer: Data je tabela raspodele frekvencija broja


porudžbina koje su u poslednjih 50 dana pristizale u
preduzeće. Izračunati varijansu i standardnu devijaciju.

Broj porudžbina f
10 – 12 4
13 – 15 12
16 – 18 20
19 – 21 14

Predavanje 3 / 26
Primer

xi - xi+1 f x’ f x’ f x’2
10 – 12 4 11 44 484
13 – 15 12 14 168 2352
16 – 18 20 17 340 5780
19 – 21 14 20 280 5600
Σ n =50 Σ f x’= Σ f x’2=
832 14216
Varijansa  fx 
' 2
832 2
fx '2
i i  i i

n
14216 
50  371,52  7,58
s2  
n 1 49 49
Standardna
devijacija s  s 2  7,58  2,75 porudžbina
Predavanje 3 / 27
Parametri osnovnog skupa i
statistike uzorka
Numeričke mere kao što su aritmetička sredina,
medijana, modus, interval varijacije, varijansa i
standardna devijacija koje su izračunate za
osnovni skup zovu se parametri skupa ili
samo parametri.
Deskriptivna mera koja se izračunava na uzorku
naziva se statistika uzorka ili statistika.

Predavanje 3 / 28
Osnovni skup Uzorak

Parametri Statistike
µ x
σ2 s2
σ s

15. 3. 2011. Beograd Predavanje 3 / 29


Pozicione mere podataka
• Pozicione mere podataka (medijana,modus, kvartili, percentili)

• Kvartili su tri deskriptivne mere Q1, Q2, Q3 koje dele rangiranu


seriju podataka na četiri jednaka dela.

• Interkvartilna razlika je iq= Q3 - Q1

25% 25% 25% 25%

Q2 =Me
xmin Q1 drugi kvartil Q3 xmax
prvi kvartil treći kvartil

15. 3. 2011. Beograd Predavanje 3 / 30


Pozicione mere podataka
• Percentili su deskriptivne mere koje dele seriju podataka
rangiranu po veličini na 100 jednakih delova.

• Ima ih 99 : P1, P2,...,P98, P99

1% 1% ... 1%

xmin P1 prvi P2 drugi P99


xmax
prcentil percentil 99-ti percentil

Predavanje 3 / 31
Podsećanje

Numeričke deskriptivne mere

• Mere centralne tendencije podataka (aritmetička,


geometrijska, harmonijska sredina)

• Mere disperzije podataka (interval varijacije, koeficijent


varijacije, varijansa i standardna devijacija)

• Pozicione mere podataka (medijana,modus, kvartili,


percentili)

Predavanje 3 / 32

You might also like