Download as pdf or txt
Download as pdf or txt
You are on page 1of 58

VJEŽBE 1

DESKRIPTIVNA STATISTIKA
Klasifikacija varijabli i uređivanje podataka
STATISTIČKI SKUP
 Sastoji se od jedinica kojima se ispituje
svojstvo/svojstva koja od jedinice do jedinice
očituju statističku promjenljivost

 Opseg skupa = broj jedinica skupa

Konačan
skup
Opseg
skupa
Beskonačan
skup
STATISTIČKA POPULACIJA I
STATISTIČKI UZORAK

 Podaci o danoj varijabli za svaki element statističkog


skupa tvore skup podataka koji se naziva
STATISTIČKOM POPULACIJOM ili OSNOVNIM
SKUPOM

 Podskup statističkog skupa naziva se


STATISTIČKIM UZORKOM

 Definirani :
pojmovno
prostorno
vremenski
STATISTIČKI SKUP
 tvore ga statističke jedinice koje imaju slična zajednička
svojstva
 mora biti precizno definiran pojmovno, prostorno i
vremenski

Npr. statistički skup Djelatnici u malim poduzećima u


Republici Hrvatskoj 01.06.2011. godine

pojmovno • djelatnici

prostorno • mala poduzeća u RH

vremenski • 01. 06. 2011. godine


STATISTIČKI SKUP
Primjer
Studenti preddiplomskog stručnog studija
Menadžment Veleučilišta u Šibeniku ak. godina
2013./2014.

Podskup: studenti druge godine


STATISTIČKI SKUP – BESKONAČNI
SKUPOVI

Primjer
Broj prijavljenih kvarova u jamstvenom roku
uređaja SimSang.
Hipotetski, prijavljenih kvarova može biti 0,1,2,3,…
(radi se o beskonačnom skupu)

Primjer
Vrijeme opsluživanja stranke na šalteru.
KLASIFIKACIJA VARIJABLI

VARIJABLE/

VJEŽBE 1
PODACI

KVANTITATIVNE KVALITATIVNE
(NUMERIČKE) (KATEGORIJALNE)

DISKRETNE KONTINUIRANE
KVALITATIVNI PODACI
 Prema definiranim kategorijama/atributima

 Primjer
 Bračno stanje
 Političko opredjeljenje
 Stupanj stručne spreme

 NAD KVALITATIVNIM PODACIMA


NISU DOZVOLJENE NUMERIČKE
OPERACIJE
KVANTITATIVNI PODACI

DISKRETNI KONTINURANI

 Prebrajaju se  Mjerne karakteristike

 Primjer  Primjer
 Broj djece  Težina
 Kvarovi po satu  Cijene
 Broj prigovora  Prihod
PODACI S OBZIROM NA MJERNE
SKALE

1. NOMINALNI

2. ORDINALNI

3. INTERVALNI

4. OMJERNI
PODACI S OBZIROM NA MJERNE
SKALE
NOMINALNI PODACI
 Opisno svojstvo
 Atributivna ili zemljopisna

 Nisu dozvoljene računske operacije

 Nije definiran uređaj (<,>)

 Mogu se svrstavati u kategorije (u slučaju velikog


broja pojavnih oblika)

 Primjer
 Bračno stanje
 Narodnost
 Zanimanje
 Zemljopisna pripadnost
 nomenklature
PRIMJER NOMENKLATURE

 Nomenklatura=uređeni popisi kategorija


nominalne varijable kojima se pripisuje šifra
 Primjer : NKD 2007
PODACI S OBZIROM NA MJERNE
SKALE
ORDINALNI PODACI
 Ordinalni ili redoslijedni
 Izražava se redoslijed ili intenzitet nekog obilježja

 Nisu dozvoljene računske operacije ali je definiran


uređaj (<,>)

 Primjer
 Stupanj stručne spreme
 Stupanj ekonomske aktivnosti
 Kreditni rejting
 Rangiranje 5 proizvoda prema zadovoljstvu: 1 najbolji, 5
najgori. Ne znamo koliko je najbolji proizvod bolji od
najgoreg. Znamo samo da je bolji (uređaj).
PODACI S OBZIROM NA MJERNE
SKALE
INTERVALNI PODACI
 Podaci mjereni na skali za koju je karakteristično
da su jednake razlike u brojevima jednake
razlikama u mjerenom svojstvu
 Dogovoren položaj nule
 Mogu biti uključene računske operacije

 Primjer
 Temperaturna ljestvica
 Vrijeme: ne možemo reći da je 10:00 sati dvostruko dugo
kao i 05:00 ujutro, ali možemo reći da je interval od 00:00
sati do 05:00 sati jednako dug kao i interval od 05:00 sati do
10:00 sati.
 Likertova skala („izrazito se slažem”, „slažem se”, „niti se
slažem niti ne slažem” , „ne slažem se” i „izrazito se ne
slažem”)
PODACI S OBZIROM NA MJERNE
SKALE
OMJERNI PODACI
 Brojevi čije jednake razlike predstavljaju jednake
razlike u mjerenom svojstvu
 Nula na omjernoj skali označava nepostojanje
svojstva

 Količine (kg, g), udaljenosti (km, m), novčane


vrijednosti (kn, $)

 Radi se o numeričkim podacima koji mogu biti


kontinuirani i diskretni
VRSTE PODATAKA – MJERNE SKALE

PODACI

KVANTITATIVNI
KVALITATIVNE
(brojčani)

BROJČANI NEBROJČANI
INERVALNI OMJERNI
KODOVI KODOVI

NOMINALNI ORDINALNI NOMINALNI ORDINALNI


DAKLE….
VRSTE OBILJEŽJA (VARIJABLI)

NOMINALNA atributivna pokazuje svojstvo (atribut)


jedinice
npr. vrsta proizvoda,
proizvođač, boja proizvoda,
zanimanje
pokazuje povezanost npr. mjesto rođenja,
zemljopisna jedinice s nekim područje prodaje, sjedište
prostorom firme
pridruženi su brojevi, npr. ocjena razvijenosti
REDOSLIJED - slovne oznake ili simboli zemlje, stručna sprema
NA elementima statističkog
skupa prema intenzitetu
ili svojstva
ORDINALNA
INTERVALNA - brojevi su pridruženi
mjernim svojstvima
npr. temperaturne skale,
Likertova skala
elemenata

OMJERNA ili diskretne broje se, ima ih konačan npr. broj proizvedenih
broj ili prebrojivo mnogo komada, broj vrata na
NUMERIČKA automobilu, broj
reklamacija, navršene
godine života
mjere se, mogu poprimiti npr. starost, visina, težina,
kontinuiran bilo koju vrijednost u cijene
e nekom intervalu
ZADATAK.
U istraživanju potrošnje kućanstava su korištene sljedeće varijable:

 Spol ispitanika
 prebivalište ispitanika
 stručna sprema ispitanika
 broj članova kućanstva, prosječna potrošnja na hranu
 prosječna primanja kućanstva
 rangiranje potrošnje u odnosu na prošlu godinu („više”,
„manje”,”jednako”)
 vrijeme kada je intervju započet

Za zadane varijable odredite radi li se o kvantitativnim ili


kvalitativnim varijablam te odredite pripadajuću mjernu skalu.
ZADATAK - NASTAVAK
Varijabla
Spol ispitanika
Prebivalište ispitanika

Stručna sprema
ispitanika

Broj članova
kućanstva
Prosječna potrošnja na
hranu

Prosječna primanja

Rangiranje
Vrijeme kada je
intervju započet

Trajanje intervjua
ZADATAK - RJEŠENJE
Rješenje.
Varijabla
Spol ispitanika Kvalitativna nominalna
Prebivalište ispitanika Kvalitativna nominalna
Stručna sprema ispitanika Kvalitativna ordinalna
Broj članova kućanstva Kvantitativna omjerna
Prosječna potrošnja na hranu Kvantitativna omjerna
Prosječna primanja Kvantitativna omjerna
Rangiranje Kvalitativna ordinalna
Vrijeme kada je intervju Kvantitativna Intervalna
započet
Trajanje intervjua Kvantitativna omjerna
UREĐIVANJE KVALITATIVNIH
PODATAKA

VJEŽBE 1
Kvalitativni
podaci

Grafičko Tablično
prikazivanje prikazivanje
podataka podataka

Stupčani
Strukturni Paretov Distribucija
grafikon
krug grafikon frekvencija
JEDNOSTAVNE STATISTIČKE TABLICE

 prikazuju samo jednu pojavu, jedan statistički niz, kada


je grupiranje provedeno prema jednom obilježju

Učenici i studenti koji su završili školovanje u RH xxxx godine


VRSTA ŠKOLE BROJ OSOBA
Osnovna škola 53213
Srednja škola 49039
Stručni studij 4618
Sveučilišni studij 8820
ukupno

Izvor: Statistički ljetopis xxxx godine, str. xx


ZADATAK 1.
U istraživanju potrošnje kućanstava su korištene sljedeće varijable:

 Spol ispitanika
 prebivalište ispitanika
 stručna sprema ispitanika
 broj članova kućanstva, prosječna potrošnja na hranu
 prosječna primanja kućanstva
 rangiranje potrošnje u odnosu na prošlu godinu („više”,
„manje”,”jednako”)
 vrijeme kada je intervju započet

Za zadane varijable odredite radi li se o kvantitativnim ili


kvalitativnim varijablam te odredite pripadajuću mjernu skalu.
ZADATAK - NASTAVAK
Varijabla
Spol ispitanika
Prebivalište ispitanika

Stručna sprema
ispitanika

Broj članova
kućanstva
Prosječna potrošnja na
hranu

Prosječna primanja

Rangiranje
Vrijeme kada je
intervju započet

Trajanje intervjua
ZADATAK 1
Rješenje.
Varijabla
Spol ispitanika Kvalitativna nominalna
Prebivalište ispitanika Kvalitativna nominalna
Stručna sprema ispitanika Kvalitativna ordinalna
Broj članova kućanstva Kvantitativna omjerna
Prosječna potrošnja na hranu Kvantitativna omjerna
Prosječna primanja Kvantitativna omjerna
Rangiranje Kvalitativna ordinalna
Vrijeme kada je intervju Kvantitativna Intervalna
započet
Trajanje intervjua Kvantitativna omjerna
SKUPNE STATISTIČKE TABLICE

 dva ili više statističkih nizova su grupirani prema jednom


obilježju

Učenici i nastavnici prema školskim ustanovama školske godine


XXXX
ŠKOLE UČENICI/STUDENT NASTAVNIC
I I
Srednje škole 170307 864
Stručni studij 12804 148
Sveučilišni studij 38129 319
ukupno

Izvor: Statistički ljetopis xxxx godine, str. xx


KOMBINIRANE STATISTIČKE TABLICE

 prikazan je jedan statistički niz promatran prema dva ili


više obilježja

Studenti prema statusu studiranja i studijskim godinama ak. god.


xxxx Status studiranja
Godina
studija Izvanredni Redoviti

Prva godina 250 850


Druga godina 160 700
Treća godina 100 550
Ukupno 510 2100

Izvor: Statistički ljetopis xxxx godine, str. xx


STATISTIČKI NIZ
- nastaje uređivanjem statističkih podataka
- vrste nizova: a) nominalni, ordinalni, numerički i
intervalni
b) negrupirani, grupirani

NEGRUPIRANI GRUPIRANI
Podaci se
Podaci su
prikazuju u
zapisani
tablicama
slijedom kojim
distribucije
su i prikupljani
frekvencija
TABELIRANJE
 Tabeliranje statističkih podataka ima za cilj da na jasan, cjelovit i
pregledan način prezentira rezultate prikupljanja i grupiranja
statističkih podataka
OBILJEŽJA (VARIJABLE)
 su svojstva po kojima su jedinice statističkog skupa
međusobno slične ili po kojima se razlikuju
 svako se obilježje javlja u više modaliteta uz koje se vežu
frekvencije kao numerički izraz intenziteta pojavnosti
pojedinog modaliteta u promatranom statističkom
skupu

obilježje Spol Broj djelatnika Struktura u %

Muškarci 147 55,26


modaliteti Žene 119 44,74

Ukupno 266 100,00

apsolutne relativne
frekvencije frekvencije
GRUPIRANJE I FORMIRANJE STATISTIČKIH
NIZOVA

 Masu individualnih podataka treba izraziti u


općem obliku kako bismo stekli pregledniju sliku
pojave

VJEŽBE 1
 GRUPIRANJE je postupak kojim statistički skup
raščlanjujemo u disjunktne podskupove
(RAZREDE) prema oblicima obilježja tako da se
u svaki podskup rasporede jedinice s jednakim ili
sličnim oblikom obilježja
BROJ RAZREDA
 KORISTIMO STUGESOVO PRAVILO

VJEŽBE 1
k = 1+3.3*logn
Gdje je k= broj razreda
n= broj podataka
ŠIRINA RAZREDA

xmax  xmin
x 

VJEŽBE 1
k

Gdje je xmax najveća vrijednost u nizu, xmin


najmanja vrijednost u nizu, a k broj razreda
ODREDIMO RELATIVNE FREKVENCIJE U DONJEM PRIMJERU

Godine Broj Struktura u


starosti studenata %
xi fi
18-23 412
23-40 106
40-55 42
∑ 560

Interpretirajte
GRUPIRANJE PODATAKA
 Metoda kojom se postiže uopćavanje statističkih podataka
 Provodi se po načelima iscrpnosti i isključivosti: razvrstati se
mora svaki podatak, a jedan podatak može biti član samo
jedne grupe

Primjer 3.
Prikupljeni su podaci o broju izdanih prometnih dozvola u razdoblju od 27 dana
Na području jedne PU:
0 3 3 4 5 6 6 7 10 11 11 12 12 14 14 15 16 17 17 21
22 24 24 24 25 27 30

Želimo grupirati podatke u 5 razreda.

Rješenje: n = broj razreda =5


Rv 30  0
i = veličina razreda i  6
Rv = xmax – xmin n 5
- Do apsolutnih frekvencija dolazi se brojanjem na temelju zadanog negrupiranog niza

Broj Broj dana


izdanih fi
dozvola
xi
0-6 7

7-13 6

14-20 6

21-27 7

28-34 1

diskretno ukupno 27
obilježje
PRIMJER 4.
 Zaposleni u jednom uredu poduzeća “XY” u Šibeniku u listopadu 2017.
prema ukupnom radnom stažu (ukupan radni staž promatramo kao
kontinuirano obilježje) bili su kako slijedi:
3 4 6 6 6 7 8 10 12 14 14 15 17 18 19 22 24 26 27
28 30 32 34 39
Želimo grupirati podatke u razrede veličine i=5.
Rv Rv 38  3
i n  7
n i 5
Radni Broj
staž zaposlenika
3-8 6

8-13 3

13-18 4

18-23 3

23-28 3
kontinuirano
obilježje 28-33 3

33-38 2

ukupno 24
GRANICE KOD GRUPIRANJA KONTINUIRANOG I
DISKRETNOG OBILJEŽJA…

 Prethodno dani primjeri pokazuju kako se razredi


različito formiraju za diskretno i kontinuirano obilježje
 Kada se razredi formiraju na osnovi kontinuiranog
obilježja donja granica jednog razreda označava se istim
brojem kao i gornja granica idućeg
ZADATAK 1.
Provedeno je istraživanje o tjelesnoj masi
(zaokruženoj na cijeli broj) djelatnika tvrtke X i
dobiveni su sljedeći rezultati:

VJEŽBE 1
69 87 58 64 67 93 75 79 59 68 81 83 74 78 67
85 71 64 66 83 71 77 80 65 59 62 83 71 70 79

Dobivene rezultate grupirajmo u razrede koristeći


Sturgesovo pravilo.
RJEŠENJE
k= 1 + 3.3*log30 = 6
xmax  xmin 93  58
x    5.83
k 6

VJEŽBE 1
Veličine razreda možemo zaokružiti na 6.
Tjelesna masa Frekvencija Relativna
frekvencija
58-63
64-69
70-75
76-81
82-87
88-93
ZADATAK 2.
Tvrtka X ima 37 zaposlenika. Među zaposlenicima
provedena je anketa o njihovom stupnju
obrazovanja. Podaci su kodirani tako da F

VJEŽBE 1
označava završen fakultet, P zvanje prvostupnika,
S završenu srednju školu i O osnovnu. Dobiveni su
podaci:
FPSSFSOOSPSSPSOSPFPSSSOSSPSSSPSFSSFSS

Grupirajte podatke prema stupnju obrazovanja.


Izračunajte relativne frekvencije.
RJEŠENJE

VJEŽBE 1
Stupanj Broj radnika Relativne Relativne
obrazovanja (frekvencije) frekvencije frekvencije
kao postoci
Fakultet 5 0.1351 13.51%
Viša škola 7 0.1892 18.92%
Srednja škola 21 0.5676 56.76%
Osnovna škola 4 0.1081 10.81%
GRANICE RAZREDA
Širina i-tog razreda
ji  L1i1  L1i , i  1,.., k

VJEŽBE 1
Razredna sredina

L1i  L2i
xi 
2
GRANICE RAZREDA
Sjetimo se –
Ako se radi o neprekidnom numeričkom obilježju,

VJEŽBE 1
donja granica tekućeg razreda nije jednaka
gornjoj granici prethodnog razreda, takve granice
nazivamo NOMINALNIM GRANICAMA

Kod crtanja potrebno je odrediti PRECIZNE


GRANICE!
GRANICE RAZREDA
 Ako prvi razred nema donje, ili posljednji razred
gornje granice, takav razred je OTVOREN.

VJEŽBE 1
 Prije grafičke analize ili numeričke analize nužno
je procijeniti granice otvorenih intervala
PRIMJER
Tjelesna Broj
masa studenata

50-59 34
60-69 41

VJEŽBE 1
70-79 40
80-89 24
90-99 15

Tjelesna Precizne Veličine Rezredne


masa granice razreda sredine
50-59 49.5-59.5 10 54.5
60-69 59.5-69.5 10 64.5
70-79 69.5-79.5 10 74.5
80-89 79.5-89.5 10 84.5
90-99 89.5-99.5 10 94.5
KUMULATIVNI NIZ
Z prethodni primjer odredimo kumulativni niz
“manje od” i kuumulativni niz “više od”

VJEŽBE 1
Tjelesna Broj Kumulati Kumulati
masa studenata vni niz vni niz
‘manje od’ ‘više od’
50-59 34 34 144
60-69 41 75 110
70-79 40 105 79
80-89 24 129 39
90-99 15 144 15

Protumačite značanje nizova!


ZADATAK
Broj prevezenih punika prema vrstama prijevoza
prikazan je tablicom
Vrsta Broj putnika (u tisućama)
prijevoza 2004. 2005. 2006.
Željeznički 36747 39842 45134

VJEŽBE 1
Cestovni 64768 64859 63576
Pomorski 10908 11440 12079
Zračni 1743 2099 2079

a) Odredite relativne frekvencije posebno za svaku


godinu
b) Odredite relativne frekvencije posebno za svaku
vrstu prijevoza
c) Odredite prosječan broj putnika za svaku vrstu
prijevoza
d) Za svaku vrstu prijevoza izračunajte kumulativni
niz “manje od”. Te komentirajte značenje elemanta
kumulativnog niza koji pripada 2005-oj godini
RJEŠENJE
a) Relativne
Godina frekvencije
2004. 0,33

VJEŽBE 1
2005. 0,34

2006. 0,35

Vrsta Relativne
b) prijevoza frekvencije

Željeznički 0,35

Cestovni 0,55

Pomorski 0,10

Zračni 0,02
RJEŠENJE

Dajemo rješenje za željeznički promet.

Željeznički
Broj putnika Kumulativni niz
promet

VJEŽBE 1
2004. 36747 36747
2005. 39842 76589
2006. 45134 121723

Prosječan broj
putnika 40574,33

Objasnimo drugi član kumulativnog niza:


U 2004-oj i 2005-oj godini broj putnika u
željezničkom prijevozu iznosio je 76589.
GRAFIČKO UREĐIVANJE
TABLICA - DISTRIBUCIJA FREKVENCIJA

PRIMJER: BOLNIČKI PACIJENTI PO ODJELIMA

VJEŽBE 1
BOLNIČKI ODJEL BROJ PACIJENATA RELATIVNA
(frekvencija) FREKVENCIJA
Kardiologija 1052 0.1192 = 11.92%
Hitna 2245 0.2545 = 24.45%
Intenzivna njega 340 0.0385 = 3.85%

Porođajni odjel 552 0.0625 = 6.25%


Kirurgija 4630 0.525 = 52.50%
PRIMJER STUPČANOG GRAFIKONA
5000
4500
4000

VJEŽBE 1
3500
3000
2500
2000
1500
1000
500
0
Kardiologija Hitna Intenzivna Porođajni odjel Kirurgija
njega
PRIMJER – STRUKTURNI KRUG
Bolnički pacijenti po odjelima

VJEŽBE 1
Kardiologija
Hitna
Intenzivna njega
Porođajni odjel
Kirurgija
GRAFIČKO PRIKAZIVANJE NUMERIČKIH
NIZOVA

Numerička
varijabla

VJEŽBE 1
NEGRUPIRANI
GRUPIRANI PODACI
S_L dijagram
Distribucije frekvencija
Dijagram točaka
Kumulativni nizivi
Box and Whisker Plot - BP

Histogram Kumulanta
Poligon frekvencija (Ogive)
STEAM AND LEAF PLOT
S-L
ZADAN JE NIZ DULJINE 31
12 11 13 10 14 12 15 16 17 18 17 18 18 19 13 11 15 16 13 13 11 11 12
18 19 17 15 12 16 16 15

VJEŽBE 1
S-L dijagram
Dot plot
1 10 0
(dijagram točaka)
5 11 0000
9 12 0000
DotPlot
13 13 0000
14 14 0
(4) 15 0000 5 7 9 11 13 15 17 19 21

13 16 0000
#1

9 17 000
6 18 0000
2 19 00
POVRŠINSKI GRAFIKONI
HISTOGRAM I BAR-CHART

Histogram
9

VJEŽBE 1
8

6
Frequency

4 Frequency

0
11 13 15 17 19 More
Bin
POLIGON FREKVENCIJA
9
8
7

VJEŽBE 1
6
5
4
3
2
1
0
10-11 12-13 14-15 16-17 18-19

You might also like