Professional Documents
Culture Documents
6 Deskriptivna Statistika 1
6 Deskriptivna Statistika 1
DESKRIPTIVNA STATISTIKA
Klasifikacija varijabli i uređivanje podataka
STATISTIČKI SKUP
Sastoji se od jedinica kojima se ispituje
svojstvo/svojstva koja od jedinice do jedinice
očituju statističku promjenljivost
Konačan
skup
Opseg
skupa
Beskonačan
skup
STATISTIČKA POPULACIJA I
STATISTIČKI UZORAK
Definirani :
pojmovno
prostorno
vremenski
STATISTIČKI SKUP
tvore ga statističke jedinice koje imaju slična zajednička
svojstva
mora biti precizno definiran pojmovno, prostorno i
vremenski
pojmovno • djelatnici
Primjer
Broj prijavljenih kvarova u jamstvenom roku
uređaja SimSang.
Hipotetski, prijavljenih kvarova može biti 0,1,2,3,…
(radi se o beskonačnom skupu)
Primjer
Vrijeme opsluživanja stranke na šalteru.
KLASIFIKACIJA VARIJABLI
VARIJABLE/
VJEŽBE 1
PODACI
KVANTITATIVNE KVALITATIVNE
(NUMERIČKE) (KATEGORIJALNE)
DISKRETNE KONTINUIRANE
KVALITATIVNI PODACI
Prema definiranim kategorijama/atributima
Primjer
Bračno stanje
Političko opredjeljenje
Stupanj stručne spreme
DISKRETNI KONTINURANI
Primjer Primjer
Broj djece Težina
Kvarovi po satu Cijene
Broj prigovora Prihod
PODACI S OBZIROM NA MJERNE
SKALE
1. NOMINALNI
2. ORDINALNI
3. INTERVALNI
4. OMJERNI
PODACI S OBZIROM NA MJERNE
SKALE
NOMINALNI PODACI
Opisno svojstvo
Atributivna ili zemljopisna
Primjer
Bračno stanje
Narodnost
Zanimanje
Zemljopisna pripadnost
nomenklature
PRIMJER NOMENKLATURE
Primjer
Stupanj stručne spreme
Stupanj ekonomske aktivnosti
Kreditni rejting
Rangiranje 5 proizvoda prema zadovoljstvu: 1 najbolji, 5
najgori. Ne znamo koliko je najbolji proizvod bolji od
najgoreg. Znamo samo da je bolji (uređaj).
PODACI S OBZIROM NA MJERNE
SKALE
INTERVALNI PODACI
Podaci mjereni na skali za koju je karakteristično
da su jednake razlike u brojevima jednake
razlikama u mjerenom svojstvu
Dogovoren položaj nule
Mogu biti uključene računske operacije
Primjer
Temperaturna ljestvica
Vrijeme: ne možemo reći da je 10:00 sati dvostruko dugo
kao i 05:00 ujutro, ali možemo reći da je interval od 00:00
sati do 05:00 sati jednako dug kao i interval od 05:00 sati do
10:00 sati.
Likertova skala („izrazito se slažem”, „slažem se”, „niti se
slažem niti ne slažem” , „ne slažem se” i „izrazito se ne
slažem”)
PODACI S OBZIROM NA MJERNE
SKALE
OMJERNI PODACI
Brojevi čije jednake razlike predstavljaju jednake
razlike u mjerenom svojstvu
Nula na omjernoj skali označava nepostojanje
svojstva
PODACI
KVANTITATIVNI
KVALITATIVNE
(brojčani)
BROJČANI NEBROJČANI
INERVALNI OMJERNI
KODOVI KODOVI
OMJERNA ili diskretne broje se, ima ih konačan npr. broj proizvedenih
broj ili prebrojivo mnogo komada, broj vrata na
NUMERIČKA automobilu, broj
reklamacija, navršene
godine života
mjere se, mogu poprimiti npr. starost, visina, težina,
kontinuiran bilo koju vrijednost u cijene
e nekom intervalu
ZADATAK.
U istraživanju potrošnje kućanstava su korištene sljedeće varijable:
Spol ispitanika
prebivalište ispitanika
stručna sprema ispitanika
broj članova kućanstva, prosječna potrošnja na hranu
prosječna primanja kućanstva
rangiranje potrošnje u odnosu na prošlu godinu („više”,
„manje”,”jednako”)
vrijeme kada je intervju započet
Stručna sprema
ispitanika
Broj članova
kućanstva
Prosječna potrošnja na
hranu
Prosječna primanja
Rangiranje
Vrijeme kada je
intervju započet
Trajanje intervjua
ZADATAK - RJEŠENJE
Rješenje.
Varijabla
Spol ispitanika Kvalitativna nominalna
Prebivalište ispitanika Kvalitativna nominalna
Stručna sprema ispitanika Kvalitativna ordinalna
Broj članova kućanstva Kvantitativna omjerna
Prosječna potrošnja na hranu Kvantitativna omjerna
Prosječna primanja Kvantitativna omjerna
Rangiranje Kvalitativna ordinalna
Vrijeme kada je intervju Kvantitativna Intervalna
započet
Trajanje intervjua Kvantitativna omjerna
UREĐIVANJE KVALITATIVNIH
PODATAKA
VJEŽBE 1
Kvalitativni
podaci
Grafičko Tablično
prikazivanje prikazivanje
podataka podataka
Stupčani
Strukturni Paretov Distribucija
grafikon
krug grafikon frekvencija
JEDNOSTAVNE STATISTIČKE TABLICE
Spol ispitanika
prebivalište ispitanika
stručna sprema ispitanika
broj članova kućanstva, prosječna potrošnja na hranu
prosječna primanja kućanstva
rangiranje potrošnje u odnosu na prošlu godinu („više”,
„manje”,”jednako”)
vrijeme kada je intervju započet
Stručna sprema
ispitanika
Broj članova
kućanstva
Prosječna potrošnja na
hranu
Prosječna primanja
Rangiranje
Vrijeme kada je
intervju započet
Trajanje intervjua
ZADATAK 1
Rješenje.
Varijabla
Spol ispitanika Kvalitativna nominalna
Prebivalište ispitanika Kvalitativna nominalna
Stručna sprema ispitanika Kvalitativna ordinalna
Broj članova kućanstva Kvantitativna omjerna
Prosječna potrošnja na hranu Kvantitativna omjerna
Prosječna primanja Kvantitativna omjerna
Rangiranje Kvalitativna ordinalna
Vrijeme kada je intervju Kvantitativna Intervalna
započet
Trajanje intervjua Kvantitativna omjerna
SKUPNE STATISTIČKE TABLICE
NEGRUPIRANI GRUPIRANI
Podaci se
Podaci su
prikazuju u
zapisani
tablicama
slijedom kojim
distribucije
su i prikupljani
frekvencija
TABELIRANJE
Tabeliranje statističkih podataka ima za cilj da na jasan, cjelovit i
pregledan način prezentira rezultate prikupljanja i grupiranja
statističkih podataka
OBILJEŽJA (VARIJABLE)
su svojstva po kojima su jedinice statističkog skupa
međusobno slične ili po kojima se razlikuju
svako se obilježje javlja u više modaliteta uz koje se vežu
frekvencije kao numerički izraz intenziteta pojavnosti
pojedinog modaliteta u promatranom statističkom
skupu
apsolutne relativne
frekvencije frekvencije
GRUPIRANJE I FORMIRANJE STATISTIČKIH
NIZOVA
VJEŽBE 1
GRUPIRANJE je postupak kojim statistički skup
raščlanjujemo u disjunktne podskupove
(RAZREDE) prema oblicima obilježja tako da se
u svaki podskup rasporede jedinice s jednakim ili
sličnim oblikom obilježja
BROJ RAZREDA
KORISTIMO STUGESOVO PRAVILO
VJEŽBE 1
k = 1+3.3*logn
Gdje je k= broj razreda
n= broj podataka
ŠIRINA RAZREDA
xmax xmin
x
VJEŽBE 1
k
Interpretirajte
GRUPIRANJE PODATAKA
Metoda kojom se postiže uopćavanje statističkih podataka
Provodi se po načelima iscrpnosti i isključivosti: razvrstati se
mora svaki podatak, a jedan podatak može biti član samo
jedne grupe
Primjer 3.
Prikupljeni su podaci o broju izdanih prometnih dozvola u razdoblju od 27 dana
Na području jedne PU:
0 3 3 4 5 6 6 7 10 11 11 12 12 14 14 15 16 17 17 21
22 24 24 24 25 27 30
7-13 6
14-20 6
21-27 7
28-34 1
diskretno ukupno 27
obilježje
PRIMJER 4.
Zaposleni u jednom uredu poduzeća “XY” u Šibeniku u listopadu 2017.
prema ukupnom radnom stažu (ukupan radni staž promatramo kao
kontinuirano obilježje) bili su kako slijedi:
3 4 6 6 6 7 8 10 12 14 14 15 17 18 19 22 24 26 27
28 30 32 34 39
Želimo grupirati podatke u razrede veličine i=5.
Rv Rv 38 3
i n 7
n i 5
Radni Broj
staž zaposlenika
3-8 6
8-13 3
13-18 4
18-23 3
23-28 3
kontinuirano
obilježje 28-33 3
33-38 2
ukupno 24
GRANICE KOD GRUPIRANJA KONTINUIRANOG I
DISKRETNOG OBILJEŽJA…
VJEŽBE 1
69 87 58 64 67 93 75 79 59 68 81 83 74 78 67
85 71 64 66 83 71 77 80 65 59 62 83 71 70 79
VJEŽBE 1
Veličine razreda možemo zaokružiti na 6.
Tjelesna masa Frekvencija Relativna
frekvencija
58-63
64-69
70-75
76-81
82-87
88-93
ZADATAK 2.
Tvrtka X ima 37 zaposlenika. Među zaposlenicima
provedena je anketa o njihovom stupnju
obrazovanja. Podaci su kodirani tako da F
VJEŽBE 1
označava završen fakultet, P zvanje prvostupnika,
S završenu srednju školu i O osnovnu. Dobiveni su
podaci:
FPSSFSOOSPSSPSOSPFPSSSOSSPSSSPSFSSFSS
VJEŽBE 1
Stupanj Broj radnika Relativne Relativne
obrazovanja (frekvencije) frekvencije frekvencije
kao postoci
Fakultet 5 0.1351 13.51%
Viša škola 7 0.1892 18.92%
Srednja škola 21 0.5676 56.76%
Osnovna škola 4 0.1081 10.81%
GRANICE RAZREDA
Širina i-tog razreda
ji L1i1 L1i , i 1,.., k
VJEŽBE 1
Razredna sredina
L1i L2i
xi
2
GRANICE RAZREDA
Sjetimo se –
Ako se radi o neprekidnom numeričkom obilježju,
VJEŽBE 1
donja granica tekućeg razreda nije jednaka
gornjoj granici prethodnog razreda, takve granice
nazivamo NOMINALNIM GRANICAMA
VJEŽBE 1
Prije grafičke analize ili numeričke analize nužno
je procijeniti granice otvorenih intervala
PRIMJER
Tjelesna Broj
masa studenata
50-59 34
60-69 41
VJEŽBE 1
70-79 40
80-89 24
90-99 15
VJEŽBE 1
Tjelesna Broj Kumulati Kumulati
masa studenata vni niz vni niz
‘manje od’ ‘više od’
50-59 34 34 144
60-69 41 75 110
70-79 40 105 79
80-89 24 129 39
90-99 15 144 15
VJEŽBE 1
Cestovni 64768 64859 63576
Pomorski 10908 11440 12079
Zračni 1743 2099 2079
VJEŽBE 1
2005. 0,34
2006. 0,35
Vrsta Relativne
b) prijevoza frekvencije
Željeznički 0,35
Cestovni 0,55
Pomorski 0,10
Zračni 0,02
RJEŠENJE
Željeznički
Broj putnika Kumulativni niz
promet
VJEŽBE 1
2004. 36747 36747
2005. 39842 76589
2006. 45134 121723
Prosječan broj
putnika 40574,33
VJEŽBE 1
BOLNIČKI ODJEL BROJ PACIJENATA RELATIVNA
(frekvencija) FREKVENCIJA
Kardiologija 1052 0.1192 = 11.92%
Hitna 2245 0.2545 = 24.45%
Intenzivna njega 340 0.0385 = 3.85%
VJEŽBE 1
3500
3000
2500
2000
1500
1000
500
0
Kardiologija Hitna Intenzivna Porođajni odjel Kirurgija
njega
PRIMJER – STRUKTURNI KRUG
Bolnički pacijenti po odjelima
VJEŽBE 1
Kardiologija
Hitna
Intenzivna njega
Porođajni odjel
Kirurgija
GRAFIČKO PRIKAZIVANJE NUMERIČKIH
NIZOVA
Numerička
varijabla
VJEŽBE 1
NEGRUPIRANI
GRUPIRANI PODACI
S_L dijagram
Distribucije frekvencija
Dijagram točaka
Kumulativni nizivi
Box and Whisker Plot - BP
Histogram Kumulanta
Poligon frekvencija (Ogive)
STEAM AND LEAF PLOT
S-L
ZADAN JE NIZ DULJINE 31
12 11 13 10 14 12 15 16 17 18 17 18 18 19 13 11 15 16 13 13 11 11 12
18 19 17 15 12 16 16 15
VJEŽBE 1
S-L dijagram
Dot plot
1 10 0
(dijagram točaka)
5 11 0000
9 12 0000
DotPlot
13 13 0000
14 14 0
(4) 15 0000 5 7 9 11 13 15 17 19 21
13 16 0000
#1
9 17 000
6 18 0000
2 19 00
POVRŠINSKI GRAFIKONI
HISTOGRAM I BAR-CHART
Histogram
9
VJEŽBE 1
8
6
Frequency
4 Frequency
0
11 13 15 17 19 More
Bin
POLIGON FREKVENCIJA
9
8
7
VJEŽBE 1
6
5
4
3
2
1
0
10-11 12-13 14-15 16-17 18-19