Download as pdf or txt
Download as pdf or txt
You are on page 1of 50

Sadržaj

STATISTIČKI POJMOVI ...................................................................................................................................... 2


VREMENSKI NIZ................................................................................................................................................ 11
SREDNJE VRIJEDNOSTI STATISTIČKOG NIZA (mjere centralne tendencije) ............................................. 14
MOD ................................................................................................................................................................. 14
MEDIJAN ......................................................................................................................................................... 14
ARITMETIČKA SREDINA ............................................................................................................................. 15
MJERE DISPERZIJE ........................................................................................................................................... 18
1.RASPON VARIJACIJE................................................................................................................................. 18
2.INTERKVARTIL .......................................................................................................................................... 18
3.KOEFICIJENT KVARTILNE DEVIJACIJE................................................................................................ 19
4. SREDNJE APSOLUTNO ODSTUPANJE (MAD ....................................................................................... 21
5. VARIJANCA ................................................................................................................................................ 21
6. STANDARDNA DEVIJACIJA ................................................................................................................... 21
7. KOEFICIJENT VARIJACIJE ...................................................................................................................... 21
MJERE ASIMETRIJE .......................................................................................................................................... 23
1. KOEFICIJENT ASIMETRIJE α3 ................................................................................................................ 23
2. PEARSONOVA MJERA.............................................................................................................................. 23
3. BOWLEYJEVA MJERA.............................................................................................................................. 24
MJERA ZAOBLJENOSTI ................................................................................................................................... 25
KOEFICIJENT ZAOBLJENOSTI α4 .............................................................................................................. 25
EKSCES............................................................................................................................................................ 26
MJERE KONCENTRACIJE ................................................................................................................................ 26
1. KONCENTRACIJSKI OMJER ................................................................................................................. 26
2. GINIJEV KOEFICIJENT .......................................................................................................................... 26
3. NORMIRANI KOEFICIJENT GINIJA .................................................................................................... 26
VJEROJATNOSTI ............................................................................................................................................... 27
DEFINICIJE VJEROJATNOSTI ..................................................................................................................... 27
MODELI DISTRIBUCIJA VJEROJATNOSTI ............................................................................................... 28
INFERENCIJALNA STATISTIKA ..................................................................................................................... 31
PROCJENE PARAMETARA .......................................................................................................................... 33
TESTIRANJE HIPOTEZA O PARAMETRU ................................................................................................. 37
REGRESIJSKA ANALIZA.................................................................................................................................. 40
MODEL JEDNOSTAVNE LINEARNE REGRESIJE – ................................................................................. 40
MODELI VREMENSKIH SERIJA ...................................................................................................................... 47
MODELI TRENDA .............................................................................................................................................. 48

1
STATISTIČKI POJMOVI

STATISTIKA – znanstvena metoda koja se bavi prikupljanjem, uređivanjem, analizom i tumačenjem


podataka.
 DESKRIPTIVNA – u okviru deskriptivne statistike zaključci se donose na temelju svih podataka.
Ona obuhvaća postupke uređivanja, grupiranja, tabeliranja, grafičkog prikazivanja te
izračunavanja različitih statističko-analitičkih veličina
 INFERENCIJALNA – u sklopu inferencijalne statistike zaključci se dodose na temelju dijela
podataka (uzoraka). Temelji se na teoriji vjerojatnosti
Poslovna statistika
 Definira se kao znanost o metodama koje se koriste za pretvaranje podataka u smislene informacije u
poslovnom okruženju sa svrhom stjecanja znanja za uspješnije odlučivanje i prognoziranje u uvjetima
neizvjesnosti i rizika
 Skup metoda za prikupljanje i uređivanje poslovnih podataka, njihovu obradu i analiziranje te
prikazivanje i tumačenje rezultata statističke analize s ciljem dobivanja što kvalitetnijih informacija koje
su potrebne pri poslovnom odlučivanju i prognoziranju
 Metode primjenjive u različitim područjima poslovanja kao što su:
o Razvoj i proizvodnja
o Financije i upravljanje financijskim rizicima
o Računovodstvo i revizija
o Marketing
o Prodaja
 Za potrebe različitih funkcija vezanih za upravljanje, kao što su:
o Kontroling
o Upravljanje kvalitetom
o Poslovna logistika i operativni menadžment
Upravljanje ljudskim resursima

STATISTIČKI SKUP – čine jedinice koje su predmetom promatranja statističkom metodom. Možemo promatrati
osobe, poduzeća, zemlje, proizvode itd.
OPSEG SKUPA – broj jedinica. S obzirom na opseg statistički skupovi se dijele na:
 KONAČNI STATISTIČKI SKUP – studenti upisani na efzg
 BESKONAČNI STATISTIČKI SKUP – bacanje novčića ili proizvodnja
Statistički skupovi definiraju se pojmovno, prostorno i vremenski.

OSNOVNI SKUP (POPULACIJA) – skup podataka o promatranom svojstvu za svaku jedinicu statističkog skupa.
UZORAK (n)
- podskup, dio osnovnog skupa. Dio podataka izdvojen iz cjelovite evidencije.
- Veličina uzorka obično je značajno manja od populacije te omogućava veću brzinu i manje troškove
prikupljanja podataka
-
2
POGREŠKE U ISTRAŽIVANJU UZORKOM:
1. Pogreške uzorka – prisutne kod istraživanja pomoću slučajnih uzoraka jer se istraživanje vrši samo na
jednom podskupu.
2. Pogreške izvan uzorka- prisutne u svim anketnim istraživanjima temeljem popisa ili uzorka

STATISTIČKO OBILJEŽJE (VARIJABLA) – svojstvo koje stupnjem ili oblikom varira od jedinice do jedinice
statističkog skupa.

VRSTE STATISTIČKOG OBILJEŽJA:


1. NUMERIČKO (KVANTITATIVNO) – izražava se brojevima
 DISKRETNO (diskontinuirano) – poprima isključivo cjelobrojne vrijednosti. npr. broj učenika u
razredu, broj djece u obitelji
 KONTINUIRANO – može poprimiti bilo koju vrijednost iz nekog intervala. npr. visina, težina,
cijena...
2. KVALITATIVNO
 NOMINALNO (atributivno i geografsko) – izražava se opisno ili riječima. npr. atributivno – spol,
zanimanje ; geografsko – mjesto rođenja
 REDOSLIJEDNO (obilježje ranga) – npr. ocijena, stupanj kvalitete

MJERENJE – postupak pridruživanja numeričkih i nenumeričkih oznaka jedinicama statističkih skupova na


temelju određenog pravila. Temelji se na primjeni mjerih skala.

MJERNE SKALE:
 NOMINALNA
- sastoji se od liste naziva
- podaci kojima se opisuje svojstvo, odnosno atribut
- oblici nominalne varijable nazivaju se modalitetima ili kategorijama

 ORDINALNA
- ovom skalom jedinicama statističkih skupova pridružuju se slovne oznake, simboli ili brojevi
sukladno intenzitetu mjernog svojstva
- pri redanju oblika bitan je poredak po jačini intenziteta
- nad njima se ne mogu provoditi nikakve računske operacije, ali se te vrijednosti mogu uspoređivati

 INTERVALNA
- ovom skalom jedinicama statističkih skupova pridružuju se brojevi sukladno intenzitetu mjernog
svojstva. Za ovu skalu karakteristično je da ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu.
npr. temperaturna ljestvica.

 OMJERNA
- ovom skalom jedinicama statističkih skupova pridružuju se brojevi sukladno intenzitetu mjernog
svojstva. Za ovu skalu karakteristično je da ima definiranu mjernu jedinicu i nulu koja označava
nepostojanje svojstva. npr. plaća, broj zastoja rada stroja.

3
IZVORI PODATAKA:
 PRIMARNI – prikupljaju se u skladu s ciljem istraživanja. Primarni podaci sz orginalna empirijska
kvantitativna istraživanja;
1. Anketna istraživanja
2. Istraživanja pomoću pokusa – eksperiment
3. Kontrolirana neposredna opažanja
 SEKUNDARNI – prikupljaju ih razne institucije (državni zavod za statistiku, banke, agencije za
istraživanje tržišta, osiguravajući zavodi...)

VRSTE PODATAKA S OBZIROM NA DIZAJN ISTRAŽIVANJA

 ANKETNI PODACI
Dobiveni su primjenom dizajna ankete (telefonskim intervjuom, osobnim intervjuom, poštanskom
metodom)
- Anketa se definira kao vrsta statističkog istraživanja koje proučava agregate jedinica pomoću anketnog
upitnika u popisu ili na statistočkom uzorku jedinica.
- Razlikujemo ankete pomoću anketara i ankete bez anketara

- VRSTE ANKETNIH PITANJA:

 S obzirom na zatvorenost
- Zatvorena pitanja s ponuđenim odgovorima
- Otvorena
 S obzirom na ulogu
- Demografska pitanja o karakteristikama ispitanika
- Filterska pitanja za izdvajanje kvalificiranog sugovornika

 EKSPERIMENTALNI PODACI
Rezultat su primjene dizajna eksperimenta.
Primjena dizajna eksperime: u fazi razvoja proizvoda, u fazi razrade, u fazi promidžbe itd.

 OPAŽENI PODACI
Dobiveni su izravnim kontroliranim opažanjima
Metoda tajnog kupca

4
UREĐIVANJE PODATAKA – uređivanjem podataka nastaju statistički nizovi

STATISTIČKI NIZOVI:
1. NOMINALNI NIZ – nastaje uređivanjem podataka o nominalnom obilježju
2. REDOSLIJEDNI NIZ – nastaje uređivanjem podataka o rang varijabli
3. NUMERIČKI NIZ – nastaje uređenjem podataka koji predstavljaju vrijednosti numeričke varijable
4. VREMENSKI NIZ – nastaje kronološkim nizanjem podataka o nekoj pojavi (proizvodnja,uvoz,izvoz)

STATISTIČKE TABELE (izvor i naslov je obavezan):


 JEDNOSTAVNA
Poljoprivredna površina po kategorijama u tisućama hektara u RH,
2003.g
KATEGORIJE POVRŠINA
oranice i vrtovi 1460
voćnjaci 68
vinogradi 57
livade 396
pašnjaci 1156
izvor: SLJRH, 2004.g., str.250

 SKUPNA – sadrži barem dva niza koji su grupirani prema modalitetima istog obilježja
Izvoz i uvoz prema pretežnoj ekonomskoj namjeni u milijunima am. $
u RH, 2003.g.
EKONOMSKA NAMJENA IZVOZ UVOZ
proizvodi za reprodukciju 2959 6583
proizvodi za investicije 1341 3316
proizvodi za široku potrošnju 1886 4311
izvor: SLJRH, 2004.g., str.386

 KOMBINIRANA (TABELA KONTIGENCE, TABELA S DVA ULAZA) – podaci su grupirani prema


modalitetima dvaju ili više varijabli
Stanovništvo prema spolu i starosti u tisućama u RH, popis iz 2001.g.

STAROST SPOL
M Ž
0 – 14 388 370
15 – 64 1482 1501
65 - 266 430
izvor: SLJRH, 2004.g., str.95

5
RELATIVNI BROJEVI – omogućavaju elementarnu analizu podataka u sklopu deskriptivne statistike
 proporcije (dio/cjelina), postoci (dio/cjelina*100) odnosno relativne frekvencije
 indeksi
 relativni brojevi koordinacije – omjerni brojevi koji nastaju diobom dvaju koordinirajućih veličina
(npr.gustoća stanovništva, dohodak po stanovniku, BDP per capita)

NIZOVI KVALITATIVNIH PODATAKA


Kvalitativni podaci su oblici nominalne ili redoslijedne varijable.
 ako ih je mali broj navode se nekim redom odabranim po volji ili prema intenzitetu mjernog
obilježja kod redoslijednih podataka (npr.ocjene od najmanje prema najvećoj)
 ako se radi o većem broju podataka pristupa se grupiranju. Grupiranjem se skup podataka
raščlanjuje na podskupove koji se međusobno ne preklapaju.

FREKVENCIJA – broj podataka istog ili sličnog modaliteta varijable

NOMINALNI ILI REDOSLIJEDNI NIZ čine parovi različitog oblika kvalitativne varijable oi i pripadajućih
frekvencija fi  (oi, fi), i=1,2,....,k

Učenici i studenti koji su završili osnovnu ili srednju


školu odnosno diplomirai na visokim učilištima u RH,
2003.g.
STUPANJ OBRAZOVANJA BROJ OSOBA
oi fi
osnovno 51211
srednje 47092
stručni studij 6489
sveuč.studij 9243
ukupno 114035
izvor: SLJRH, 2004.g., str.487

OPSEG SKUPA (TOTAL) – zbroj frekvencija


RELATIVNA FREKVENCIJA (proporcija)– omjer frekvencije i opsega skupa  p  fi
i k

i 1
fi

POSTOTNA RELATIVNA FREKVENCIJA – relativna frekvencija pomonožena sa 100  P  fi


 100
i k


i 1
fi

6
NUMERIČKI NIZOVI – nastaju uređenjem numeričkih podataka. Način njihova uređivanja ovisi o tome da li
su podaci diskretni ili kontinuirani.

NAČINI UREĐIVANJA:
(negrupirani podaci grafički se prikazuju S-L dijagramom ili dijagramom s točkama)

1. mali broj podataka - uređuje se nizanjem po veličini. Pojedinačni numerički podaci grafički se prikazuju
dijagramom s točkama i dijagramom stablo-list (S-L dijagram)

Primjer 1.
Podaci o prodaji proizvoda A za 15 dana jednog razdoblja:
Xi: 8, 15, 9, 17, 20, 14, 34, 27, 30, 18, 10, 18, 24, 25, 29
Podaci uređeni po veličini:
Xi: 8, 9, 10, 14, 15, 17, 18, 18, 20, 24, 25, 27, 29, 30, 34

dijagram s točkama:

dijagram stablo-list:
- je grafička tehnika koja se koristi za preeliminarnu analizu numeričkih podataka.
- Konstruiranje: podaci trebaju biti poredani od najmanjeg do najvećeg, brojevi se dijele na stablo i
listove, u prvom stupcu su poredana stable, a u ostalim stupcima poredani su svi listovi od
najmanjeg do najvećeg.

0 8 9
1 0 4 5 7 8 8
2 0 4 5 7 9
3 0 4

O|8 predstavlja 8

7
2. diskretno obilježje - velik broj podataka i manji broj oblika – pristupa se grupiranju. Numerički niz
odnosno distribucija frekvencija se sastoji od parova (xi, fi), i=1,2,....,k
xi – modaliteti numeričkog obilježja
fi – pripadajuće frekvencije
Primjer 2.
Dnevna prodaja garnitura sobnog namještaja
BROJ GARNITURA BROJ DANA
xi fi
1 1
2 5
3 8
4 26
5 19
6 12
ukupno 71

3. kontinuirano obilježje/ diskretno obilježje s većim brojem oblika – grupiranje se provodi na temelju
razreda. Svaki razred ima donju i gornju granicu.
frekvencija razreda – broj podataka omeđen donjom i gornjom granicom razreda
Numerički niz odnosno distribucija frekvencija sastoji se od parova razreda i pripadajućih frekvencija
 (Li1 ≤ xi ≤ Li2, fi), i= 1,2,....,k
Li1 – donja granica i-tog razreda; Li2 – gornja granica i-tog razreda; fi – frekvencija i-tog razreda
Primjer 3.
Radnici poduzeća A prema
starosti
STAROST BROJ RADNIKA
18 – 26 5
26 – 34 6
34 – 42 10
42 – 50 5
50 – 58 4
ukupno 30

Formiranju distribucije frekvencija prethodi određivanje broja razreda i njihove veličine. Za određivanje
broja razreda koristi se Sturgesovo pravilo: k ≈ 1 + 3,3 logN
(k-broj razreda; N-zbroj frekvencija)

Ako su razredi jednakih veličina, veličina im se aproksimira tako da se raspon varijacije podijeli sa
x max  x min
brojem razreda: ii 
k
Razredi jednakih veličina primjenjuju se kada su podaci simetrično raspoređeni.
Razredi različitih veličina primjenjuju se kada su podaci asimetrično raspoređeni.
8
Pri brojčanoj analizi numeričkog niza potrebno je utvrditi da li su granice prave, a nakon toga odrediti
veličinu razreda i rezredne sredine.

GRANICE RAZREDA:
 PRAVE – donja granica tekućeg razreda je jednaka gornjoj granici prethodnog razreda
 NOMINALNE – pretvaraju se u prave tako da se svaka donja granica umanji za polovicu
jedinice, a svaka gornja se uveća za polovicu jedinice. To vrijedi za sve slučajeve osim za
navršene godine života. Kod navršenih godina života svaka se gornja granica poveća za
jedinicu.
VELIČINA RAZREDA (ii )– određuje se kao razlika gornje i donje prave granice razreda
REZREDNA SREDINA i-tog razreda (xi) – određuje se kao poluzbroj gornje i donje prave granice razreda.

g .g .  d .g .
xi 
2

Kada su razredi različitih veličina potrebno je korigirati frekvencije:


fi

f ci  - ova se formula koristi kada su svi razredi različitih veličina
ii

fi

f ci 
i i - bazna veličina razreda (najčešće se pojavljuje)
ib

Distribucija frekvencija grafički se prikazuje histogramom i poligonom frekvencija.

(!!!! TOČKE SU NA SREDINI RAZREDA)


Bitno je da grafikon ima naslov, izvor, mjernu jedinicu i po potrebi legendu.

9
HISTOGRAM:
- Grafikon stupaca može prikazivati apsolutne i relativne frekvencije
- Histogram je stupčani grafikon sastavljen od uspravnih stupaca bez razmaka
- Površine stupaca su određene frekvencijama
- X OS- granice, moraju relevantno prikazivati širinu razreda (širina stupaca mora odgovarati
širini razreda)
- Y OS- apsolutne i relativne frekvencije ( korigirane ako su razredi različitih veličina)
- Pokazuje decentriranost ili centriranost razdiobe podataka, raspršenost, odnosno disperziju
numeričkih podataka i oblik razdiobe podataka.

POLIGON FREKVENCIJA
- Linijski grafikon
- Na apcisu se nanosi mjerilo za numerički varijablu-granice, na ordinatu frekvencije

IZVEDENI NIZOVI:
 KUMULATIVNI NIZ – nastaje postupnim zbrajanjem apsolutnih ili relativnih frekvencija. On
se grafički prikazuje kumulantom.
Stanovništvo prema starosti u RH u tisućama prema popisu iz 2001.g.
STAROST BROJ OSOBA PRAVE GRANICE KUMULATIVNI NIZ
0-14 758 -0.5 – 14.5 758
15-64 2983 14.5 – 64.5 3741
65-(99) 696 64.5 – (99.5) 4437

(!!! Točke su na KRAJU razreda, crtamo od prve donje granice)


(na kumulanti grafički prikazujemo medijan, kvartile)

10
VREMENSKI NIZ
–skup kronološki uređenih vrijednosti koje predstavljaju neku pojavu (proizvodnja, uvoz, izvoz).
ČLANOVI NIZA – vrijednosti koje tvore niz

Vremenski niz nože biti:


 INTERVALNI – nastaje trajanjem vrijednosti pojave po intervalima vremena (godina, kvartal,
mjesec) npr. proizvodnja, uvoz, izvoz...
Frekvencije se dobivaju postupnim zbrajanjem unutar intervala odabrane vremenske
jedinice, prikazuje se stupcima ili linijskim grafikonom
 TRENUTAČNI – sastoji se od kronološki uređenih vrijednosti koje predstavljaju stanja pojave
u odabranim vremenskim točkama (početak, sredina, kraj) npr. stanje na računima,
zaključne cijene dionica.. (prikazuje se samo linijskim grafikonom)

GRAFIČKO PRIKAZIVANJE VREMENSKIH NIZOVA:


 INTERVALNI NIZOVI prikazuju se površinskim i linijskim grafikonima.
 TRENUTNI NIZOVI prikazuju se samo linijskim grafikonima

Na osi apscisa je mjerilo za varijablu vrijeme, a na osi ordinata za članove vremenskog niza.

OKOMITI PREKID GRAFIKONA – ako se ne raspolaže podacima za dio razdoblja moguće je izostaviti dio mjerila
na osi apscisa.
VODORAVNI PREKID GRAFIKONA – ako neka pojava varira na velikim razinama moguće je izostaviti dio mjerila
osi ordinata.
Prekidaju se samo linijski grafikoni.

POLULOGARITAMSKI GRAFIKON – koristi se ako se na istom grafikonu uspoređuju raznorodni podaci (nizovi
izraženi u različitim mjernim jedinicama). To je grafikon sa aritmetičkim mjerilom na osi apscisa, a
logaritamskim na osi ordinata.

INDIVIDUALNI INDEKSI – njima se prati razvoj jedne pojave u vremenu


 verižni indeksi – njima se prati razvoj pojave u uzastopnim vremenskim razdobljima. Verižni
indeks Vt razdoblja t dobije se tako da se vrijednost toga razdoblja podijeli s vrijednošću
yt
prethodnog razdoblja te se pomnoži sa sto  Vt   100
yt 1
Verižni indeksi se grafički prikazuju specifičnim linijskim grafikonom i grafikonom jednostavnih
stupaca.
KOEFICIJENT DINAMIKE – vrijednost tekućeg razdoblja podijeljena sa vrijednošću prethodnog
yt
razdoblja ne pomnožena sa sto  Vt 
y t 1
STOPA PROMJENE – od verižnog indeksa se odbije sto  S t  Vt  100

11
Primjer 1.

Izvoz RH u milijunima US$ u razdoblju od 1999. do 2003.g.


GODINA IZVOZ VERIŽNI INDEKSI STOPA PROMJENE
yt Vt St
1999 4302 - -
2000 4432 103,2 3,02
2001 4665 105,26 5,26
2002 4904 105,12 5,12
2003 6197 126,36 26,36
izvor: SLJRH 2004., str.384

Indeks se interpretira kao postotna promjena u odnosu na 100. Ako je veći od 100 predstavlja
postotno povećanje, a ako je manji od 100 predstavlja postotno smanjenje.
npr. Izvoz u RH u 2003.g. povećao se za 26.36% u odnosu na 2002.g.

 indeksi na stalnoj bazi – njima se mjere promjene u odnosu na neko odabrano bazno razdoblje.
Izračunavaju se tako da se svaki član niza podijeli s vrijednošću baznog razdoblja te pomnoži sa
yt
100  I t   100
yb
BAZNO RAZDOBLJE – razdoblje u kojemu pojava nije bila izložena nekim neuobičajenim
utjecajima (prirodne katastrofe, rat). Ponekad se uzima neka vrijednost izvan niza ili nekakav
prosjek.

STOPA PROMJENE – kad od indeksa odbijemo sto  S t  I t  100


*

Bazni indeksi se grafički prikazuju linijskim grafikonom ili grafikonom jednostavnih stupaca.

Primjer 2.
GODINA IZVOZ BAZNI INDEKSI STOPA PROMJENE
1999 = 100
1999 4302 100,00 0,00
2000 4432 103,02 3,02
2001 4665 108,44 8,44
2002 4904 113,99 13,99
2003 6197 144,05 44,05
U 2003.g. izvoz se povećao za 44.05% u odnosu na baznu 1999.g.

12
SKUPNI INDEKSI

Skupni indeksi su relativni brojevi koji služe za istodobno praćenje razvoja u vremenu između dviju ili više
pojava koje čine logičku cjelinu.

njima se prati dinamika skupine pojava u vremenu npr.proizvodnja, uvoz, izvoz....


 SKUPNI INDEKSI CIJENA
 SKUPNI INDEKSI KOLIČINA
 SKUPNI INDEKS VRIJEDNOSTI
U pravilu se računaju kao vagana aritmetička sredina individualnih indeksa. Ponderi su obično vrijednosti.
Uglavnom se izračunavaju:
 LASPEYRESOV INDEKS CIJENA I KOLIČINA
 PAASCHEOV INDEKS CIJENA I KOLIČINA
 FISHEROV INDEKS CIJENA I KOLIČINA
 INDEKS VRIJEDNOSTI

Skupnim indeksom cijena izražava se, u relativnom iznosu i u prosijeku, promjena cijena skupine različitih
pojava.
Skupni indeks količina prati tijekom vremena i promjenu količine skupine pojava ( fizički obujam) u relativnom
iznosu.
Skupni indeks vrijednosti prati promjenu vrijednosti skupine pojava

Skupne indekse izračunavaju i objavljuju statistički uredi. Obično su Laspeyresova tipa: INDEKS POTROŠAČKIH
CIJENA – mjera inflacije.
Skupni indeksi cijena koriste se u postupku deflacioniranja tj. uklanjanja utjecaja promjena cijena na
vrijednosno izražene pojave.

13
SREDNJE VRIJEDNOSTI STATISTIČKOG NIZA (mjere centralne tendencije)
– konstante kojima se predstavljaju nizovi varijabilnih podataka.
 POTPUNE – računaju se na temelju svih podataka. U njih se ubrajaju aritmetička, geometrijska i
harmonijska sredina.
 POLOŽAJNE – u pravilu su jednake jednom modalitetu statističke varijable. U njih se ubrajaju
MOD i MEDIJAN.

MOD – najčešći modalitet varijable, odnosno to je modalitet varijable s najvećom frekvencijom Distribucija
može biti bezmodalna i multimodalna. Računa se za omjerne, intervalne, ordinalne i nominalne podatke.

1. pojedinačni podaci – kod pojedinačnih podataka MOD je vrijednost koja se najčešće pojavljuje

2. distribucija frekvencija sa razredima – MOD se aproksimira pomoću izraza:


(b  a )
M o  L1  i
(b  a )  (b  c )
b – najveća korigirana frekvencija
a – frekvencija ispred nje
c – frekvencija iza nje
L1 – donja prava granica modalnoga razreda
i – njegova veličina

MODALNI RAZRED – razred s najvećom korigiranom frekvencijom

MEDIJAN – srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednakobrojna dijela
1. pojedinačni podaci (neparan broj) – MEDIJAN je jednak vrijednosti varijable središnjeg člana u nizu
N
 INT M e  xr N
r  INT    1
2  2
Primjer:
Podaci moraju biti uređeni po veličini
1 3 5 8 10 12 14  7/2 = 3.5 ; r =4 ; Me = x4 = 8

2. pojedinačni podaci (paran broj) – MEDIJAN je jednak poluzbroju vrijednosti varijable središnjih dvaju
članova niza uređenog po veličini  N/2 = INT ; Me = (xr+Xr+1)/2 ; r = N/2
Primjer:
11 24 29 37 40 53 65 72  N=8 ; r=4 ; Me = (37+40)/2 = 38.5

14
3. distribucija frekvencija s razredima – MEDIJAN se aproksimira pomoću izraza:
N
  fi
M e  L1  2 i
f med

L1 – donja prava granica medijalnog razreda


N – zbroj apsolutnih ili relativnih frekvencija
∑fi – zbroj frekvencija do medijalnog razreda
fmed – frekvencija medijalnog razreda
i – veličina medijalnog razreda
MEDIJALNI RAZRED – onaj čija kumulativna frekvencija prvi put uključuje N/2.

KVANTILI – numerički niz uređen po veličini dijele na jednakobrojne dijelove. Medijan spada među kvantile
 KVARTILI – niz uređen po veličini dijele na 4 jednakobrojna dijela
 DECILI – niz uređen po veličini dijele na 10 jednakobrojnih dijelova
 PERCENTILI – niz uređen po veličini dijele na 100 jednakobrojnih dijelova
Broj kvartila je za jedan manji od njihova reda, tj. 3 su kvartila, 9 decila i 99 percentila

ARITMETIČKA SREDINA – dobije se tako da se zbroje vrijednosti numeričke varijable i podijele sa njihovim
brojem.
TOTAL – zbroj vrijednosti numeričke varijable; aritmetička sredina je jednaki dio totala po jedinici
Svojstva aritmetičke sredine:
1. zbroj vrijednosti odstupanja numeričke varijable od njezine aritmetičke sredine jednak je nuli
2. zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine minimalan je
3. aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunata

x
i 1
i

JEDNOSTAVNA ARITMETIČKA SREDINA – računa se kod pojedinačnih kvantitavnih podataka  x 


N
Aritmetička sredina izražena je u istim mjernim jedinicama kao i obilježje.
VAGANA (PONDERIRANA) ARITMETIČKA SREDINA – primjenjuje se za grupirane podatke, tj. za distribuciju
frekvencija
k

 fixi
i 1
1. ponderi: APSOLUTNE FREKVENCIJE (fi)  x
 fi
k

 Pixi
2. ponderi: RELATIVNE FREKVENCIJE U VIDU POSTOTAKA (Pi)  x 
i 1
100

15
k
3. ponderi: RELATIVNE FREKVENCIJE U VIDU PROPORCIJA (pi)  x   pixi
i 1

ARITMETIČKA SREDINA ARITMETIČKIH SREDINA – određuje se kao vagana sredina u kojoj se za pondere
uzima broj podataka za koje su pojedine sredine računate ili tom broju proporcionalne veličine.
k

 Nixi
i 1
X  k

 Ni
i 1

Primjer:
Odabrane kompanije zaposlenih i prosječne mjesečne plaće u kn
KOMPANIJA BROJ PROSJEČNA UKUPNA
ZAPOSLENIH PLAĆA PLAĆA Prosječna plaća za sve kompanije:
Ni x Ni xi
3711000
ALFA 550 3500 1925000 X   3313,39
1120
GAMA 320 2300 736000
TRADE 250 4200 1050000
UKUPNO 1120 - 3711000

Ako se svaka individualna vrijednost numeričkog obilježja zamijeni aritmetičkom sredinom dobiva se polazna
veličina tj. total ili zbroj vrijednosti numeričkog obilježja.

ARITMETIČKA SREDINA RELATIVNIH BROJEVA KOORDINACIJE – određuje se kao vagana sredina u kojoj su
k

 BiRi
i 1
ponderi baze tih brojeva  R  k

 Bi
i 1

RELATIVNI BROJEVI KOORDINACIJE – omjerni su brojevi koji nastaju diobom dviju koordinirajućih veličina
Vi
Ri 
Bi
Grafički se prikazuju na 2 načina:
1. jednostavnim stupcima
2. pravokutnicima čije su osnovice proporcionalne bazama tih brojeva, a visine samim relativnim
brojevima koordinacije

16
Primjer
Najveće države svijeta, površina u km2 i broj stanovnika na km2
DRŽAVA POVRŠINA U km2 STANOVNIŠTVO/ km2 UKUPAN BROJ Prosječan broj stanovnika
STANOVNIKA na km2 za sve navedene
Bi Ri Vi= Ri*Bi države:
1929776010
RUSIJA 17075400 8 136603200 R  35.22  35st. / km2
KANADA 9970610 3 29911830 54786277
SAD 9629091 30 288872730
KINA 9596961 135 1295589735
BRAZIL 8514215 21 178798515
UKUPNO 54786277 - 1929776010

GEOMETRIJSKA SREDINA – jednaka je N-tom korijenu produkta N pojedinačnih vrijednosti


G N x1 x 2 .... x i .... x N

G N f f f fk
Za grupirane podatke geometrijska sredina dana je izrazom: x1 1 x 2 2 .... x i i .... x k

Primjer zadani su koeficijenti dinamike


GODINA 2000 2001 2002 2003 2004
Vt - 1,06 1,05 1,03 1,02
prosječna stopa računata pomoću geometrijske sredine:
S  (G  1)  100
G  n 1 V2V3 .....Vn
G  4 1.06  1.05  1.03  1.02  1.03988 Promatrana pojava prosječno se godišnje povećavala
za 3.99%.
S  (1.03988  1)  100  3.99%

Geometrijska i harmonijska sredina relativno se rijetko primjenjuju. Geometrijska sredina se primjenjuje u


analizi vremenskih nizova. Pomoću nje se računa prosječna stopa promjene pojave. Geometrijska sredina
poprima nižu vrijednost od aritmetičke sredine.

HARMONIJSKA SREDINA – recipročna vrijednost aritmetičke sredine recipročnih vrijednosti varijable x

N
 negrupirani pojedinačni podaci  H  N
1
x
i 1 i

17
k

f
i 1
i

 grupirani podaci  H  k
fi
x
i 1 i

Harmonijska sredina manja je od aritmetičke i geometrijske sredine

MJERE DISPERZIJE

Reprezentativnost srednje vrijednosti ovisi o stupnju varijabilnosti podataka.Varijabilnost numeričkog obilježja


predočava se i pomoću grafičkih prikaza: dijagram s točkama i dijagram s pravokutnikom (BOX PLOT)
Mjere za varijabilnost podataka su:
1. raspon varijacije nepotpune mjere
2. interkvartil
3. koeficijent kvartilne devijacije
4. varijanca
5. standardna devijacija potpune mjere
6. koeficijent varijacije
7. srednje apsolutno odstupanje (MAD)

1.RASPON VARIJACIJE
 pojedinačni podaci – određuje se kao razlika između najveće i najmanje vrijednosti

Rx  xmax  xmin
 distribucija frekvencija formirana na temelju pojedinačnih podataka – određuje se kao razlika
između posljednje i prve vrijednosti
R x  x k  x1
 distribucija frekvencija s razredima – aproksimira se kao razlika između gornje granice
posljednjeg i donje granice prvog razreda ili kao razlika razrednih sredina posljednjeg i prvog
razreda.
Raspon varijacije je apsolutna (izražena je u istim mjernim jedinicama kao i obilježje) i nepotpuna (dobiva se iz
samo dvije vrijednosti) mjera disperzije.

2.INTERKVARTIL
KVARTILI:
 PRVI ILI DONJI KVARTIL (Q1) – vrijednost numeričke varijable koja članove niza dijeli u dvije skupine.
U prvoj je skupini 25% elemenata s vrijednostima varijable koja je jednaka ili manja od donjeg
kvartila, a u drugoj je skupini 75% elemenata s vrijednostima većim od donjeg kvartila.

18
 DRUGI ILI MEDIJAN (Me)
 TREĆI ILI GORNJI KVARTIL (Q3) - vrijednost numeričke varijable koja članove niza dijeli u dvije
skupine. U prvoj je skupini 75% elemenata s vrijednostima varijable koja je jednaka ili manja od
gornjeg kvartila, a u drugoj je skupini 25% elemenata s vrijednostima većim od gornjeg kvartila.

Interkvartil se određuje kao razlika kvartila  I Q  Q3  Q1 50%


Interpretira se kao raspon varijacije središnjih 50% podataka:

Interkvartil je također apsolutna i nepotpuna mjera disperzije.

3.KOEFICIJENT KVARTILNE DEVIJACIJE - njime se uspoređuje stupanj disperzije raznorodnih nizova. Određuje
se kao omjer interkvartila i zbroja kvartila:
Q  Q1
VQ  3 0 ≤ VQ < 1
Q3  Q1
Ovo je relativna i nepotpuna mjera disperzije.

GRAFIČKI PRIKAZ VARIJABILNOSTI PODATAKA – dijagram s pravokutnikom  box-plot (B-P) dijagram


Za njegovu konstrukciju koristi se 5 pokazatelja numeričkog niza – 5's (five summary numbers)
 najmanja vrijednost
 najveća vrijednost
 medijan
 donji kvartil
 gornji kvartil
Na ovom grafičkom prikazu oučava se raspon varijacije i interkvartilni raspon te se prosuđuje o mogućoj
asimetriji kao i o pojavi netipičnih vrijednosti (izdvojenice, out lier)

MODIFICIRANI BOX PLOT – pored položaja medijana i kvartila, pruža mogućnost uočavanja sumnjivih
vrijednosti, te ozbiljnih izdvojenica temeljem ucrtanih karakterističkih ograda

19
SIMETRIČNA DISTRIBUCIJA

POZITIVNO (desnostrano) ASIMETRIČNA DISTRIBUCIJA

NEGATIVNO (lijevostrano) ASIMETRIČNA DISTRIBUCIJA

20
4. SREDNJE APSOLUTNO ODSTUPANJE (MAD) – za mjerenje disperzije može se koristiti i prosječno apsolutno
odstupanje vrijednosti varijable od njezine aritmetičke sredine ili medijana:
N N

 i 1
xi  x x i  Me
pojedinačni podaci: MAD 
i 1
 MADMe 
N N
 za distiribuciju frekvencija apsolutne razlike ponderiraju se apsloutnim ili relativnim
frekvencijama

5. VARIJANCA – aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable od njezine


aritmetičke sredine. Varijanca je mjera disperzije u drugom stupnju koju je potrebno vratiti u prvi stupanj.
N

x
2
i x
negrupirani podaci  
2 i 1

N
k

 f (x i i  x)2
grupirani podaci  
2 i 1
 k

f i 1
i

6. STANDARDNA DEVIJACIJA – pozitivni drugi korijen iz varijance. Potpuna i apsolutna mjera disperzije.
N

(x i  x)2
negrupirani podaci  
i 1

N

 f (x i i  x)2
grupirani podaci  
i 1
 k

f i 1
i

7. KOEFICIJENT VARIJACIJE – realtivna mjera disperzije. Određuje se kao omjer srtandardne devijacije i
aritmetičke sredine pomnožen sa sto.

V   100
x

Standardna devijacija se interpretira kao prosječno odstupanje od prosjeka izraženo apsolutno, a koeficijent
varijacije kao to isto odstupanje izraženo relativno i to u vidu postotka.

21
STANDARDIZIRANA VARIJABLA – linearna transformacija numeričke varijable x. Određuje se tako da se
odstupanja numeričke varijable od njezine aritmetičke sredine podijele sa standardnom devijacijom, tj. da se
izraze u jedinicama standardnih devijacija. Aritmetička sredina standardizirane varijable jednaka je nuli, a
standardna devijacija jednaka je jedan.
xx
z z  0 ; z 1

PRAVILO ČEBIŠEVA – ( koristi se za sve ostale distribucije koje nisu zvonolikog oblika) govori da je najmanja
proporcija članova bilo kojeg niza obuhvaćenih bilo kojim intervalom x  k , k  1 , jednaka 1  12 .
k
U pojasu x  2 nalazi se najmanje 0.75 tj. 75% svih podataka.
U pojasu x  3 nalazi se najmanje 0.889 tj. 88.89% svih podataka.

Vrijednost koja odstupa od prosjeka za 3 ili više standardnih devijacija je netipična, jer je proporcija takovih
vrijednosti vrlo mala, ili ekvivalentno mala je vjerojatnost izbora takve vrijednosti.

TIPIČNO
NETIPIČNO NETIPIČNO

-3  3

EMPIRIJSKO PRAVILO (pravilo normalne distribucije):


Korisni statistički koncept za otkrivanje netipičnih izdvojenih
vrijednosti, te za utvrđivanje relativnog položaja xi s obzirom na
aritmetičku sredini, a temelje se na standardiziranoj vrijednosti
varijable z.
Ako su podaci raspoređeni po normalnoj distribuciji onda:
 pojas x  1 obuhvaća oko 68% podataka
 pojas x  2 obuhvaća oko 95% podataka
 pojas x  3 obuhvaća oko 99.73% podataka

 3  2  1 x 1 2 3

TIPIČNO
NETIPIČNO NETIPIČNO

-2  2

22
MJERE ASIMETRIJE
– njima se mjeri način rasporeda podataka prema aritmetičkoj sredini ili nekoj drugoj vrijednosti.Najvažnije su:
1. Koeficijent asimetrije α3 - potpuna mjera
2. Pearsonova mjera nepotpune
3. Bowleyeva mjera mjere

1. KOEFICIJENT ASIMETRIJE α3
MOMENTI OKO SREDINE – aritmetičke sredine odstupanja vrijednosti numeričke varijable od
njezine aritmetičke sredine podignuti na neku potenciju
N

(x i  x)
pojedinačni podaci   r 
i 1

N
k

 f (x i i  x)r
grupirani podaci   r 
i 1
 k

f i 1
i

- s obzirom na veličinu r govori se o nultom, prvom, drugom, trećem ili četvrtom momentu oko
sredine

- koeficijent asimetrije α3 je omjeru trećeg momenta oko sredine i standardne devijacije podignute
3
na treću potenciju   3  obično se kreće u intervalu ±2, a u određenim slučajevima može
3
biti izvan toga intervala:
α3 = 0  simetrična distribucija
α3 < 0  negativno asimetrična distribucija
α3 > 0  pozitivno asimetrična distribucija

2. PEARSONOVA MJERA – temelji se na odnosu srednjih vrijednosti u distribucijama frekvencija

 simetrična distribucija 

23
 pozitivno asimetrična distribucija 

 negativno asimetrična distibucija 

- Pearsonova mjera definira se kao standardizirano odstupanje vrijednosti medijana ili moda od
aritmetičke sredine:
3( x  Me) ( x  Mo)
St  St  kreće se u intervalu ±3
 
St = 0  simetrična distribucija
St > 0  pozitivno asimetrična distribucija
St < 0  negativno asimetrična distribucija

3. BOWLEYJEVA MJERA – temelji se na odnosu medijana i kvartila

 simetrična distribucija 
Me  Q1  Q3  Me
Q1  Q3  2 Me  0

 pozitivno asimetrična distribucija 


Me  Q1  Q3  Me
Q1  Q3  2 Me  0

24
 negativno asimetrična distibucija 
Me  Q1  Q3  Me
Q1  Q3  2 Me  0

Q1  Q3  2 Me
S ka  kreće se u intervalu ±1
Q3  Q1
Ska = 0  simetrična distribucija
Ska > 0  pozitivno asimetrična distribucija
Ska < 0  negativno asimetrična distribucija

MJERA ZAOBLJENOSTI

KOEFICIJENT ZAOBLJENOSTI α4 – njime se mjeri zaobljenost modalnog vrha distribucije. Izračunava se kao

omjer četvrtog momenta oko sredine i standardne devijacije podignute na 4. potenciju   4  44

N

 (x i  x)4
 negrupirani podaci   4  i 1

N
k

 f (x x) i i
4

 grupirani podaci   4  i 1
k

fi 1
i

- α4 = 3  NORMALNA DISTRIBUCIJA – najvažnija teorijska


distribucija
- α4 > 3  šiljatija distribucija od normalne
- α4 < 3  plosnatija distribucija od normalne

- α4 ≈ 1.8  pravokutna distribucija


- α4 < 1.8  U-distibucija

25
EKSCES – alternativna mjera zaobljenosti  K   1  3
K = 0 ---- normalna distribucija
K > 0 ---- šiljatija distribucija
K < 0 ---- plosnatija distribucija

MJERE KONCENTRACIJE –
njima se mjeri način rasporeda totala po jedinicama niza
 apsolutne – najčešće se koriste koncentracijski omjeri
 relativne – najčešće se koristi Ginijev koeficijent koncentracije

1. KONCENTRACIJSKI OMJER reda r se određuje tako da se zbroj r vrijednosti (od njih N) podijeli sa
zbrojem N vrijednosti. Pri tome se pretpostavlja da su podaci poredani od najvećeg prema najmanjem.
r

x
i 1
i
1
Cr  N
 Cr  1
N
x
i 1
i

Ako se radi o ravnomjernoj raspodjeli, koncentracijski omjer poprima vrijednost od 1 do N.


A ako se radi o maksimalnoj raspodijeli, koncentracijski omjer poprima vrijednost 1.
- u analizi koncentracije koristi se grafički prikaz – LORENZOVA KRIVULJA
1) na osi apscisa nalazi se aritmetičko mjerilo za kumulativni niz relativnih frekvencija
2) na osi ordinata nalazi se aritmetičko mjerilo za kumulativni niz proporcija podtotala
3) prva točka ima koordinate (0,0); posljednja točka ima koordinate (1,1); koordinate ostalih točaka
određene su vrijednostima članova kumulativnih nizova
4) u grafički prikaz ucrtava se pravac jednolike raspodjele, on prolazi točkama (0,0) i (1,1)

2. GINIJEV KOEFICIJENT – temelj za njegovo utvrđivanje je površina između pravca jednolike raspodjele i
Lorenzove krivulje. Što je koncentacija veće to se Lorenzova krivulja više udaljuje od toga pravca
N N
2 ixi  ( N  1) x i xi - pojedinačne vrijednosti varijable
 negrupirani podaci  G i 1
N
i 1

N  xi i - redni broj podatka


i 1

-podaci moraju biti uređeni od najmanjeg prema najvećem


-kreće se u intervalu od 0 do 1
-G = 0  ravnomjerna raspodjela
-G = 1  maksimalna koncentracija
 N
3. NORMIRANI KOEFICIJENT GINIJA  G  G 
N 1

26
VJEROJATNOSTI

VJEROJATNOST – brojčana mjera nastanka neizvjesnih, tj. slučajnih događaja. Vjerojatnost nastanka događaja
A jednaka je P(A) pri čemu je 0 ≤ P(A) ≤ 1. Nekada se izražava i u obliku postotka.

DEFINICIJE VJEROJATNOSTI

SLUČAJNI POKUS – pokus je slučajan ako se u definiranim uvjetima može ponavljati, ako postoje barem 2
različita ishoda te ako se ishodi ne mogu predvidjeti sa sigurnošću.
PROSTOR UZORKA S – skup svih mogućih ishoda slučajnog pokusa
SLUČAJNI DOGAĐAJ – jednočlani ili višečlani podskup skupa S te su sa događajima dopuštene skupovne
operacije.

1. KLASIČNA DEFINICIJA (vjerojatnost a priori) – pretpostavlja se da se pokus ponavlja konačan broj puta, pri
čemu se vjerojatnost određuje kao omjer povoljnog broja ishoda m i ukupnog broja ishoda n 
m
P ( A) 
n
2. STATISTIČKA VJEROJATNOST (vjerojatnost a posteriori) – broj ponavljanja pokusa je beskonačan, a
vjerojatnost se aproksimira relativnom frekvencijom, tj.omjerom apsolutne frekvencije opsega i opsega
statističkog skupa.
3. SUBJEKTIVNA VJEROJATNOST – to je broj iz intervala [0,1] određen na temelju prosudbe okolnosti
relevantnih za nastup slučajnog događaja.

SVOJSTVA VJEROJATNOSTI:
1) vjerojatnost da događaj A neće nastupiti jednaka je P(Ā)=1-P(A)
2) vjerojatnost istodobnog nastupa događaja A1 i A2 jednaka je P(A1∩A2)
3) ako su događaji međusobno isključivi, vjerojatnost da će nastupiti događaj A1 ili A2 jednaka je
P(A1UA2)=P(A1)+P(A2)
4) ako događaji nisu međusobno isključivi, vjerojatnost nastupa barem jednog od njih jednaka je
P(A1UA2)=P(A1)+P(A2)-P(A1∩A2)
5) ponekad je potrebno odrediti vjerojatnost nastupa događaja A uz uvjet da se dogodio događaj B. Takva
P( A  B)
se vjerojatnost naziva uvjetnom vjerojatnošću  P( A | B) 
P( B)
6) ako su događaji neovisni tada vrijedi da je P(A∩B)=P(A)P(B)

SLUČAJNA VARIJABLA X – numerička funkcija koja svakom ishodu slučajnog pokusa pridružuje realan broj.
 diskretna- ako poprima konačan broj vrijednosti
 kontinuirana – može poprimiti bilo koju vrijednost iz nekog intervala

27
DISTRIBUCIJA VJEROJATNOSTI
 diskretne slučajne varijable – skup uređenih parova različitih vrijednosti slučajne varijable xi i
pripadajućih vjerojatnosti p(xi). Ima slijedeća svojstva:
- p(xi) ≥ 0
- ∑p(xi) = 1
Kumulativna funkcija ili funkcija distribucije F(xi) – pokazuje kolika je vjerojatnost da slučajna
varijabla x poprimi vrijednost xi ili manju.
 kontinuirane slučajne varijable – opisuje razdiobu vjerojatnosti na intervalu vrijednosti varijable. Njena
svojstva:
- f(x) ≥ 0

-  f ( x)dx  1


MODELI DISTRIBUCIJA VJEROJATNOSTI – temelj inferencijalne statistike


Distribucije vjerojatnosti diskretne slučajne varijable: (najčešće se koriste binomna i poissonova)
1. BINOMNA
2. POISSONOVA
3. HIPERGEOMETRIJSKA
4. UNIFORMNA

1. BINOMNA DISTRIBUCIJA – njena je definicija povezana sa Bernaulijevim pokusom. Bernaulijev pokus je


slučajni pokus slijedećih svojstava: - ima dva ishoda (uspjeh i neuspjeh)
- vjerojatnost ishoda uspjeh je p, a neuspjeh q=1-p
- pokusi su neovisni
n  n n!
P( x)     p x  (1  p) n x   
 x  x  x!( n  x )!
n-broj ponavljanja Bernaulijevih pokusa
p-vjerojatnst ishoda uspjeh
x-slučajni broj ishoda uspjeha

Očekivana vrijednost  Ex   n  p


Varijanca    n  p  (1  p)
2

2. POISSONOVA DISTRIBUCIJA – granični slučaj binomne distribucije. Prikladna je za opis rijetkih događaja, tj.
događaja koji se javljaju s malom vjerojatnošću.
e n x
p( x )  x-broj povoljnih ishoda
x!
Očekivana vrijednost  E x   
Varijanca    
2

28
Distribucije vjerojatnosti kontinuirane slučajne varijable:
1. NORMALNA (GAUSSOVA)
2. STUDENTOVA (T-DISTRIBUCIJA)
3.  2 (HI-KVADRAT)
4. F-DISTRIBUCIJA
5. UNIFORMNA KONTINUIRANA
6. EKSPONENCIJALNA

1. NORMALNA (GAUSSOVA) DISTRIBUCIJA – najvažnija distribucija vjerojatnosti.


- dvoparametarska funkcija (određena s 2 parametra) : očekivana vrijednost i varijanca N ( ,  2 )
- zvonolika je i simtrična
- budući da aritmetička sredina i standardna devijacija ovise o mjernim jedinicama varijable uvodi se
x
jedinična (standardizirana) normalna distribucija  z  N (0,1);  2  0;  2
2


Jedinična normalna distribucija je tabelirana. U poljima tabele nalaze se površine koje predstavljaju
vjerojatnosti. U pred-stupcu tabele su sve vrijednosti izražene kao brojevi s jednom decimalom. Druga
decimala nalazi se u zaglavlju.Budući da je distribucija simetrična u tabeli su dane samo vrijednosti z.

 označena površina označava vjerojatnost da


slučajna varijabla poprimi vrijednost iz intervala od 0 do
z.

2. STUDENTOVA DISTRIBUCIJA
- njen oblik je određen veličinom n
- za n>30 (veliki uzorak) distribucija se po obliku približava normalnoj distribuciji
- za n<30 (mali uzorak) distribucija je više razvučena na obje strane uzduž apscise
- i ona je zvonolika i simetrična te tabelirana
- u pred-stupcu tablice nalaze se stupnjevi slobode, u zaglavlju su vjerojatnosti. U poljima tabele su
kritične vrijednosti.

Vjerojatnost da će slučajna varijabla koja se ravna po Studentovoj


distribuciji poprimiti vrijednost veću od tα iznosi α.

29
3. HI KVADRAT distribucija
- Koristi se pri testiranju hipoteza o jednakosti proporcija 3 ili više osnovnih skupova
- Koristi se za testiranje hipoteza o nezavisnosti obilježja
- U predstupcu; stupnjevi slobode
- U zaglavlju: vjerojatnosti
- U poljima tabele: kritične vrijednosti

4. F DISTRIBUCIJA
- Koristi se u području regresije ( testiranje hipoteza o značajnosti nezavisnih varijabli)
- Razina signifikantnosti može biti 1% ili 5%

30
INFERENCIJALNA STATISTIKA

INFERENCIJALNA STATISTIKA – skup analitičkih metoda koje polaze od uzorka.. Budući da se zaključci donose
na temelju dijela podataka oni sadrže pogrešku nastalu zbog primjene uzorka (Sampling error).
To je induktivni pristup statističkoj analizi koji od manjeg broja podataka jednog slučajnog uzorka void do
informacija o populaciji.

2 skupine metoda inferencijalne statistike:

1. Metode procjenjivanja nepoznatih parametara populacije uz odabranu razinu pouzdanosti


2. Metode testiranja statističkih hipoteza o nepoznatim parametrima populacije uz odabranu razinu
značajnosti

Faktori koji uvjetuju primjenu uzorka su slijedeći:


3. pojedini konačni skupovi sadrže veliki broj članova pa bi njihovo istraživanje zahtijevalo velika
financijska sredstva
4. do rezultata se dolazi u kraćem vremenu
5. uzorak se primjenjuje kada bi se istraživanjem uništio čitav statistički skup (npr.istraživanje trajnosti
električnih žarulja)
6. beskonačni skupovi istražuju se isključivo metodom uzorka (pr.beskonačnog skupa:proizvodnja)

Dvije su osnovne zadaće metode uzorka:


1. procjenjivanje parametra
2. testiranje hipoteza

PLAN UZORKA – plan izbora jedinica u uzorak. Osnovna svrha plana je izbor reprezentativnog uzorka, tj.
uzorak mora biti umanjena slika osnovnog skupa.
S obzirom na način izbora jedinica uzorka razlikuju se namjerni i slučajni uzorci.

1. namjerni uzorci – jedinice uzorka izabiru se prema odluci istraživača


 prigodni uzorak – ispituju se dostupne jedinice (npr.javno mišljenje)
 uzorak izabran na temelju prosudbe istraživača – istraživač izabire reprezentativne
jedinice pri čemu je potrebno da dobro poznaje osnovni skup
 kvotni uzorak – anketari se slobodno odlučuju za jedinice u sklopu kvota
Namjerni uzorci jednostavni su za primjenu te se često koriste. Analiziraju se metodama
deskriptivne statistike.
Nedostatak: nije moguće izračunati grešku nastalu zbog primjene uzorka.

2. slučajni uzorci – svaki elemnt ima vjerojatnost izbora veću od nule. Kod ovih uzoraka moguće je
izračunati grešku. Analiziraju se metodama inferencijalne statistike.
 jednostavni slučajni uzorak – svaki element ima jednaku vjerojatnost izbora. primjenjuje
se kod homogenih skupova.
 stratificirani uzorak – prikladniji je kod skupova koji pokazuju veći stupanj varijabilnosti.
Jedinice se izabiru iz homogenih dijelova osnovnog skupa koji se nazivaju STRATUMI.
 uzorak skupina – u uzorak se ne izabiru pojedini elementi nego njihove skupine.
31
Ponekad se primjenjuje sistematski izbor (npr.ako iz skupa od 10 000 članova biramo uzorak
veličine 1000 birat ćemo svaki 10. član). Budući da se radi o slučajnom uzorku potrebno je
odrediti slučajni početak.

OKVIR IZBORA – popis članova statističkog skupa (npr.birački popis)

SAMPLING DISTRIBUCIJA – teorijska distribucija vjerojatnosti procjenitelja parametra. Zasniva se na


konceptu ponovljenih izbora slučajnih uzoraka iz danog osnovnog skupa pri čemu različiti uzorci dovode do
različitih vrijednosti procjena.

Očekivana vrijednost sampling distribucije aritmetičkih sredina uzoraka jednaka je aritmetičkoj sredini
osnovnog skupa. Standardna devijacija sampling distribucije sredina prosječno je odstupanje aritmetičkih
sredina od aritmetičke sredine osnovnog skupa. Ona izražava pogrešku koja nastaje zbog primjene uzorka,
stoga se naziva standardnom pogreškom aritmetičke sredine.

32
PROCJENE PARAMETARA – parametar se procjenjuje brojem i intervalom.
Intervalna procjena sastoji se od određivanja granica u kojima će se naći nepoznati parametar.
(ˆ  greška. procjene  .. ..  ˆ  greška. procjene )
ˆ - karakteristika uzorka, a ujedno i procjena broja
 - karakteristika osnovnog skupa koja se procjenjuje (npr. aritmetička sredina, total i proporcija)
Procjenitelj  :
 nepristran – ako je njegova očekivana vrijednost jednaka parametru koji se procjenjuje E ˆ   
 konzistentan – ako njegova standardna devijacija s porastom uzorka teži nuli

PROCJENA ARITMETIČKE SREDINE – može biti brojem i intervalom


 procjena brojem – jednaka je aritmetičkoj sredini uzorka
 intervalna procjena za veliki uzorak (n>30) – koristi se normalna distribucija (Gaussova) 

P x  z  x    x  z  x   1    x  aritmetička sredina uzorka


 2 2  z  koeficijent pouzdanosti koji se određuje na temelju
2
površina ispod normalne krivulje
 x  standardna pogreška procjene aritm.sredine
  aritmetčka sredina osnovnog skupa,a ujedno i
parametar koji se procjenjuje
1     razina signifikantnosti

 intervalna promjena za mali uzorak (n≤30) – koristi se Studentova T – distribucija

P x  t  x    x  t  x   1    t -koeficijent pouzdanosti koji se određuje na temelju


 2 2  2
studentove distribucije

Primjer 2.
Odredite vrijednost standardne pogreške procjene aritmetičke sredine osnovnog skupa za ove slučajeve:
a) Procjenjuje se sredina konačnog skupa od 125 768 članova pomoću slučajnog uzorka veličine 1250
članova. Standardna devijacija osnovnog skupa iznosi 64.
N  125768
N- broj elemenata osnovnog skupa
n  1250 n-broj elemanata uzorka
n 1250
f    0.0099 ; f  0.05
N 125768 Frakcija izbora (f) pokazuje da je u uzorak izabrano približno
1% osnovnog skupa.
  N n 
 , f  0.05
 n N 1 
 64
  x    1.81019
x    n 1250
  
 , f  0.05 
 n 
33
b) Sredina se procjenjuje pomoću slučajnog uzorka veličine 600 formiranog izborom svakog desetog člana
konačnog osnovnog skupa, a varijanca skupa iznosi 100.
n  600 n 600
f    0.1, f  0.05
N N 6000
 10   N  10  n  6000
n  N n 10 6000  600
x    0.38733
  100     10
2
n N 1 600 6000  1

c) Uzorak veličine 36 izabran je iz beskonačnog osnovnog skupa N(μ, 52)


beskonačni skup  f<0.05 (kad u zadatku nemamo N pretpostavljamo da je skup beskonačan i f<0.05)
 5 5
x     0.83333
n 36 6

d)
N  35679
n  2500 - ˆ nepristrani procjenitelj standardne devijacije populacije (osnovnog skupa)
ˆ  10
n 2500
 ˆ N  n  f    0.07 , f  0.05
 , f  0.05 N 35679
 n N 1 
 
x  
 ˆ  ˆ N n 10 35679  2500
x    0.19287
 , f  0.05  n N 1 2500 35679  1
 n 

e) Veličina je uzorka 256 i čini 2% osnovnog skupa, a standardna devijacija uzorka je 32.
s  32 s – standardna devijacija uzorka
n  256
256
2 100   N  12800
N

f  0.02 , f  0.05 n
ˆ  32.06268
ˆ  s
n1  faktor korekcije
ˆ
x   2.00392
n

34
Primjer 3.
Tvrtka isporučuje vijke pakovanih po 100 komada. Kupac je primio pošiljku od 10000 pakovanja. Radi kontrole
izabran je slučajni uzorak od 60 pakovanja. Kontrolom je ustanovljen slijedeći broj neispravnih vijaka po
60 60

 xi  117 , x  293
2
pakovanju: 4, 3, 3, 1, 3,…. Njihov zbroj je 117. i
i 1 i 1
Procjenite brojem i intervalom prosječan broj neispravnih vijaka po pakovanju za cijelu pošiljku. Razina
povjerenja (pouzdanosti) je 95%.
n  60   veliki uzorak
n 60
f    0.006 , f  0.05
N 10000

 procjena brojem – procjenitelj aritmetičke sredine je aritmetička sredina uzorka

x
 xi  117  1.95  2  procjena prosječnog broja neispravnih vijaka po pakovanju
N 60
 intervalni procjenitelj
P x  z  x    x  z  x   1   
 2 2 

0.95:2 = 0.4750
z(P=0.4750) = 1.96

Kako nije poznata standardna devijacija osnovnog skupa potrebno je izračunati njezinu procjenu pomoću
podataka iz uzorka.
1
293  117 2
 xi 
2 1
n
 
xi
2
ˆ  60
59
 1.04840
ˆ  ˆ 1.04840
n1 x    0.13535
n 60

P1.95  1.96  0.13535    1.95  1.96  0.13535  0.95


P0.68471    2.21529  0.95

Interpretacija: S razinom pouzdanosti od 0.95 odnosno 95% očekuje se da će se prosječan broj neispravnih
vijaka po pakovanju kretati između 0.68471 i 2.21529.

35
PROCJENA TOTALA OSNOVNOG SKUPA

TOTAL – zbroj vrijednosti numeričkog obilježja. Taj je parametar povezan s aritmetičkom sredinom.


x i

T
 T  N 
N N
Zbog toga se postupak procjenjivanja totala svodi na postupak procjenjivanja aritmetičke sredine.
 procjena totala brojem - Tˆ  N  x
-  Tˆ  N   x
  2 2

intervalna procjena za veliki uzorak - P Tˆ  z  Tˆ  T  Tˆ  z  Tˆ  1   
z - koeficijent pouzdanosti
2

 Tˆ - standardna pogreška procjene totala


1    - razina pouzdanosti (povjerenja)
 intervalna procjena za mali uzorak – kao koeficijent korisnosti koristi se t .
2

ODREĐIVANJE VELIČINE UZORKA ZA PROCJENU ARITMETIČKE SREDINE OSNOVNOGA SKUPA


Veličina uzorka ovisi o slijedećim elementima:
1. vrsti osnovnog skupa (konačan ili beskonačan)
2. razini pouzdanosti procjene
3. željenoj pouzdanosti procjene
4. stupnju varijabilnosti podataka

PRETHODNA VELIČINA UZORKA n0 :


 z  
2

 ako su pogreška (d) i stupanj varijabilnosti izraženi apsolutno: 0  2 


n 
 d 

 z .V 
 ako su pogreška (dr) i stupanj varijabilnosti izraženi relativno: n0   2 
 d r 

KONAČNA VELIČINA UZORKA:

 
n , f  0.05 


0 0


n  n0
f0 
 n   frakcija: N
 0
, f o  0.05

1  f 0 

36
PROCJENA PROPORCIJE OSNOVNOG SKUPA

PROPORCIJA OSNOVNOG SKUPA – parametar koji predstavlja omjer broja članova osnovnog skupa s
određenim modalitetom obilježja i opsega statističkog skupa

m
procjenitelj procjene brojem: Pˆ  m - broj elemenata s određenim modalitetom obilježja u uzorku
n
n - broj elemenata uzorka
Sampling distribucija proporcija uzoraka ima oblik binomne ili hipergeometrijske distribucije. Za dovoljno veliki
uzorak aproksimira se normalnom distribucijom.

 
intervalna procjena za veliki uzorak: P pˆ  z  pˆ  p  pˆ  z  pˆ   1   
 2 2 
p-proporcija osnovnog skupa

TESTIRANJE HIPOTEZA O PARAMETRU

STATISTIČKA HIPOTEZA – tvrdnja o veličini parametra ili o obliku distribucije osnovnog skupa čija se istinitost
ispituje pomoću slučajnog uzorka.
TESTIRANJE STATISTIČKIH HIPOTEZA – postupak kojim se donosi odluka o prihvaćanju ili ne prihvaćanju
tvrdnje.

STATISTIČKI TESTOVI:
 parametarski – polazi se od danog oblika numeričke varijable u osnovnom skupu
 neparametarski

Svaki postupak testiranja polazi od nulte (H0) i alternativne hipoteze (H1)

U postupku donošenja odluka mogu se pojaviti dvije vrste pogrešaka:


 POGREŠKA TIPA I – nastaje ako se odbaci istinita nulta hipoteza
 POGREŠKA TIPA II – nastaje ako se prihvati lažna nulta hipoteza

RAZINA ZNAČAJNOSTI (RAZINA SIGNIFIKANTNOSTI) α – vjerojatnost odbacivanja istinite nulte hipoteze


β – vjerojatnost prihvaćanja lažne nulte hipoteze
SNAGA TESTA (1-β)– vjerojatnost odbacivanja lažne nulte hipoteze

37
TESTIRANJE HIPOTEZA O PRETPOSTVLJENOJ VRIJEDNOSTI ARITMETIČKE SREDINE
OSNOVNOG SKUPA – ovo se testiranje provodi na temelju slučajnog uzorka od N članova
N > 30 veliki uzorak – TEST VELIKIM UZORKOM
N ≤ 30 mali uzorak – TEST MALIM UZORKOM

Testiranje se provodi u slijedećim koracima:


1. postavljanje hipoteza
2. identificiranje izraza za testnu veličinu i određivanje njene vrijednosti
3. odabir razine signifikantnosti i određivanje kritičnih granica
4. donošenje odluke
Test može biti:
 dvosmjeran
 jednosmjeran (na donju ili na gornju granicu)

Odluka se može donijeti na iduće načine:


 pomoću kritičnih granica ( uspoređuje se s prosjekom)

 Z-test ; T-test (uspoređuje se s teorijskim z,t)


 pomoću empirijske razine signifikantnosti tj. p-vrijednosti (uspoređuje se s α)
P    H0
P    H1

DVOSMJERNI TEST – nije ograničen smjer odstupanja. Pretpostavka je da je aritmetička sredina jednaka
pretpostavljenoj. Pretpostavka se formulira kao nulta hipoteza.
H 0 ...........   0
H 1 ...........   0

JEDNOSMJERNI TEST NA GORNJU GRANICU - od interesa je promatrati odstupanje na više. Pretpostavlja se


da je aritmetička sredina osnovnog skupa veća od pretpostavljene. Pretpostavka se formulira kao alternativna
hipoteza. (“više od”, “najmanje”, “barem”)
H 0 ...........  0
H 1 ...........  0

JEDNOSMJERNI TEST NA DONJU GRANICU – od interesa je promatrati odstupanje na niže. Pretpostavlja se da


je aritmetička sredina osnovnog skupa manja od pretpostavljene. Pretpostavka se formulira kao alternativna
hipoteza. (“manje od”, “najviše”, “ne više od”)
H o .........  0
H 1 .........  0
38
.
TESTIRANJE HIPOTEZA O RAZLICI ARITMETIČKIH SREDINA DVAJU OSNOVNIH SKUPOVA
NEZAVISNIM UZORCIMA

Uzorci su nezavisni ako rezultati opažanja i mjerenja u jednome uzorku ne ovise o rezultatima opažanja i
mjerenja u drugome uzorku, npr. ispitivanje efikasnosti rada radnika u dvije tvornice.

Uzorci su zavisni ako se vrijednosti iz uzorka dobivaju ponovljenim opažanjem odnosno mjerenjem odabrane
varijable na istim jedinicama u različitim vremenskim terminima, npr. mjerenje efikasnosti rada radnika u istoj
tvornici prije i nakon provedenog programa stručnog usavršavanja.

DVOSMJERNI TEST – pretpostavlja se da su aritmetičke sredine osnovnih skupova jednake (μ 1,μ2).


Pretpostavka se formulira kao nulta hipoteza.
H 0 ........1   2  0
H 1 ........1   2  0

JEDNOSMJERNI TEST NA GORNJU GRANICU – pretpostavlja se da je aritmetička sredina prvog osnovnog skupa
veća od aritmetičke sredine drugog osnovnog skupa. Pretpostavka se formulira kao alternativna hipoteza.
H 0 .......1   2  0
H 1 .......1   2  0

JEDNOSMJERNI TEST NA DONJU GRANICU – pretpostavlja se da je aritmetička sredina prvog osnovnog skupa
manja od aritmetičke sredine drugog osnovnog skupa. Pretpostavka se formulira kao alternativna hipoteza.
H o ........1   2  0
H 1 ........1   2  0

39
REGRESIJSKA ANALIZA
– njom se ispituje ovisnost jedne varijable o drugoj varijabli ili o više drugih varijabli, npr.proizvodnja o broju
zaposlenih, potrošnja o visini plaće

ZAVISNA VARIJABLA – varijabla čije se varijacije objašnjavaju


NEZAVISNE VARIJABLE – varijable kojima se objašnjavaju varijacije zavisne varijable
REGRESIJSKI MODEL – jednadžba ili skup jednadžbi s konačnim brojem parametara i varijabli
 linearni
 nelinearni

MODEL JEDNOSTAVNE LINEARNE REGRESIJE – njime se izražava odnos među dvjema


pojavama. Model sadrži jednu zavisnu i jednu nezavisnu varijablu. Primjenjuje se za varijable koje su u
linearnom statističkom odnosu.

DESKRIPITVNO STATISTIČKA ANALIZA MODELA JEDNOSTAVNE LINEARNE REGRESIJE


opći oblik modela jednostavne regresije: y  f  x   e
f(x) – funkcionalni dio modela
e – stohastička varijabla koja odražava nesistemske utjecaje na zavisnu varijablu

Ako je funkcionalni dio modela oblika f  x     x model postaje: y    x  e


Ako su a i b procjene nepoznatih parametara α i β, a u i procjene nepoznatih vrijednosti varijable e, model se
može izraziti na slijedeći način: y i  a  bx i  ui
linearna regresijska jednadžba: yˆ i   0  1 xi

Do procjene a i b dolazi se primjenom metode najmanjih kvadrata: 1 


 x y  nxy
i i
 0  y  1 x
 x  nx
2 2
i

KONSTANTNI ČLAN β0 - predstavlja vrijednost regresije u slučaju kada je nezavisna varijabla jednaka nuli
REGRESIJSKI KOEFICIJENT β1 - pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna
varijabla poveća za jedinicu.

JEDNADŽBA ANALIZE VARIJANCE

y  y     yˆ i  y     yi  yˆ i 
2 2 2
i

ST  SP  SR

ST – ukupan zbroj kvadrata


SP – protumačeni zbroj kvadrata
SR – rezidualni ili neprotumačeni zbroj kvadrata
yi - empirijske ili stvarne vrijednosti zavisne varijable
y - aritmetička sredina zavisne varijable
ŷ i - regresijske vrijednosti

40
Osnove za mjerenje reprezentativnosti regresije su rezidualna odstupanja.
y  yˆ i 
2
SR
Varijanca regresije aritmetička je sredina kvadrata rezidualnih odstupanja:  yˆ  
2 i

n n
SR
Standardna devijacija regresije:  yˆ 
n
 yˆ
Koeficijent varijacije regresije: V y   100
y
Standardna devijacija regresije interpretira se kao prosječno odstupanje empirijskih vrijednosti od regresijskih
izraženo apsolutno.
Koeficijent varijacije je to isto odstupanje izraženo relativno.

Specifičan pokazatelj reprezentativnosti regresije je koeficijent determinacije:


  yˆ  y
2
SP
r  
i
0  r2  1
2

y  y
2
ST i

Regresija je to reprezentativnija što se koeficijent determinacije više približava jedinici.


Koeficijent determinacije interpretira koliko je modelom PROTUMAČENO ukupnih odstupanja.

KORELACIJSKA ANALIZA – njome se određuju jakosti veze. Mjera jakosti veze je koeficijent korelacije.
Koeficijent korelacije drugi je korijen iz koeficijenta determinacije: r   r
2

sign r  sign b 1 r  1

Ako je koeficijent korelacije jednak nula, među pojavama ne postoji veza.


Ako je koeficijent korelacije jednak -1, veza je potpuna i negativnog smjera.
Ako je koeficijent korelacije jendak +1, veza je potpuna i pozitivnog smjera.

Primjer 1.
U 6 prodavaonica na području A registriran je slijedeći broj zaposlenih i ostvareni promet u tisućama kn.
broj promet xi
2
yi
2
xi y i
zaposlenih
xi yi
2 25 4 625 50
3 31 9 961 93
8 85 . . .
4 51 . . .
7 69 . . .
6 65 . . .
30 326 178 20 398 1900

a) Odredite status varijabli u modelu!


Zavisna varijabla (y) – promet u tisućama kuna
Nezavisna varijabla (x) – broj zaposlenih
41
b) Nacrtajte dijagram rasipanja!
Konstruira se u pravokutnom koordinatnom sustavu. Na osi-x nalazi se aritmetičko mjerilo za nezavisnu
varijablu (x), a na osi-y mjerilo za zavisnu varijablu (y). Predstavlja pomoćno sredstvo za izbor oblika
funkcije u modelu.

x
x i

30
5
n 60

y
y i

326
 54.33
n 6

Iz dijagrama rasipanja se zaključuje o :


1. obliku veze – oblik veze je linearan
2. smjeru veze – smjer je pozitivan
3. jakosti veze – veza je relativno jak

Interpretacija:
β0 (konstantni član) – Kada je broj zaposlenih jednak 0 regresijska vrijednost ukupnog prometa je 6.08
tisuća kuna.
Β1(regresijski koeficijent) – Ako se broj zaposlenih poveća za jednu osobu tada će se ukupan promet
povećati linearno i u prosjeku za 9.65 tisuća kuna.

Rezidualna odstupanja izračunavaju se tako da se od stvarne varijable y i oduzme pripadajuća


regresijska vrijednost ŷ i :

Relativna rezidualna odstupanja definiraju se izrazom:

42
INFERENCIJALNO-STATISTIČKA ANALIZA MODELA JEDNOSTAVNE LINEARNE REGRESIJE – empirijske
vrijednosti zavisne varijable smatraju se uzorkom iz zamišljenoga beskonačnoga osnovnog skupa. U sklopu
inferencijalno-statističke analize provodi se procjenjivanje parametara i testiranje hipoteza.

model osnovnog skupa (populacije): yi   0  1 xi  ei


α i β – nepoznati parametri populacije
e – nepoznate vrijednosti slučajne varijable

model uzorka: yi   0  ˆxi  eˆi


ˆ i ˆ - procjene nepoznatih parametara
ê - procjene nepoznatih vrijednosti slučajne varijable

Procjene parametara brojem u sklopu inferencijalne statistike jednake su procjenama u sklopu deskriptivne
statistike, tj. ˆ  a , ˆ  b

y  yˆ i 
2
i

procjena varijance brojem: ˆ 


2 i 1
n2
n

y  yˆ i 
2
i

procjena standardne devijacije: ˆ 


i 1

n2

intervalna procjena parametra β:

 mali uzorak  P   ˆ  t  ˆ    ˆ  t  ˆ   1   
 2 2 
ˆ 2
 veliki uzorak  P   ˆ  z  ˆ    ˆ  z  ˆ   1     ˆ 
 
x  nx 2
2 2 2
i

Primjer 1.
0 ˆ
Dana je regresijska jednadžba : yˆ  125 0.092
.03
x
 ˆ

U kojim se granicama može očekivati da će se naći parametar β? Pouzdanost procjene je 95%, a n=25.

s.s.  n  k  1  n  2  23 P0.92  2.069  0.03    0.92  2.069  0.03  0.95


n 2   23 
t  t 0.025  2.069 P0.85793    0.98207   0.95
2

Uz pouzdanost od 95% očekuje se da će se nepoznati parametar naći unutar ovih granica.

43
TESTIRANJE HIPOTEZA U MODELU JEDNOSTAVNE LINEARNE REGRESIJE – može se provesti na više
ekvivalentnih načina:
1. F-TEST
H 0 ........ yi    ei H 0 .........  0
ili alternativno (češće) 
H 1 ........ yi     xi  ei H 1 .........  0

  yˆ  y
2
i
i 1
test veličina (empirijski f-omjer) : F 
ˆ 2
Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom vrijednošću koja
se očitava iz tablica.

2. T-TEST
ˆ
test veličina (empirijski t-omjer) : t 
 ˆ
Odluka se donosi usporedbom empirijskog t-omjera sa teorijskom vrijednošću koja
se očitava iz tablica.
Test se može provesti kao dvosmjerni ili jednosmjerni (na donju ili gornju granicu).
- Ako je β<0  jednosmjerni test na donju granicu
- Ako je β>0  jednosmjerni test na gornju granicu

Primjer 2.
0 ˆ1
Dana je regresijska jednadžba: yˆ  125 0.92 x
0.03
 ˆ

Može li se prihvatiti pretpostavka da je varijabla x suvišna u modelu? Testirati na razini 5% signifikantnosti.


n=25. Primjenite t-test.
H 0 .......  0 ˆ 0.92   0.05
 dvosmjerni test  t   30.667 
H 1 .......  0  ˆ 0.03 t 023
.025  2.069

ODLUKA:
t  t  H o
2
 30.667  2.069  H1
t  t  H1
2
Nezavisna varijabla x nije suvišna u modelu.

44
MODEL VIŠESTRUKE REGRESIJE (MULTIPLA REGRESIJA) – njime se izražava ovisnost jedne varijable o
više drugih varijabli.

ANALIZA MODELA VIŠESTRUKE LINEARNE REGRESIJE

model osnovnog skupa (populacije): y   0  1 x1   2 x2  .......   k xk  e


model uzorka: y  ˆ0  ˆ1 x1  ˆ2 x2  ......  ˆk xk  eˆ alternativno y  yˆ  eˆ

linearna regresijska jednadžba s procijenjenim parametrima: yˆ  ˆ0  ˆ1 x1  ˆ2 x2  ......  ˆk xk
Za procjenjivanje parametra koristi se metoda najmanjeg kvadrata.
β0- konstantni član – predstavlja vrijednost regresije kada su nezavisne varijable jednake 0.
ˆ j - regresijski koeficijent – pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna
varijabla xj poveća za jedan uz uvjet da ostale nezavisne varijable ostanu nepromijenjene.

REGRESIJSKE VRIJEDNOSTI – određuju se uvrštavanjem vrijednosti nezavisnih varijabli u regresijsku


jednadžbu.
REZIDUALNA ODSTUPANJA – odstupanja empirijskih vrijednosti od regresijskih izražena apsolutno
eˆi  yi  yˆ i
y i  yˆ i
RELATIVNA REZIDUALNA ODSTUPANJA - eˆ i ,rel   100
yi
y i  yˆ i
STANDARDIZIRANA REZIDUALNA ODSTUPANJE - eˆ i ,rel   100
ˆ
y  yˆ i  y  yˆ i 
2 2
SR
NEPRISTRANA PROCJENA VARIJANCE BROJEM - ˆ   ˆ 
2 i i

n  k  1 n  k  1 n  k  1

P ˆ j  t  ˆ    ˆ j  t  ˆ   1   
INTERVALNE PROCJENE PARAMETARA -
 2 j 2 j 

  yˆ i  y 2 SP
KOEFICIJENT VIŠESTRUKE DETERMINACIJE - R  
2
opći pokazatelj kvalitete modela
 i  y  y  2
ST
Model je to reprezentativniji što je
koeficijent determinacije bliže
jedinici.

TESTIRANJE HIPOTEZA O MODELU VIŠESTRUKE REGRESIJE – najčešće se koriste slijedeći testovi:


1. PARCIJALNI TEST – testira se značajnost podskupa nezavisne varijable
2. POJEDINAČNI TEST – testira se značajnost jedne nezavisne varijable. Može se
provesti i kao f-test i kao t-test
3. SKUPNI TEST – testira se značajnost svih nezavisnih varijabli u modelu. Uvijek
se provodi kao f-test.
H 0 ........ 1   2  ....   j   k  0
H 1 ........ j  0
45
U hipotezi H0 stoji da nijedna nezavisna varijabla nije značajna za model.
U hipotezi H1 stoji da je barem jedna nezavisna varijabla značajna za model.

Test veličina je empirijski f-omjer iz tabele ANOVA.


Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom vrijednošću koja
se očitava iz tablica.

TABLICA ANOVA ZA VIŠESTRUKU REGRESIJU:


izvor varijacije stupnjevi zbroj sredine empirijski
slobode kvadrata kvadrata f-omjer
protumačen k SP SP SP
modelom k k
SR
n  k  1
k – broj nezavisnih varijabli
neprotumačena n-(k+1) SR SR /
modelom n  k  1
(rezidualna)
odstupanja
ukupno n-1 ST / /

ukupna odstupanja: empirijske vrijednosti od prosjeka


protumačena odstupanja: regresijske vrijednosti od prosjeka
neprotumačena odstupanja: empirijske vrijednosti od regresijskih

46
MODELI VREMENSKIH SERIJA – njima se opisuje razvoj pojava u vremenu.
Vremenska serija se može raščlaniti na slijedeće komponente:
 KOMPONENTA TRENDA – predstavlja osnovnu tendenciju razvoja pojave u vremenu. Izražava se
nekom funkcijom vremena. S obzirom na tu funkciju vremena trend može biti linearni i
eksponencijalni.
 SEZONSKA KOMPONENTA – posljedica je klimatskih faktora, ritma, proizvodnje, potrošnje…
Očituje se onda kada se vremenska pojava obnavlja na približno isti način unutar jedne godine.
 CIKLIČKA KOMPONENTA – očituje se onda kada se vremenska pojava obnavlja na približno isti
način s periodom od 2 ili više godine.
 SLUČAJNA (STOHASTIČKA) KOMPONENTA – odražava nesistematske utjecaje na pojavu

opći oblik aditivnog modela: Y  T  C  S  e Y – pojava koju promatramo


T – vrijednost komponente trenda
C – vrijednost cikličke komponente
S – vrijednost sezonske komponente
e – vrijednost slučajne komponente
U kratkom vremenskom razdoblju trend i ciklus komponente se ne razdvajaju pa se model može pisati:
Y  TC  S  e ili Y  T  S  e T – komponenta trend ciklusa

I s  sezonskakomponenta
opći oblik multiplikativnog modela: Y  T  I s  I 
I   sluč . komponenta

47
M OD ELI T R EN D A – njima se statistički opisuje dugoročna kovarijacija pojave sa vremenom
Y  vrijednosti vremenske serije
1. ADITIVNI MODEL: Y  T  e T  vrijednosti komponente trenda
2. MULTIPLIKATIVNI MODEL: Y  T  I  e, I   sluč . odstupanja od trenda

xt  nezavisna var ijabla vrijeme koja


3. MODEL LINEARNOG TRENDA: Yt    xt  et dogovorno poprima vrijednosti
4. MODEL EKSPONENCIJALNOG TRENDA: Yt     t
xt
prvih n prirodnih brojeva
et  sluč . odstupanja
 ,   parametri

Primjer 1. Linearni trend


Model linearnog trenda identičan je modelu jednostavne linearne regresije u kojemu je vrijeme nezavisna
varijabla. Prikladan je kada se vremenska pojava mijenja od razdoblja do razdoblja za približno isti apsolutni
iznos, tj. kada su prve diferencije približno konstantne.
Stanovništvo SAD-a u milijunima, stanje sredinom godine
godina stanovništvo prve varijabla xt yt xt
2
yt
2
trend rezidualna
diferencije vrijeme vrijednosti odstupanja
yt y t xt ŷ t Ut
1992 255 - 1 255 1 65025 255.32 -0.32
1993 258 3 2 516 4 . 257.93 0.07
1994 261 3 3 . . . 260.53 0.47
1995 263 2 4 . . . 263.13 -0.13
1996 266 3 5 . . . 265.73 0.27
1997 268 2 6 . . . 268.33 -0.33
ukupno 1571 - 21 5544 91 411459 1571.00 0.00

a) Odredite vrijednosti prvih diferencija! Što se zaključuje na temelju grafa i prvih diferencijacija?
Yt  Yt  Yt 1
Ako su prve diferencije približno konstantne radi se o linearnom trendu.

b) Procijenite parametre modela linearnog trenda metodom najmanjih kvadrata!


Yˆt   0  1 xt
Varijabla vrijeme – koliko podataka imamo toliko brojeva poprima (1,….,n)

x
 xt  21  3.5  xt yt  nxy  5544  6  3.5  261.83  2.604
 

n 6 91  6  3.5 2
xt  nx 2
1
 2

y
 yt  1571  261.83  0  Y  1 x  261.83  2.604  3.5  252.716
n 6

48
Yˆ  252.716  2.604 x jedinica za y je milijun s tan ovnika
jednadžba linearnog trenda:
x  1, 30.06.1992 jedinica za x je jedna godina

Interpretacija:
a (konstantni član) = 252.716
Vrijednost trenda broja stanovnika za godinu koja prethodi prvoj godini u nizu tj.za 1991. iznosi
252.716 milijuna.

b (koeficijent linearnog trenda) = 2.604


Pokazuje prosječnu linearnu pojavu razine pojave za jedinični porast vrijednostii varijable vrijeme,
dakle broj stanovnika povećavao se u prosjeku linearno 2.604 milijuna godišnje

c) Odredite trend vrijednosti!


Računaju se uvrštavanjem varijable vrijeme u jednadžbu trenda.
Yˆ1  252.716  2.604  1  255.32
Procjena broja stanovnika prema trendu za 1992. iznosi 255.32 milijuna. Y  Yˆ
t t

d) Odredite rezidualna osdtupanja i protumačite im značenje!


et  Yt  Yˆt
  et  0 za malu decimalu se može razlikovati od 0 zbog zaokruživanja
e1  255  255.32  0.32
Interpretacija:
Stvarni broj stanovnika zta 1992.g. iznosi 255 milijuna, a vrijednost trenda broja stanovnika za tu
godinu 255.32 milijuna. Razlika predstavlja rezidualno odstupanje, tj. prema trendu broj stanovnika je
precijenjen za 0.32 milijuna

e) Formulirajte tabelu ANOVA!


ST   Yt  ny 2  411459  6  261,833  129.31
2

SR   Yt  a  Yt  b xt yt  411459  252.716  1571  2.604  5544  5.59


2

SP  ST  SR  123.72

izvor varijacije stupnjevi zbroj sredina empirijski f-omjer


slobode kvadrata kvadrata
protumačen k SP SP/k SP k
88.37
modelom 1 123.72 123.72 SR n  (k  1)
neprotumačena n-(k+1) SR SR/n-(k+1) /
odstupanja 4 5.59 1.40
ukupno n-1 ST / /
5 129.31

49
f) Izračunajte varijancu, standardnu devijaciju i koeficijent varijacije trenda! to su mjere reprezentativnosti
trenda.
 
 yˆ 2   t t 
 ˆ 2
Y y SR 5.59
  0.93
n n 6
 yˆ   yˆ 2  0.30 milijuna s tan ovnika
 yˆ 0.30
V yˆ  100  100  0.11%
y 261.83
Interpretacija:
Prosječno odstupanje stvarnog broja stanovnika od vrijednosti trenda iznosi 0.30 milijuna ili
relativno 0.11%. Na temelju ovih pokazatelja može se zaključiti da je reprezentativnost trenda velika.

Primjer 2. Eksponencijalni trend


Prikladan je kada se vremenska pojava mijenja od razdoblja do razdoblja za približno isti relativni iznos, tj. kada
su verižni indeksi približno konstantni.
primjer eksponencijalnog trenda  Yˆ  ab x

log yˆ  log  0  x log 1

log 1 
 x log Y  x  log Y
t t t

 x  nx
2 2
t

log  0 
 log Y  log  x
t
1
n
Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model linearnog trenda. U
linegriziranom modelu se umjesto originalnih vrijednosti koriste njihovi logaritmi.

Interpretacija:
a (konstantni član)
To je trend vrijednost za razdoblje prije prvoga.

b (koeficijent eksponencijalnog trenda)


Pokazuje za koliko će se puta promijeniti trend vrijednost ako se varijabla vrijeme poveća za 1.

50

You might also like