Professional Documents
Culture Documents
Pascal Statistika Teorija
Pascal Statistika Teorija
1
STATISTIČKI POJMOVI
STATISTIČKI SKUP – čine jedinice koje su predmetom promatranja statističkom metodom. Možemo promatrati
osobe, poduzeća, zemlje, proizvode itd.
OPSEG SKUPA – broj jedinica. S obzirom na opseg statistički skupovi se dijele na:
KONAČNI STATISTIČKI SKUP – studenti upisani na efzg
BESKONAČNI STATISTIČKI SKUP – bacanje novčića ili proizvodnja
Statistički skupovi definiraju se pojmovno, prostorno i vremenski.
OSNOVNI SKUP (POPULACIJA) – skup podataka o promatranom svojstvu za svaku jedinicu statističkog skupa.
UZORAK (n)
- podskup, dio osnovnog skupa. Dio podataka izdvojen iz cjelovite evidencije.
- Veličina uzorka obično je značajno manja od populacije te omogućava veću brzinu i manje troškove
prikupljanja podataka
-
2
POGREŠKE U ISTRAŽIVANJU UZORKOM:
1. Pogreške uzorka – prisutne kod istraživanja pomoću slučajnih uzoraka jer se istraživanje vrši samo na
jednom podskupu.
2. Pogreške izvan uzorka- prisutne u svim anketnim istraživanjima temeljem popisa ili uzorka
STATISTIČKO OBILJEŽJE (VARIJABLA) – svojstvo koje stupnjem ili oblikom varira od jedinice do jedinice
statističkog skupa.
MJERNE SKALE:
NOMINALNA
- sastoji se od liste naziva
- podaci kojima se opisuje svojstvo, odnosno atribut
- oblici nominalne varijable nazivaju se modalitetima ili kategorijama
ORDINALNA
- ovom skalom jedinicama statističkih skupova pridružuju se slovne oznake, simboli ili brojevi
sukladno intenzitetu mjernog svojstva
- pri redanju oblika bitan je poredak po jačini intenziteta
- nad njima se ne mogu provoditi nikakve računske operacije, ali se te vrijednosti mogu uspoređivati
INTERVALNA
- ovom skalom jedinicama statističkih skupova pridružuju se brojevi sukladno intenzitetu mjernog
svojstva. Za ovu skalu karakteristično je da ima definiranu mjernu jedinicu i dogovorno utvrđenu nulu.
npr. temperaturna ljestvica.
OMJERNA
- ovom skalom jedinicama statističkih skupova pridružuju se brojevi sukladno intenzitetu mjernog
svojstva. Za ovu skalu karakteristično je da ima definiranu mjernu jedinicu i nulu koja označava
nepostojanje svojstva. npr. plaća, broj zastoja rada stroja.
3
IZVORI PODATAKA:
PRIMARNI – prikupljaju se u skladu s ciljem istraživanja. Primarni podaci sz orginalna empirijska
kvantitativna istraživanja;
1. Anketna istraživanja
2. Istraživanja pomoću pokusa – eksperiment
3. Kontrolirana neposredna opažanja
SEKUNDARNI – prikupljaju ih razne institucije (državni zavod za statistiku, banke, agencije za
istraživanje tržišta, osiguravajući zavodi...)
ANKETNI PODACI
Dobiveni su primjenom dizajna ankete (telefonskim intervjuom, osobnim intervjuom, poštanskom
metodom)
- Anketa se definira kao vrsta statističkog istraživanja koje proučava agregate jedinica pomoću anketnog
upitnika u popisu ili na statistočkom uzorku jedinica.
- Razlikujemo ankete pomoću anketara i ankete bez anketara
S obzirom na zatvorenost
- Zatvorena pitanja s ponuđenim odgovorima
- Otvorena
S obzirom na ulogu
- Demografska pitanja o karakteristikama ispitanika
- Filterska pitanja za izdvajanje kvalificiranog sugovornika
EKSPERIMENTALNI PODACI
Rezultat su primjene dizajna eksperimenta.
Primjena dizajna eksperime: u fazi razvoja proizvoda, u fazi razrade, u fazi promidžbe itd.
OPAŽENI PODACI
Dobiveni su izravnim kontroliranim opažanjima
Metoda tajnog kupca
4
UREĐIVANJE PODATAKA – uređivanjem podataka nastaju statistički nizovi
STATISTIČKI NIZOVI:
1. NOMINALNI NIZ – nastaje uređivanjem podataka o nominalnom obilježju
2. REDOSLIJEDNI NIZ – nastaje uređivanjem podataka o rang varijabli
3. NUMERIČKI NIZ – nastaje uređenjem podataka koji predstavljaju vrijednosti numeričke varijable
4. VREMENSKI NIZ – nastaje kronološkim nizanjem podataka o nekoj pojavi (proizvodnja,uvoz,izvoz)
SKUPNA – sadrži barem dva niza koji su grupirani prema modalitetima istog obilježja
Izvoz i uvoz prema pretežnoj ekonomskoj namjeni u milijunima am. $
u RH, 2003.g.
EKONOMSKA NAMJENA IZVOZ UVOZ
proizvodi za reprodukciju 2959 6583
proizvodi za investicije 1341 3316
proizvodi za široku potrošnju 1886 4311
izvor: SLJRH, 2004.g., str.386
STAROST SPOL
M Ž
0 – 14 388 370
15 – 64 1482 1501
65 - 266 430
izvor: SLJRH, 2004.g., str.95
5
RELATIVNI BROJEVI – omogućavaju elementarnu analizu podataka u sklopu deskriptivne statistike
proporcije (dio/cjelina), postoci (dio/cjelina*100) odnosno relativne frekvencije
indeksi
relativni brojevi koordinacije – omjerni brojevi koji nastaju diobom dvaju koordinirajućih veličina
(npr.gustoća stanovništva, dohodak po stanovniku, BDP per capita)
NOMINALNI ILI REDOSLIJEDNI NIZ čine parovi različitog oblika kvalitativne varijable oi i pripadajućih
frekvencija fi (oi, fi), i=1,2,....,k
i 1
fi
i 1
fi
6
NUMERIČKI NIZOVI – nastaju uređenjem numeričkih podataka. Način njihova uređivanja ovisi o tome da li
su podaci diskretni ili kontinuirani.
NAČINI UREĐIVANJA:
(negrupirani podaci grafički se prikazuju S-L dijagramom ili dijagramom s točkama)
1. mali broj podataka - uređuje se nizanjem po veličini. Pojedinačni numerički podaci grafički se prikazuju
dijagramom s točkama i dijagramom stablo-list (S-L dijagram)
Primjer 1.
Podaci o prodaji proizvoda A za 15 dana jednog razdoblja:
Xi: 8, 15, 9, 17, 20, 14, 34, 27, 30, 18, 10, 18, 24, 25, 29
Podaci uređeni po veličini:
Xi: 8, 9, 10, 14, 15, 17, 18, 18, 20, 24, 25, 27, 29, 30, 34
dijagram s točkama:
dijagram stablo-list:
- je grafička tehnika koja se koristi za preeliminarnu analizu numeričkih podataka.
- Konstruiranje: podaci trebaju biti poredani od najmanjeg do najvećeg, brojevi se dijele na stablo i
listove, u prvom stupcu su poredana stable, a u ostalim stupcima poredani su svi listovi od
najmanjeg do najvećeg.
0 8 9
1 0 4 5 7 8 8
2 0 4 5 7 9
3 0 4
O|8 predstavlja 8
7
2. diskretno obilježje - velik broj podataka i manji broj oblika – pristupa se grupiranju. Numerički niz
odnosno distribucija frekvencija se sastoji od parova (xi, fi), i=1,2,....,k
xi – modaliteti numeričkog obilježja
fi – pripadajuće frekvencije
Primjer 2.
Dnevna prodaja garnitura sobnog namještaja
BROJ GARNITURA BROJ DANA
xi fi
1 1
2 5
3 8
4 26
5 19
6 12
ukupno 71
3. kontinuirano obilježje/ diskretno obilježje s većim brojem oblika – grupiranje se provodi na temelju
razreda. Svaki razred ima donju i gornju granicu.
frekvencija razreda – broj podataka omeđen donjom i gornjom granicom razreda
Numerički niz odnosno distribucija frekvencija sastoji se od parova razreda i pripadajućih frekvencija
(Li1 ≤ xi ≤ Li2, fi), i= 1,2,....,k
Li1 – donja granica i-tog razreda; Li2 – gornja granica i-tog razreda; fi – frekvencija i-tog razreda
Primjer 3.
Radnici poduzeća A prema
starosti
STAROST BROJ RADNIKA
18 – 26 5
26 – 34 6
34 – 42 10
42 – 50 5
50 – 58 4
ukupno 30
Formiranju distribucije frekvencija prethodi određivanje broja razreda i njihove veličine. Za određivanje
broja razreda koristi se Sturgesovo pravilo: k ≈ 1 + 3,3 logN
(k-broj razreda; N-zbroj frekvencija)
Ako su razredi jednakih veličina, veličina im se aproksimira tako da se raspon varijacije podijeli sa
x max x min
brojem razreda: ii
k
Razredi jednakih veličina primjenjuju se kada su podaci simetrično raspoređeni.
Razredi različitih veličina primjenjuju se kada su podaci asimetrično raspoređeni.
8
Pri brojčanoj analizi numeričkog niza potrebno je utvrditi da li su granice prave, a nakon toga odrediti
veličinu razreda i rezredne sredine.
GRANICE RAZREDA:
PRAVE – donja granica tekućeg razreda je jednaka gornjoj granici prethodnog razreda
NOMINALNE – pretvaraju se u prave tako da se svaka donja granica umanji za polovicu
jedinice, a svaka gornja se uveća za polovicu jedinice. To vrijedi za sve slučajeve osim za
navršene godine života. Kod navršenih godina života svaka se gornja granica poveća za
jedinicu.
VELIČINA RAZREDA (ii )– određuje se kao razlika gornje i donje prave granice razreda
REZREDNA SREDINA i-tog razreda (xi) – određuje se kao poluzbroj gornje i donje prave granice razreda.
g .g . d .g .
xi
2
fi
f ci
i i - bazna veličina razreda (najčešće se pojavljuje)
ib
9
HISTOGRAM:
- Grafikon stupaca može prikazivati apsolutne i relativne frekvencije
- Histogram je stupčani grafikon sastavljen od uspravnih stupaca bez razmaka
- Površine stupaca su određene frekvencijama
- X OS- granice, moraju relevantno prikazivati širinu razreda (širina stupaca mora odgovarati
širini razreda)
- Y OS- apsolutne i relativne frekvencije ( korigirane ako su razredi različitih veličina)
- Pokazuje decentriranost ili centriranost razdiobe podataka, raspršenost, odnosno disperziju
numeričkih podataka i oblik razdiobe podataka.
POLIGON FREKVENCIJA
- Linijski grafikon
- Na apcisu se nanosi mjerilo za numerički varijablu-granice, na ordinatu frekvencije
IZVEDENI NIZOVI:
KUMULATIVNI NIZ – nastaje postupnim zbrajanjem apsolutnih ili relativnih frekvencija. On
se grafički prikazuje kumulantom.
Stanovništvo prema starosti u RH u tisućama prema popisu iz 2001.g.
STAROST BROJ OSOBA PRAVE GRANICE KUMULATIVNI NIZ
0-14 758 -0.5 – 14.5 758
15-64 2983 14.5 – 64.5 3741
65-(99) 696 64.5 – (99.5) 4437
10
VREMENSKI NIZ
–skup kronološki uređenih vrijednosti koje predstavljaju neku pojavu (proizvodnja, uvoz, izvoz).
ČLANOVI NIZA – vrijednosti koje tvore niz
Na osi apscisa je mjerilo za varijablu vrijeme, a na osi ordinata za članove vremenskog niza.
OKOMITI PREKID GRAFIKONA – ako se ne raspolaže podacima za dio razdoblja moguće je izostaviti dio mjerila
na osi apscisa.
VODORAVNI PREKID GRAFIKONA – ako neka pojava varira na velikim razinama moguće je izostaviti dio mjerila
osi ordinata.
Prekidaju se samo linijski grafikoni.
POLULOGARITAMSKI GRAFIKON – koristi se ako se na istom grafikonu uspoređuju raznorodni podaci (nizovi
izraženi u različitim mjernim jedinicama). To je grafikon sa aritmetičkim mjerilom na osi apscisa, a
logaritamskim na osi ordinata.
11
Primjer 1.
Indeks se interpretira kao postotna promjena u odnosu na 100. Ako je veći od 100 predstavlja
postotno povećanje, a ako je manji od 100 predstavlja postotno smanjenje.
npr. Izvoz u RH u 2003.g. povećao se za 26.36% u odnosu na 2002.g.
indeksi na stalnoj bazi – njima se mjere promjene u odnosu na neko odabrano bazno razdoblje.
Izračunavaju se tako da se svaki član niza podijeli s vrijednošću baznog razdoblja te pomnoži sa
yt
100 I t 100
yb
BAZNO RAZDOBLJE – razdoblje u kojemu pojava nije bila izložena nekim neuobičajenim
utjecajima (prirodne katastrofe, rat). Ponekad se uzima neka vrijednost izvan niza ili nekakav
prosjek.
Bazni indeksi se grafički prikazuju linijskim grafikonom ili grafikonom jednostavnih stupaca.
Primjer 2.
GODINA IZVOZ BAZNI INDEKSI STOPA PROMJENE
1999 = 100
1999 4302 100,00 0,00
2000 4432 103,02 3,02
2001 4665 108,44 8,44
2002 4904 113,99 13,99
2003 6197 144,05 44,05
U 2003.g. izvoz se povećao za 44.05% u odnosu na baznu 1999.g.
12
SKUPNI INDEKSI
Skupni indeksi su relativni brojevi koji služe za istodobno praćenje razvoja u vremenu između dviju ili više
pojava koje čine logičku cjelinu.
Skupnim indeksom cijena izražava se, u relativnom iznosu i u prosijeku, promjena cijena skupine različitih
pojava.
Skupni indeks količina prati tijekom vremena i promjenu količine skupine pojava ( fizički obujam) u relativnom
iznosu.
Skupni indeks vrijednosti prati promjenu vrijednosti skupine pojava
Skupne indekse izračunavaju i objavljuju statistički uredi. Obično su Laspeyresova tipa: INDEKS POTROŠAČKIH
CIJENA – mjera inflacije.
Skupni indeksi cijena koriste se u postupku deflacioniranja tj. uklanjanja utjecaja promjena cijena na
vrijednosno izražene pojave.
13
SREDNJE VRIJEDNOSTI STATISTIČKOG NIZA (mjere centralne tendencije)
– konstante kojima se predstavljaju nizovi varijabilnih podataka.
POTPUNE – računaju se na temelju svih podataka. U njih se ubrajaju aritmetička, geometrijska i
harmonijska sredina.
POLOŽAJNE – u pravilu su jednake jednom modalitetu statističke varijable. U njih se ubrajaju
MOD i MEDIJAN.
MOD – najčešći modalitet varijable, odnosno to je modalitet varijable s najvećom frekvencijom Distribucija
može biti bezmodalna i multimodalna. Računa se za omjerne, intervalne, ordinalne i nominalne podatke.
1. pojedinačni podaci – kod pojedinačnih podataka MOD je vrijednost koja se najčešće pojavljuje
MEDIJAN – srednja vrijednost koja numerički niz uređen po veličini dijeli na dva jednakobrojna dijela
1. pojedinačni podaci (neparan broj) – MEDIJAN je jednak vrijednosti varijable središnjeg člana u nizu
N
INT M e xr N
r INT 1
2 2
Primjer:
Podaci moraju biti uređeni po veličini
1 3 5 8 10 12 14 7/2 = 3.5 ; r =4 ; Me = x4 = 8
2. pojedinačni podaci (paran broj) – MEDIJAN je jednak poluzbroju vrijednosti varijable središnjih dvaju
članova niza uređenog po veličini N/2 = INT ; Me = (xr+Xr+1)/2 ; r = N/2
Primjer:
11 24 29 37 40 53 65 72 N=8 ; r=4 ; Me = (37+40)/2 = 38.5
14
3. distribucija frekvencija s razredima – MEDIJAN se aproksimira pomoću izraza:
N
fi
M e L1 2 i
f med
KVANTILI – numerički niz uređen po veličini dijele na jednakobrojne dijelove. Medijan spada među kvantile
KVARTILI – niz uređen po veličini dijele na 4 jednakobrojna dijela
DECILI – niz uređen po veličini dijele na 10 jednakobrojnih dijelova
PERCENTILI – niz uređen po veličini dijele na 100 jednakobrojnih dijelova
Broj kvartila je za jedan manji od njihova reda, tj. 3 su kvartila, 9 decila i 99 percentila
ARITMETIČKA SREDINA – dobije se tako da se zbroje vrijednosti numeričke varijable i podijele sa njihovim
brojem.
TOTAL – zbroj vrijednosti numeričke varijable; aritmetička sredina je jednaki dio totala po jedinici
Svojstva aritmetičke sredine:
1. zbroj vrijednosti odstupanja numeričke varijable od njezine aritmetičke sredine jednak je nuli
2. zbroj kvadrata odstupanja vrijednosti numeričke varijable od njezine aritmetičke sredine minimalan je
3. aritmetička sredina nalazi se između najmanje i najveće vrijednosti niza za koji je izračunata
x
i 1
i
fixi
i 1
1. ponderi: APSOLUTNE FREKVENCIJE (fi) x
fi
k
Pixi
2. ponderi: RELATIVNE FREKVENCIJE U VIDU POSTOTAKA (Pi) x
i 1
100
15
k
3. ponderi: RELATIVNE FREKVENCIJE U VIDU PROPORCIJA (pi) x pixi
i 1
ARITMETIČKA SREDINA ARITMETIČKIH SREDINA – određuje se kao vagana sredina u kojoj se za pondere
uzima broj podataka za koje su pojedine sredine računate ili tom broju proporcionalne veličine.
k
Nixi
i 1
X k
Ni
i 1
Primjer:
Odabrane kompanije zaposlenih i prosječne mjesečne plaće u kn
KOMPANIJA BROJ PROSJEČNA UKUPNA
ZAPOSLENIH PLAĆA PLAĆA Prosječna plaća za sve kompanije:
Ni x Ni xi
3711000
ALFA 550 3500 1925000 X 3313,39
1120
GAMA 320 2300 736000
TRADE 250 4200 1050000
UKUPNO 1120 - 3711000
Ako se svaka individualna vrijednost numeričkog obilježja zamijeni aritmetičkom sredinom dobiva se polazna
veličina tj. total ili zbroj vrijednosti numeričkog obilježja.
ARITMETIČKA SREDINA RELATIVNIH BROJEVA KOORDINACIJE – određuje se kao vagana sredina u kojoj su
k
BiRi
i 1
ponderi baze tih brojeva R k
Bi
i 1
RELATIVNI BROJEVI KOORDINACIJE – omjerni su brojevi koji nastaju diobom dviju koordinirajućih veličina
Vi
Ri
Bi
Grafički se prikazuju na 2 načina:
1. jednostavnim stupcima
2. pravokutnicima čije su osnovice proporcionalne bazama tih brojeva, a visine samim relativnim
brojevima koordinacije
16
Primjer
Najveće države svijeta, površina u km2 i broj stanovnika na km2
DRŽAVA POVRŠINA U km2 STANOVNIŠTVO/ km2 UKUPAN BROJ Prosječan broj stanovnika
STANOVNIKA na km2 za sve navedene
Bi Ri Vi= Ri*Bi države:
1929776010
RUSIJA 17075400 8 136603200 R 35.22 35st. / km2
KANADA 9970610 3 29911830 54786277
SAD 9629091 30 288872730
KINA 9596961 135 1295589735
BRAZIL 8514215 21 178798515
UKUPNO 54786277 - 1929776010
G N f f f fk
Za grupirane podatke geometrijska sredina dana je izrazom: x1 1 x 2 2 .... x i i .... x k
N
negrupirani pojedinačni podaci H N
1
x
i 1 i
17
k
f
i 1
i
grupirani podaci H k
fi
x
i 1 i
MJERE DISPERZIJE
1.RASPON VARIJACIJE
pojedinačni podaci – određuje se kao razlika između najveće i najmanje vrijednosti
Rx xmax xmin
distribucija frekvencija formirana na temelju pojedinačnih podataka – određuje se kao razlika
između posljednje i prve vrijednosti
R x x k x1
distribucija frekvencija s razredima – aproksimira se kao razlika između gornje granice
posljednjeg i donje granice prvog razreda ili kao razlika razrednih sredina posljednjeg i prvog
razreda.
Raspon varijacije je apsolutna (izražena je u istim mjernim jedinicama kao i obilježje) i nepotpuna (dobiva se iz
samo dvije vrijednosti) mjera disperzije.
2.INTERKVARTIL
KVARTILI:
PRVI ILI DONJI KVARTIL (Q1) – vrijednost numeričke varijable koja članove niza dijeli u dvije skupine.
U prvoj je skupini 25% elemenata s vrijednostima varijable koja je jednaka ili manja od donjeg
kvartila, a u drugoj je skupini 75% elemenata s vrijednostima većim od donjeg kvartila.
18
DRUGI ILI MEDIJAN (Me)
TREĆI ILI GORNJI KVARTIL (Q3) - vrijednost numeričke varijable koja članove niza dijeli u dvije
skupine. U prvoj je skupini 75% elemenata s vrijednostima varijable koja je jednaka ili manja od
gornjeg kvartila, a u drugoj je skupini 25% elemenata s vrijednostima većim od gornjeg kvartila.
3.KOEFICIJENT KVARTILNE DEVIJACIJE - njime se uspoređuje stupanj disperzije raznorodnih nizova. Određuje
se kao omjer interkvartila i zbroja kvartila:
Q Q1
VQ 3 0 ≤ VQ < 1
Q3 Q1
Ovo je relativna i nepotpuna mjera disperzije.
MODIFICIRANI BOX PLOT – pored položaja medijana i kvartila, pruža mogućnost uočavanja sumnjivih
vrijednosti, te ozbiljnih izdvojenica temeljem ucrtanih karakterističkih ograda
19
SIMETRIČNA DISTRIBUCIJA
20
4. SREDNJE APSOLUTNO ODSTUPANJE (MAD) – za mjerenje disperzije može se koristiti i prosječno apsolutno
odstupanje vrijednosti varijable od njezine aritmetičke sredine ili medijana:
N N
i 1
xi x x i Me
pojedinačni podaci: MAD
i 1
MADMe
N N
za distiribuciju frekvencija apsolutne razlike ponderiraju se apsloutnim ili relativnim
frekvencijama
x
2
i x
negrupirani podaci
2 i 1
N
k
f (x i i x)2
grupirani podaci
2 i 1
k
f i 1
i
6. STANDARDNA DEVIJACIJA – pozitivni drugi korijen iz varijance. Potpuna i apsolutna mjera disperzije.
N
(x i x)2
negrupirani podaci
i 1
N
f (x i i x)2
grupirani podaci
i 1
k
f i 1
i
7. KOEFICIJENT VARIJACIJE – realtivna mjera disperzije. Određuje se kao omjer srtandardne devijacije i
aritmetičke sredine pomnožen sa sto.
V 100
x
Standardna devijacija se interpretira kao prosječno odstupanje od prosjeka izraženo apsolutno, a koeficijent
varijacije kao to isto odstupanje izraženo relativno i to u vidu postotka.
21
STANDARDIZIRANA VARIJABLA – linearna transformacija numeričke varijable x. Određuje se tako da se
odstupanja numeričke varijable od njezine aritmetičke sredine podijele sa standardnom devijacijom, tj. da se
izraze u jedinicama standardnih devijacija. Aritmetička sredina standardizirane varijable jednaka je nuli, a
standardna devijacija jednaka je jedan.
xx
z z 0 ; z 1
PRAVILO ČEBIŠEVA – ( koristi se za sve ostale distribucije koje nisu zvonolikog oblika) govori da je najmanja
proporcija članova bilo kojeg niza obuhvaćenih bilo kojim intervalom x k , k 1 , jednaka 1 12 .
k
U pojasu x 2 nalazi se najmanje 0.75 tj. 75% svih podataka.
U pojasu x 3 nalazi se najmanje 0.889 tj. 88.89% svih podataka.
Vrijednost koja odstupa od prosjeka za 3 ili više standardnih devijacija je netipična, jer je proporcija takovih
vrijednosti vrlo mala, ili ekvivalentno mala je vjerojatnost izbora takve vrijednosti.
TIPIČNO
NETIPIČNO NETIPIČNO
-3 3
3 2 1 x 1 2 3
TIPIČNO
NETIPIČNO NETIPIČNO
-2 2
22
MJERE ASIMETRIJE
– njima se mjeri način rasporeda podataka prema aritmetičkoj sredini ili nekoj drugoj vrijednosti.Najvažnije su:
1. Koeficijent asimetrije α3 - potpuna mjera
2. Pearsonova mjera nepotpune
3. Bowleyeva mjera mjere
1. KOEFICIJENT ASIMETRIJE α3
MOMENTI OKO SREDINE – aritmetičke sredine odstupanja vrijednosti numeričke varijable od
njezine aritmetičke sredine podignuti na neku potenciju
N
(x i x)
pojedinačni podaci r
i 1
N
k
f (x i i x)r
grupirani podaci r
i 1
k
f i 1
i
- s obzirom na veličinu r govori se o nultom, prvom, drugom, trećem ili četvrtom momentu oko
sredine
- koeficijent asimetrije α3 je omjeru trećeg momenta oko sredine i standardne devijacije podignute
3
na treću potenciju 3 obično se kreće u intervalu ±2, a u određenim slučajevima može
3
biti izvan toga intervala:
α3 = 0 simetrična distribucija
α3 < 0 negativno asimetrična distribucija
α3 > 0 pozitivno asimetrična distribucija
simetrična distribucija
23
pozitivno asimetrična distribucija
- Pearsonova mjera definira se kao standardizirano odstupanje vrijednosti medijana ili moda od
aritmetičke sredine:
3( x Me) ( x Mo)
St St kreće se u intervalu ±3
St = 0 simetrična distribucija
St > 0 pozitivno asimetrična distribucija
St < 0 negativno asimetrična distribucija
simetrična distribucija
Me Q1 Q3 Me
Q1 Q3 2 Me 0
24
negativno asimetrična distibucija
Me Q1 Q3 Me
Q1 Q3 2 Me 0
Q1 Q3 2 Me
S ka kreće se u intervalu ±1
Q3 Q1
Ska = 0 simetrična distribucija
Ska > 0 pozitivno asimetrična distribucija
Ska < 0 negativno asimetrična distribucija
MJERA ZAOBLJENOSTI
KOEFICIJENT ZAOBLJENOSTI α4 – njime se mjeri zaobljenost modalnog vrha distribucije. Izračunava se kao
omjer četvrtog momenta oko sredine i standardne devijacije podignute na 4. potenciju 4 44
N
(x i x)4
negrupirani podaci 4 i 1
N
k
f (x x) i i
4
grupirani podaci 4 i 1
k
fi 1
i
25
EKSCES – alternativna mjera zaobljenosti K 1 3
K = 0 ---- normalna distribucija
K > 0 ---- šiljatija distribucija
K < 0 ---- plosnatija distribucija
MJERE KONCENTRACIJE –
njima se mjeri način rasporeda totala po jedinicama niza
apsolutne – najčešće se koriste koncentracijski omjeri
relativne – najčešće se koristi Ginijev koeficijent koncentracije
1. KONCENTRACIJSKI OMJER reda r se određuje tako da se zbroj r vrijednosti (od njih N) podijeli sa
zbrojem N vrijednosti. Pri tome se pretpostavlja da su podaci poredani od najvećeg prema najmanjem.
r
x
i 1
i
1
Cr N
Cr 1
N
x
i 1
i
2. GINIJEV KOEFICIJENT – temelj za njegovo utvrđivanje je površina između pravca jednolike raspodjele i
Lorenzove krivulje. Što je koncentacija veće to se Lorenzova krivulja više udaljuje od toga pravca
N N
2 ixi ( N 1) x i xi - pojedinačne vrijednosti varijable
negrupirani podaci G i 1
N
i 1
26
VJEROJATNOSTI
VJEROJATNOST – brojčana mjera nastanka neizvjesnih, tj. slučajnih događaja. Vjerojatnost nastanka događaja
A jednaka je P(A) pri čemu je 0 ≤ P(A) ≤ 1. Nekada se izražava i u obliku postotka.
DEFINICIJE VJEROJATNOSTI
SLUČAJNI POKUS – pokus je slučajan ako se u definiranim uvjetima može ponavljati, ako postoje barem 2
različita ishoda te ako se ishodi ne mogu predvidjeti sa sigurnošću.
PROSTOR UZORKA S – skup svih mogućih ishoda slučajnog pokusa
SLUČAJNI DOGAĐAJ – jednočlani ili višečlani podskup skupa S te su sa događajima dopuštene skupovne
operacije.
1. KLASIČNA DEFINICIJA (vjerojatnost a priori) – pretpostavlja se da se pokus ponavlja konačan broj puta, pri
čemu se vjerojatnost određuje kao omjer povoljnog broja ishoda m i ukupnog broja ishoda n
m
P ( A)
n
2. STATISTIČKA VJEROJATNOST (vjerojatnost a posteriori) – broj ponavljanja pokusa je beskonačan, a
vjerojatnost se aproksimira relativnom frekvencijom, tj.omjerom apsolutne frekvencije opsega i opsega
statističkog skupa.
3. SUBJEKTIVNA VJEROJATNOST – to je broj iz intervala [0,1] određen na temelju prosudbe okolnosti
relevantnih za nastup slučajnog događaja.
SVOJSTVA VJEROJATNOSTI:
1) vjerojatnost da događaj A neće nastupiti jednaka je P(Ā)=1-P(A)
2) vjerojatnost istodobnog nastupa događaja A1 i A2 jednaka je P(A1∩A2)
3) ako su događaji međusobno isključivi, vjerojatnost da će nastupiti događaj A1 ili A2 jednaka je
P(A1UA2)=P(A1)+P(A2)
4) ako događaji nisu međusobno isključivi, vjerojatnost nastupa barem jednog od njih jednaka je
P(A1UA2)=P(A1)+P(A2)-P(A1∩A2)
5) ponekad je potrebno odrediti vjerojatnost nastupa događaja A uz uvjet da se dogodio događaj B. Takva
P( A B)
se vjerojatnost naziva uvjetnom vjerojatnošću P( A | B)
P( B)
6) ako su događaji neovisni tada vrijedi da je P(A∩B)=P(A)P(B)
SLUČAJNA VARIJABLA X – numerička funkcija koja svakom ishodu slučajnog pokusa pridružuje realan broj.
diskretna- ako poprima konačan broj vrijednosti
kontinuirana – može poprimiti bilo koju vrijednost iz nekog intervala
27
DISTRIBUCIJA VJEROJATNOSTI
diskretne slučajne varijable – skup uređenih parova različitih vrijednosti slučajne varijable xi i
pripadajućih vjerojatnosti p(xi). Ima slijedeća svojstva:
- p(xi) ≥ 0
- ∑p(xi) = 1
Kumulativna funkcija ili funkcija distribucije F(xi) – pokazuje kolika je vjerojatnost da slučajna
varijabla x poprimi vrijednost xi ili manju.
kontinuirane slučajne varijable – opisuje razdiobu vjerojatnosti na intervalu vrijednosti varijable. Njena
svojstva:
- f(x) ≥ 0
- f ( x)dx 1
2. POISSONOVA DISTRIBUCIJA – granični slučaj binomne distribucije. Prikladna je za opis rijetkih događaja, tj.
događaja koji se javljaju s malom vjerojatnošću.
e n x
p( x ) x-broj povoljnih ishoda
x!
Očekivana vrijednost E x
Varijanca
2
28
Distribucije vjerojatnosti kontinuirane slučajne varijable:
1. NORMALNA (GAUSSOVA)
2. STUDENTOVA (T-DISTRIBUCIJA)
3. 2 (HI-KVADRAT)
4. F-DISTRIBUCIJA
5. UNIFORMNA KONTINUIRANA
6. EKSPONENCIJALNA
Jedinična normalna distribucija je tabelirana. U poljima tabele nalaze se površine koje predstavljaju
vjerojatnosti. U pred-stupcu tabele su sve vrijednosti izražene kao brojevi s jednom decimalom. Druga
decimala nalazi se u zaglavlju.Budući da je distribucija simetrična u tabeli su dane samo vrijednosti z.
2. STUDENTOVA DISTRIBUCIJA
- njen oblik je određen veličinom n
- za n>30 (veliki uzorak) distribucija se po obliku približava normalnoj distribuciji
- za n<30 (mali uzorak) distribucija je više razvučena na obje strane uzduž apscise
- i ona je zvonolika i simetrična te tabelirana
- u pred-stupcu tablice nalaze se stupnjevi slobode, u zaglavlju su vjerojatnosti. U poljima tabele su
kritične vrijednosti.
29
3. HI KVADRAT distribucija
- Koristi se pri testiranju hipoteza o jednakosti proporcija 3 ili više osnovnih skupova
- Koristi se za testiranje hipoteza o nezavisnosti obilježja
- U predstupcu; stupnjevi slobode
- U zaglavlju: vjerojatnosti
- U poljima tabele: kritične vrijednosti
4. F DISTRIBUCIJA
- Koristi se u području regresije ( testiranje hipoteza o značajnosti nezavisnih varijabli)
- Razina signifikantnosti može biti 1% ili 5%
30
INFERENCIJALNA STATISTIKA
INFERENCIJALNA STATISTIKA – skup analitičkih metoda koje polaze od uzorka.. Budući da se zaključci donose
na temelju dijela podataka oni sadrže pogrešku nastalu zbog primjene uzorka (Sampling error).
To je induktivni pristup statističkoj analizi koji od manjeg broja podataka jednog slučajnog uzorka void do
informacija o populaciji.
PLAN UZORKA – plan izbora jedinica u uzorak. Osnovna svrha plana je izbor reprezentativnog uzorka, tj.
uzorak mora biti umanjena slika osnovnog skupa.
S obzirom na način izbora jedinica uzorka razlikuju se namjerni i slučajni uzorci.
2. slučajni uzorci – svaki elemnt ima vjerojatnost izbora veću od nule. Kod ovih uzoraka moguće je
izračunati grešku. Analiziraju se metodama inferencijalne statistike.
jednostavni slučajni uzorak – svaki element ima jednaku vjerojatnost izbora. primjenjuje
se kod homogenih skupova.
stratificirani uzorak – prikladniji je kod skupova koji pokazuju veći stupanj varijabilnosti.
Jedinice se izabiru iz homogenih dijelova osnovnog skupa koji se nazivaju STRATUMI.
uzorak skupina – u uzorak se ne izabiru pojedini elementi nego njihove skupine.
31
Ponekad se primjenjuje sistematski izbor (npr.ako iz skupa od 10 000 članova biramo uzorak
veličine 1000 birat ćemo svaki 10. član). Budući da se radi o slučajnom uzorku potrebno je
odrediti slučajni početak.
Očekivana vrijednost sampling distribucije aritmetičkih sredina uzoraka jednaka je aritmetičkoj sredini
osnovnog skupa. Standardna devijacija sampling distribucije sredina prosječno je odstupanje aritmetičkih
sredina od aritmetičke sredine osnovnog skupa. Ona izražava pogrešku koja nastaje zbog primjene uzorka,
stoga se naziva standardnom pogreškom aritmetičke sredine.
32
PROCJENE PARAMETARA – parametar se procjenjuje brojem i intervalom.
Intervalna procjena sastoji se od određivanja granica u kojima će se naći nepoznati parametar.
(ˆ greška. procjene .. .. ˆ greška. procjene )
ˆ - karakteristika uzorka, a ujedno i procjena broja
- karakteristika osnovnog skupa koja se procjenjuje (npr. aritmetička sredina, total i proporcija)
Procjenitelj :
nepristran – ako je njegova očekivana vrijednost jednaka parametru koji se procjenjuje E ˆ
konzistentan – ako njegova standardna devijacija s porastom uzorka teži nuli
Primjer 2.
Odredite vrijednost standardne pogreške procjene aritmetičke sredine osnovnog skupa za ove slučajeve:
a) Procjenjuje se sredina konačnog skupa od 125 768 članova pomoću slučajnog uzorka veličine 1250
članova. Standardna devijacija osnovnog skupa iznosi 64.
N 125768
N- broj elemenata osnovnog skupa
n 1250 n-broj elemanata uzorka
n 1250
f 0.0099 ; f 0.05
N 125768 Frakcija izbora (f) pokazuje da je u uzorak izabrano približno
1% osnovnog skupa.
N n
, f 0.05
n N 1
64
x 1.81019
x n 1250
, f 0.05
n
33
b) Sredina se procjenjuje pomoću slučajnog uzorka veličine 600 formiranog izborom svakog desetog člana
konačnog osnovnog skupa, a varijanca skupa iznosi 100.
n 600 n 600
f 0.1, f 0.05
N N 6000
10 N 10 n 6000
n N n 10 6000 600
x 0.38733
100 10
2
n N 1 600 6000 1
d)
N 35679
n 2500 - ˆ nepristrani procjenitelj standardne devijacije populacije (osnovnog skupa)
ˆ 10
n 2500
ˆ N n f 0.07 , f 0.05
, f 0.05 N 35679
n N 1
x
ˆ ˆ N n 10 35679 2500
x 0.19287
, f 0.05 n N 1 2500 35679 1
n
e) Veličina je uzorka 256 i čini 2% osnovnog skupa, a standardna devijacija uzorka je 32.
s 32 s – standardna devijacija uzorka
n 256
256
2 100 N 12800
N
f 0.02 , f 0.05 n
ˆ 32.06268
ˆ s
n1 faktor korekcije
ˆ
x 2.00392
n
34
Primjer 3.
Tvrtka isporučuje vijke pakovanih po 100 komada. Kupac je primio pošiljku od 10000 pakovanja. Radi kontrole
izabran je slučajni uzorak od 60 pakovanja. Kontrolom je ustanovljen slijedeći broj neispravnih vijaka po
60 60
xi 117 , x 293
2
pakovanju: 4, 3, 3, 1, 3,…. Njihov zbroj je 117. i
i 1 i 1
Procjenite brojem i intervalom prosječan broj neispravnih vijaka po pakovanju za cijelu pošiljku. Razina
povjerenja (pouzdanosti) je 95%.
n 60 veliki uzorak
n 60
f 0.006 , f 0.05
N 10000
x
xi 117 1.95 2 procjena prosječnog broja neispravnih vijaka po pakovanju
N 60
intervalni procjenitelj
P x z x x z x 1
2 2
0.95:2 = 0.4750
z(P=0.4750) = 1.96
Kako nije poznata standardna devijacija osnovnog skupa potrebno je izračunati njezinu procjenu pomoću
podataka iz uzorka.
1
293 117 2
xi
2 1
n
xi
2
ˆ 60
59
1.04840
ˆ ˆ 1.04840
n1 x 0.13535
n 60
Interpretacija: S razinom pouzdanosti od 0.95 odnosno 95% očekuje se da će se prosječan broj neispravnih
vijaka po pakovanju kretati između 0.68471 i 2.21529.
35
PROCJENA TOTALA OSNOVNOG SKUPA
TOTAL – zbroj vrijednosti numeričkog obilježja. Taj je parametar povezan s aritmetičkom sredinom.
x i
T
T N
N N
Zbog toga se postupak procjenjivanja totala svodi na postupak procjenjivanja aritmetičke sredine.
procjena totala brojem - Tˆ N x
- Tˆ N x
2 2
intervalna procjena za veliki uzorak - P Tˆ z Tˆ T Tˆ z Tˆ 1
z - koeficijent pouzdanosti
2
z .V
ako su pogreška (dr) i stupanj varijabilnosti izraženi relativno: n0 2
d r
n , f 0.05
0 0
n n0
f0
n frakcija: N
0
, f o 0.05
1 f 0
36
PROCJENA PROPORCIJE OSNOVNOG SKUPA
PROPORCIJA OSNOVNOG SKUPA – parametar koji predstavlja omjer broja članova osnovnog skupa s
određenim modalitetom obilježja i opsega statističkog skupa
m
procjenitelj procjene brojem: Pˆ m - broj elemenata s određenim modalitetom obilježja u uzorku
n
n - broj elemenata uzorka
Sampling distribucija proporcija uzoraka ima oblik binomne ili hipergeometrijske distribucije. Za dovoljno veliki
uzorak aproksimira se normalnom distribucijom.
intervalna procjena za veliki uzorak: P pˆ z pˆ p pˆ z pˆ 1
2 2
p-proporcija osnovnog skupa
STATISTIČKA HIPOTEZA – tvrdnja o veličini parametra ili o obliku distribucije osnovnog skupa čija se istinitost
ispituje pomoću slučajnog uzorka.
TESTIRANJE STATISTIČKIH HIPOTEZA – postupak kojim se donosi odluka o prihvaćanju ili ne prihvaćanju
tvrdnje.
STATISTIČKI TESTOVI:
parametarski – polazi se od danog oblika numeričke varijable u osnovnom skupu
neparametarski
37
TESTIRANJE HIPOTEZA O PRETPOSTVLJENOJ VRIJEDNOSTI ARITMETIČKE SREDINE
OSNOVNOG SKUPA – ovo se testiranje provodi na temelju slučajnog uzorka od N članova
N > 30 veliki uzorak – TEST VELIKIM UZORKOM
N ≤ 30 mali uzorak – TEST MALIM UZORKOM
DVOSMJERNI TEST – nije ograničen smjer odstupanja. Pretpostavka je da je aritmetička sredina jednaka
pretpostavljenoj. Pretpostavka se formulira kao nulta hipoteza.
H 0 ........... 0
H 1 ........... 0
Uzorci su nezavisni ako rezultati opažanja i mjerenja u jednome uzorku ne ovise o rezultatima opažanja i
mjerenja u drugome uzorku, npr. ispitivanje efikasnosti rada radnika u dvije tvornice.
Uzorci su zavisni ako se vrijednosti iz uzorka dobivaju ponovljenim opažanjem odnosno mjerenjem odabrane
varijable na istim jedinicama u različitim vremenskim terminima, npr. mjerenje efikasnosti rada radnika u istoj
tvornici prije i nakon provedenog programa stručnog usavršavanja.
JEDNOSMJERNI TEST NA GORNJU GRANICU – pretpostavlja se da je aritmetička sredina prvog osnovnog skupa
veća od aritmetičke sredine drugog osnovnog skupa. Pretpostavka se formulira kao alternativna hipoteza.
H 0 .......1 2 0
H 1 .......1 2 0
JEDNOSMJERNI TEST NA DONJU GRANICU – pretpostavlja se da je aritmetička sredina prvog osnovnog skupa
manja od aritmetičke sredine drugog osnovnog skupa. Pretpostavka se formulira kao alternativna hipoteza.
H o ........1 2 0
H 1 ........1 2 0
39
REGRESIJSKA ANALIZA
– njom se ispituje ovisnost jedne varijable o drugoj varijabli ili o više drugih varijabli, npr.proizvodnja o broju
zaposlenih, potrošnja o visini plaće
KONSTANTNI ČLAN β0 - predstavlja vrijednost regresije u slučaju kada je nezavisna varijabla jednaka nuli
REGRESIJSKI KOEFICIJENT β1 - pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna
varijabla poveća za jedinicu.
y y yˆ i y yi yˆ i
2 2 2
i
ST SP SR
40
Osnove za mjerenje reprezentativnosti regresije su rezidualna odstupanja.
y yˆ i
2
SR
Varijanca regresije aritmetička je sredina kvadrata rezidualnih odstupanja: yˆ
2 i
n n
SR
Standardna devijacija regresije: yˆ
n
yˆ
Koeficijent varijacije regresije: V y 100
y
Standardna devijacija regresije interpretira se kao prosječno odstupanje empirijskih vrijednosti od regresijskih
izraženo apsolutno.
Koeficijent varijacije je to isto odstupanje izraženo relativno.
y y
2
ST i
KORELACIJSKA ANALIZA – njome se određuju jakosti veze. Mjera jakosti veze je koeficijent korelacije.
Koeficijent korelacije drugi je korijen iz koeficijenta determinacije: r r
2
Primjer 1.
U 6 prodavaonica na području A registriran je slijedeći broj zaposlenih i ostvareni promet u tisućama kn.
broj promet xi
2
yi
2
xi y i
zaposlenih
xi yi
2 25 4 625 50
3 31 9 961 93
8 85 . . .
4 51 . . .
7 69 . . .
6 65 . . .
30 326 178 20 398 1900
x
x i
30
5
n 60
y
y i
326
54.33
n 6
Interpretacija:
β0 (konstantni član) – Kada je broj zaposlenih jednak 0 regresijska vrijednost ukupnog prometa je 6.08
tisuća kuna.
Β1(regresijski koeficijent) – Ako se broj zaposlenih poveća za jednu osobu tada će se ukupan promet
povećati linearno i u prosjeku za 9.65 tisuća kuna.
42
INFERENCIJALNO-STATISTIČKA ANALIZA MODELA JEDNOSTAVNE LINEARNE REGRESIJE – empirijske
vrijednosti zavisne varijable smatraju se uzorkom iz zamišljenoga beskonačnoga osnovnog skupa. U sklopu
inferencijalno-statističke analize provodi se procjenjivanje parametara i testiranje hipoteza.
Procjene parametara brojem u sklopu inferencijalne statistike jednake su procjenama u sklopu deskriptivne
statistike, tj. ˆ a , ˆ b
y yˆ i
2
i
y yˆ i
2
i
n2
mali uzorak P ˆ t ˆ ˆ t ˆ 1
2 2
ˆ 2
veliki uzorak P ˆ z ˆ ˆ z ˆ 1 ˆ
x nx 2
2 2 2
i
Primjer 1.
0 ˆ
Dana je regresijska jednadžba : yˆ 125 0.092
.03
x
ˆ
U kojim se granicama može očekivati da će se naći parametar β? Pouzdanost procjene je 95%, a n=25.
43
TESTIRANJE HIPOTEZA U MODELU JEDNOSTAVNE LINEARNE REGRESIJE – može se provesti na više
ekvivalentnih načina:
1. F-TEST
H 0 ........ yi ei H 0 ......... 0
ili alternativno (češće)
H 1 ........ yi xi ei H 1 ......... 0
yˆ y
2
i
i 1
test veličina (empirijski f-omjer) : F
ˆ 2
Odluka se donosi usporedbom empirijskog f-omjera sa teorijskom vrijednošću koja
se očitava iz tablica.
2. T-TEST
ˆ
test veličina (empirijski t-omjer) : t
ˆ
Odluka se donosi usporedbom empirijskog t-omjera sa teorijskom vrijednošću koja
se očitava iz tablica.
Test se može provesti kao dvosmjerni ili jednosmjerni (na donju ili gornju granicu).
- Ako je β<0 jednosmjerni test na donju granicu
- Ako je β>0 jednosmjerni test na gornju granicu
Primjer 2.
0 ˆ1
Dana je regresijska jednadžba: yˆ 125 0.92 x
0.03
ˆ
ODLUKA:
t t H o
2
30.667 2.069 H1
t t H1
2
Nezavisna varijabla x nije suvišna u modelu.
44
MODEL VIŠESTRUKE REGRESIJE (MULTIPLA REGRESIJA) – njime se izražava ovisnost jedne varijable o
više drugih varijabli.
linearna regresijska jednadžba s procijenjenim parametrima: yˆ ˆ0 ˆ1 x1 ˆ2 x2 ...... ˆk xk
Za procjenjivanje parametra koristi se metoda najmanjeg kvadrata.
β0- konstantni član – predstavlja vrijednost regresije kada su nezavisne varijable jednake 0.
ˆ j - regresijski koeficijent – pokazuje za koliko se u prosjeku mijenja zavisna varijabla ako se nezavisna
varijabla xj poveća za jedan uz uvjet da ostale nezavisne varijable ostanu nepromijenjene.
n k 1 n k 1 n k 1
P ˆ j t ˆ ˆ j t ˆ 1
INTERVALNE PROCJENE PARAMETARA -
2 j 2 j
yˆ i y 2 SP
KOEFICIJENT VIŠESTRUKE DETERMINACIJE - R
2
opći pokazatelj kvalitete modela
i y y 2
ST
Model je to reprezentativniji što je
koeficijent determinacije bliže
jedinici.
46
MODELI VREMENSKIH SERIJA – njima se opisuje razvoj pojava u vremenu.
Vremenska serija se može raščlaniti na slijedeće komponente:
KOMPONENTA TRENDA – predstavlja osnovnu tendenciju razvoja pojave u vremenu. Izražava se
nekom funkcijom vremena. S obzirom na tu funkciju vremena trend može biti linearni i
eksponencijalni.
SEZONSKA KOMPONENTA – posljedica je klimatskih faktora, ritma, proizvodnje, potrošnje…
Očituje se onda kada se vremenska pojava obnavlja na približno isti način unutar jedne godine.
CIKLIČKA KOMPONENTA – očituje se onda kada se vremenska pojava obnavlja na približno isti
način s periodom od 2 ili više godine.
SLUČAJNA (STOHASTIČKA) KOMPONENTA – odražava nesistematske utjecaje na pojavu
I s sezonskakomponenta
opći oblik multiplikativnog modela: Y T I s I
I sluč . komponenta
47
M OD ELI T R EN D A – njima se statistički opisuje dugoročna kovarijacija pojave sa vremenom
Y vrijednosti vremenske serije
1. ADITIVNI MODEL: Y T e T vrijednosti komponente trenda
2. MULTIPLIKATIVNI MODEL: Y T I e, I sluč . odstupanja od trenda
a) Odredite vrijednosti prvih diferencija! Što se zaključuje na temelju grafa i prvih diferencijacija?
Yt Yt Yt 1
Ako su prve diferencije približno konstantne radi se o linearnom trendu.
x
xt 21 3.5 xt yt nxy 5544 6 3.5 261.83 2.604
n 6 91 6 3.5 2
xt nx 2
1
2
y
yt 1571 261.83 0 Y 1 x 261.83 2.604 3.5 252.716
n 6
48
Yˆ 252.716 2.604 x jedinica za y je milijun s tan ovnika
jednadžba linearnog trenda:
x 1, 30.06.1992 jedinica za x je jedna godina
Interpretacija:
a (konstantni član) = 252.716
Vrijednost trenda broja stanovnika za godinu koja prethodi prvoj godini u nizu tj.za 1991. iznosi
252.716 milijuna.
SP ST SR 123.72
49
f) Izračunajte varijancu, standardnu devijaciju i koeficijent varijacije trenda! to su mjere reprezentativnosti
trenda.
yˆ 2 t t
ˆ 2
Y y SR 5.59
0.93
n n 6
yˆ yˆ 2 0.30 milijuna s tan ovnika
yˆ 0.30
V yˆ 100 100 0.11%
y 261.83
Interpretacija:
Prosječno odstupanje stvarnog broja stanovnika od vrijednosti trenda iznosi 0.30 milijuna ili
relativno 0.11%. Na temelju ovih pokazatelja može se zaključiti da je reprezentativnost trenda velika.
log 1
x log Y x log Y
t t t
x nx
2 2
t
log 0
log Y log x
t
1
n
Logaritamskom transformacijom model eksponencijalnog trenda svodi se na model linearnog trenda. U
linegriziranom modelu se umjesto originalnih vrijednosti koriste njihovi logaritmi.
Interpretacija:
a (konstantni član)
To je trend vrijednost za razdoblje prije prvoga.
50