Download as pdf or txt
Download as pdf or txt
You are on page 1of 236

Dr uro Miki

Dr Neboja Ralevi

STATISTIKE METODE U MENADMENTU

BANJA LUKA

PANEVROPSKI UNIVERZITET APEIRON

FAKULTET POSLOVNE EKONOMIJE


B A NJ A L U K A
Dr uro Miki
Dr Neboja Ralevi

STATISTIKE METODE U MENADMENTU


Izdava:
Panevropski univerzitet "APEIRON"
Banja Luka
2. izdanje, godina 2006.
Odgovorno lice izdavaa,
DARKO Uremovi
Urednik:
JOVO Vojnovi, prof.
Prelom:
ALEKSANDRA Vidovi
tampa:
"ART-PRINT", Banja Luka,
p.o., grafika - dizajn - marketing
Banja Luka
Odgovorno lice tamparije:
VLADIMIRA Stijak- Ilisi
Tira 500 primjeraka

EDICIJA:

SADRAJ
1. UVOD ............................................................................................................................8
1.1 POJAM, DEFINISANJE I RAZVOJ STATISTIKE I STATISTIKE DJELATNOSTI
1.2 PREDMET, CILJ, ZADACI I METODI STATISTIKOG ISTRAIVANJA
1.3 KOMPJUTERSKI PRILAZ - PROGRAMSKA PODRKA
1.3.1 Izbor i vrednovanje programskih statistikih paketa
1.4 OSNOVNI STATISTIKI POJMOVI I KATEGORIJE
1.4.1 Statistiki skup
1.4.2 Statistika obiljeja
1.4.3 Statistike jedinice
1.4.4 Varijacija
2. PRISTUP STATISTIKOM ISTRAIVANJU
2.1 STATISTIKO POSMATRANJE I PRIKUPLJANJE PODATAKA
2.1.1 Cilj, predmet, jedinica i obiljeja posmatranja i prikupljanja
2.1.2 Izvori prikupljanja podataka
2.1.3 Naini prikupljanja podataka
2.1.4 Obim i oblik (metode) obuhvatanja jedinica posmatranja
2.1.5 Sredstva prikupljanja podataka
2.1.6 Kontrola i provjera podataka
2.2 GRUPISANJE I SREIVANJE PODATAKA
2.2.1 Statistike serije
2.2.1.1 Numerike serije strukture
2.2.1.2 Atributivne serije struktur
2.2.1.3 Vremenske serije
2.2.1.4 Prostorne serije
2.3 PRIKAZIVANJE STATISTIKIH PODATAKA
2.3.1 Tabelarno prikazivanje (statistike tabele)
2.3.2 GRAFIKO PRIKAZIVANJE
2.3.2.1 Linijski dijagrami
2.3.2.2 Povrinski dijagrami
2.4 DESKRIPTIVNE MJERE STATISTIKE ANALIZE
2.4.1 Srednje vrijednosti (mjere centralne tendencije)
2.4.2 Izraunate srednje vrijednosti sredine
2.4.2.1 Aritmetika sredina
2.4.2.2 Harmonijska sredina
2.4.2.3 Geometrijska sredina
2.4.3. Pozicione vrijednosti
2.4.3.1 Modus (Mo)
2.4.3.2 Medijana (Me)
2.5 MJERE VARIJABILITETA (DISPERZIJE)
2.5.1 Apsolutne mjere varijabiliteta
2.5.1.1 Interval varijacije
2.5.1.2. Srednje apsolutno odstupanje
2.5.1.3 Varijansa (
)
2.5.1.4 Standardna devijacija ( )
2.5.2 Relativne mjere varijabiliteta
2.5.2.1 Koeficijent varijacije
2.5.2.2 Normalizovano (standardno) odstupanje
2.5.2.3 Mjere oblika rasporeda

3. TEORIJSKE RASPODJELE SLUAJNIH PROMJENLJIVIH


3.1 RASPODJELA DISKRETNE SLUAJNE PROMJENLJIVE
3.1.1 Numeriki pokazatelji diskretne sluajne promjenljive
3.1.2 Binomna raspodjela
3.1.3 Poasonova raspodjela
3.1.4 Hipergeometrijska raspodjela
3.2 RASPODJELA NEPREKIDNE SLUAJNE PROMJENLJIVE
3.2.1 Funkcija i gustina raspodjele
3.2.2 Numeriki pokazatelji neprekidne sluajne promjenljive
3.2.3. Normalna raspodjela
3.2.4
- raspodjela
3.2.5 Studentova raspodjela
3.2.6 Fisher Snedecor-ova F-raspodjela
4. METOD UZORKA
4.1 IZBOR I NAINI FORMIRANJA UZORKA
4.2 RASPODJELA PARAMETARA UZORKA
4.2.1 Tane raspodjele parametara uzorka iz osnovnog
skupa sa normalnom raspodjelom
120
4.3ODREIVANJE OBIMA UZORKA
4.3.1 Obim uzorka za ocjenu srednje vrijednosti osnovnog
4.3.2 Obim uzorka za ocjenu proporcije svojstva A u osnovnom skupu
5. STATISTIKA OCJENA NEPOZNATIH PARAMETARA OSNOVNOG SKUPA
5.1 POJAM I VRSTE STATISTIKE OCJENE
5.2. OSNOVNA SVOJSTVA TAKASTE OCJENE
5.3 INTERVALNE OCJENE PARAMETARA RASPODJELE
5.3.1 Interval povjerenja za srednju vrijednost osnovnog skupa
(poznata varijansa)
5.3.2 Interval povjerenja za srednju vrijednost osnovnog skupa
(nepoznata varijansa)
5.3.3 Interval povjerenja za proporciju osnovnog skupa
6. TESTIRANJE STATISTIKIH HIPOTEZA
6.1 TESTIRANJE PARAMETARSKIH HIPOTEZA
6.1.1 Testiranje hipoteze o srednjoj vrijednosti osnovnog skupa
6.1.2 Testiranje hipoteze o jednakosti srednjih vrijednosti dva osnovna skupa
6.1.3 Testiranje hipoteze o proporciji u osnovnom skupu
6.1.4 Testiranje hipoteze o jednakosti proporcija dva osnovna skupa
6.2 ANALIZA VARIJANSE

132

6.2.1 Jednofaktorska analiza varijanse sa fiksiranim nivoima faktora


6.2.2

kriterijum za provjeru hipoteze o raspodjeli osnovnog skupa

7. REGRESIJA I KORELACIJA
7.1 POJAM KORELACIONE ZAVISNOSTI
7.2 PROSTA LINEARNA REGRESIJA
7.2.1 Jednaina regresije
7.2.2 Testiranje znaajnosti regresionih koeficijenata
7.2.3 Analiza varijanse

232
7.2.4 Interpolacija i ekstrapolacija
7.3 KOEFICIJENT KORELACIJE
7.3.1 Testiranje znaajnosti koeficijenta korelacije
7.4 VIESTRUKA REGRESIJA I KORELACIJA
7.4.1 Linearna regresija sa dvije nezavisno-promjenljive
7.4.1.1 Analiza varijanse
7.4.1.2 Interpolacija i ekstrapolacija
7.4.2 Viestruka korelacija
7.5 KRIVOLINIJSKA REGRESIJA I KORELACIJA
7.5.1 Prosta kvadratna regresija i korelacija
8. RELATIVNI BROJEVI
8. 1 INDEKSI
8.1.1 Individualni indeksi
8.1.2 Grupni indeksi
8.1.3 Testiranje indeksa
8.2 EKONOMSKI POKAZATELJI DINAMIKE
8.3 STATISTIKA ANALIZA DINAMIKE PRODUKTIVNOSTI
8.3.1 Mjerenje produktivnosti
8.3.2 Individualni indeks produktivnosti
8.3.3 Grupni indeks produktivnosti
8.4 STATISTIKA ANALIZA DINAMIKE ZARADA
8.4.1 Indeksi zarada
9. ANALIZA VREMENSKIH SERIJA
9.1 TREND KOMPONENTA
9.1.1 METOD POKRETNIH PROSJEKA
9.2 METOD TRENDA
9.2.1 Linearni trend
9.2.2 Kvadratni trend
9.2.3 Eksponencijalni trend
9.3 KORELACIONA ZAVISNOST IZMEDJU VREMENSKIH SERIJA
9.4 SEZONSKA KOMPONENTA
9.4.1 Metod sezonskih indeksa
DODATAK TABLICE .....................................................................................................

LITERATURA ..................................................................................................365

339

1. UVOD
1.1 Pojam, definisanje i razvoj statistike i statistike djelatnosti
Izuavanje fenomena varijacije i primjena naunih rezultata u cilju stvaranja
upravljakih informacija na zadacima odluivanja, uslovili su potrebu sistemskog pristupa u
afirmaciji pojedinih naunih disciplina. Sistemski pristup posmatranja masovnih pojava sa
aspekta otkrivanja njihove zakonomjernosti ponaanja, pretpostavlja kombinaciju empirije
sa matematikom teorijom algoritama i modela. U sutini to je pragmatian prilaz koji
pripada klasi sistemskih disciplina, meu kojima je nala put za afirmaciju i statistika. Rije
"statistika" prvi put je upotrijebljena u prvoj polovini 18. vijeka u radovima Gotfrida
Ahenvala na univerzitetu u Getingenu. Smatrao je da taj naziv preuzima od latinske rijei
"status" to znai stanje. Kao porijeklo rijei statistika navodi se takoe italijanska rije
"stato" to znai drava.
Statistika kao nauni metod kvantitativnog i kvalitativnog istraivanja varijacija
obiljeja statistikih jedinica masovnih pojava ima znaaj, kako u matematici, saobraaju,
tehnici, sociologiji itd, tako i u ekonomiji. Novi trini uslovi u modernoj ekonomiji
zahtijevaju stalno prikupljanje, ureivanje, grupisanje, obradu i tumaenje dobijenih
rezultata s ciljem donoenja kvalitetnih poslovnih odluka. Prvi poslovi statistike djelatnosti
odnosili su se na prebrojavanje i popis stanovnitva i imovine, registraciju roenih,
vjenanih i umrlih, popis vojnika, poreskih obaveznika itd, jer su vladari htjeli da znaju
demografsku i ekonomsku mo svoje drave. Uvoenjem rauna vjerovatnoe statistika
dobija u punoj mjeri sadrinu, jer mnotvo pojava koje su predmet statistikog istraivanja,
odlikuju se elementima sluajnosti i neizvjesnosti, gdje teorija vjerovatnoe nalazi svoju
punu primjenu.
Statistika istraivanja odnose se samo na mjerljive elemente, jer mjerenjem,
registracijom, popisom i prebrojavanjem odreenih injenica, statistika kvantitativno
obuhvata obim posmatrane pojave. Istie njen znaaj i vri kvantitativno istraivanje uz date
teorijske pretpostavke i naznake o postojanju odreene pravilnosti u pogledu njenog
ponaanja. Tako npr. statistikom analizom moe se utvrditi podudarnost u varijabilitetu
dviju ili vie pojava, ali to nije dokaz meusobne zavisnosti jer moe biti i koincidencija
dogaaja. Statistika analiza je skup metoda i tehnika kvantitativne analize masovnih pojava i
dogaaja koji se deavaju u sloenim dinamikim sistemima kao to su socio-ekonomski,
bioloki, proizvodni itd. Zadatak statistike je dobijanje relevantne informacije iz raspoloive
baze podataka sa unaprijed odreenom vjerovatnoom pouzdanosti, odnosno rizika
pogrenog zakljuivanja.
Statistiki metod razlikuje se od ostalih kvantitativnih metoda jer je prilagoen za
istraivanje varijabiliteta kao opteg svojstva pojava. Varijabilitet u neorganskom svijetu ne
moe se primijetiti jer se posmatra velika masa atoma i tako uoava samo ono to je opte.
Varijabilitet u organskom svijetu je uoljiv, ali poto se posmatra velika masa elija, dobija se
predstava monotone ujednaenosti. Varijabilitet je naroito prisutan i intenzivan u okviru
drutveno-ekonomskih procesa, gdje se posmatraju jedinke i njihovo pojedinano ponaanje.
Razvoj metoda i tehnika statistikog posmatranja masovnih pojava generisani su
upravljakim zadacima i potrebama njihovog konkretnog rjeavanja, naroito u toku
posljednjih pedeset godina. Meutim, prvi pisani tragovi statistike prakse, koja je krila put

statistikoj teoriji, pojavili su se oko 3000. god. p.n.e. u Kini i Egiptu, tada najrazvijenijim
dravama svijeta, a odnosili su se na popise stanovnitva i imovine. Statistika kao nauna
disciplina nastajala je istovremeno u Njemakoj i Engleskoj u 17. vijeku, kada se javljaju
dvije koncepcije: njemaka univerzitetska statistika, inspirisana radovima G. Ahenvala
(sistematizacija podataka o stanovnitvu i privredi) i engleska politika aritmetika koja je
isticala zahtjev za matematikom obradom statistikih podataka u cilju otkrivanja zakonitosti
u ponaanju posmatrane pojave.
Statistika teorija se naglo razvila u 18. vijeku zahvaljujui razvoju teorije
vjerovatnoe kao grane matematike analize. Znaajan korak u razvoju statistike u 19. vijeku
napravio je belgijski fiziar i astronom F. Ketle uvoenjem teorije vjerovatnoe, a daljem
razvoju statistike misli doprinijeli su Gaus, Poasan, Pirson, Markov, ebiov i drugi. Bri
napredak i iru primjenu statistike tokom 20. vijeka omoguio je razvoj raunarske
tehnologije i softverskih kapaciteta. Raunari velikom brzinom prihvataju, obrauju i emituju
blokove informacija koji se telekomunikacijama dostavljaju do mjesta korienja, inei tako
bazu informatike infrastrukture. Ekspanzija informacija postavlja pred statistiku nove i sve
brojnije zahtjeve, ali istovremeno prua sve ire mogunosti za primjenu sloenih analitikih
metoda kao i provjeru njihovih teorijskih rezultata. Danas se pomou statistikih metoda vre
ocjene, odmjeravaju rizici, ispituju tendencije, analiziraju odnosi i faktori koji ih odreuju,
testiraju odreene hipoteze, itd.
Postoji itav niz pokuaja definisanja statistike, to pokazuje da je ona relativno mlada
nauka. Uvaavajui sve znaajne elemente koji predstavljaju osnov za definisanje statistike
moe se kritiki prihvatiti sljedea definicija: "Statistika je nauka o varijacijama obiljeja,
zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u vremenu i
prostoru".
1.2 Predmet, cilj, zadaci i metodi statistikog istraivanja
Statistika djelatnost u svojim rudimentarnim oblicima bila je predmetno vezana za
masovne pojave, to znai da je u svom istorijskom razvoju nastala iz potreba prakse da se
varijabilne pojave posmatraju na velikom broju. Masovne pojave nisu samo predmet
statistikog istraivanja, ve predmet prouavanja tehnikih, drutvenih i drugih nauka, to
znai da je statistika samo komplementarna nauna disciplina. Kako je statistika jasno
odreena po svojim zadacima i ulozi u sklopu ostalih nauka, proizlazi da je njen predmet
istraivanja varijacija obiljeja jedinica posmatrane cjelokupnosti. Varijacija predstavlja
specifian oblik kretanja koje se ispoljava u raznim oblicima, u zavisnosti od vrste obiljeja
koje je nosilac te varijacije, odnosno jedinice koja je nosilac tog obiljeja.
Istraivanje masovnih pojava se zasniva na masovnosti i varijabilitetu, kao optim
svojstvima svih pojava, ije ponaanje nastaje i zavisi od kombinacije niza faktora koji su i
sami varijabilni. Najmanji varijabilitet individualnih sluajeva ispoljavaju elementarne pojave
u prirodi, pa se kod njih uspjeno moe primijeniti metod pojedinanog posmatranja
upotrebom klasinog eksperimentalnog rada. Sistemsko mijenjanje uticaja faktora, koji svoj
varijabilitet prenose na pojavu, zasnovano je na principima formalne logike, tako da statistika
koristi indukciju, dedukciju, analizu, sintezu, analogiju, reprezentativnost, grafiku itd, kao
metode istraivanja.
Kod pojava koje ispoljavaju vei varijabilitet ispitivanje jednog ili malog broja
sluajeva i generalizacija rezultata ne bi donosilo pouzdane zakljuke. Posmatranje ponaanja
ovih pojava u pogledu varijabiliteta na malom broju sluajeva izgleda bez reda i pravilnosti,

skoro haotino i sluajno. Prava predstava stie se posmatranjem veeg broja sluajeva, jer
tada dolaze do izraaja odreene pravilnosti i periodika zakonitosti koje autentino
odraavaju karakteristike pojave. Dakle, zadatak primjene statistikih metoda je da omogui
otkrivanje optih karakteristika varijabilnih pojava kao i njihove pravilnosti i tendencije koje
nazivamo statistikim zakonitostima. Ilustrativnu statistiku zakonitost zabiljeio je statistiar
Levi posmatranjem i obuhvatanjem velikog broja poroaja. Proirujui svoje posmatranje na
100 miliona dogaaja, konstatovao je stabilan sljedei odnos: na 81 sluaj raanja jedinki
dolazi 1 sluaj raanja dvojki; na 84 sluaja raanja dvojki dolazi 1 sluaj raanja trojki; na
85 sluajeva raanja trojki dolazi 1 sluaj raanja etvorki i na 85 sluajeva raanja etvorki
dolazi 1 sluaj raanja petorki. Dakle, zadatak statistike je da istrauje te pravilnosti i
varijacije, polazei od velikog broja sluajeva koje posmatra, uporeuje, grupie, opisuje,
obrauje, analizira i praktino provjerava kroz masovnost i varijabilitet.
Predmet statistike analize je kvantitativna analiza masovnih pojava kao skupova koji
se posmatraju sa aspekta teorije sistema sloene organizovane globalne koncepcije. U ovakve
sloene organizovane sisteme ubrajamo: privredu zemlje - skup privrednih preduzea;
zdravstvo - skup zdravstvenih institucija; stanovnitvo - svi graani jedne zemlje, itd. Ako ih
uzmemo kao predmet statistikog posmatranja, postaju osnovni statistiki skup ili populacija.
Cilj statistike analize je da se na osnovu podataka o promjenama obiljeja na
elementima statistikog skupa doe do pouzdanih informacija potrebnih za upravljanje
sloenim dinamikim sistemima. U ovim sistemima se pod uticajem sklopa unutranjih i
spoljnih faktora odvijaju izvjesne promjene preko kojih se tumai njihovo kretanje, otkrivaju
unutranje veze, kako izmeu elemenata tako i sa drugim sistemima iz okruenja i predvia
njihovo ponaanje u budunosti. U rjeavanju praktinih zadataka koristimo ograniene
empirijske podatke, tako da rezultati obrade i statistike ocjene nose u sebi element
stohastinosti. Uveanjem broja jedinica posmatranja kao i broja eksperimenata, izvedena
statistika ocjena na nivou osnovnog skupa postaje pouzdanija.
1.3 Kompjuterski prilaz - programska podrka
Programska podrka statistike obrade podataka sastoji se iz odreenog paketa
programa, kao niza logiki povezanih instrukcija, za rjeavanje odreenog zadatka. Sistemski
program, koji se stalno nalazi u operativnoj memoriji raunara, omoguava korisniku da
izvri svoje praktine aplikativne programe. Znai, programska podrka podrazumijeva
izradu i eksploataciju sopstvenih aplikativnih programa koji se obino piu na nekom od
programskih jezika prilagoenih konkretnom problemu. Takoe, postoji veliki broj gotovih
paketa statistikih programa, a u zavisnosti od sloenosti zadatka pojedini programi mogu da
sadre i potprograme, s tim to odreeni broj potprograma pojedinano korespondira s
osnovnim upravljakim programom. Ovakvi programi su univerzalni tj. mogu da se koriste za
rjeavanje ireg spektra zadataka. Problem razliitih n podataka lako se moe prikazati kao
statistiki niz od n nivoa, gdje je "n" ulazna konstanta koju korisnik unaprijed zadaje, ili se do
nje dolazi prebrojavanjem preko raunara. Za rjeavanje standardnih zadataka koriste se
softverski kapaciteti koji ine programski paket, a neki od znaajnijih paketa statistikih
programa su sljedei:
STATISTICA moan paket namijenjen statistikoj analizi sa veoma razvijenim
grafikim interfejsom
SPSS statistiki paket namijenjen analizi podataka iz oblasti drutvenih pojava,

MINITAB - namijenjen studentima koji izuavaju poetni kurs statistike i dr.


BMDP - prilagoen novoj tehnici i statistikoj metodologiji,
1.3.1 Izbor i vrednovanje programskih statistikih paketa
Izbor i primjena odreenog paketa zavisi od vrste i prirode problema. Svaki paket
programa oslobaa korisnika rutinskih raunskih zadataka, s tim to analiza i interpretacija
rezultata i dalje ostaju na njegovom znanju i iskustvu. Svaki programski paket namee
sljedee zahtjeve korisniku:

da prilagodi svoje potrebe uslovima pod kojima se koristi odgovarajui paket,


kao i da prema uputstvima koristi dobijene izlazne informacije,
da prihvati raunske metode date u programu, iako one ponekad nisu
najefikasnije za date probleme,
paketom programa nisu naznaene sve mogue izlazne informacije, tako da
neki programi daju konane ocjene statistikih parametara bez intervala
pouzdanosti,
po pravilu paketi primjenjuju standardne statistike metode to im omoguava
komercijalnost, dok korienje nestandardnih metoda podrazumijeva izradu
vlastitih programa.
Ocjena i vrednovanje paketa statistikih programa vri se na bazi stepena njegove
praktine provjere u primjeni. U principu optimalan program u jednoj situaciji nije optimalan
u drugoj, tako da korsnik procjenjuje statistiki paket, sa pozicije svojih zahtjeva u odnosu na
dati problem, na bazi sljedeih kriterija:

razumljivost za korisnika,
statistika efektivnost i
podobnost za eksploataciju.

1.4 Osnovni statistiki pojmovi i kategorije


1.4.1 Statistiki skup
Ispitivanje ponaanja masovne pojave, koja je predmet statistikog istraivanja,
podrazumijeva obuhvatanje njene manifestacije tj. registrovanje svih njenih individualnih
sluajeva. Skup svih sluajeva tj. elemenata na kojima se pojava statistiki posmatra, naziva
se osnovni skup ili populacija. Osnovni statistiki skup (masovna pojava, populacija) jeste
odreen skup elemenata, individua, sluajeva, itd. koji istovremeno postoje ili se ponavljaju,
koji se nalaze jedni do drugih ili se mijenjaju, koji se odlikuju nizom istovrsnih ali varirajuih
obiljeja, po kojima se svi elementi mase razlikuju ili su slini i koji su vezani nekom optom
vezom koja omoguava da se otkrivaju zakonitosti ponaanja pojave.
Pojedinani elementi od kojih se statistiki skup sastoji mogu biti razni predmeti,
objekti, institucije, dogaaji, sluajevi, iva bia, subjekti itd, to zavisi od prirode pojave.
Kod formiranja statistikog skupa mora se zadovoljiti kriterijum da skup bude relativno
homogen, tj. da mnotvo jedinica koje ga sainjavaju imaju barem jednu zajedniku osobinu.

Znai, jedinice koje ga ine moraju biti istovrsne, a razlike mogu da pokazuju samo u
pogledu ispitivanih osobina, tj. statistiki skup je relativno homogen ali i diferenciran s
obzirom na odabrana svojstva iji se varijabilitet ispituje. Statistiki skup mora biti odreen
sutinski, prostorno, vremenski i pojmovno. Svojstva po kojima se jedinice posmatranog
statistikog skupa meusobno razlikuju, nazivaju se statistikim obiljejima, a njihovi
pojavni oblici - modalitetima.
1.4.2 Statistika obiljeja
Svojstva po kojima se razlikuju ili su sline statistike jedinice osnovnog statistikog
skupa predstavljaju njihova obiljeja koje ih oznaavaju (obiljeavaju).. Statistike jedinice
mogu imati vei broj obiljeja koja variraju, a promjene obiljeja predstavljaju varijaciju kao
predmet statistikog istraivanja. Sve mogue varijante ili potklase svojstva jednog obiljeja
koje se mogu jasno uoiti i rasporediti nazivamo modalitetima tog obiljeja. Npr. ako
posmatramo boju kao obiljeje, njeni modaliteti su crna, bijela, plava itd.
Postoji vie principa i ema podjele obiljeja, a na osnovu logike njihove prirodne
diferencijacije, proizilazi sljedea podjela:
1. Obiljeja prema sadrini:
Numerika - izraavaju se brojem (cifrom), a razlikujemo:
kontinuelna - mogu uzimati cijele i razlomljene vrijednosti
diskontinuelna - mogu uzimati samo cjelobrojne vrijednosti
Atributivna - izraavaju se rijeima (opisno)
Stalna - karakteriu nepromjenljivo stanje
Promjenljiva - karakteriu promjenljivo stanje
Faktorijalna - karakteriu faktore bitne za nastajanje pojave
Rezultativna - karakteriu konaan rezultat dejstva faktorijalnih
2. Obiljeja prema tipu:

Rodovska - karakteriu vrstu kojoj pripada neka statistika jedinica


Tipina - znaajna za identifikaciju statistike jedinice
Prostorna (geografska) - prikazuju mjesto oitovanja statistike jedinice
Vremenska - prikazuju vrijeme oitovanja statistike jedinice
Stvarna (sadrinska) - sutinski odreuju statistiku jedinicu

3. Obiljeja prema nastanku:


Objektivna - karakteriu stanje po prirodi stvari
Subjektivna - nastaju po volji subjekta
Mjeovita - objektivna obiljeja koja su pod odreenim uticajem postala
subjektivna
Promjena veliine i znaaja obiljeja statistikih jedinica ini pojam varijacije, kao
specifian oblik kretanja, ije stanje u odreenoj periodizaciji iskazujemo empirijskim
podacima. Dobijeni podaci su rezultat pojedinanih opaanja i mjerenja varijabiliteta

obiljeja jedinica posmatranja statistikog skupa. Ovo mjerenje ima za rezultat dodjeljivanje
odgovarajueg broja, simbola, znaka, klase ili kategorije, odgovarajuem stanju osobine
statistike jedinice.
Empirijskim podacima mogu se oznaavati klase ili kategorije ili izraavati odreene
algebarske veliine, s tim to se u prvom sluaju ne mogu primjenjivati algebarske operacije,
dok je u drugom sluaju aritmetika dozvoljena. Jedinice, kao i skale mjerenja i vrednovanja,
mogu biti sasvim razliite. Razlikuju se etiri vrste mjernih skala i to: nominalna skala, skala
poretka, intervalna skala i skala odnosa.
Posmatrana obiljeja, na bazi ijeg varijabiliteta nastaju numeriki podaci, mogu biti
(diskretna) prekidna i (kontinuelna) neprekidna. U tom smislu identifikacione oznake i
oznake poretka uvijek su diskretne veliine, a intervalne oznake i oznake odnosa mogu biti i
diskretne i kontinuelne. Danas postoje brojni i raznovrsni metodi i tehnika sredstva koja nam
omoguavaju brza izraunavanja i izvoenje raznih aritmetikih operacija u realizaciji veih
statistikih akcija. Ovo podrazumijeva ukljuivanje savremene raunarske tehnike velike
memorije i brzine raunanja sa razliitim mogunostima predstavljanja izlaznih informacija.
Znai, svako konkretno statistiko istraivanje pojave, procesa ili dogaaja transferira se u
nizove empirijskih podataka, ureene prema zadanim kriterijumima, koje nazivano
empirijskim distribucijama, odnosno statistikim serijama.
1.4.3 Statistike jedinice
Elementi osnovnog statistikog skupa koji imaju bar jedno zajedniko obiljeje, koje
ih meusobno razlikuje ili izjednaava, nazivaju se statistike jedinice. Statistikim
jedinicama se vri mjerenje i iskazivanje obima, karakteristika i strukture posmatrane pojave.
Statistike jedinice su varijabilne (promjenljive) veliine, jer statistika istrauje mnotvo
razliitih pojava, tako da se njihov pojam ne moe shvatiti statino. Upravo u nejednakosti
statistikih jedinica u odreenom periodu ispoljavaju se varijacije njihovih obiljeja.
Varijaciju, kao specifian oblik kretanja, statistika prati sa tri osnovne vrste jedinica:

Statistike jedinice za obim pojave, u koje spadaju jedinice posmatranja (dogaaji i


sluajevi) i uslovne statistike jedinice,
Statistike jedinice za obavjetavanje i
Statistike jedinice za mjerenje varijabiliteta, u koje spadaju varijansa, standardna
devijacija i disperzija.

Zbirne promjene koje se deavaju u statistikim skupovima manifestuju se preko


pojedinanih promjena, tj. jedinica skupa i njihovih uzajamnih odnosa. Dimenzionalnost
skupa odreuje se brojem elemenata-jedinica, a sloenost brojem i raznovrsnou uzajamnih
veza. Sa aspekta statistike analize nisu relevantna individualna svojstva, jer promjene
karakteristine za jedan element (jedinicu) statistikog skupa ne mogu se uoptiti, dok se
promjene koje su karakteristine za sve jedinice mogu smatrati optim. Znai, statistike
jedinice su osnovni izvori informacija kvalitativnih i kvantitativnih katakteristika osnovnog
statistikog skupa to ih ini bazom za dalju statistiku analizu i zakljuivanje. Statistike
jedinice treba da ispunjavaju sljedee preduslove:
da su varijabilnog karaktera
da su precizno definisane
da su meusobno uporedive
da se mogu svoditi na kvantitativni izraz

1.4.4 Varijacija
Varijacija kao specifian oblik kretanja se ispoljava u vidu promjena veliine ili
znaaja obiljeja statistikih jedinica. Do konkretnog pojma varijacije dolazimo
uporeivanjem podataka o veliini ili znaaju nekog obiljeja u vremenu ili prostoru za jednu
jedinicu ili za vie jedinica u posmatranom trenutku. Rezultat uporeivanja moe da se
posmatra kao razlika dva uzastopna stanja istog obiljeja - varijacija kao razlika i kao odnos
dva uzastopna stanja - varijacija kao kolinik.
Varijaciju kao razliku iskazujemo u aritmetikom obliku to znai da nas interesuje
njen predznak, a ne samo apsolutna vrijednost. Ako stanja o veliini nekog posmatranog
obiljeja tokom vie uzastopnih mjerenja oznaimo: N1, N2, N3...Ni (za i=1,2,3...n) tada e
varijacija kao razlika izraavati sljedea odstojanja:

Odstojanje izmeu nivoa moe biti:

- pojava pokazuje tendenciju rasta


- pojava pokazuje tendenciju pada
- pojava stagnira, nema promjene

Ukupnost svih varijacija tokom nekog perioda (1 godine) izraavaju bilansne


jednaine u vrijednosnom obliku, a balansne jednaine u naturalnom obliku. Bilansne i
balansne jednaine svode se na to da izraunavamo sadanje stanje na osnovu poznatog
poetnog stanja i zbira varijacija koje su se desile, to se matematiki moe ovako izraziti:
,

gdje je

:
- sadanje stanje
- poetno stanje
- zbir svih pozitivnih i negativnih varijacija u
posmatranom periodu
- broj perioda
Koristei navedene jednaine mogue je prognozirati neko budue oekivano stanje
na osnovu vrste, obima i karaktera promjena koje predviamo.
Varijacija kao kolinik izraava odnos dva uzastopna stanja posmatranog obiljeja
statistikih jedinica, dajui ire mogunosti da se sagledaju kvalitativne karakteristike

kretanja to predstavlja sljedei stepen uoptavanja u statistikom istraivanju. Ako stanja o


veliini posmatranog obiljeja, dobijena nizom uzastopnih mjerenja, oznaimo sa: N1, N2,
N3...Ni (za i=1,2,3...n) tada e varijacija kao kolinik biti:

I varijacija kao kolinik moe imati tri pojavna stanja, s tim to se ne moe kretati u zoni
negativnih vrijednosti:

- pojava pokazuje tendenciju rasta


- pojava pokazuje tendenciju pada
- pojava stagnira, nema promjene

2. PRISTUP STATISTIKOM ISTRAIVANJU

Cjelokupnost statistikih postupaka, od poetka do kraja neke konkretne statistike


akcije, predstavlja program statistikog istraivanja. Poligon za takvo istraivanje su masovne
pojave, s tim da je prethodno neophodno izvriti dovoljne pripreme u pogledu izbora
najpodesnijih metodologija i adekvatnih postupaka.
Uspjeh statistikog istraivanja, kao niza postupaka, koji ukljuuju veoma velik broj
elemenata, zavisi od stepena unoenja planskog reda i osmiljenog planskog djelovanja. Taj
plan treba da sadri sve to se odnosi na pojedine faze statistikog rada, kao i da obuhvata
sve elemente tehniko-finansijskog, organizacionog, sadrinskog i metodolokog karaktera.
Kod velikih statistikih akcija ove faze ine logino zaokruene grupe poslova, tako da nije
znaajan njihov broj i razgranienje, ve je znaajno da se istraivanje koncepcijski izvede
tako da svi poslovi teku u logiki vezanom redu i da se fazno sagledavaju.
Proces statistikog istraivanja odvija se u tri osnovne faze:
1. Statistiko posmatranje i prikupljanje podataka,
2. Sreivanje, grupisanje, obrada i prikazivanje podataka,
3. Statistika analiza sa publikacijama.
Rasporeujui vremenski, organizaciono i sadrinski poslove statistikog istraivanja
u navedene faze, dolazimo do zakljuka da planiranje organizacije istraivanja obuhvata i
predvia rjeenja sljedeih problema:

grupisanje poslova u logiki povezane cjeline (faze),


utvrivanje rokova i alternative,
predvianje kadrova i njihova edukacija,
utvrivanje neophodnih materijalnih pretpostavki,
snimanje trokova istraivanja za koja se esto radi poseban finansijski plan
opravdanosti

Faze projekta statistikog istraivanja sadre odreen stepen autonomije koja


proizilazi iz razliitosti pojedinih grupa poslova, ali istovremeno su meusobno veoma vrsto
povezane i uslovljene jer od nivoa kritinosti ulaznih podataka direktno zavisi i stepen
naunosti dobijenih rezultata.
2.1 Statistiko posmatranje i prikupljanje podataka
Statistiko posmatranje je osnova za nastajanje i prikupljanje statistikih podataka
koji treba da budu tani, potpuni i podesni za obradu. Statistiki podatak nije bilo kakav
podatak, ve onaj koji je rezultat statistike obrade, tj. koji je rezultat mjerenja, prebrojavanja,
uporeivanja itd, tako da nosi u sebi odreenu koliinu obavjetenja u vidu neraspakovane
informacije. Priprema posmatranja obuhvata izradu plana i programa posmatranja i
organizacije istraivanja kao logiki sloenog reda rjeenja pod kojim se podrazumijeva
cjelokupna statistika akcija. Smisao prikupljanja podataka je pribavljanje obavjetenja o
odabranim obiljejima posmatranog skupa jedinica. U tu svrhu koriste se odreena statistika
sredstva - statistiki formulari (upitnik), hardverska i softverska rjeenja koja moraju biti

jednoobrazna i sastavljena prema posebnim standardima. Podaci, kao registrovane injenice


utvrene posmatranjem, pokazuju objektivno stanje dobijeno uzastopnim mjerenjem ili
prebrojavanjem, kao npr. podaci o vodostaju, temperaturi, informacije o zaradi radnika,
kretanju produktivnosti itd.
Za uspjeno posmatranje potrebno je, pored odreivanja pojma jedinice, odrediti i
koje e se karakteristike, tj obiljeja, odabrati za posmatranje. Posmatrano obiljeje moe
imati istu numeriku vrijednost kod vie jedinica, pa se zato broj koji pokazuje koliko se puta
ista vrijednost obiljeja pojavljuje naziva frekvencija, a raspodjela statistikog skupa prema
vrijednostima datog obiljeja naziva se raspored frekvencija.
Kao preduslov prikupljanja podataka neophodno je da se izvri prethodno izvianje i
probno snimanje, kako bi se dobro upoznali sa pojavom koju emo ispitivati, kao i da se
provjeri podesnost raznih sredstava koja smo planom predvidjeli. Takoe, tokom posmatranja
vre se potrebne korekcije plana istraivanja, odreuju optimalne kombinacije svih elemenata
i postupaka, te kontrolie i provjerava izbor cilja, izbor obiljeja jedinica skupa, izbor
statistikih sredstava i drugih instrumenata, regularnost uputstava za rad, podobnost izvora
itd.
Dakle, priprema programa posmatranja i prikupljanja podataka obuhvata utvrivanje i
unoenje planskog reda i sadraja posmatranja kao i metodolokih rjeenja pod kojima
podrazumijevamo:

cilj, predmet, jedinicu i obiljeje posmatranja,


izvore prikupljanja podataka,
naine prikupljanja podataka,
metode obuhvatanja tj. obim i oblik jedinica posmatranja,
sredstva prikupljanja - izrada baze podataka
kontrola i provjera podataka.

2.1.1 Cilj, predmet, jedinica i obiljeja posmatranja i prikupljanja


Cilj posmatranja proizilazi iz praktinih ili naunoistraivakih potreba i mora da
bude postavljen jasno i odreeno kako bi bio odrednica za ostale elemente. Na osnovu
konkretno formulisanog cilja mogu se jasno odrediti svi aspekti prikupljanja podataka o
karakteristikama pojedinanih sluajeva posmatrane masovne pojave.
Predmet posmatranja (statistiki skup) je masovna pojava ili statistika cjelokupnost o
ijim obiljejima jedinica se prikupljaju podaci. Osnovni statistiki skup mora biti stvarno
(sadrinski) vremenski i teritorijalno definisan. Popisom jedinica posmatranja i izborom
izvjetajne jedinice konano se definie i formalno ustanovljava statistiki skup. Jedinica ini
elementarni dio skupa, a odreuje se izborom osobina ili uslova koje treba da ima pojedinani
sluaj da bi postao statistika jedinica.
Statistike jedinice posmatranja prema prirodi postojanja mogu biti: realne, koje
vremenski due postoje (stanovnik, uenik, preduzee, kola...) i momentne, tj. dogaaji koji
se deavaju u trenutku (roenje, udes, kraa...)
Obiljeja su karakteristike statistikih jedinica prema kojima se one meusobno
razlikuju ili su sline, a definiu se stvarno (sadrinski), prostorno i vremenski.
2.1.2 Izvori prikupljanja podataka
Statistika teorija i praksa koriste podatke iz sljedeih izvora, i to pojedinano ili
kombinovano:
Primarni izvori predstavljaju neposredno posmatranje i prikupljanje, tj. organizovanje
samostalnog snimanja podataka koje je pouzdano, ali je esto komplikovano i zahtjevno.
Sekundarni izvori :
posredni - predstavljaju posredno uzimanje podataka ispitivanjem lica; ovaj izvor se
oslanja na odgovore izvjetajnih jedinica (starjeina domainstva daje podatke za lana),
neposredni predstavljaju postojeu dokumentaciju i druge zapise; podaci su ovdje
ve prikupljeni, samo nad njima treba izvriti inspekciju u smislu zvaninosti i
odgovarajue upotrebe (matine knjige, zemljine knjige, poslovne knjige i registri, itd).
Podaci iz primarnih izvora su tani, pouzdani i aktuelni, ali esto veoma skupi i
vremenski zahtjevni, dok podaci iz sekundarnih izvora imaju zadovoljavajui stepen tanosti
i aktuelnosti, a relativno su jeftini i dostupni u kratkom roku. Pojedinano ili kombinovano
koritenje navedenih izvora najee je uslovljeno ciljem i planom istraivanja.
2.1.3 Naini prikupljanja podataka
Na bazi primarnih i sekundarnih izvora, podaci se mogu prikupljati razliito, a izbor
zavisi od cilja i prirode same pojave, tako da prikupljanje moe da bude organizovano na
sljedee naine:

Ekspedicioni: Popisiva na licu mjesta prikuplja podatke, a primjenjuje se najee kod


popisa stanovnitva; podrazumijeva mreu popisivaa i instruktora koji istovremeno tumae
pitanja i kontroliu tanost odgovora to obezbjeuje dobar kvalitet ulaznih podataka.
Prijavni: Statistike jedinice dolaze po pozivu ili zvaninoj obavezi u odreeni centar
statistikog organa i daju potrebne podatke (slube narodne odbrane, bezbjednosti itd.).
Samoregistracija: Popisivai donose izvjetajnim jedinicama formulare (upitnike) da ih
popune, daju uputstva za nejasna pitanja, kontroliu ispravnost odgovora i ispravljaju vidljive
greke.
Korespodentni: Na terenu se organizuje mrea korespodenata koji u odreenom vremenu
prikupljaju podatke, unose ih u bazu podatka i u naznaenom roku dostavljaju nosiocu
statistike akcije.
Potansko-telegrafski: Materijali za unoenje podataka, zajedno sa uputstvima, alju se
elektronskom ili obinom potom statistikim jedinicama koje trebaju da daju podatke i na
isti nain vrate u sjedite statistike slube.

2.1.4 Obim i oblik (metode) obuhvatanja jedinica posmatranja


Statistika istraivanja mogu se vriti prikupljanjem podataka o svim jedinicama koje
ine osnovni skup ili samo o jednom dijelu, to zavisi od prirode pojave, brzine koju elimo
postii, sredstava, stepena tanosti i naunosti rezultata i zakljuaka itd. U teoriji i praksi
esto se pojavljuje zahtjev da se informacije pribave bre i ekonominije, ali na nivou
aproksimacije. Prema obuhvatnosti jedinica posmatranja razlikujemo sljedee dvije metode
prikupljanja podataka: potpuno i nepotpuno prikupljanje:
Potpuno (totalno) prikupljanje - Ovaj metod daje vrlo pouzdane rezultate ali je
dosta skup i spor, a moe da se organizuje u vidu popisa i tekuih registracija. Popis
predstavlja vrlo glomaznu i najstariju organizovanu statistiku akciju mnotva jedinica
razasutih na velikom prostoru. Izvodi se kao periodina statistika akcija, a daje predstavu o
broju statistikih jedinica u odreenom momentu (kritini momenat), koji se odreuje danom
i asom. Pored kritinog momenta potrebno je odrediti i rok popisa kao period u kojem se
statistike jedinice popisuju, a njegova duina uslovljena je obimom pojave. Popis moe biti
periodian i prigodan, a odvija se po sljedeim utvrenim principima: sveobuhvatnost,
jednovremenost, periodinost i zakonitost. Tekua registracija sastoji se u tome da se podaci
o svim jedinicama neke masovne pojave snimaju redovno u odreenim intervalima (npr.
svakog dana, sedmice) i da se alju u obliku izvjetaja nadlenim statistikim organima.
Primjer za to je godinja registracija vozila, dnevno registrovanje vodostaja ili temperature,
praenje proizvodnje itd. Pojave sa ovakvim varijabilitetom zahtijevaju permanentno tekue
registrovanje, iji zbir za odreeno vrijeme moe dati podatke za analizu njenog ponaanja u
perspektivi.
Nepotpuno (djelimino) prikupljanje podataka Izborom jednog, dovoljno
selektivnog broja jedinica iz statistikog skupa ekspeditivno dolazimo do sudova i zakljuaka
o cijelom statistikom skupu, a taj broj je uvijek obrnuto proporcionalan homogenosti
masovne pojave koju istraujemo. Istinitost sudova i zakljuaka koji se utvruju kroz

nepotpuno posmatranje zavisi od toga da li su odabrane jedinice reprezentativne u odnosu na


osnovni statistiki skup iz kojeg su izabrane. Najznaajniji naini djeliminog posmatranja i
prikupljanja podataka su uzorak, anketa, monografija i procjena.
Uzorak predstavlja odreeni broj jedinica osnovnog skupa, odabran po principu
sluajnosti, tako da sve jedinice imaju istu vjerovatnou izbora. Metod uzorka je u statistikoj
teoriji posebno razraen, tako da je nastala nova oblast statistike - reprezentativna analiza,
koja je postala dominirajui metod za statistika istraivanja. Primjenom ove analize,
karakteristike osnovnog skupa ocjenjuju se na osnovu rezultata uzorka, koji mora biti
dovoljno reprezentativan, odnosno predstavljati njegovu umanjenu sliku. Pitanja koja se pri
ovoj supstituciji moraju rijeiti su izbor vrste uzorka, nain izbora jedinica, kao i obim
uzorka. Rjeenje ovih pitanja zavisi od cilja istraivanja, prirode statistikog skupa, rizika
koji moemo prihvatiti, kao stepena greke, odnosno valjanosti zakljuaka.
Anketa je posmatranje odreenog broja namjerno ili sluajno odabranih tipinih
jedinica statistikog skupa, a da bi se taj izbor izvrio potrebno je dobro poznavati
karakteristike jedinica pojave koju istraujemo. Ankete se izvode povodom neke konkretne
situacije, dogaaja ili akcije koje joj prethode ili slijede. Po sadrini su kratke, a pored
odgovora mogu imati sugestije, miljenja i procjene. Mogu biti namjerne, sluajne, pismene,
usmene, javne, tajne itd.
Procjena je poseban metod djeliminog posmatranja i prikupljanja podataka gdje se
na osnovu jednog dijela, koji nas u odreenom momentu zadovoljavajue informie, donose
aproksimativni sudovi i zakljuci o svim jedinicama osnovnog skupa. Procjena moe da
bude:
prosta ("od oka"): zasniva se na iskazima i podacima koje daju struna lica ili
oslanja na iskustvo;
sraunata: zasniva se na mjerenju i izraunavanju, kako bi se rezultat
proporcionalno prenio na cjelokupnu masu, a moemo je posmatrati po srazmjeri i
analogiji.
Monografija predstavlja najui oblik statistikog istraivanja, gdje se posmatranje
svodi na jednu ili mali broj statistikih jedinica koje predstavljaju primjere osobina tj. nose
karakteristike slinih jedinica. Koristi se pri posmatranju oglednih poljoprivrednih dobara,
uzornih institucija, preduzea itd.
Izbor metoda i tehnika prikupljanja podataka prema obimu sa jedne strane je uslovljen
karakterom i tipom masovne pojave, iji je varijabilitet predmet statistikog istraivanja, a sa
druge strane postavljenim ciljem prema kojem se vri poreenje svih prednosti i nedostataka
navedenih metoda.
2.1.5 Sredstva prikupljanja podataka
Upitnik je relativno praktino sredstvo za prikupljanje podataka o varijabilitetu
obiljeja posmatranih jedinica. Sainjen je u vidu obrasca tj. tampane ili elektronski
distribuirane liste pitanja na osnovu kojih se dolazi do odgovora koje u sljedeoj fazi
statistikog postupka pretvaramo u brojeve za dalju obradu.

Redakcija i sastavljanje upitnika podrazumijeva kreiranje sadrinske i formalne


strane, pri emu se respektuje cilj istraivanja i kriterijum adekvatne formulacije pitanja.
Formu upitnika sainjavaju opti elementi, pitanja i obavjetenja koja se odnose na
organizaciju posmatranja, kao to su: naziv organa koji je izdao upitnik i organizuje
posmatranje, pravni osnov kojim se odobrava posmatranje, naziv upitnika u vidu naslova iz
kog se vidi ta se posmatra, ifra upitnika i djelatnosti koja se prati itd.
Sutinu sadrine upitnika ine pitanja koja treba da budu pragmatina, jasno
formulisana, razumljiva, precizna, kratka, kategorina, direktna i logina. Dvosmislena,
provokativna, sugestivna, tendenciozna i suvina pitanja uskrauju mogunost tanog
odgovora. Potujui navedene kriterijume, pitanja u upitniku mogu imati razliite tehnike
forme, to zavisi od vrste obiljeja i mogunosti obrade podataka. Tako npr. kod sastavljanja
upitnika za stanja u pogledu stavova postoje dvije tehnike postavljanja pitanja:
formulacija pitanja i uz njih prazno mjesto za odgovor i
formulacija pitanja sa ponuenim modalitetima odgovora i njihovom ifrom
Upitnik moe biti individualan, kada se popunjava pojedinano za svaku jedinicu i
kolektivan, kada se popunjava za sve jedinice posmatranja.
2.1.6 Kontrola i provjera podataka
S obzirom na mnotvo podataka i uee veeg broja lica i sredstava, objektivno
postoji mogunost greke, pa je neophodno predvidjeti kontrolu koja moe da se organizuje
preventivno i neposredno nakon prikupljanja.
Kontrola u toku prikupljanja je preventivna i obavljaju je popisivai, a primjenjuje se
kod ekspeditivnog naina i samoregistracije gdje se neposredno vri uvid u tanost odgovora.
Za punu efikasnost kontrole u pogledu identifikacije i otklanjanja greaka potrebno je da
razlikujemo sluajne i namjerne greke. Sluajne greke nastaju previdom tj. bez svjesne
namjere da se na taj nain utie na ishod i u masi se one anuliraju, to ne iskljuuje potrebu
njihove ispravke. Namjerne greke nastaju kao posljedica namjere tj. pod dejstvom
sistematskog uzroka da se utie na konaan rezultat i one se u masi umnoavaju. Analogno
grekama u statistici se primjenjuju i dvije vrste kontrole i to logika i raunska. Logikom
kontrolom se eliminiu sluajne greke kao i raunske koje se logiki uoavaju (logiki
nesklad odgovora). Raunska kontrola izvodi se sistematski i obuhvata provjeru tanosti
podataka i njihovih odnosa.
2.2 Grupisanje i sreivanje podataka
Rezultat prve faze postupka statistikog istraivanja je amorfna i haotina sirova
statistika graa koju treba dalje sortirati, grupisati i sreivati, odnosno obraivati. Grupisanje
i sreivanje empirijskih podataka predstavlja ralanjivanje statistikog materijala prema vrsti
grupnih obiljeja i njihovim modalitetima na odgovarajue grupe, ijim se redanjem po
odreenom kriteriju, formiraju statistike serije. Statistiki podaci u izvornom obliku
predstavljaju gomilu prikupljenog materijala i izvjetaja u tvrdoj ili elektronskoj formi, koji
su kao takvi neupotrebljivi direktno, niti je mogue na osnovu njih bilo ta zakljuivati.
Ovakvu masu statistikog materijala je potrebno odreenim tehnikama obrade, zasnovanim

na statistikim principima, uiniti podesnom za statistiku analizu. Sreivanjem i


grupisanjem, kao sinhronizovanim poslovima, nastaju podaci grupisani po obiljejima
jedinica posmatranja. Grupisanje podataka vri se pridruivanjem jedinica i formiranjem
grupa po modalitetima datog obiljeja, na osnovu prethodno izraene eme grupisanja, u
kojoj je dat izbor obiljeja i red po kom e se vriti grupisanje. Pojedinani podaci se
ralanjuju prema vrijednostima obiljeja u eme, obrazujui pritom nizove grupisanih
podataka u vidu statistikih serija. Podaci sreeni u statistike serije brojano izraavaju
promjene u strukturi pojave, po odreenim karakteristikama, odnosno njen varijabilitet.
Pitanja izbora obiljeja i tehnike formiranja grupa, kao i varijacionog intervala koji je osnov
sreivanja, moraju biti rijeena u skladu sa ciljem istraivanja.
Sastavljanje eme grupisanja predstavlja oblik ili ablon grupisanja podataka po
pojedinim vrstama obiljeja, pa prema tom kriteriju razlikujemo sljedee vrste grupisanja:
prema vrsti grupnog obiljeja: stvarno (numeriko i atributivno), vremensko i
prostorno,
prema obimu (broju obiljeja): prosto i kombinovano,
prema cilju: tipoloko, varijaciono i analitiko,
prema atributivnim modalitetima; u obliku nomenklatura i klasifikacija kao slubeno
propisanih i zvaninih ema koje predstavljaju sistematizovane spiskove svih
modaliteta u kojima se posmatrano obiljeje parametarski konkretizuje.
Prema emi grupisanja i cilju istraivanja prikupljeni statistiki materijal tehnikometodoloki se sreuje rasporedom u serije i tabele koje predstavljaju sintaksu statistikog
jezika.
Postupak grupisanja po obiljejima koja se javljaju u veem broju modaliteta je neto
sloenije, zbog ralanjivanja na vei broj grupa. Neka obiljeja se pojavljuju u velikom
varijacionom intervalu, tako da imaju irok spektar konkretnih oblika kao to su npr.
zanimanja, vrste bolesti, sredstva za rad, asortiman proizvoda, krivina djela, starost, visina
zarada itd. Koncentracija jedinica oko pojedinih modaliteta u ovakvim sluajevima imala bi
za rezultat duge i nepregledne nizove koji ne bi imali praktinu primjenu. Rjeenje ovog
pitanja postie se pridruivanjem susjednih modaliteta u razrede (klase, intervale), ime se
individualni modalitet zamjenjuje modalitetom grupe, a niz se redukuje i postaje
pragmatian.

2.2.1 Statistike serije


Statistiko istraivanje odreene pojave, procesa ili dogaaja temelji se na
prikupljanju, sreivanju, obradi i statistikoj analizi originalnih podataka, do kojih dolazimo
empirijskim radom. Rezultat ovakve procedure u statistikom smislu je niz empirijskih
podataka koji, ureen prema zadanom kriterijumu, predstavlja empirijsku distribuciju. Poto
se statistiko zakljuivanje temelji na raspoloivim informacijama o karakteristikama jedinica
posmatranja, logino je da te informacije, sreene po nekom algoritmu, nazivamo statistikim
serijama. Dakle, statistike serije su nizovi grupisanih statistikih podataka koji jezikom cifre
prikazuju promjene strukture skupa po nekom obiljeju ili raspored vrijednosti skupa u
prostoru i njegove promjene u vremenu.
Prema nainu formiranja i analitikom sadraju obiljeja statistikih jedinica,
razlikujemo:

Numerike serije
Atributivne serije strukture
Vremenske serije
Prostorne (geografske) serije, itd.

Prema strukturi, statistike serije se mogu dijeliti u sljedee potklase:


Proste statistike serije (serije negrupisanih podataka)
Serije distribucije frekvencija (serije grupisanih podataka)
Statistike serije pokazuju raspored statistikog skupa po modalitetima obiljeja i
obino se sastoje od dvije kolone obavjetenja: modaliteti (kvalitet serije) i frekvencije
(kvantitet serije). Serije strukture mogu biti sa atributivnim i numerikim obiljejem, ali emo
ih posmatrati metodologijom podklasa, prema kojoj se nainom grupisanja mogu pojaviti kao
proste, neintervalne i intervalne.
2.2.1.1 Numerike serije strukture

Ralanjivanjem statistikih podataka prema numerikom obiljeju i njegovim


modalitetima, nastaju numerike grupe ijim se redanjem po veliini formiraju numerike
serije.
Numerike serije strukture predstavljaju statistike nizove kod kojih su podaci
rasporeeni na osnovu vrijednosti numerikih obiljeja, odnosno njihovih frekvencija.
a) Prosta numerika serija (serija negrupisanih podataka)
Xi
x1
x2

.
.

xn
b) Neintervalna numerika serija distribucije frekvencija (serija grupisanih podataka)

Opti prikaz:
Obiljeje
(Xi)

Frekvencije

.
.
.

.
.
.

i)

Ukupno:
Konkretan primjer:
Obiljeje
(Xi)
1
2
3
4
5
6
7
8
9
10
Ukupno:

Frekvencije
(fi)
2
3
5
7
9
11
8
6
4
1
56

Ulazni materijal programa za formiranje distribucije frekvencija navedenih primjera


numerike serije je niz (N) za sortiranje po rastuem redoslijedu. Ovako sortirani slogovi
ine datoteku ukupnog broja podataka iz navedenog primjera, koja je ulaz za program za
formiranje distribucije frekvencija.
Dok se za numeriko obiljeje postavlja problem komparacije vrijednosti, za atributivno
obiljeje postavlja se problem klasifikacije atributa. Varijacioni interval individualnih
vrijednosti jednog numerikog obiljeja u posmatranom statistikom skupu nominuje se
gradacijom brojanih vrijednosti tog obiljeja u zavisnosti od tog da li je ono kontinuelno ili

diskontinuelno. Problem je sloeniji kod neprekidnih obiljeja, kao i kod prekidnih sa


velikim brojem modaliteta. Rjeenje u ovom sluaju predstavlja formiranje klasa (intervala,
razreda), tako da distribucije rasporeda frekvencija spadaju u klasu distribucija strukture. Za
oznaavanje modaliteta obiljeja jedinice posmatranja koristi se intervalna skala (razred) kao
skup vrijednosti obiljeja nad kojim je dozvoljena odgovarajua algebra.
Izbor veliine i broja grupnih intervala je sutinsko pitanje, jer vei broj grupnih intervala
daje kompletniju informaciju o sastavu skupa, a manji broj bolje otkriva pravilnosti u
njegovom ponaanju. irina grupnog intervala, odnosno razreda.
Izbor veliine i broj grupnih intervala je sutinsko pitanje, jer vei broj grupnih intervala
daje kompletniju informaciju o sastavu skupa, a manji broj bolje otkriva pravilnosti u
njegovom ponaanju.
Neophodno je da se postigne optimalna irina intervala, optimalan broj klasa, a time i
optimalan broj jedinica koje pripadaju klasi, za ta se preporuuju sljedei obrasci:

K=1+3,32logN;

gdje je :
H - irina intervala
N - ukupan broj podataka

Rezultati grupisanja u vidu intervalne numerike serije distribucije frekvencija


(serije grupisanih podataka) mogu se predstaviti sljedeom tabelom frekvencija:
Obiljeje (razredi
Xi)
(c1 - c2)

Frekvencije (i)

(c2 - c3)
.
.
.

.
.
.

(ci - ci+1)
.
.
.

.
.
.

(ck - ck+1)
Ukupno:

Program formiranja niza (serije) rasporeda frekvencije

Zadatak programa je da obezbijedi formiranje niza rasporeda frekvencija


stanovnitva po starosnim grupama u obliku tabele pod nazivom: "Struktura stanovnitva
prema starosti po popisu od 1981. godine

Starosne grupe
(Xi)
(obiljeje)
do
4

Apsolutne
frekvencije (fi)

Kumulanta
frekvencija
(rastua)

4 - 8
8 - 12
.
72 - 76
.
72 - 76

+
(

)+
.

+...+

76 i vie
Ukupno:

Primjer 2.1 Odrediti veliinu i broj grupa za 100 podataka koji variraju od 50 do
121,5.

Dakle, ove podatke rasporedili bi u 8 intervala irine 9.


Iz prethodnog primjera moemo zakljuiti da pravilno formiranje intervala zahtijeva
da se rijei sljedee:

kolika e biti veliina grupnih intervala i njihov broj,


da li e grupni intervali biti uporedivi,
kako e se razgraniavati grupni intervali.

Razgraniavanje grupnih intervala znai precizno odreivanje donje i gornje granice,


kako bi se znalo kojoj grupi pripada svaka jedinica. esto se prvi i posljednji interval
ostavljaju otvoreni tj. prvi bez donje, a posljednji bez gornje granice. U tom sluaju
izostavljene granice se pretpostave uvaavajui veliine razreda.
Kod kontinuelnih numerikih obiljeja razgraniavanje razreda moe se izvriti na
sljedee naine:

Primjer 2.2
a) Prave granice
Godine
starosti (Xi)
do 18
18 - 24
24 - 39
39 - 49
49 i vie
Ukupno:

Broj
zaposlenih(fi)
65
70
90
50
45
320

b) Nominalne granice
Povrina
u km2 (Xi)
do 49
50 - 99
100 - 199
200 - 299
300 - 399
400 - 499
500 - 599
600 i vie
Ukupno:

Broj
optina(fi)
8
10
15
20
15
12
11
9
98

Kod diskontinuelnih numerikih obiljeja razgraniavanje se vri uz primjenu


nominalnih granica, za razliku od prethodnog sluaja, gdje se mogu primjenjivati i prave i
nominalne:
Broj
zaposlenih (Xi)
51 - 60
61 - 70
71 - 80
81 - 90
91 - 100
Ukupno:

Broj
preduzea(fi)
5
6
9
7
3
30

2.2.1.2 Atributivne serije strukture

Osnovni statistiki niz predstavlja polazni statistiki materijal koji se formira tako to
se iz razraene statistike dokumentacije preuzmu raspoloivi podaci o jednom obiljeju kao
izvorna obavjetenja.
Ralanjivanjem statistikih podataka prema atributivnom obiljeju i njegovim
modalitetima, nastaju atributivne grupe ijim se redanjem prema odreenom kriteriju
formiraju atributivne serije.
Neintervalna serija distribucije frekvencija se uvijek izraava u obliku dva niza
informacija, gdje prvi niz ine informacije o modalitetima obiljeja poredane po odreenom
redoslijedu, a drugi se uvijek izraava numeriki i oznaava ukupan broj jedinica posmatranja
pripadajuih odgovarajuim modalitetima.
Atributivne serije strukture: opti prikaz
Broj uenika (fi)

Uspjeh uenika (Xi)


Odlian

(C)

Vrlodobar

(U)

Dobar

(Z)

Dovoljan

(u)

Nedovolja

(j)

Ukupno:

Ovaj prikaz serije distribucije frekvencija upuuje na viestruke prednosti u odnosu na


osnovni statistiki niz; npr. omoguava da se otkriju grube greke, da se dobijeni rezultati
uporeuju sa oekivanim, da se odredi relativno uee za svaku od uvedenih kategorija
modaliteta itd.
2.2.1.3 Vremenske serije

Ralanjivanjem statistikih podataka prema vremenskom obiljeju i njegovim


modalitetima nastaju vremenske grupe ijim se hronolokim redoslijedom formiraju
vremenske serije.
Vremenske (hronoloke) serije su nizovi statistikih podataka grupisani po
uzastopnim momentima vremena ili intervalima. Kao i serije strukture, prikazuju se u dva
niza, s tim to se ovdje prvi niz uvijek odnosi na vrijeme, a drugi na veliinu pojave u
posmatranom periodu. Vremenske serije, prema prirodi podataka koje sadre, dijele se na
momentne i intervalne.

Momentne serije pokazuju nivo pojave u odreenim sukcesivnim momentima


vremena, a dobijamo ih kao rezultate popisa stanovnitva, tednje itd. Kod ovih serija
sumiranje nema smisla, to se vidi iz sljedeeg primjera:
Godine (Xi)
1960
1970
1980
1990
49 i vie
Ukupno:

Broj stanovnika
(u mil.)
12
13
15
16
45
-

Intervalne vremenske serije pokazuju kretanje pojave u sukcesivnim vremenskim


intervalima, a formiraju se kao rezultat izvjetajnog metoda i podaci im se mogu sumirati, to
se moe vidjeti iz sljedeeg primjera:
Godine
1999
2000
2001
2002
2003
2004
2005
Ukupno:

Proizvodnja uglja
( u 000 t)
22
25
30
20
15
18
12
142

2.2.1.4 Prostorne serije

Ralanjivanjem statistikih podataka prema prostornom obiljeju i njegovim modalitetima


nastaju prostorne grupe ijim se redanjem, prema odreenom kriteriju, formiraju prostorne
(geografske) serije:
Gradovi
(Xi)
Banja Luka

Broj uenika

Prijedor

6000

Gradika

5000

Dubica

4000

Prnjavor

3000

Ukupno:

28000

10000

2.3 Prikazivanje statistikih podataka


2.3.1 Tabelarno prikazivanje (statistike tabele)
Tabelarno prikazivanje predstavlja pogodnu i preglednu formu izraavanja rezultata
grupisanja i sreivanja statistikog materijala i dostavljanja, kao informacije, korisnicima na
raspolaganje. Statistike tabele, kao grafiko sredstvo se konstruiu sistemskim ukrtanjem
veeg broja vertikalnih i horizontalnih linija, pri emu se obrazuju pravougaone povrine koje
se nazivaju polja tabele. Horizontalno povezana polja ine redove, a vertikalno povezana
polja ine kolone, tako da polje tabele, odreeno presjekom odgovarajueg reda i kolone,
predstavlja mjesto za upisivanje statistikog podatka u vidu cifre. Prvi red predstavlja
zaglavlje, a prva kolona pretkolonu tabele i slue za upisivanje modaliteta, odnosno za
gradaciju obiljeja prema kome su podaci i sreeni. Statistika tabela mora biti objanjena
naslovom iz kojeg se vidi kakve podatke tabela sadri i u kojim su jedinicama dati. Prema
sadrini
statistike
tabele
mogu
biti proste(prikazuju
jednu
statistiku
seriju), sloene (prikazuju dvije ili vie statistikih serija sreenih po istom obiljeju)
i kombinovane (prikazuju podatke dobijene ukrtanjem dva ili vie obiljeja ije se oznake
unose u zaglavlje i pretkolonu).
Prosta statistika tabela:
Obiljeje
(C)
x1
x2
x3
.
.
.
xn
Ukupno:

Xii

Frekvencija
(i)
1
2
3
.
.
.
n
i

x11
x22
x33
.
.
.
xnn
Xi i

Sloena statistika tabela; sa n redova i m kolona:


Obiljeje
(C)
1
x1
x2
x3
.
.
.
xn
Ukupno:

Frekvencija
(i1)
2
11
21
31
.
.
.
n1
i1

...
...
...
...
...
.
.
.
...
...

Frekvencija
(im)
m
1m
2m
3m
.
.
.
nm
ij

Kombinovana statistika tabela; sa m redova i n kolona:


C(a)

Naziv obiljeja A

Svega

...
C(b)
C1
C2
C3
Cm
1
2
3
4
...
m-1
m
...
x1
11
21
31
m1
j1
...
x2
12
22
32
m2
j2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
xn
in
2n
3n
mn
jn
...
Ukupno:
mi ij
1i
2i
3i
Prilikom tabelarnog prikazivanja pravilo je da sva polja u tabeli moraju biti
popunjena. Ukoliko je neki podatak nepoznat polje se popunjava konvencionalnim znakom
(:), ako nedostaje neki modalitet unosi se znak (-), ako je podatak nepotpun i neprovjeren
unosi se znak (//), ukoliko je ispravljan unosi se (*) u polje tabele itd.
2.3.2 Grafiko prikazivanje
Serije statistikih podataka, pored tabelarnog prikazivanja, mogu se, radi bolje
vizuelne prezentacije, predstaviti grafikim ilustracijama u vidu geometrijskih pojmova.
Grafiko prikazivanje statistikih podataka, pored ilustracije dobijenih rezultata statistike
analize, slui i za orijentaciju kada je u pitanju izbor najpodesnijeg tipa funkcije ili oblika
rasporeda. U grafikom prikazivanju statistikih serija koristi se uglavnom dvodimenzionalni
oblik unutar i van koordinatnog sistema, jer se tako postie tanost i preglednost. Grafikoni
oiglednim putem i na popularan nain prikazuju statistike veliine, njihovu strukturu,
kretanje i meusobne odnose. U grafikom metodu sluimo se raznim geometrijskim
pojmovima, slikama i likovima, crteima i figurama na liniji, povrini, u prostoru itd. Dakle,
statistiki grafikoni predstavljaju dopunu serijama i tabelama i istovremeno njihovog
najboljeg tumaa, jer na jednostavan vizuelan nain, jezikom slike, iskazuju karakteristine
osobine i promjene posmatrane pojave, te njene zakonomjernosti i tendencije u dinamici. S
obzirom na izbor elemenata i geometrijskih pojmova koji se upotrebljavaju za konstrukciju
grafikona kao statistikih publikacija, dijelimo ih na dijagrame, kartograme i slikovitopopularne grafikone.
Dijagrami kao geometrijski oblici konstruiu se na raznim skalama uz pomo taaka
(stigmogrami), linija (linijski dijagrami), povrina (histogrami) i oblika prostora
(stereogrami).

2.3.2.1 Linijski dijagrami

Linijski dijagrami slue za prikazivanje modaliteta jednog obiljeja i analizu


statistikih podataka svrstanih u rasporede frekvencija ili vremenske serije. Za konstrukciju
linijskih dijagrama koristimo dva osnovna koordinatna sistema i to pravougli koordinatni
sistem u ravni i polarni koordinatni sistem, koji se konstruie kombinacijom radijalne i
cikline mree.
Pravougli linijski dijagram slui za grafiki prikaz rasporeda frekvencija, najee
unutar prvog kvadranta, pri emu se na X osi vri izbor skale koja moe biti ravnomjerna
(aritmetika) ili neravnomjerna (logaritamska) i nanose modaliteti (Xi), a na Y osu
frekvencije (fi), takoe uz adekvatan izbor veliine podioka. Statistike serije upravo
predstavljaju nizove parova podataka u vidu modaliteta i frekvencija pa je nanoenje i
njihova konstrukcija vrlo jednostavno. Ako elimo grafiki da prikaemo dinamiku
posmatrane pojave, tada se kao nezavisno promjenljiva veliina uzima vrijeme, obino u
kalendarskim razdobljima, a nivo posmatrane pojave kao zavisno promjenljiva. Ucrtane take
parova podataka, koje su odreene pripadajuim koordinatama (apscisom i ordinatom),
spajaju se po redoslijedu i na taj nain se dobija izlomljena linija pravougli linijski dijagram
- iji tok odraava intenzitet promjena i strukturu pojave. Koristi se za prikazivanje serija
strukture i vremenskih intervalnih serija.
Primjer 2.3
Broj
l. (Xi)
1
2
3
4
5
6
7
8
Ukupno:

Broj
doma. (fi)

Rastua
kumulanta

Opadajua
kumulanta

2
5
10
15
8
4
3
1
48

2
7
17
32
40
44
47
48
-

48
46
41
31
16
8
4
1
-

Polarni linijski dijagram koristi se za prikazivanje vremenskih serija onih pojava koje
imaju izraeno sezonsko kretanje u duim ili kraim ciklusima (promet turista, potronja piva
po mjesecima). Konstruie se na taj nain da se vrijednosti obiljeja nanesu na radijalnu
mreu koja predstavlja zrakasto irenje vektor-radijusa od centra ka periferiji. Na jedan od
njih se oznai skala sa odabranim omjerom i kroz oznaene podioke opiu koncentrini
krugovi koji omoguavaju unos frekvencija. Kombinovani sa vektor-radijusima, obrazuju
polarnu mreu u kojoj je poloaj take takoe odreen parom (r,a) tj. udaljenou od centra
(r) i otklonom od nekog poetnog poloaja (a).
Primjer 2.4 Prodaja piva (u hl) u toku dvije godine
Mjeseci
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII

2000.
2
3
5
10
20
30
40
50
35
25
10
5

2001.
1
2
4
8
15
20
35
40
30
20
10
5

Dijagram predstavlja izlomljenu liniju koja pokazuje komparativan razvoj pojave tokom dvije
godine, sa tumaenjem da svako udaljavanje ili pribliavanje linije centru znai vei ili manji
uticaj sezone na pojavu. Radi lake analize moe se u dijagram ucrtati i krug iji je
poluprenik jednak prosjenoj veliini pojave. Uporeivanjem izlomljene linije i ucrtane
krunice dobija se uvid u kolebanje i odstupanje pojave od svog regularnog toka iz kog je
potisnuta pod uticajem sezonskog faktora. Za sve take presjeka, koje pripadaju krugu,
pojava je bila ispod prosjeka, za one van kruga pojava je bila iznad prosjeka, a za one na
krugu pojava je jednaka prosjeku.
2.3.2.2 Povrinski dijagrami

Povrinski dijagrami se koriste za grafiko prikazivanje, prvenstveno serija strukture i


poreenja i to najee u obliku histograma i poligona frekvencija.
Histogram frekvencija se dobija podizanjem ordinate iznad granica intervala prema
veliini frekvencija. Spajanjem ovih ordinata dobija se onoliko pravougaonika koliko ima
grupnih intervala. Baza svih pravougaonika je jedinina, tako da su im visine odreene
frekvencijama.
Primjer 2.5
Broj stanovnika
Broj
optina (fi)
(u 000) (Xi)
do 10
5
11 - 20
7
21 - 30
10
31 - 40
12
41- 50
15
51 - 60
20
61 - 70
18
71 - 80
14
81 - 90
9
91 - 100
6

Poligon frekvencija nastaje kada se ucrtane take, odreene sredinom grupnog


intervala i grupnom frekvencijom, meusobno po redoslijedu spoje pravim linijama. Na taj se
nain dobija zatvorena povrina izmeu izlomljene linije i apscise koja se naziva poligon
frekvencija, a najee slui za odreivanje teorijskog oblika rasporeda uestalosti.
Dijagram pravougaonika se moe istovremeno smatrati kao linijski dijagram jer je
baza jedinina, to se na osnovu prethodnog primjera moe pokazati na sljedei nain:

Histogram kvadrata - upotrebljava se za prikaz uporeivanja obima dviju ili vie


pojava ili hronolokih promjena strukture jedne pojave. Povrine pojedinih kvadrata, koje
ilustruju promjene, srazmjerne su statistikim skupovima koje uporeujemo. Iz tih povrina
izraunamo stranice i nad njima konstruiemo kvadrate.
Primjer 2.6
Godine
2001.
2002.
2003.

Broj nezaposlenih
(u 000)
9
16
25

P1
Za 2001. god:
Za 2002. god:
Za 2003. god:

2003

2002

2001

Histogram krugova - predstavlja takav nain grafikog prikaza u kojem, pomou


povrine krugova, vrimo uporeivanje obima dviju ili vie pojava ili hronoloke promjene
strukture na jednoj pojavi, tako to e povrine krugova biti srazmjerne vrijednostima koje
poredimo. Vrijednost statistikih podataka predstavljamo povrinom kruga iz koje
izraunavamo poluprenik i konstruiemo krug.

Primjer 2.7
Godine
2001.
2002.
2003.

Broj nezaposlenih
(u 000)
9
16
25

Za 2001. god:
Za 2002. god:
Za 2003. god:

2003

2002

2001

Strukturni krug - slui da prikaemo strukturu neke pojave po sastavnim elementima tako
to cjelokupnu pojavu (100%) preslikavamo na puni krug (360o), pri emu 1% brojnosti serije
odgovara 3,6okruga. Dakle, prethodno se utvrdi struktura serije u procentima, a zatim se u
krug proizvoljnog poluprenika unesu segmenti iji su uglovi odreeni procentualnim
ueem pojedinih struktura u seriji.
Primjer 2.8
Ocjena
(Xi)
1
2
3
4
5
Ukupno:

Broj
uenika (fi)
20
30
100
40
10
200

Broj stepeni
(a)
36
54
180
72
18
360

Rjeenje:

gdje je:

a - broj stepeni (segment)


D frekvencija grupe
C brojnost serije

a2
a3

a1

a5
a4

Provjera rjeenja:
360:200 = 1,8
a1= 20 x 1,8 = 36,
a2= 30 x 1,8 = 54 ,
a4 = 40 x 1,8 = 72 , a5= 10 x 1,8 = 18

a3= 100 x 1,8 = 180,

2.4 Deskriptivne mjere statistike analize


2.4.1 Srednje vrijednosti (mjere centralne tendencije)
Osnovni zadatak statistike analize numerikih podataka jeste da prui to
kompletniju sliku i deskripciju pojave sa aspekta razvojnih tendencija. Mnotvo brojanih
podataka jedino je mogue kontrolisati svoenjem individualnih vrijednosti na manji broj
statistikih pokazatelja, tako da se veina originalnih podataka koncentrie oko jedne
sintetike centralne vrijednosti opteg znaenja. Takva vrijednost odraava centralnu
tendenciju skupa i reprezentativna je u pogledu znaaja obiljeja. Autentino zamjenjuje sve
vrijednosti ije karakteristike objedinjuje, to je ini tipinom za dati raspored. Pokazatelje
rasporeda frekvencija, koji se obino koncentriu oko sredine, nazivamo numerikim
parametrima skupa empirijskog rasporeda i dijelimo ih u sljedee grupe:
a) srednje vrijednosti kao mjere centralne tendencije rasporeda,

b) mjere varijabiliteta (disperzije) podataka,


c) mjere oblika rasporeda,
d) relativna uea statistikih rasporeda.
U zavisnosti od rasporeda empirijskog niza, srednje vrijednosti se mogu matematiki
izraunati preko odgovarajueg postupka - izraunate srednje vrijednosti sredine(aritmetika, harmonijska, geometrijska i druge) i odreivati prema poloaju u seriji
pozicione vrijednosti- (modus, medijana). Izraunate srednje vrijednosti su osjetljive na
promjene bilo koje individualne veliine, pogotovo ekstremnih, to posebno dolazi do
izraaja ako je posmatran relativno mali broj jedinica.
Statistiki skup uvijek karakterie samo jedna od vie moguih pozicionih ili
izraunatih srednjih vrijednosti, tj. predstavlja njegov parametar centralne tendencije, a koja
e se vrijednost izabrati kao parametar skupa zavisi od naina grupisanja podataka i obiljeja
konkretnog sluaja.
Za izbor srednje vrijednosti koja bi bila najpodesnija za primjenu u odreenom
sluaju, potrebno je ispitati:
vrstu, prirodu i karakter masovne pojave (skupa) koja je predmet statistikog
posmatranja,
stepen homogenosti i srodnosti podataka u seriji,
cilj istraivanja na bazi kog se planira postupak.
2.4.2 Izraunate srednje vrijednosti - sredine
2.4.2.1 Aritmetika sredina

Aritmetika sredina ima najiru upotrebu u statistikoj analizi, a konvencionalno se


naziva prosjek. Uslov za pravilnu primjenu aritmetike sredine je da su podaci u seriji
homogeni tj. da je amplituda rasipanja mala, u protivnom svodimo je na formalnost.
Razlikujemo dva prilagoena naina izraunavanja aritmetike sredine, od kojih se prvi
odnosi na serije u kojima se svaka vrijednost obiljeja pojavljuje jedanput (prosta aritmetika
sredina), a drugi na sreene serije distribucije frekvencija (ponderisana aritmetika sredina).
Ovdje se modaliteti ponavljaju razliito, tako da se prilikom raunanja svaki modalitet
ponderie pripadajuom frekvencijom.
Prosta aritmetika sredina se rauna za seriju negrupisanih empirijskih podataka
sluajne veliineX, koji su dati u obliku osnovnog rasporeda vrijednosti x1,x2,...xn, pri emu
su empirijske vjerovatnoe (a posteriori) za svaki od moguih ishoda xi jednake. Izraunava
se pomou formule:
. Za sluajno promjenljivu X koja uzima diskretne
vrijednosti x1,x2,...xn sa
odgovarajuim
a
posteriori
vjerovatnoamap(x1),p(x2),...p(xn), matematiko oekivanje (E(X)) se definie u obliku sume
proizvoda:

, pri emu je

Ako

pretpostavimo

da

su

xi tj.

empirijske

vjerovatnoe

jednake

za

svako

tada se matematiko oekivanje definie kao prosta

aritmetika sredina:

odnosno

Primjer 2.9 Odrediti prosjek sljedee serije negrupisanih podataka:


Xi
1
3
5
7
9

Ponderisana aritmetika sredina tj. sredina serije grupisanih podataka se ee


susree u statistikim istraivanjima. U sluaju grupisanih podataka u vidu rasporeda
frekvencija moramo pri izraunavanju ponderisane aritmetike sredine uzeti u obzir razlike
meu frekvencijama. Ako raspored vrijednosti obiljeja oznaimo sa x1,x2,...xi,...xn, a njihove
pripadajue frekvencije sa 1, 2,...i,...ntada se ponderisana aritmetika sredina izraunava
pomou formule:

Primjer 2.10 Izraunati


prekidnog obiljeja:
Ocjene
(xi)
6
7
8
9
10
Ukupno:

kod

sljedeeg

Broj
studenata (i)
10
20
30
25
5
90

rasporeda

xi i
60
140
240
225
50
715

frekvencija

numerikog

Ponderisanje modaliteta sa odgovarajuim frekvencijama (xii) predstavlja grupne


proizvode iji zbir (
) daje obim pojave,
predstavlja brojnost statistike serije (veliinu skupa).

dok

zbir

frekvencija

Izraunavanje ponderisane aritmetike sredine, tj. intervalne serije distribucije


frekvencija, polazi od pretpostavke da su modaliteti obiljeja unutar intervala ravnomjerno
rasporeeni, tako da se prilikom izraunavanja koriste sredine intervala.
Primjer 2.11 Na jednoj povrini zasijano je 310 ha kukuruza. Prinos je varirao od 189
do 520 kg po ha. Podaci su dati u grupnim intervalima pa je potrebno proglasiti razredne
sredine (ri) kao predstavnike razreda.
xi
200-250
250-300
300-350
350-400
400-450
450-500
500-550

i
12,5
65,8
82,0
73,4
52,1
10,1
7,1
310,0

rii
2012,5
18095,0
26650,0
27525,0
22142,5
4797,5
3727,5
106175,

(xi)ri
225
275
325
375
425
475
525
-

Ponderisana aritmetika sredina posmatrane intervalne serije distribucije frekvencija,


odnosno, u konkretnom sluaju, prosjean prinos kukuruza po ha iznosi 342,5 kg, to znai
da , kao sintetiki pokazatelj, izravnava apsolutne varijacije obiljeja tj. pojedinane prinose
po ha.
Prema vjerovatnoi realizacije vrijednosti aleatorne promjenljive pri sluajnom izboru
modaliteta, ponderisana aritmetika sredina moe se definisati preko vjerovatnoe u vidu
matematikog oekivanja:

Vjerovatnoa sluajnog izbora modaliteta (xi) moe se izraziti:


.
Uvrtavanjem ovih relativnih uea u razvijeni oblik ponderisane aritmetike sredine
dobijamo:

, odnosno:

Dakle, ponderisana aritmetika sredina je izraena kao zbir proizvoda modaliteta i


vjerovatnoa njihovog sluajnog izbora, to eksplicitno predstavlja matematiko oekivanje
ili matematiku nadu:

Neefikasna i esta primjena aritmetike sredine, ne potujui njene osobine kao i


osobine znaajne za njenu primjenu, duguje se njenom komfornom raunskom postupku.
Osnovna svojstva aritmetike sredine su:

vea je od najmanje, a manja od najvee originalne vrijednosti:


ne zavisi od njihovog poretka
izjednaava se sa vrijednostima obiljeja kada su one
jednake:
odstupanja
tj.

tj.
individualnih
za

vrijednosti

negrupisane

ne
od

podatke,

i
meusobno

postoji varijabilitet zbir


aritmetike sredine je 0
kao

za

grupisane

podatke
zbir kvadrata odstupanja vrijednosti xi od pripadajue aritmetike sredine je
minimalan, tj. manji je od zbira kvadrata odstupanja od bilo koje vrijednosti
obiljeja, kao i srednjih vrijednosti ako se ne podudaraju sa , odnosno:
za negrupisane podatke
za grupisane podatke

Primjer 2.12 Provjeriti posljednja dva svojstva, na osnovu podataka iz sljedee serije:
i
3
4
13
21
11
5
3
60

xi
2
3
4
5
6
7
8
S
a) Zbir odstupanja individualnih vrijednosti od

b) Zbir kvadrata odstupanja

od

za svako

razliito od

2.4.2.2 Harmonijska sredina

Harmonijska sredina se primjenjuje onda kada su vrijednosti obiljeja, za koje se


odreuje prosjek, izraene u vidu recipronog odnosa, tj. kada se pojava kree u suprotnom
smjeru u odnosu na podatke koji je prikazuju. Harmonijska sredina je reciprona vrijednost
aritmetike sredine izraunate iz recipronih vrijednosti obiljeja, a najee se koristi kod
izraunavanja prosjene reciprone produktivnosti rada, prosjenog vremena obrta kapitala,
prosjene koliine robe koja se moe kupiti za odreenu koliinu novca itd.
Ako je statistika serija negrupisana, tada se izraunava prosta harmonijska sredina na
sljedei nain:

Kada je zadana statistika serija sa grupisanim podacima ili intervalna numerika serija
distribucije frekvencija, tada se izraunava ponderisana harmonijska sredina na osnovu
formule:

Primjer 2.13 Za izvrenje odreenog posla etiri grupe radnika su utroile sljedea vremena:
5 radnika - 35 minuta
6 radnika - 38 minuta
4 radnika - 48 minuta
8 radnika - 25 minuta

Zakljuujemo da prosjeno vrijeme po grupama za izvrenje ovog posla iznosi 32,6


minuta.

2.4.2.3 Geometrijska sredina

Geometrijska sredina za statistiko obiljeje X: x1,x2,...xi,...xn gdje je xi>0,


i=1,2,...N jeste srednja vrijednost koja izravnava relativne ili proporcionalne promjene
podataka posmatranog niza, za razliku od aritmetike sredine koja izravnava apsolutne
varijacije tj. razlike originalnih podataka. Takoe, ako obiljeje ispoljava neke relativne
pokazatelje ili karakteristike geometrijske progresije, kao npr. prosjean razvitak u
dinamikoj analizi, onda se iz takvih serija izraunava geometrijska sredina. Geometrijska
sredina je konstantan broj odreen iz niza varijabilnih veliina tako da se proizvod lanova
niza ne mijenja kada se varijabilne veliine zamijene tim konstantnim brojem.
Postupak izraunavanja po navedenoj definiciji se moe pokazati na sljedeem nizu:
2,4,8,16,32, iji meusobni proizvod iznosi 32768. Treba nai takav broj iji je peti stepen
jednak proizvodu lanova niza:
, odnosno
. Uoptavajui ovaj
postupak izraunavanja geometrijske sredine, zakljuujemo da se geometrijska sredina
izraunava kao n-ti korijen iz proizvoda individualnih veliina.
Ako je data statistika serija sa negrupisanim podacima, tada se prosta geometrijska
sredina izraunava na sljedei nain:
, odnosno:
Antilogaritmovanjem ovog izraza dobijamo:

Ako na posmatrane grupisane podatke intervalne numerike serije primijenimo


ponderisanu geometrijsku sredinu, u tom sluaju modalitete stepenujemo pripadajuim
frekvencijama posmatranog obiljeja, a iz proizvoda vrijednosti trai se korijen iji je
eksponent jednak brojnosti serije
.
Za skup pozitivnih grupisanih (ureenih) vrijednosti, koje rastu geometrijskom
progresijom, geometrijska sredina se izraunava logaritamskom transformacijom prema
sljedeem obrascu:

Primjer 2.14 Na bazi sljedeih podataka izraunati ponderisanu geometrijsku


sredinu:
xi
6
10
14
19
22
S

i
2
5
6
4
3
20

logxi
0,77815
1,00000
1,14613
1,27875
1,34242
-

i logxi
1,55630
5,00000
6,87678
5,11500
4,02726
22,57534

U poslovnoj praksi geometrijska sredina (G) se najee koristi za izraunavanje


stope razvoja, stope rasta i drugih pokazatelja dinamike proizvodnje i prometa.
2.4.3. Pozicione vrijednosti
Pozicione srednje vrijednosti se odreuju na osnovu poloaja - pozicije koju
zauzimaju u seriji, za razliku od izraunatih srednjih vrijednosti koje se ponaaju kao tipini
pokazatelji.
I pozicione i izraunate srednje vrijednosti imaju svoje mjesto, a koju srednju
vrijednost odabrati kao najpodesniju karakteristiku rasporeda frekvencija, konano zavisi od
cilja istraivanja. U grupu pozicionih srednjih vrijednosti ubrajamo modus i medijanu.
2.4.3.1 Modus (Mo)

Modus kao najea vrijednost u seriji je jedna od vanih karakteristika za posmatrani


statistiki skup, a predstavlja modalitet obiljeja koji dominira u nizu, odnosno modalitet sa
najveom frekvencijom ili najveom vjerovatnoom. Ako je data statistika serija sa
grupisanim podacima modus se jednostavno oitava kao modalitet sa najveom frekvencijom
i za takve serije kaemo da su unimodalne. Ako postoje dva ili vie modaliteta sa jednakim
najveim frekvencijama, serije su bimodalne, odnosno multimodalne. Kod intervalnih
numerikih serija grupisanih podataka neprekidnih vrijednosti obiljeja modus se pojavljuje
implicitno u modalnom intervalu koji je dominantan i izraunava se po formuli:

; gdje je:
- donja granica modalnog intervala
- veliina modalnog intervala
- frekvencija prethodnog intervala - predmodalni
- frekvencija modalnog intervala - modalni
- frekvencija narednog intervala postmodalni
Primjer 2.15 Odrediti modus na bazi podataka sljedeeg rasporeda vrijednosti
obiljeja
:
Ci
i
2- 8
4
8 - 14
6
14 - 20
13
20 - 26
21

26 - 32
32 - 38
Prema

15
3

modalni interval je 20-26.

Konstatujemo da su intervali meusobno jednaki i primjenjujemo direktno formulu za


izraunavanje modusa, pa imamo:

= 20+6

= 23,6,

to znai da je 23,6 najdominantnija (najuticajnija) vrijednost u posmatranoj seriji.

2.4.3.2 Medijana (Me)

Pretpostavimo da se vrijednosti obiljeja xi, i=1,2,...N sluajno promjenljive X


gomilaju oko neke unaprijed oekivane vrijednosti, tada moemo rei da je medijana (Me)
vrijednost sredinjeg lana prethodno ureenog niza. Medijana dijeli sumu frekvencija tj.
statistiki skup na dva jednaka dijela, tako da jedna polovina obuhvaenih sluajeva ima
manju, a druga veu vrijednost u odnosu na medijanu. Medijana serije negrupisanih podataka
odreuje se traenjem poloaja sredinjeg lana serije po veliini sreenih podataka.
Naprimjer imamo niz 1,6,8,10,11,14,18. Medijana je vrijednost sredinjeg (etvrtog)
lana;Me=10. Ako niz po veliini sreenih podataka ima paran broj lanova, medijana se
odreuje kao poluzbir dva sredinja lana. Npr. za niz 1,3,5,7,9,10; Me=6. Ako treba odrediti
medijanu intervalne serije grupisanih podataka, tada se najprije utvruje medijalni interval
kao najmanji lan kumulante frekvencija u kojem se sadri polovina brojne vrijednosti serije,
to je saglasno i njenoj definiciji. Znai, medijana se dobija interpolacijom izmeu granica
intervala u kom se nalazi.

; gdje je:

- donja granica medijanskog intervala


- gornja granica medijanskog intervala
- zbirna frekvencija medijanskog intervala
- zbirna frekvencija prethodnog intervala

Primjer 2.16 Izraunati medijanu iz sljedee serije grupisanih podataka:


Xi

5
6
7
8
9
10
11
12

3
7
11
12
15
13
10
4
75

Kumulanta
(rastua)
3
10
21
33
48
61
71
75
-

; to predstavlja njenu poziciju.


Budui da je odreena pozicija medijane (38) kao element sredine brojne vrijednosti serije,
jasno je da pripada petom modalitetu, odakle zakljuujemo:
Me = 9
Primjer 2.17 Neka je obiljeje X rasporeeno prema sljedeim podacima:
Xi

2- 8
8 - 14
14 - 20
20 - 26
26 - 32
32 - 38

4
6
13
21
15
3
62

Kumulanta
(rastua)
4
10
23
44
59
62
-

Odrediti i protumaiti medijanu na osnovu prikazane intervalne serije distribucije frekvencija:


Najprije odreujemo medijanski interval:
; to znai da sredinji lan lei izmeu 31. i 32. elementa, pa
vidimo da je vrijednost medijane u 4. razredu.
,
to znai da 50% vrijednosti obiljeja se nalazi ispod 22,3, a 50% iznad ove vrijednosti.

2.5 Mjere varijabiliteta (disperzije)


Ukoliko svaka od pojedinih vrijednosti obiljeja manje odstupa od srednje vrijednosti,
utoliko srednja vrijednost, koja za dati skup predstavlja optu mjeru centralne tendencije,
postaje reprezentativna. Za adekvatnu statistiku interpretaciju nije dovoljno samo izraunati
srednje vrijednosti, ve i odgovarajue pokazatelje pojedinane varijabilnosti kao mjere
podobnosti njihovih iskaza.
Poto srednja vrijednost istie samo koncentraciju statistikog skupa oko neke
vrijednosti obiljeja, potrebno je izraunati i odstupanja pojedinih vrijednosti obiljeja od
srednje vrijednosti tj. potrebno je izmjeriti varijabilitet obiljeja u cjelini. Bez pokazatelja
varijacije vrilo bi se netano uoptavanje karakteristika statistikih skupova koji imaju
sluajno jednaku srednju vrijednost.
U statistikoj analizi koriste se apsolutne mjere varijabiliteta u koje spadaju interval
varijacije, srednje apsolutno odstupanje, varijansa i standardna devijacija i relativne
mjere varijabiliteta u koje se ubrajaju koeficijent varijacije, normalizovano odstupanje itd.

2.5.1 Apsolutne mjere varijabiliteta


2.5.1.1 Interval varijacije

Interval varijacije (Iv) ili amplituda kolebanja vrijednosti obiljeja iskazuje se kao
razlika izmeu najvee i najmanje oznaene vrijednosti obiljeja: Iv=xmax-xmin. Interval
varijacije ima smisla samo za konane razmake disperzije serije, jer na njega iskljuivo utiu
krajnje vrijednosti, tako da se ne moe uzeti kao dovoljno informativna mjera varijacije.
Direktan je rezultat razlike ekstremnih vrijednosti koje su najee opredijeljene sluajnim
okolnostima, tako da u sebi nosi mjeru pouzdanosti samo ukoliko mu je gustina vea, a koju
moemo izraunati na sljedei nain:

; gdje je:
Gi - gustina intervala varijacije,

- brojna vrijednost serije,


- interval varijacije,

Ukoliko je interval varijacije ( ) manji, uz


, to je gustina intervala ( )
vea, a time i interval ( ) postaje reprezentativnija mjera. Da bi se eliminisao uticaj izraeno
ekstremnih i individualnih vrijednosti na interval varijacije, izraunava se kao dopunska
mjera interkvartilna razlika (razlika izmeu treeg i prvog kvartila), gdje prvi kvartil
predstavlja medijanu za prvu polovinu serije, a trei kvartil je medijana druge polovine serije.

Grafiki prikaz intervala varijacije:

interkvartilna razlika

gdje je:

- interkvartilna razlika
- trei kvartil
- prvi kvartil
2.5.1.2. Srednje apsolutno odstupanje

Potpuniju informaciju o varijabilitetu posmatrane serije daju pokazatelji ije se


izraunavanje zasniva na odstupanju srednje vrijednosti (aritmetike sredine) od
individualnih vrijednosti obiljeja. Algebarski zbir odstupanja originalnih vrijednosti od
aritmetike sredine, po svojstvu aritmetike sredine, jednak je nuli. Zato se algebarska
odstupanja zamjenjuju apsolutnim odstupanjima iji prosjek predstavlja mjeru varijabiliteta
poznatu kao srednje apsolutno odstupanje.
Znai, srednje apsolutno odstupanje je aritmetika sredina apsolutnih odstupanja
pojedinanih vrijednosti obiljeja (
slijedi:

) od aritmetike sredine datog niza , tako da iz definicije

za seriju negrupisanih podataka:

za seriju distribucije frekvencija (grupisanih podataka):

za intervalnu seriju distribucije frekvencija:

2.5.1.3 Varijansa (

; gdje je: - sredina intervala

Varijansa predstavlja prosjeno kvadratno odstupanje pojedinanih vrijednosti


obiljeja od aritmetike sredine i uvijek je pozitivna veliina tj.

Za statistike serije negrupisanih podataka varijansa se izraunava na osnovu izraza:

Transformacijom ovog izraza dolazimo do podesnijeg radnog obrasca za


izraunavanje varijanse:

Ovako sreen obrazac varijanse za serije negrupisanih podataka omoguava da se


direktno izraunava iz podataka bez traenja odstojanja (
).
Za statistike serije grupisanih podataka polazni obrazac za izraunavanje varijanse,
koji se daljnjom transformacijom racionalie u tzv. radni obrazac je:

Posmatrajmo lan

i razloimo ga na sljedei nain:

pri emu
da je:

predstavljaju relativne frekvencije (vjerovatnoe) koje oznaavamo sa

tako

Konano imamo:
, to omoguava izraunavanje varijanse kroz vjerovatnou
2.5.1.4 Standardna devijacija (

Da bi izmjerili varijabilitet odreenog obiljeja potrebno je mjeriti odstupanje


individualnih vrijednosti obiljeja statistikog skupa od date srednje vrijednosti. Poto su ova
odstupanja dvosmjerna, ne moe im se izraunati prosjek jer im je zbir jednak nuli. Zato se
varijacija mjeri prosjekom kvadrata odstupanja pojedinanih vrijednosti od srednje
vrijednosti. Ovako izraunat podatak, koji smo nazvali varijansa ( ), je primitivan oblik
pokazatelja varijacije. Znai, varijansa je predimenzionisan pokazatelj varijacije jer
predstavlja kvadrat pravog pokazatelja varijacije koji se zove standardna devijacija ( ).
Matematiki posmatrano, standardna devijacija je linearni oblik varijanse, odnosno kvadratni
korijen iz varijanse, tako da se izraunava na sljedei nain:
Standardna devijacija za serije negrupisanih podataka (proste serije):

Standardna devijacija za serije grupisanih podataka (serije distribucije frekvencija):

Primjer 2.18 Odabran je uzorak od 645 stambenih jedinica i posmatran prema broju
nastanjenih lica, na osnovu ega je sreivanjem i grupisanjem formirana sljedea serija
distribucije frekvencija.
Br.li.
(X)
1
2
3
4
5
6

Br.
(f)
85
150
140
130
65
35

st.
85
300
420
520
325
210

- 2,32
- 1,32
- 0,32
0,7
1,7
2,7

5,38
1,74
0,10
0,46
2,82
7,18

457,3
261,0
14,0
59,8
183,3
251,3

1
4
9
16
25
36

85
600
1260
2080
1625
1260

7
Ukupno

40
645

280
2140

3,7
-

13,54
-

541,6
1768,3

49
-

1960
8870

Odrediti aritmetiku sredinu i mjere disperzije:


Aritmetika sredina:

Interval varijacije:
Iv= x max x min = 7 1 = 6
Varijansa:

Standardna devijacija:

Koeficijent varijacije:

U ovom primjeru disperzija je velika. Aritmetika sredina nije dovoljno reprezentativna jer je
relativno visok varijabilitet.
2.5.2 Relativne mjere varijabiliteta
2.5.2.1 Koeficijent varijacije

Koeficijent varijacije je odnos standardne devijacije i aritmetike sredine, a moe se


izraunati prema sljedeoj formuli:

Kao relativna mjera stepena varijabiliteta sluajne promjenljive, koeficijent varijacije


(Kv) se koristi za poreenje varijabiliteta podataka serija ije mjerne jedinice nisu iste.

2.5.2.2 Normalizovano (standardno) odstupanje

Normalizovano (standardizovano) odstupanje (zi) predstavlja odstupanje bilo koje


vrijednosti
od
sljedei nain:

, izraeno u jedinicama standardne devijacije, a moe se izraziti na

Normalizovano odstupanje omoguava da se odredi procenat i broj frekvencija


obuhvaenih u intervalu odstojanju od modaliteta x1 do modaliteta x2,
odnosno

Primjer 2.19
Uporediti produktivnost rada radnika A i radnika B koji rade u razliitim grupama,
ako su poznati sljedei podaci:

Prosjena produktivnost grupe


Prosjean varijabilitet grupe (stand. devijacija)
Produktivnost rada

I grupa

II grupa

mA = 52
A=5
XA=47

mB=75
B=7
XB=60

Relativna udaljenost radnika A i B od prosjeka svojih grupa je:


=
;
=
;
Radnik A je relativno blii prosjenoj produktivnosti rada svoje grupe u odnosu na radnika B.
2.5.2.3 Mjere oblika rasporeda

Pored srednjih vrijednosti i mjera disperzije postoje i pokazatelji rasporeda u koje


ubrajamo mjere asimetrije i zaobljenosti empirijskih rasporeda u odnosu na normalni. Ako su
vrijednosti statistikog obiljeja X: x1,x2,...xn ravnomjerno i ekvivalentno rasporeene lijevo i
desno oko neke uoene vrijednosti, takvu distribuciju nazivamo simetrinom. Ako je
gomilanje vrijednosti obiljeja sa lijeve i desne strane od uoene srednje vrijednosti
neravnomjerno rasporeeno, onda se radi o asimetrinoj distribuciji. Prema tome,
razlikujemo lijevu i desnu asimetriju kao varijante mjere oblika rasporeda.
Kada su maksimalne vrijednosti frekvencija ravnomjerno i ekvidistantno rasporeene
na obe strane serije, a minimalne frekvencije u centru serije, tada imamo karakteristinu Udistribuciju. Potreban ali ne i dovoljan uslov simetrinosti izraava se sljedeim odnosom:

U statistici se za odreena mjerenja koriste odstupanja vrijednosti obiljeja


od skupa za odreen stepen, to predstavlja centralne momente rasporeda ( ). Tako
) jednak je jedinici, prvi momenat ( ) jednak je nuli, drugi
npr. nulti momenat (

momenat (

) je varijansa, trei momenat (

)je mjera asimetrije, a etvrti

momenat (
) je mjera spljotenosti.
Na bazi navedenih statistikih momenata odreujemo:

- relativna mjera asimetrije


- relativna mjera spljotenosti
Ako je a3 = 0, distribucija je simetrina. Za -0.5 < a3 < 0.5, kaemo da je empirijska
distribucija umjereno asimetrina. Za a4 = 3 empirijska distribucija je normalno spljotena;
vrijednosti vee od 3 prisutne su kod izduenijih, a vrijednosti manje od 3 kod spljotenijih
distribucija u odnosu na normalnu.
Primjer 2.20 Izraunati mjere oblika rasporeda plodova jabuka prema masi.
Aritmetika sredina i varijansa, odnosno standardna devijacija ovog rasporeda, poznati su iz
ranijih primjera, tj:

U radnoj tabeli data su neophodna izraunavanja:


Potrebni centralni momenti, treeg i etvrtog reda su:

70 75
75 80
80 85
85 90

72,5
77,5
82,5
87,5

2
5
10
17

-15
-10
-5
0

-6700
-5000
-1250
0

101250
50000
6250
0

90 95
95 100
100 - 105
Ukupno

92,5
97,5
102,5
-

1125
4000
10125
1125

5
10
15
-

9
4
3
50

5625
40000
151875
355000

Koeficijenti asimetrije i spljotenosti

Posmatrani

raspored

je

vrlo

slabo

desno

asimetrian,

jer

je

koeficijent
Da se radi o desnoj asimetriji, iako slabo izraenoj, vidi se iz odnosa aritmetike
sredine, modusa i medijane ovog rasporeda:
Prema koeficijentu spljotenosti,
(srednje spljoten).

, raspored je skoro mezokurtian

3. TEORIJSKE RASPODJELE SLUAJNIH PROMJENLJIVIH


Pod pojmom sluajne promjenljive podrazumijeva se veliina koja u zavisnosti od
ishoda nekog sluajnog eksperimenta uzima vrijednosti iz skupa realnih brojeva.[1]
Sluajne promjenljive se oznaavaju velikim slovima A, B, C,X, Y, Z, a
njihove vrijednosti malim slovima a, b, c, x, y, z,. esto se slovima dodaju i indeksi pa
se dobijaju oznake kao npr. X1, X2, za sluajeve promjenljive, odnosno x1, x2, za njihove
vrijednosti.
Sluajne promjenljive mogu biti diskretne i neprekidne. Diskretne su one sluajne
promjenljive koje mogu uzeti konano ili prebrojivo mnogo izolovanih vrijednosti. Za
razliku od njih, neprekidne sluajne promjenljive mogu uzeti bilo koju vrijednost iz nekog
konanog ili beskonanog intervala realnih brojeva.
3.1 Raspodjela diskretne sluajne promjenljive
S obzirom da diskretna sluajna promjenljiva uzima vrijednosti na sluajan nain, za
njenu potpunu karakterizaciju nije dovoljno znati samo te vrijednosti, ve i vjerovatnoe sa
kojima se one mogu realizovati. Funkcionalna veza izmeu vrijednosti sluajne promjenljive
i vjerovatnoa njihove realizacije predstavlja zakon raspodjele sluajne promjenljive.
Pretpostavimo da diskretna sluajna promjenljiva X uzima vrijednosti x1,x2,,xn sa
vjerovatnoama p1,p2,pn,tj.

.
.
.

pri emu je

Zakon raspodjele sluajne promjenljive X moe se zadati pomou tabele raspodjele


X
P

x1
p1

x2
p2

xn
pn

Ovaj zakon raspodjele moe se predstaviti i grafiki pomou tzv. poligona raspodjele
kao na sljedeoj slici:
Poligon raspodjele

.
Ponekad je zakon raspodjele mague zadati pomou analitikog izraza

Ako je broj vrijednosti sluajne promjenljive beskonaan (prebrojiv) pretpostavlja se da


brojni red

konvergira ka jedinici.

Primjer 3.1 Neka u eksperimentu sa bacanjem kocke za igranje, sluajna


promjenljiva X predstavlja broj okaca na gornjoj strani kocke. Mogue vrijednosti ove
sluajne promjenljive su x1=1, x2=2, x3=3, x4=4, x5=5, x6=6. Poto su sve ove vrijednosti
jednako vjerovatne, zakon raspodjele sluajne promjenljive X je:
X
P

1
1/6

2
1/6

3
1/6

4
1/6

5
1/6

6
1/6

odnosno

Primjer 3.2 Neka u eksperimentu sa bacanjem tri novia sluajna promjenljiva X


predstavlja broj okrenutih grbova. Ako sa P oznaimo pismo a sa G grb, mogui ishodi
eksperimenta su:PPP, PPG, PGP, GPP, PGG, GPG, GGP, GGG. Za nula grbova povoljan je
jedan ishod (PPP), za jedan grb povoljna su tri ishoda (ppg, pgp, gpp) i td. Poto je ukupno
osam moguih ishoda onda je raspodjela sluajne promjenljive X:

X
P

0
1/8

1
3/8

2
3/8

3
1/8

3.1.1 Numeriki pokazatelji diskretne sluajne promjenljive


Iako zakon raspodjele u potpunosti odreuje sluajnu promjenljivu, ponekad u
praktinim zadacima nije neophodno znati zakon raspodjele, ve je dovoljno poznavati neke
od numerikih pokazatelja sluajne promjenljive. Meu najznaajnije od njih spadaju
matematiko oekivanje, modus, medijana, varijansa, standardna devijacija i momenti. Svi
ovi pokazatelji mogu se interpretirati kao i kod empirijskih raspodjela.
Matematiko oekivanje diskretne sluajne promjenljive X u oznaci M(X) je suma
svih proizvoda njenih vrijednosti i odgovarajuih vjerovatnoa, tj.:

kada sluajna promjenljiva ima konaan broj vrijednosti, i

kada sluajna promjenljiva ima prebrojivo mnogo vrijednosti.


Kolinik centralnog momenta treeg reda i treeg stepena standardne devijacije
predstavlja mjeru asimetrije;

a kolinik centralnog momenta etvrtog reda i etvrtog stepena standardne devijacije mjeru
spljotenosti:
, to je detaljnije objanjeno u prvom poglavlju.

3.1.2

Binomna raspodjela

Pretpostavimo da sluajna promjenljiva X predstavlja broj realizacija nekog sluajnog


dogaaja u jednom eksperimentu. Ako je p vjerovatnoa realizacije tog dogaaja, a q=1-p
suprotna vjerovatnoa onda sluajna promjenljiva X ima zakon raspodjele nula-jedan:6

Matematiko oekivanje i varijansa sluajne promjenljive X lako se izraunavaju


pomou prethodno objanjenih formula:

Pretpostavimo, dalje, da sluajna promjenljiva X predstavlja broj realizacija nekog


sluajnog dogaaja u n-nezavisnih eksperimenata. Ako je p-vjerovatnoa realizacije tog
sluaja dogaaja u svakom pojedinanom eksperimentu, a q=1-p suprotna vjerovatnoa iz
teorije vjerovatnoe je poznato da je:

Lako se moe vidjeti da je ovim izrazom zadan jedan zakon raspodjele. Naime, na
osnovu binomnog obrasca je:

a ovo je jednako jedinici, jer je p+q=1.


Prethodni izraz definie tzv. binomni zakon raspodjele. injenica da sluajna
promjenljiva X ima binomnu raspodjelu sa parametrima n i p obino se oznaava sa
X:B(n,p).
Poto sluajnu promjenljivu X moemo smatrati zbirom n nezavisnih sluajnih
promjenljivih Xi sa zakonom raspodjele nula-jedan, onda je na osnovu formula sa prethodnih
stranica:

zbog p+q=1:

tj.

Slino, rjeavanjem druge nejednaine dobija se da je:

Prema tome, modus Mo se moe odrediti iz uslova

Iz ove dvostruke nejednakosti vide se da binomna sluajna promjenljiva moe biti ili
unimodalna ili bimodalna, zavisno od toga da li je p(n+1) razlomljen ili cijeli broj.
Poto binomni zakon raspodjele zavisi od dva parametra n i p, njihove razliite
kombinacije odreuju i razliite binomne zakone. Iz prethodnog izraza vidi se da je p=q
raspodjela simetrina, dok je za
raspodjela nesimetrina u desnu ili levu stranu
zavisno od toga da li je q>p ili q<p. Kad

mjera

tei nuli, odnosno raspodjela tei

ka simetrinoj, a
tei ka tri, odnosno raspodjela tei mezokurtinoj. To se vidi iz poligona
raspodjele na sljedeoj slici:
Poligon binomnog zakona raspodjele za razne vrijednosti p (a) i za
razne vrijednosti n (b)

Primjer 3.3 Odrediti pokazatelje raspodjele broja kinih dana u mjesecu junu, ako je
vjerovatnoa kinog dana p=0,2.
Oigledno je da je n=30 i p=0,2. Dalje je:

Primjer 3.4 U pakovanju od 50 proizvoda vjerovatnoa neispravnih proizvoda je


p=0,15. Odrediti oekivani i najvjerovatniji broj neispravnih proizvoda. Odrediti
vjerovatnou da broj neispravnih proizvoda bude manji od 3.
Ovdje je n=50 i p=0,15, pa je:

3.1.3 Poasonova raspodjela


Pretpostavimo da se kod binomne raspodjele parametri n i p mijenjaju u nizu
eksperimenata, ali tako da je
i da n tei beskonanosti. Ukoliko je
vjerovatnoa p veoma mala (p 0,05) i kada je n 20, tada umjesto binomnog modela
moemo koristiti Poasonov model.
Za dovoljno veliko n je
. S obzirom da je np=const. to je za veliko n
vrijednost parametra p mala, pa se dogaaj, ija se realizacija u nizu eksperimenata posmatra,
naziva rijetkim dogaajem. Dobijeni zakon raspodjele realizacije retkih dogaaja naziva
se Poasonov zakon.
Dakle, sluajna promjenljiva X ima Poasonovu raspodjelu ako je:

Ova injenica skraeno se oznaava sa

Dakle, kod Poasonove raspodjele aritmetika sredina i varijansa su:

, odnosno:

Poasonova sluajna promjenljiva moe biti unimodalna i bimodalna, zavisno od toga


da li je razlomljen ili cijeli broj. Iz prethodnog izraza za Poasonovu raspodjelu se vidi da je
raspodjela nesimetrina u desnu stranu i to utoliko vie ukoliko je manje,
raspodjela tei ka simetrinoj. To se vidi iz poligona raspodjele na sljedeoj slici:
kad

Poligon Poasonove raspodjele

3.1.4 Hipergeometrijska raspodjela


Pretpostavimo da se iz skupa N elemenata od kojih m ima neko svojstvo, na sluajan
nain bira nelemenata. Neka sluajna veliina X predstavlja broj elemenata, od n izabranih,
koji imaju posmatrano svojstvo. Lako se moe vidjeti da je:

Prethodnim izrazom definisan je jedan zakon raspodjele diskretne sluajne


promjenljive, koji se naziva hipergeometrijski zakon raspodjele. Kao to se vidi, ovaj zakon
raspodjele zavisi od tri parametra:N, m, i n.

Modus

hipergeometrijske

uslova

raspodjele

se

dobija

iz

Moe se pokazati da je

to znai da je hipergeometrijska raspodjela ili unimodalna ili bimodalna, zavisno od toga da


li je (m+1)(n+1)/(N+2) razlomljen ili cijeli broj.
Hipergeometrijska raspodjela ima veliku primjenu u statistikoj kontroli kvaliteta. U
tom smislu ona se moe interpretirati kao raspodjela karta u uzorku koji je uzet iz
proizvodne serije za potrebe kontrole.
Ako se, polazei od definicije hipergeometrijske raspodjele, sa p oznai vjerovatnoa
posmatranog dogaaja, tj. p=m/N, a sa q vjerovatnoa suprotnog dogaaja q=1-p, ona je na
osnovu prethodnih izraza:
i
Vidi se da za konano n, kad se N neogranieno poveava, matematiko oekivanje i
varijansa hipergeomatrijske raspodjele tee odgovarajuim pokazateljima binomne
raspodjele.
U praktinim zadacima smatra se da se hipergeometrijska raspodjela dobro
aproksimira binomnom kada je
Primjer 3.5 Iz serije od 100 kutija vonog soka na sluajan nain izabrano je 10 za
kontrolu ispravnosti proizvoda. Prema usvojenom standardu serija e biti prihvaena ako
meu izabranim ne bude vie od jedne neispravne kutije. Izraunati vjerovatnou da serija
bude prihvaena ako u njoj ima jneispravnih kutija.
U ovom primjeru N=100, n=10 i m=k. Traena vjerovatnoa izraunata na osnovu
hipergeometrijske raspodjele je:

Ako se koristi binomna raspodjela sa parametrima n=10 i p=n/N=5/100=0,5, onda je

3.2 Raspodjela neprekidne sluajne promjenljive


Neprekidna sluajna promjenljiva uzima proizvoljne vrijednosti iz nekog intervala
(a,b), a sve vrijednosti iz tog intervala je nemogue taksativno navesti. Osim toga, kao to e
biti kasnije pokazano, vjerovatnoa svake pojedinane vrijednosti jednaka je nuli. Stoga se za
karakterizaciju neprekidne sluajne promjenljive X ne koriste vjerovatnoe P(X=x), ve
vjerovatnoe P(X<x) pomou kojih se zadaje funkcija raspodjele.

3.2.1 Funkcija i gustina raspodjele


Funkcija raspodjele neprekidne sluajne promjenljive X
F(x)=P(X<x)
ima sljedea svojstva:

1.

i
Ovo svojstvo slijedi iz injenice da je
a
potpuno izvjestan dogaaj.

2.

nemogu sluajan dogaaj,

za x1<x2
Zaista, iz x1<x2 slijedi da je

odnosno

tj.

3.

F(x) je neprekidna9

Grafik funkcije neprekidne sluajne promjenljive prikazan je na sljedeoj slici.


Funkcija raspodjele neprekidne sluajne promjenljive

Vrijednost x0 za koju je
gde je
neka unaprijed zadana vjerovatnoa,
naziva se kvantil raspodjele definisane funkcijom F(x).
Na osnovu navedenih svojstava funkcije raspodjele lako je pokazati da je
vjerovatnoa da neprekidna sluajna promjenljiva X uzme vrijednost x jednaka nuli, tj.
P(X=x)=0
Neprekidna promjenljiva X se moe zadati na jo jedan nain, pomou tzv. gustine
raspodjele.
Gustina raspodjele f(x) sluajne promjenljive X predstavlja prvi izvod funkcije
raspodjele, tj:

Drugim rijeima, funkcija raspodjele je primitivna funkcija za gustinu raspodjele.


Na osnovu poznate Njutn-Lajbnicove formule slijedi da je

to, geometrijski, predstavlja mjerni broj povrine ispod grafika funkcije gustine u intervalu
(x1,x2):
Zamjenom u prethodnom izrazu

odnosno

Gustina raspodjele

dobija se da je

a odavde

jer je
3.2.2 Numeriki pokazatelji neprekidne sluajne promjenljive
Numeriki pokazatelji neprekidne sluajne promjenljive X definiu se analogno kao i
kod diskretne sluajne promjenljive, s tim to vjerovatnoe pi zamjenjuju vjerovatnoe f(x)dx
a sumu, integral.
Tako je matematiko oekivanje jednako:

a varijansa:

odnosno:

Za matematiko oekivanje i varijansu neprekidne sluajne promjenljive vae osobine


kao kod diskretne sluajne promjenljive.
Uopte, poetni i centralni moment k-tog reda definiu se kao:

Modus neprekidne sluajne promjenljive je ona njena vrijednost u kojoj postie


maksimum gustine raspodjele.
Ostali pokazatelji definiu se na isti nain kao i kod diskretne sluajne promjenljive.

3.2.3. Normalna raspodjela


Neprekidna sluajna promjenljiva X ima normalnu raspodjelu ako je njena gustina
raspodjele zadana funkcijom:

Ova injenica se obino oznaava sa

Prethodnim analitikim izrazom definisana je familija krivih koje zavise od dva


parametra
i . Za fiksirane vrijednosti ovih parametara grafik je predstavljen na
sljedei nain:
Gustina raspodjele normirane sluajne veliine

Grafik gustine normalne raspodjele naziva se normalna kriva. Promjenom


parametara grafik se translira du x-ose. Za vee vrijednosti parametra
maksimum je
manji a grafik iri u odnosu na pravu
, a za manje vrijednosti tog parametra maksimum
je vei, a grafik blii pravoj
.
Parametri i predstavljaju
rasporeene sluajne promjenljive.

matematiko

Pokazatelji asimetrije i spljotenosti su:

oekivanje

varijansu

normalno

Sa prethodnog grafika normalne krive vidi se da su modus i medijana jednaki


matematikom oekivanju .
Za proizvoljnu sluajnu promjenljivu X sa matematikim oekivanjem
varijansom

sluajna promjenljiva:

se naziva normirana (normalizovana, standardizovana) sluajna promjenljiva.


Na osnovu svojstava matematikog oekivanja i varijanse jasno je da je za normiranu
sluajnu promjenljivu matematiko oekivanje jednako nuli i varijansa jednaka jedinici.
Ako sluajna promjenljiva X ima normalnu raspodjelu onda i odgovarajua
normalizovana sluajna promjenljiva Z ima normalnu raspodjelu, tj. Z:N(0,1), sa gustinom

Funkcija raspodjele normalne sluajne promjenljive sa parametrima

je:

a za normiranu sluajnu promjenljivu je:

Pomou tablica vrijednosti funkcije, za t=1;2;3 mogu se odrediti tzv. sigma pravila:
prvo

drugo

tree

-pravilo se dobija za t=1:

-pravilo za t=2:

-pravilo se dobija za t=3:

Normalna raspodjela ima veliku primjenu u statistikoj analizi. Ova tvrdnja proistie
iz tzv. centralne granine teoreme koja se u grubim crtama moe formulisati na sljedei
nain: Zbir velikog broja nezavisnih sluajnih promjenljivih od kojih svaka ima mali udio u
zbiru ima priblino normalnu raspodjelu.10
U poljoprivrednim istraivanjima pojava je esto slina uslovima centralne granine
teoreme. Veliki broj sloenijih biolokih obiljeja predstavlja kumulaciju prostijih svojstava
na elijskom nivou. Pri mjerenju razliitih kvantitativnih veliina greka mjerenja je

kumulanta pojedinanih greaka izazvanih mnogim faktorima kao to su temperature,


vlanost, nesavrenost mjernih instrumenata, subjektivizam lica koja mjere itd.
U pojedinim sluajevima, usljed predominantnog uticaja jednog ili vie faktora na
zbirnu sluajnu promjenljivu, dolazi do znaajnog odstupanja od normalnosti. Tada, esto,
nekom od transformacija podataka npr. korijenom, logaritamskom transformacijom i sl,
moemo dobiti priblino normalnu raspodjelu.
Primjer 3.6 Normalno rasporeena sluajna promjenljiva X ima matematiko
oekivanje
i varijansu
P(7<X<8), P(9<X<15) i P(X>16).

Odrediti

vjerovatnoe

P(X<6),

Traene vjerovatnoe su:

Pored normalne raspodjele veliku primjenu u statistici imaju tri teorijske raspodjele
, t i F raspodjela. S obzirom da se na
koje su izvedene iz normalne raspodjele. To su
osnovu ove tri raspodjele formiraju kriterijumi za testiranje statistikih hipoteza, esto ih
nazivaju i kriterijumske raspodjele. Zbog sloenosti izraza kojima se zadaju njihove gustine,
ovdje se neemo uputati u izvoenje numerikih pokazatelja, to, u krajnjoj liniji, nije bitno
za njihovu praktinu primjenu o kojoj e dalje biti rijei.

3.2.4

- raspodjela

Neka su X1, X2, , Xn uzajamno nazavisne, normirane normalno rasporeene


sluajne promjenljive. Suma njihovih kvadrata:

ima tzv.

(hi kvadrat) raspodjelu sa n stepeni slobode. injenica da sluajna

promjenljiva x ima

-raspodjelu sa n-stepeni slobode oznaava se sa

Pod pojmom broja stepeni slobode podrazumijeva se broj linearno nezavisnih


promjenljivih u nekom skupu promjenljivih. Tako npr. ako za n promjenljivih
X1,X2,,Xn postoji jedna linearna veza, onda se jedna od njih moe izraziti preko ostalih n-1.
U tom sluaju broj stepeni slobode bi bio n-1. Broj stepeni slobode se oznaava sa d.f. to
predstavlja prva slova engleskih rijei degree of freedom (=stepen slobode).
Moe se pokazati da se gustine

gde je

-raspodjele zadaju funkcijom:

gama funkcija:

Sa poveanjem broja stepeni slobode

-raspodjela tei normalnoj raspodjeli. Obino

se za n>30 smatra da je
-raspodjela veoma slina normalnoj i da se, u praktinim
zadacima, moe zamijeniti normalnom raspodjelom.
Grafik gustine
sljedei nain:
Gustina

-raspodjele za razliite brojeve stepeni slobode prikazan je na

raspodjele

Kvantil

raspodjele

3.2.5 Studentova raspodjela


Neka je X normirana, normalno rasporeena sluajna promjenljiva, a Y/n je nezavisna
sluajna promjenljiva koja ima

-raspodjelu. Tada sluajna promjenljiva:

ima Studentovu ili t-raspodjelu11 sa n stepeni slobode. injenica da sluajna promjenljiva X


ima t-raspodjelu sa n stepeni slobode obino se oznaava sa X:Tn.
Moe se pokazati da se gustina ove raspodjele zadaje funkcijom:

Sa poveanjem broja stepeni slobode i ova raspodjela tei normalnoj i smatra se da se


u praktinim zadacima, za n>30, moe zamijeniti normalnom raspodjelom.
Grafik gustine t-raspodjele za razliite brojeve stepeni slobode prikazan je na
sljedeoj slici:
Gustina Studentove t-raspodjele

3.2.6 Fisher Snedecor-ova F-raspodjela


Neka su X i Y nezavisne sluajne promjenljive koje imaju
n2 stepeni slobode. Tada sluajna promjenljiva

-raspodjelu sa n1 i

ima F-raspodjelu (raspodjelu Fisher-Snedecor-a) sa n1 i n2 stepeni slobode. injenica da


sluajna promjenljiva X ima F-raspodjelu sa n1 i n2 stepeni slobode obino se oznaava
sa

.
Moe se pokazati da se gustina raspodjele zadaje funkcijom:

Iz definicije se vidi da ako sluajna promjenljiva ima Studentovu t-raspodjelu sa n


stepeni slobode, njen kvadrat ima F-raspodjelu sa 1 i n stepeni slobode.
Grafik gustine F-raspodjele za razliite parove brojeva stepeni
slobode prikazan je na slici ispod.
Numeriki pokazatelji ove raspodjele su:

Koeficijent asimetrije i spljotenosti se izvodi iz formule za centralne momente:

a zbog glomaznosti njihovih analitikih izraza ovdje ih neemo navoditi.

Za odreivanje kvantila, tj. vrijednosti

za koju je

kao na sljedeoj slici, koristi se tabela F-raspodjele u kojoj su izraunati kvantili za razliite
vrijednosti n1, n2 i . Tako, naprimjer, ako se kod F-raspodjele sa n1=5 i n2=10 stepeni
slobode trai odgovarajui kvantil, takav da je
proitati da je

, iz tablica se moe

Grafik gustine F-raspodjele

Kvantil F-raspodjele

4. METOD UZORKA

4.1 Izbor i naini formiranja uzorka


Statistiki podaci ine niz posmatranja u ispitivanju sluajne promjenljive X(u daljem
tekstu obiljeja) koja karakterie skup homogenih objekata. Najtanije zakljuivanje o
obiljeju X dobija se vrei najvei mogui broj posmatranja.
Osnovni skup ine sva mogua, ponekad zamiljena (hipotetika), posmatranja
obiljeja X. Umjesto termina funkcija raspodjele obiljeja X esto se koristi raspodjela
osnovnog skupa.
U praktinim situacijama najee je nemogue vriti ispitivanje cijelog osnovnog
skupa, tj. izvriti sva mogua posmatranja obiljeja X. Jedan od razloga za to je to osnovni
skup moe imati beskonano mnogo elemenata. U konanim sluajevima ispitivanje cijelog
osnovnog skupa iziskuje velike materijalne trokove a esto moe dovesti i do unitenja
objekata ispitivanja. Zbog toga se za ispitivanje zakonitosti obiljeja x vri posmatranje na
dijelu osnovnog skupa koji se naziva uzoraki skup ili jednostavno uzorak. Broj objekata u
osnovnom skupu i u uzorku naziva se obim. Broj jedinica u osnovnom skupu oznaava se sa
N, a broj jedinica u uzorku sa n. Kao to je ve reeno, osnovni skup moe imati kako
konaan, tako i beskonaan obim.
Rezultati n posmatranja obiljeja X obino se oznaavaju sa x1.x2,,xn. Metod, koji
se sastoji u tome da se na osnovu svojstava uzorka x1,x2,xn izvedu zakljuci o numerikim
karakteristikama i zakonu raspodjele obiljeja X, naziva se metod uzorka.
Svaki uzorak ne omoguava dobijanje stvarne slike o ispitivanom obiljeju. Da bi
zakljuci o obiljeju X bili objektivni, neophodno je da uzorak bude reprezentativan, tj. da
dovoljno dobro predstavlja ispitivano obiljeje X. Postoje specijalno razraene metode
dobijanja reprezentativnih uzoraka. Sutina tih metoda je da svaki element osnovnog skupa
ima istu ansu (vjerovatnou) da bude ukljuen u uzorak. Drugim rijeima, izbor elemenata iz
osnovnog skupa treba da bude sluajan. Meutim, u praktinim situacijama nije uvijek
mogue dobiti potpuno sluajan uzorak. Zbog prirode ispitivane pojave ili raspoloivih
materijalnih sredstava, nekad se eksperiment planira tako da postoji neko ogranienje
potpuno sluajnog izbora. U skladu sa tim sve procedure izbora se mogu podijeliti u dvije
osnovne grupe:
a) prost sluajan izbor;
b) kontrolisani izbor.
Kod prostog sluajnog izbora elementi uzorka se biraju iz cijelog osnovnog skupa sa
istom vjerovatnoom. Postoje dva tipa ovakvog izbora:
a) prost sluajan izbor sa vraanjem;
b) prost sluajan izbor bez vraanja.
Prost sluajan izbor sa vraanjem je, kao to sam naziv govori, postupak formiranja
uzorka kod koga se sluajno izvuen element iz osnovnog skupa vraa u osnovni skup i ima

istu ansu da bude ponovo izvuen kao i svi ostali elementi. Kod potpuno sluajnog izbora
bez vraanja jednom izvuen element vie se ne vraa u osnovni skup. Jasno je da se razlika
izmeu ova dva postupka anulira u sluaju beskonanih ili jako velikih osnovnih skupova.
Sama procedura formiranja uzorka realizuje se na sljedei nain. Da bi se formirao
uzorak svi objekti osnovnog skupa se numeriu brojevima od 1 do N, a zatim se vri
izvlaenje n brojeva kao kod igre loto. Svaki broj ima istu ansu da bude izvuen. Ukoliko se
izvuen broj vraa, tj. moe biti ponovo izvuen, formira se uzorak sa vraanjem, u
protivnom uzorak je bez vraanja.
Zbog velikog obima osnovnog skupa nije uvijek mogue formirati uzorak izvlaenjem
brojeva. U takvim sluajevima koriste se tablice sluajnih cifara ili generator sluajnih
brojeva na raunaru.
Tablice sluajnih cifara koriste se tako to se kolone grupiu da dobijeni brojevi u
vrstama budu reda veliine broja N. Zatim se redom izdvaja n brojeva manjih od N. Ako je
uzorak bez vraanja, izdvojeni brojevi moraju biti meusobno razliiti.
Primjer 4.1 Iz osnovnog skupa obima N=121, datog u tabeli - broj traktora po
poljoprivrednim organizacijama:

treba izdvojiti sluajan uzorak bez vraanja obima n=20.


Tablicu sluajnih cifara treba podijeliti na grupe od po tri kolone i izdvojiti prvih 20
razliitih brojeva manjih od 121.
Brojevi sastavljeni pomou tablice sluajnih cifara su: 22, 82, 45, 53, 106, 3, 75, 108,
121, 20, 98, 28, 63, 21, 46, 8, 14, 35, 105 i 97. Tim brojevima odgovaraju sljedee vrijednosti
obiljeja X u uzorku: x1=12, x2=17, x3=8, x4=7, x5=15, x6=10, x7=13, x8=20, x9=22, x10=9,
x11=8, x12=18, x13=11, x14=13, x15=15, x16=21, x17=20, x18=10, x19=13 i x20=12.

Pomou generatora sluajnih brojeva moe se na raunaru slimulirati izvlaenje n


jedinica iz osnovnog skupa obima N. Faktiki, to je simulacija realizacije diskretne sluajne
promjenljive sa ravnomjernom raspodjelom, tj

Iz osnovnog skupa obima N moe se formirati


razliitih
sluajnih uzoraka bez vraanja obima n, i w2=Nn razliitih sluajnih uzoraka sa vraanjem
obima n.
U drugu grupu procedura izbora, tz. kontrolisanog izbora, spadaju procedure kod
kojih postoji ogranienje sluajnosti. One ne pruaju jednaku ansu svim elementima
osnovnog skupa da budu ukljueni u uzorak. Postoji vei broj procedura kontrolisanog
izbora. Meu najee koriene spadaju:
a) mehaniki izbor;
b) vieetapni izbor;
c) stratifikovani izbor.
Mehaniki izbor je oblik kontrolisanog izbora kod koga se osnovni skup od N
elemenata dijeli na onoliko jednakih dijelova kolika je potrebna veliina uzorka n, a zatim se
iz svakog dijela bira po jedan element u uzorak. Pri tome, ako su u svakom dijelu elementi
numerisani brojevima od 1 do (N/n), na sluajan nain se bira samo jedan od tih brojeva i
zatim se iz svakog dijela izvlai element koji mu odgovara. Tako, ako je q sluajno izabran
cijeli broj izmeu 1 i (N/n) i ako elemente osnovnog skupa oznaimo sa x1, x2,..,xN, onda
uzorak sainjavaju
elementa odreeni i svi ostali elementi u uzorku.

. Oigledno je da su izborom prvog

Osnovni nedostatak mehanikog izbora je to ne obezbjeuje reprezentativnost


uzorka. To je posebno uoljivo kod skupova ije se vrijednosti periodino ponavljaju sa
periodom (N/n). Zbog ovog nedostatka, uprkos svojoj jednostavnosti, mehaniki izbor se
rijetko primjenjuje.
Vieetapni izbor je oblik kontrolisanog izbora kod koga se elementi osnovnog skupa
biraju po hijerarhijskom principu. Procedura izbora se odvija tako to se pomou prostog
sluajnog izbora biraju elementi najvieg nivoa pa zatim meu njima, slino, elementi prvog
nieg podreenog nivoa i tako dalje, dok se ne stigne do najnieg nivoa, sa koga se biraju
elementi u uzorak. Tako, naprimjer, ako treba izabrati uzorak koji reprezentuje
poljoprivredna domainstva jedne zemlje, na sluajan nain se moe izabrati izvjestan broj
optina iz kojih se biraju domainstva koja se ukljuuju u uzorak. Vieetapni izbor u
znaajnoj mjeri smanjuje materijalne trokove i druge napore oko formiranja uzorka. S druge
strane, statistiki metodi pomou kojih se izvode zakljuci o osnovnom skupu na osnovu
vieetapnog izbora, baziraju se na koncepciji uslovne vjerovatnoe, i kao takvi sloeniji su,
nego npr., u sluaju prostog sluajnog izbora.
Stratifikovani izbor je procedura kod koje se prvo osnovni skup dijeli na homogenije
disjunktne podskupove, tzv. stratume, a zatim se iz svakog stratuma kao kod prostog
sluajnog izbora izvlae elementi u uzorak. Na ovaj nain nastaje tz. stratifikovani uzorak.

Stratifikovani uzorak se obino primjenjuje kod skupova sa velikim variranjem, kod


kojih je za postizanje reprezentativnosti potrebno ukljuiti veliki broj elemenata u uzorak.
Podjelom osnovnog skupa na stratume, kao to e kasnije biti pokazano, varijabilitet izmeu
stratuma ne utie na reprezentativnosti uzorka.
Pored pomenutih postoje i druge procedure izbora. U daljem tekstu bie vie rijei o
prostom sluajnom izboru i o stratifikovanom izboru.
U praksi se obino primjenjuje tzv. kombinovani izbor. Naime, osnovni skup se
razbija na podskupove jednakog obima, zatim se prostim sluajnim izborom bira izvjestan
broj podskupova, iz kojih se, zatim, prostim sluajnim izborom izvlae pojedini objekti.

4.2 Raspodjela parametara uzorka


Parametri raspodjele obiljeja X (parametri raspodjele osnovnog skupa) nisu
sluajne veliine. Njihova traena vrijednost mogla bi se dobiti kada bi se ispitale sve
jedinice osnovnog skupa ili kada bi bila poznata funkcija raspodjele osnovnog skupa.
Parametri uzorka izraunavaju se poslije formiranja uzorka. S obzirom da su vrijednosti koje
obrazuju sluajan uzorak realizacije sluajne veliine (obiljeja) X, to su i na osnovu njih
izraunati parametri realizacije neke sluajne promjenljive. Po pravilu, raspodjela parametara
uzorka odreena je raspodjelom osnovnog skupa.
Teorija raspodjele parametara uzoraka dijeli se na teoriju tanih raspodjela i teoriju
asimptotskih raspodjela. Tana raspodjela odreuje se za sve realne vrijednosti obima uzorka
n. Raspodjela kojoj tei tana raspodjela kad
naziva se asimptotska raspodjela.
Izraunavanje tanih raspodjela zavisi od naina formiranja uzoraka, i najee je
dosta sloeno. Elementi uzorka x1, x2,..,xn posmatraju se kao realizacije sluajnih veliina
X1, X2,,Xn sa istom raspodjelom. Ukoliko je uzorak sluajan sa vraanjem, sluajne
veliine
X1,
X2,,Xn su
nezavisne,
jer
je
Ova injenica dosta pojednostavljuje
izraunavanje traenih raspodjela parametara uzorka. Ako se formira sluajan uzorak bez
vraanja, sluajne veliine X1, X2,,Xn su zavisne. Zaista, ako je obim osnovnog skupa N,
vjerovatnoa dogaaja X1=x1 je

, a vjerovatnoa dogaaja X2=x2, pri

uslovu da je element x1 ve odabran, jednaka je


Zavisnost
sluajnih veliina X1, X2,,Xn dosta komplikuje izraunavanje zakona raspodjele.

4.2.1 Tane raspodjele parametara uzorka iz osnovnog


skupa sa normalnom raspodjelom
S obzirom da se elementi uzorka x1, x2,..,xn posmatraju kao realizacije nezavisnih
sluajnih veliina X1, X2,,Xn sa istom raspodjelom, aritmetika sredina
uzroka

je jedna realizaciji sluajne veliine


.

Ako je uzorak izvuen iz osnovnog skupa sa normalnom raspodjelom sa


parametrima i , to e i nezavisne sluajne promjenljive X1, X2,,Xn imati normalnu
raspodjelu sa parametrima
i , tj.
Moe se zakljuiti, na osnovu
osobina normalne raspodjele, da uzoraka sredina, kao zbir n nezavisnih normalno
rasporeenih veliina, ima normalnu raspodjelu sa parametrima:

tj.

Primjer 4.2 Utvreno je da produktivnost rada radnika, pri proizvodnji nekog


proizvoda, ima normalnu raspodjelu. Nai vjerovatnou da e prosjena produktivnost 16
sluajno odabranih radnika odstupati od srednje produktivnosti manje od 3pr./ov.as., ako se
zna da je varijansa produktivnosti rada jednaka
Srednja produktivnost 16 sluajno izabranih radnika posmatra se kao sluajna
promjenljiva . Ako se pretpostavi da su sluajne promjenljive X1, X2,,X16 nezavisne, pri
emu je u konkretnom sluaju

gde je

i n=16. Treba nai vjerovatnou dogaaja

sluajna veliina sa normiranom normalnom raspodjelom, tj. Z:N(0;1).

Primjer 4.3 Ako se zna da prinos penice ima normalnu raspodjelu sa


parametrima =52(00)kg/ha i
=49, odrediti vjerovatnou da e prosjean prinos penice
na 100ha, sluajno izabranih, biti vei od 53(00)kg/ha.
Treba odrediti vjerovatnou dogaaja da je

gde je Z:N(0;1).
4.3 Odreivanje obima uzorka
Neophodan obim uzorka za ocjenu nepoznatog parametra osnovnog skupa obima N
odreuje se u zavisnosti od izabranog naina formiranja uzorka, zadane tanosti (gornje
granice apsolutne greke)

i eljene pouzdanosti

Bie razmotreno odreivanje obima sluajnog uzorka sa vraanjem i sluajnog uzorka


bez vraanja, za ocjenu srednje vrijednosti osnovnog skupa
i proporcije p, na osnovu
uzorakih posmatranja.

4.3.1 Obim uzorka za ocjenu srednje vrijednosti osnovnog skupa


Posmatraju se dva sluaja u zavisnosti od toga da li je poznata varijansa osnovnog
skupa (obiljeja X) ili ne.

I VARIJANSA

OSNOVNOG SKUPA JE POZNATA

Na osnovu izvedenih formula za tanost ocjene u paragrafu neophodan obim


sluajnog uzorka je:

kada je uzorak sa vraanjem;

kada je uzorak bez vraanja.


Primjer 4.4 Odrediti koliko treba uzeti flaa ulja iz dnevne proizvodnje, da bi se
ocijenila prosjena koliina ulja u flai, sa pouzdanou 0,975. Poznato je da je varijansa
koliine

. Tanost dobijene ocjene treba da bude: a)0,1l; b)0,2l.

a)

Uzorak treba da sadri 100 flaa.


b)

Uzorak treba da sadri 26 flaa.


Primjer 4.5 Odrediti povrinu na kojoj treba mjeriti prinos kukuruza, radi ocjene
prosjenog prinosa kukuruza na 10000ha. Ocjenu dati sa pouzdanou a) 95% i b) 99%, ako
se zna da je varijansa 35. Duina intervala treba da bude 4(00kg)/ha.
S obzirom da je:

bie:
a)

Dakle, uzorak treba da sadri 34ha.


b)

Dakle, uzorak treba da sadrzi 58ha.


II VARIJANSA OSNOVNOG SKUPA NIJE POZNATA

U ovom sluaju prvo se preliminarnim uzrokom obima no ocjenjuje nepoznata


varijansa osnovnog skupa. Za ocjenu nepoznate varijanse koristi se korigovana uzoraka
varijansa, tj.

Na
dato

osnovu

izvedene

formule

za

tanost

ocjene

dobija

se,

za

, potreban obim:

a) sluajnog uzorka sa vraanjem

b) sluajnog uzorka bez vraanja

.
Ukoliko je izraunati obim uzorka n manji od obima preliminarnog uzorka
no
, ocjena nepoznatog parametra moe se dobiti na osnovu ve formiranog uzorka. U
protivnom, treba izvriti dodatna posmatranja, kako bi se uzorak proirio do traenog obima.
Za ocjenu nepoznate varijanse koristi se izraunata vrijednost

iz preliminarnog uzorka.

Primjer 4.6 Na osnovu preliminarnog uzorka no=10 dobijeni su podaci o prinosu


nove sorte penice (primjer 5.16). Nai minimalni broj hektara na kojima treba zasijati novu
sortu penice da bi se sa pouzdanou 0,95 moglo tvrditi da granina greka takaste ocjene
nee biti vea od: a) 1(ookg)/ha i b) 0,5(00kg)/ha.
Bie:
(

pa je:
a) za

b) za

vidi primjer 5.16)

4.3.2 Obim uzorka za ocjenu proporcije svojstva A u osnovnom skupu


Da bi se odredio obim uzorka n za ocenu proporcije, mora postojati neka informacija
o proporciji svojstva A u osnovnom skupu. Naime, varijansa ocjene proporcije
zavisi od
parametra p, pa on mora biti poznat iz ranijih ispitivanja, ili ocjenjen na osnovu
preliminarnog uzorka. Obim preliminarnog uzorka nomora biti dovoljno velik
bi se mogla koristiti aproksimacija binomne raspodjele normalnom.

, da

Neka je p proporcija svojstva A, tada je minimalan obim uzorka za:


a) uzorak sa vraanjem

jer je

b) uzorak bez vraanja

jer je

Ukoliko proporcija p nije poznata iz ranijih ispitivanja, umjesto p stoji ocjena


proporcije

S obzirom, da funkcija p(1-p) dostie maksimum za p=1/2, ako ne posjedujemo


apriornu informaciju o proporciji osnovnog skupa, stavlja se da je p(1-p)=1/4. U tom sluaju
prethodne formule postaju

Primjer 4.7 Sa pouzdanou 0,99 treba ocijeniti procenat poljoprivrednih


domainstava koja imaju kombajn. U probnom uzorku proporcija takvih domainstava bila je
10%. Koliko najmanje domainstava treba anketirati ako duina intervala povjerenja treba da
bude najvie: a) 0,04 i b) 0,06? Koliko bi domainstava trebalo anketirati kad ne bi postojala
nikakva informacija o nepoznatoj proprciji?
Ovdje je:
I za

, pa je:

a)

.
b)

.
II U sluaju kad ne postoji nikakva informacija o nepoznatoj proporciji postavlja se
da je p(1-p)=1/4, pa je
a)

dom.
b)

dom.
Primjer 4.8 Iz dnevne produkcije od 10000 proizvoda treba izabrati uzorak za ocjenu
broja neispravnih proizvoda sa vjerovatnoom 0,99. Odrediti neophodan obim uzorka, ako je
u ranijim ispitivanjima procenat neispravnih proizvoda bio 2% i ako se trai da uzoraka
proporcija ne odstupa od stvarne vie od 2%. Posmatrati sluajeve uzorka sa vraanjem i bez
vraanja.
Na osnovu postavljenih uslova je:

I uzorak sa vraanjem

proiz.
II uzorak bez vraanja

Primjer 4.9 Za ocjenu procenta unitene penice od grada polje od 2000ha


podijeljeno je na 1000 jednakih dijelova. Koliko dijelova treba posmatrati, da bi se sa

vjerovatnoom 0,95 moglo tvrditi, da dobijeni interval duine 0,10 pokriva stvarnu vrijednost
procenta unitene penice, ako je na osnovu preliminarnog uzorka dobijeno

S obzirom na postavljene zahtjeve:

neophodan obim uzorka je:

5. STATISTIKA OCJENA NEPOZNATIH


PARAMETARA OSNOVNOG SKUPA
5.1 Pojam i vrste statistike ocjene
Statistika ocjena, pored statistike provjere hipoteza, predstavlja osnovni vid
statistikog zakljuivanja. Statistiko ocjenjivanje poinje apriornom informacijom o
raspodjeli osnovnog skupa (na osnovu histograma ili poligona frekvencija vizuelno se
odreuje vid raspodjele), a zatim se izvode zakljuci o vrijednostima nepoznatih parametara
raspodjele na osnovu sluajnog uzroka iz posmatranog osnovnog skupa. Statistika provjera
hipoteza vri se istim redoslijedom, ali ukljuuje dopunsku pretpostavku koju treba provjeriti.
Postupak statistikog ocjenjivanja sastoji se u sljedeem: Iz osnovnog skupa se
funkcijom raspodjele
, gde je nepoznati parametar, izvlai sluajan uzorak
obima n i na osnovu dobijenih posmatranja x1, x2,, xn izraunava se priblina vrijednost
nepoznatog parametra . Priblina vrijednost za nepoznati parametar , koja se odreuje na
osnovu uzorka, naziva se vrijednost ocjene nepoznatog parametra . Vrijednost (realizacija)
ocjene nepoznatog parametra
Za

dobijanje

ocjene

obino se oznaava sa
nepoznatog

parametra

.
V

posmatra

se

funkcija

oblika
, koja se naziva uzoraka funkcija ili statistika (predikator,
ocjenjiva). Zadatak ocjene nepoznatog parametra svodi se na nalaenje takvih uzorakih
funkcija
nepoznatog parametra

, koje se mogu koristiti kao kvalitetna (dobra) ocjena


.

Kod svakog statistikog zakljuivanja, pa i statistikog ocjenjivanja, postoji rizik da


se napravi greka, tj. rizik da se izvede pogrean zakljuak. Ovaj rizik je posljedica
zakljuivanja na osnovu podataka uzorka, koji se sastoje iz konanog, esto veoma malog,
broja jedinica. Taj rizik se smanjuje sa porastom broja jedinica u uzorku, ali uvijek postoji.
To je razlog to rjeenje, doneseno na osnovu statistikog zakljuivanja, prate izraunate
vjerovatnoe da e prihvaeno rjeenje biti pravilno. Naravno, to ne znai da se pravilna
teorija statistikog zakljuivanja formira samo na osnovu izraunavanja vjerovatnoa. Za
formiranje pravilne teorije statistikog zakljuivanja, pored rezultata teorije vjerovatnoe,
neophodno je koristiti niz dopunskih pravila zasnovanih na zdravom razumu.
Pretpostavimo, naprimjer, da treba ocijeniti srednju vrijednost posmatranog obiljeja
X koje ima normalnu raspodjelu i da je za to iz osnovnog skupa uzet uzorak obima n.
Postavlja se pitanje koju veliinu, izraunatu na osnovu podataka uzorka, treba uzeti za
najpribliniju ocjenu srednje vrijednosti obiljeja X, tj. srednja vrijednost osnovnog skupa .
Mogue je izabrati nekoliko uzorakih veliina, koje su, za dovoljno veliki obim uzorka,
bliske srednjoj vrijednosti osnovnog skupa. To su aritmetika sredina rezultata posmatranja,
ili njihova medijana, ili aritmetika sredina izmeu najmanje i najvee posmatrane vrijednosti
i sl. Svaka od navedenih veliina, sa gledita teorije vjerovatnoe, moe se posmatrati kao
jednako dobro pribliavanje ocjenjivanom parametru. Naime, pri viekratnom ponavljanju
ocjenjivanja, na osnovu sluajnog uzorka iz tog osnovnog skupa, u srednjem bi se dobio

pravilan rezultat sa gledita teorije vjerovatnoe. Pravilnost rezultata ovdje se sastoji u


tome, da pri pojedinanim uzorcima greka ocjenjivanja srednje vrijednosti osnovnog skupa
moe biti znaajna, ali e pri velikom broju uzoraka srednja vrijednost greke biti jednaka
nuli.
Ovakav pristup pravilnosti rezultata nije dovoljan. U praksi se obino uzima jedan
uzorak i na osnovu njega se ocjenjuje nepoznati parametar osnovnog skupa. Zbog toga je
vano formirati takva pravila ocjenjivanja da se na osnovu jednog uzorka dobije to je
mogue tanija ocjena traenog parametra. Da bi se to postiglo neophodna su neka dopunska
pravila o kvalitetu ocjene, koja ne proistiu neposredno iz izraunavanja vjerovatnoe
greke. Ona su, uglavnom, obuhvaena osnovnim svojstvom koje treba da ima dobra
ocjena, a zavise i od konkretne, praktine situacije.
S obzirom da je uzorak sluajan i konaan, sve uzorake funkcije posmatranja bie
sluajne veliine. Dakle, ocjena nepoznatog parametra bie sluajna veliina, a njena
vrijednost, izraunata na osnovu podataka sluajnog uzorka obima n, bie jedna realizacija te
sluajne veliine iz skupa moguih realizacija, tj.
Ocjene
parametra

parametara

odreena

je

dijele

se

na

jednim

parametra odreena sa dva broja


ocjenjivani parametar .

takaste

brojem
i

intervalne.
.

Takasta

Intervalna

ocjena
ocjena

, koji ine granice intervala koji pokriva

5.2. Osnovna svojstva takaste ocjene


Osnovna
parametra

svojstva

koja

treba

da

ima

dobra

ocjena

nepoznatog

su: nepristrasnost, stabilnost (konzistentnost) i efikasnost.

Ocjena
nepoznatog parametra naziva se nepristrasnom (bez
sistematske greke) ako je njeno matematiko oekivanje jednako ocjenjivanom parametru,
tj. ako je

Nepristrasnost je minimalni zahtjev koji se trai od ocjene. Ukoliko je ocjena


nepristrasna, pri viekratnom (teorijski beskonanom) ponavljanju sluajnog uzorka, srednja
greka ocjene svih uzoraka bila bi jednaka nuli. Dakle, nepristrasna uzoraka ocjena daje u
srednjem taku ocjene posmatranog parametra.
Ocjena za koju nije ispunjen uslov iz prethodnog izraza naziva se pristrasnom (sadri
sistematsku greku).
Razlika izmeu matematikog oekivanja ocjene i vrijednosti ocjenjivanog parametra
naziva se pristrasnost (bias) ocjene i oznaava se sa

Saglasnost ocjene znai da se sa poveanjem obima uzorka poveava vjerovatnoa da


greka ocjene ne prelazi dovoljno malu veliinu . Moe se dokazati da e prethodna
jednakost biti ispunjena, ako pri naogranienom poveanju obima uzorka varijansa
ocjene

i pristrasnost

tee nuli, tj. ako

(5.4)

kad

Ukoliko postoji vie nepristrasnih ocjena, po pravilu, bira se ocjena sa najmanjom


varijansom.
Nepristrasna ocjena
napoznatog parametra , koja ima najmanju
varijansu, izmeu svih moguih nepristrasnih ocjena parametra izraunatih na osnovu
uzorka istog obima, naziva se efikasnom ocjenom.
5.3 Intervalne ocjene parametara raspodjele
Metode za dobijanje takaste ocjene
, nepoznatog parametra ,
ne omoguavaju da se odredi kakva se greka ini zato to se stvarna vrijednost nepoznatog
parametra zamjenjuje njegovom ocjenom . Zbog toga je u mnogim sluajevima zgodnije
koristiti intervalnu ocenu, jer ona omoguava da se odrede tanost i pouzdanost ocjene.
Intervalne ocjene se preporuuju u sluaju malog broja posmatranja, kada je takasta ocjena
malo pouzdana.
Takasta ocjena
razlika
ocjene, tj.

mala. Pozitivan broj

Dakle, ako je
i
tanost zavisi od obima uzorka.
S obzirom, da je ocjena

nepoznatog parametra

je bolja kada je

koji karakterie granicu ove razlike naziva se tanost

, onda je ocjena tanija to je

sluajna veliina, ne moe se kategoriki odgovoriti na

pitanja vezana za greku ocjene, ve se moe samo govoriti o vjerovatnoi

ili

manje. Jasno je da

Vjerovatnoa
Vjerovatnoa

naziva

se

pouzdanost

, suprotnog dogaaja

ili

vjerovatnoa

povjerenja.

, naziva se rizik. U statistici je uobiajeno da

uzima vrijednosti 0,90; 0,95; 0,99.

pouzdanost

Kada je
dovoljno blisko jedinici
greka takaste ocjene nepoznatog parametra .

je granina apsolutna

, koji sa vjerovatnoom
pokriva nepoznati
Interval
2
parametar , naziva se interval povjerenja ili interval pouzdanosti . Dakle, pri formiranju
vie

uzoraka

interval

obima

iz

jednog

pokriva napoznati parametar

osnovnog

skupa

,au

sluajeva

sluajeva ga ne pokriva.

(1-) 100% interval pouzdanosti za


nepoznati parametar

U praktinim sluajevima velika panja se poklanja duini intervala povjerenja. to je


manja duina intervala pouzdanosti, to je ocjena tanija. Ako je duina intervala povjerenja
velika, ocjena nema praktinu primjenu. Duina intervala jednaka je
, tj.
.
Duina intervala povjerenja zavisi od obima uzorka n i pouzdanosti
.
Veliine n,

tijesno su povezane. Znajui dvije od njih lako se nalazi trea.

Opta ema formiranja intervala povjerenja za nepoznati parametar


sljedeem:
1.

Vri se n posmatranja obiljeja X iz osnovnog skupa sa nepoznatim parametrom


raspodjele.
Nekom
od
navedenih
metoda
nalazi
se
takasta
ocjena

2.

sastoji se u

nepoznatog parametra

Na osnovu dobijene takaste ocjene formira se neka sluajna veliina koja je funkcija
nepoznatog
naprimjer

parametra,

naprimjer

ima

poznatu

gustinu

raspodjele,

;
;

3.

Zadaje se pouzdanost

4.

Na osnovu poznate gustine raspodjele sluajne veliine


intervala) c1 i c2tako da za njih vai

nalaze se kvantili (granice


. Kvantili c1 i c2 raspodjele

sluajne

veliine

biraju

je

se,

po

pravilu,

tako

da

kao to je prikazano na sljedeoj slici:

Kvantili raspodjele sluajne promjenljive


5.

Nejednakost
nejednakost

6.

transformie

se

, tj.

jednakoverovatnu

Za konkretan uzorak izraunava se realizacija takaste ocjene


odnosno realizacije granica sluajnog intervala

, tj.

U tabeli je dat pregled nekih vanijih nepristrasnih takastih ocjena nepoznatih


parametara:
Nepristrasne ocjene nepoznatih parametara
OCJENA

Za
sa vraanjem.

mogu se koristiti ocjene nepoznatih parametara dobijene na osnovu uzoraka

5.3.1 Interval povjerenja za srednju vrijednost osnovnog skupa


(poznata varijansa)

Posmatra se osnovni skup sa normalnom raspodjelom

, pri emu

je
poznato a nepoznato. Za ocjenu nepoznatog parametra
iz osnovnog skupa izvlai
se sluajan uzorak. U sluaju konanog osnovnog skupa, uzorak e biti sa vraanjem. Na
osnovu dobijenog uzorka izraunava se uzoraka sredina kao realizacija takaste ocjene
nepoznatog parametra , tj.

Za formiranje interval povjerenja posmatra se sluajna veliina

koja ima standardizovanu normalnu raspodjelu, tj Z:N(0;1), jer


sa srednjom vrijednou
Za
raspodjele

zadani

nivo

i varijansom
znaajnosti

ima normalnu raspodjelu

mogue

je

nai

kvantile

normalne

iz tablica normalne raspodjele, za koje je

Nejednakost, koja se nalazi u vitiastim zagradama relacije, jednostavno se


transformie, tako da u sredini ostane nepoznati parametar

, tj.

Na osnovu prethodne relacije moe se zakljuiti da interval

pokriva srednju vrijednost osnovnog skupa sa zadanom vjerovatnoom


ocjene srednje vrijednosti osnovnog skupa

da je tanost

zbog
nepoznati parametar

i da je duina intervala povjerenja za

Kvantili normirane sluajne veliine

Na osnovu dobijenih izraza za tanost ocjene i duinu intervala moe se zakljuiti


, poveava tanost ocjene
da se sa poveanjem obima uzorka, pri istoj vjerovatnoi
( je obrnuto proporcionalno obimu uzorka), tj. smanjuje se duina intervala povjerenja, i da
se sa poveanjem vjerovatnoe
, pri istom obimu uzorka, tanost smanjuje, tj.
poveava se duina intervala povjerenja.
U sluaju konanog osnovnog skupa, ukoliko je sluajan uzorak bez vraanja,
prethodne relacije se zbog

koriguju, pa je interval povjerenja

tanost ocjene

i duina intervala povjerenja

Kao to je ve reeno, popravni faktor


je
za

tj,

za

primjenjuju

formule prije posljednje korekcije.

se

se primjenjuje ukoliko
gore

izvedene

formule,

Ukoliko se zna obim osnovnog skupa N, moe se pomou prve od gore navedenih
formula odrediti interval povjerenja za ukupnu vrijednost posmatranog obiljeja X na
posmatranom osnovnom skupu. Naime, ukupna vrijednost

pokrivena je intervalom

odnosno

Primjer 5.1 Izmjerena je masa deset paketia putera, da bi se ocijenila prosjena


masa paketia cijele proizvodnje. Pretpostavlja se da je raspodjela mase paketia normalna,
sa standardnom devijacijom
gr i nepoznatom srednjom vrijednou . Na osnovu
dobijenih rezultata mjerenja, mase paketia putera su u gr.: 251,5; 248,7; 250,7; 250; 250,9;
249,3; 249; 251; 251,2; 249,1. Ocjenu prosjene mase paketia putera treba dati sa
pouzdanou 95%. Kolika je tanost dobijene ocjene?
Uzoraka sredina i standardna devijacija srednje vrijednosti su:

Dalje je:

pa je:

Dakle,

prosjena

teina

paketia

putera

cijele

proizvodnje

intervalu
sa pouzdanou 95%.
Tanost dobijene ocjene je:
gr,

bie

a duina intervala povjerenja


gr.

Primjer 5.2 Na osnovu sluajnog uzorka obima 100 treba ocijeniti prosjenu masu
pilia u osnovnom skupu, ako se zna da je varijansa mase pilia 0,3. Nai, sa poudanou
0,99 (uz rizik 1%), tanost sa kojom uzoraka sredina ocjenjuje srednju vrijednost osnovnog
skupa.
Na osnovu uzorake informacije je:

pa je na osnovu prethodno pokazanog:


kg.
Dakle, tanost ocjene je 0,142 kg, tj. uzoraka sredina odstupa do
od sredine osnovnog skupa u 99% sluajeva.

kg

S obzirom, da je obim uzorka relativno veliki (n=100>30) dobijeni rezultat je


primjenljiv i u sluaju osnovnog skupa sa proizvoljnom raspodjelom.

Pri
mjer 5.3 Iz
osnovnog
skupa
od
2000 ovaca izabran je uzorak obima 100 za ocjenu prosjene mase ostriene vune. Rezultati
mjerenja dati su u tabeli:
Ako se zna da je raspodjela koliine ostriene vune normalna, sa varijansom 2,
ocijeniti, sa pouzdanou 0,99, prosjenu teinu ostriene vune u cijelom osnovnom skupu.
Kolika je tanost dobijene ocjene? Odrediti ukupnu koliinu ostriene vune. Odrediti
vjerovatnou da odstupanje prosjene koliine ostriene vune u uzorku od prosjene ostriene
vune u osnovnom skupu ne bude vee od 0,2 kg.
Ovdje je N=2000; n=100, n/N=100/2000=0,05>0,04. Zbog n/N=0,04 koriste se
formule iz prethodnih primjera, pa je:

Dakle, prosjena koliina ostriene vune po


ovci bie u intervalu
ocjene je:

sa pouzdanou 99%. Tanost dobijene


.

to znai da e uzoraka sredina, pri istim uslovima, odstupati od sredine osnovnog skupa
najvie

kg/ovci u 99% sluajeva.


Ukupna koliina ostriene vune u posmatranom osnovnom skupu bie sa
, tj.:

pouzdanou 99% u intervalu

Dalje treba odrediti vjerovatnou dogaaja da je


je

. Kako

to je na osnovu:

Iz tablica normalne raspodjele moe se proitati da je

, pa je:

5.3.2 Interval povjerenja za srednju vrijednost osnovnog skupa


(nepoznata varijansa)
Posmatra se osnovni skup sa normalnom raspodjelom

i nepoznatim

parametrima i
. Za ocjenu nepoznatog parametra
iz osnovnog skupa izvlai se
sluajan uzorak obima n. U sluaju konanog osnovnog skupa uzorak je sa vraanjem. Na
osnovu uzorakih vrijednosti izraunava se nepristrasna takasta ocjena nepoznatih
parametara, tj.

a nepristrasna ocjena za

je

pa je
;

ili

Statistika

ima Studentovu t-raspodjelu sa (n-1) stepeni slobode. Ona se koristi za odreivanje intervala
povjerenja nepoznatog parametra .
Za
kvantile

zadani

nivo

znaajnosti
iz

tablica

je

mogue
t-raspodjele,

je
tako

, kao na sljedeoj slici:


Kvantili t-raspodjele

nai
da

Dakle,

Nejednakost, koja se nalazi u vitiastim zagradama prethodne relacije, jednostavno se


transformie tako da u sredini ostane nepoznati parametar , tj.

Na osnovu toga moe se zakljuiti da interval

pokriva srednju vrijednost skupa

sa zadanom pouzdanou

Tanost ocjene srednje vrijednosti osnovnog skupa je

a duina intervala

Dobijeni interval ima ista svojstva kao i interval povjerenja za srednju vrijednost
osnovnog skupa pri poznatoj varijansi.
U sluaju konanog osnovnog skupa, kada se uzorak formira bez vraanja,
nepristrasna ocjena varijanse osnovnog skupa je
pa je nepristrasna ocjena varijanse uzorake sredine

tj. njena realizacija je:

Dakle, kada je n/N>0,04 u prethodnim formulama za ocjenu varijanse


sredine
koristi se ve navedena formula.

uzorake

Ukupna vrijednost obiljeja X u osnovnom skupu obima N odreuje se kao i u


prethodnom paragrafu. Granice intervala mnoe se sa N.
Ukoliko je obim uzorka dovoljno veliki
, za formiranje intervala
povjerenja nepoznate srednje vrijednosti , mogu se koristiti kvantili normalne raspodjele.
Primjer 5.4 Na osnovu devet nezavisnih mjerenja nekog objekta izraunata je
prosjena masa
gr i korigovana uzoraka varijansa
Treba ocijeniti stvarnu vrijednost izmjerene veliine sa pouzdanou 0,95.
Ovdje je

gr, n=9 pa je broj st. sl.

i
gr

Zbog
pa je interval pouzdanosti

Dakle, stvarna teina je sa 95% pouzdanosti pokrivena intervalom


.
Tanost dobijene ocjene je:
gr.

Primjer 5.5 Nova sorta penice zasijana je na 10 opitnih parcela. Poslije etve
dobijeni su sljedei prinosi:

Treba ocijeniti prosjean prinos nove sorte penice sa pouzdanou od 99% (uz rizik
1%). Kolika je tanost ocjene?

Na osnovu uzorake informacije je:

pa je interval pouzdanosti:

Sa pouzdanou 99% moe se tvrditi da e prosjean prinos nove sorte penice biti
pokriven
intervalom

Tanost dobijene ocjene je:


.

Primjer 5.6 Za ocjenu srednjeg prinosa kukuruza vreno je uzorako posmatranje na


16 ha, od ukupno zasijanih 300 ha. Dobijeni rezultati su dati u sljedeoj tabeli:

Ocijeniti prosjean prinos kukuruza po ha za cijelo polje sa pouzdanou 0,99. Kolika


je tanost ocjene? Kolika je procjena ukupnog prinosa?
Ovdje je N=300 i n=16 pa je n/N=16/300=0,053>0,04. S obzirom da je n/N>0,04
varijansa uzorake sredine, bie:

Zbog
pouzdanosti:

pa

je

interval

Dakle, sa 99% pouzdanosti moe se rei da e prosjean prinos na cijelom polju biti
od 62,02 00kg/ha do 64,23 00kg/ha.
Tanost dobijene ocjene je

Procjena ukupnog prinosa sa pouzdanou 99% je:

Primjer 5.7 Iz osnovnog skupa od 10000 individualnih gazdinstava izabran je uzorak


od 200 gazdinstava za ocjenu prosjene povrine imanja. Podaci u uzorku su sljedei:

Ocijeniti prosjenu povrinu imanja sa rizikom od 5%.


Na osnovu dobijenih vrijednosti iz uzorka izaunava se:

Kako je n/N=20/10000=0,02<0,04 i n>30 za ocjenu prosjene povrine koristie se


kvantili normalne raspodjele iz uslova:

Nepristrasna ocjena za nepoznatu varijansu

je:

pa je interval povjerenja za nepoznatu srednju vrijednost

Sa pouzdanou 95% (uz rizik 5%) moe se tvrditi da e prosjena povrina imanja
biti pokrivena intervalom

5.3.3 Interval povjerenja za proporciju osnovnog skupa


Pretpostavlja se da treba odrediti nepoznatu proporciju nekog svojstva A u osnovnom
skupu. Da bi se odredio interval povjerenja, iz osnovnog skupa formira se uzorak obima n.
Nepristrasna ocjena nepoznate proporcije p je uzoraka proporcija
, gdje je M
sluajna veliina koja karakterie broj jedinica u uzorku koje imaju svojstvo A, a n je obim
uzorka (njena realizacija, je
). Za dovoljno veliko n
uzoraka proporcija
ima priblino normalnu raspodjelu sa srednjom vrijednou p i varijansom

, tj.

Za formiranje intervala povjerenja koristi se statistika

koja ima N(0;1) kada je n dovoljno veliko i kada p nije blisko 0 ili 1.
Zbog jednostavnijeg izraunavanja, kod dovoljno velikih uzoraka, za varijansu
ocjene

obino se uzima realizacija njene nepristrasne ocjene, tj.:

Na osnovu prethodno navedenih statistika dobija se da je priblini interval povjerenja,


, za nepoznatu proporciju p svojstva A u osnovnom skupu8, za konkretne
pouzdanosti
uzorake vrijednosti:

Tanost ocjene je

a duina intervala

U sluaju konanog osnovnog skupa i uzorka bez vraanja koristi se sljedea ocjena
za

kada je n/N>0,04.
Ukupan broj jedinica u osnovnom skupu koje imaju svojstvo A bie, za konkretne
uzorake vrijednosti, sa pouzdanou

pokriven intervalom:

Ukoliko nisu ispunjeni uslovi aproksimacije binomne raspodjele normalnom, koristi


se veza izmeu sluajnih veliina sa binomnom raspodjelom i F-raspodjelom.
Korienjem ove injenice odreuju se formule za donju i gornju granicu intervala
povjerenja nepoznatog parametra p. Sa pouzdanou
pokriven intervalom

a
je

gde je
je

kvantil

nepoznati parametar p bie

gdje je

F-raspodjele

sa

st.

sl.

takav

da

kvantil F-raspodjele sa

stepeni slobode takav da

, a m broj jedinica u uzorku sa svojstvom A.

Primjer 5.8 Za ispitivanje hermetinosti staklenih tegli za pakovanje zimnice, od


5000 komada izabrano je 250 komada, na sluajan nain bez vraanja. U uzorakom skupu
28 tegli ima nedostatak hermetinosti. Odrediti sa pouzdanou 99% interval povjerenja za
procenat neispravnih tegli u osnovnom skupu.
Na osnovu uzorake informacije N=5000; n=250; m=28; realizacija nepristrasne
ocjene nepoznatog parametra p je:

S obzirom da je n/N=250/5000=0,05>0,04 za ocenu varijanse proporcije koristi se


relacija:

Kako je
nepoznatu proporciju u osnovnom skupu:

to je interval pouzdanosti za

Primjer 5.9 Pri provjeri nekog lijeka na 17 ivotinja, kod 3 ivotinje javili su se
pratei efekti.Odrediti 05% interval povjerenja za procenat ivotinja koje imaju pratee
efekte.
Vrijednost takaste ocjene za nepoznatu proporciju je:

Zbog malog obima uzorka, za ocjenu intervala povjerenja koriste se izrazi sa


prethodne stranice (formule za donju i gornju granicu intervala povjerenja). Za gornju
granicu
je:

pa je:

Za
je

donju
,

granicu
i

pa je

Dakle, 95% interval povjerenja je 3,8% - 43,5%. Ovaj interval je dosta irok, to je
uzrokovano malim obimom uzorka.

Primjer 5.10 Iz beskonanog osnovnog skupa izabran je stratifikovan uzorak za


ocjenu proporcije nekog dogaaja. Podaci iz uzorka prikazani su u sljedeoj tabeli:

Ocjenu dati sa 95% tanosti.


Bie:

tj.

Interval pouzdanosti je

Primjer 5.11 Iz osnovnog skupa od 5000 gazdinstava izabran je proporcionalan


stratifikovan uzorak od 300 gazdinstava za ocjenu proporcije gazdinstava sa posjedom veim
od 8ha. Podaci iz uzorka, sa izraunatim proporcijama i varijansama po stratumima, dati su u
sljedeoj tabeli:

Ocjenu dati sa rizikom 1%.


mora se uzeti u obzir
S obzirom da nije ispunjen uslov
korektivni faktor pri izraunavanju pribline vrijednosti za varijansu ocjene proporcije. Bie:

pa je

Interval povjerenja za proporciju je:

Dakle, na osnovu dobijenih podataka moe se tvrditi sa 99% pouzdanosti da e


procenat gazdinstava sa posjedom veim od 8ha biti pokriven intervalom

6. TESTIRANJE STATISTIKIH HIPOTEZA


Statistika hipoteza je neka pretpostavka o karakteristikama osnovnog skupa koja se
moe statistiki provjeriti. Pod statistikom provjerom (testiranjem) podrazumijeva se
jednostavno pravilo odbacivanja ili neodbacivanja hipoteze na osnovu uzorakih
posmatranja. Testiranje statistike hipoteze treba da utvrdi, da li je razlika izmeu
karakteristika uzorka i odgovarajuih karakteristika osnovnog skupa nastala kao posljedica
sluajnih kolebanja, ili, pak, nekih sistematskih faktora.
Testiranje statistikih hipoteza ima veliku praktinu primjenu. Savremena biologija,
medicina, neke oblasti tehnike, ekonomije, agronomije i druge naune oblasti, masovno
koriste testiranje statistikih hipoteza pri obradi rezultata istraivanja.
U zavisnosti od formulisane pretpostavke, statistika hipoteza moe biti parametarska
i neparametarska. Kod parametarske statistike hipoteze formulisana pretpostavka se odnosi
na vrijednost parametra funkcije raspodjele poznatog tipa
. Kod neparametarske
statistike hipoteze formulisana pretpostavka se odnosi na tip raspodjele osnovnog skupa.
U statistici se postavljena hipoteza obino naziva nulta hipoteza i oznaava se
simbolom Ho. Pored nulte hipoteze Ho posmatra se jedna ili vie alternativnih hipoteza, koje
se obino oznaavaju sa H1 ili H2. Ukoliko se nulta hipoteza Ho odbacuje, njeno mjesto
zauzima alternativna hipoteza Ha.
U zavisnosti od broja pretpostavki koje formulie, parametarska hipoteza moe biti
prosta i sloena. Parametarska hipoteza je prosta ako sadri samo jednu pretpostavku o
parametru. Ukoliko se parametarska hipoteza sastoji od konanog ili beskonanog broja
prostih hipoteza, ona je sloena.
Tako, naprimjer, pretpostavimo da je na parametar
tipom raspodjele

osnovnog skupa sa poznatim

. Uobiajeno je da se u nultoj hipotezi pretpostavlja da je nepoznati

parametar jednak nekoj konkretnoj vrijednosti, npr. . Alternativna hipoteza moe biti
prosta, kada se pretpostavlja da parametar ima neku drugu, konkretnu, vrijednost,
npr.

ili sloena kada se pretpostavlja da

skupa moguih vrijednosti, npr.

ili

uzima vrijednost iz konanog ili beskonanog


i dr. Uobiajeni su zapisi:

S obzirom da se za statistiku provjeru koriste uzoraki podaci, neophodno je rijeiti


nain njihovog sreivanja i izbora uzorake statistike kojoj se objanjava raspoloiva
uzoraka informacija. Uzoraka statistika koja je izabrana za provjeru hipoteze naziva se
statistiki kriterijum (test). Statistiki kriterijum je sluajna veliina (kao funkcija uzorakih
posmatranja), izabrana tako da je poznata njena tana ili priblina funkcija raspodjele. U
zavisnosti od tipa raspodjele, statistiki kriterijum se oznaava razliitim slovima, npr: Znormalna; T-Studentova, Fisher-Snedecor-ova F-raspodjela i td. Zbog optosti, u ovom dijelu
poglavlja se za statistiki kriterijum koristi oznaka K. Provjera nulte hipoteze vri se na
osnovu uzorake vrijednosti kriterijuma K, koja se obino oznaava sa k ili Kuz.

Neka je

skup svih moguih vrijednosti statistike (sluajne veliine) K. U optem

je viedimenziona oblast. Ukoliko je kriterijum K definisan pomou jedne


sluaju
sluajne veliine, to je najei sluaj,
je realna prava ili jedan njen dio, i moe se
grafiki precizno prikazati. Provjera statistike hipoteze vri se razbijanjem oblasti
na
dvije disjunktne oblasti W i
.
Pri tome, nulta hipoteza se odbacuje ako uzoraka vrijednost k kriterijuma K pripada oblasti
W (
opitom)

ako

se odbacuje), a ne odbacuje se (smatra se saglasnom sa


posmatrana uzoraka vrijednost k ne pripada oblasti W
se ne odbacuje)1. Podskup W se naziva kritina oblast (oblast

odbacivanja) hipoteze Ho, a podskup

oblast neodbacivanja (oblast saglasnih rjeenja).

oblast neodbacivanja
(oblast saglasnih rjeenja)
kritina oblast (oblast
odbacivanja)

Grafiki prikaz kritine oblasti

Funkcija raspodjele sluajne veliine K, bez obzira da li je tana ili priblina, mijenja
se u zavisnosti od pretpostavke o karakteristikama osnovnog skupa, tj. u zavisnosti od
pretpostavljene hipoteze. Ukoliko se zna funkcija raspodjele kriterijuma K, mogu se odrediti
vjerovatnoe dogaaja
i
. Vjerovatnoe ovih dogaaja
zavise od konkretne raspodjele sluajne veliine K. Kriterijum K bi trebalo izabrati tako da
vjerovatnoa dogaaja (**
/kada je Ho tano)** bude vrlo mala. Pod izrazom
vrlo mala podrazumijeva se sa verovatnoom 0,01 (1%) ili sa verovatnoom 0,05
(5%). Naime, to znai da se hipoteza Ho odbacuje, kada je stvarno tana, samo pri pojavi
malovjerovatnih uzoraka. S druge strane, kriterijum K bi trebalo birati tako da vjerovatnoa
dogaaja (**
/kada je Ho netano)*** bude vrlo mala. Naime, to znai da se
hipoteza Ho ne odbacuje kada u stvari nije tana samo pri pojavi malovjerovatnih uzoraka.
Dakle, pri testiranju statistikih hipoteza, u dva sluaja se moe donijeti pravilno rjeenje, a u
dva nepravilno, to je posljedica zakljuivanja na osnovu uzorakih vrijednosti (mali obim
uzorka, nedostatak metodike eksperimenta i sl.). U vezi sa tim se u statistici definiu greka I
vrste i greka II vrste.

Greka I vrste je greka odbacivanja nulte hipoteze Ho. To se deava


kada
, a Ho je tano. Vjerovatnoa ovog dogaaja, tj. vjerovatnoa greke I
vrste oznaava se sa ,

i obino se zove nivo znaajnosti statistikog kriterijuma K.


Greka druge vrste je greka neodbacivanja netane nulte hipoteze Ho. To se deava
kad

a Ha je tano. Vjerovatnoa ovog dogaaja se oznaava sa

, tj.

U vezi sa grekom II vrste definie se mo M kriterijuma K. Mo kriterijuma je


da se desi greka II vrste, tj. to je vjerovatnoa da se H o odbaci

vjerovatnoa
kada je netana.

Ukoliko je mo kriterijuma vea, onda je vjerovatnoa greke II vrste

PRAVILNO
RJEENJE

Ho

NE ODBACUJE SE

Ha

manja

NEPOZNATA ISTINA
Ho TANO
Ho NETANO
Ha NETANO
Ha TANO
PRAVILNO
GREKA
RJEENJE
II VRSTE
1-a
b
GREKA
II VRSTE
a

PRAVILNO
RJEENJE
1-b

Mogua rjeenja pri testiranju hipoteze H0


S obzirom na mogunost pogrenog zakljuivanja treba teiti ka minimizaciji tete od
greaka oba tipa, tj. ka minimizaciji vjerovatnoe da se greke dogode. Poeljno bi bilo doi
do minimuma vjerovatnoe greke prve i druge vrste istovremeno, ali to nije mogue. Naime,
da bi se minimizirala greka prve vrste trebalo bi to vie smanjiti kritinu oblast W, pa time i
vjerovatnou njene realizacije. To bi dovelo do poveanja oblasti neodbacivanja
time i vjerovatnoe

, a

realizacije greke II vrste.

Dakle, greku I i II vrste nije mogue istovremeno smanjiti, ako se mijenja samo
podjela oblasti . O ovome treba voditi rauna pri izboru kriterijuma K za provjeru
statistike hipoteze.
Jedan od naina klasifikacije statistikih kritetijuma K, za provjeru konkretne hipoteze
Ho u odnosu na konkretnu alternativnu hipotezu Ha, je prema njihovoj moi. Naime, treba
izabrati onaj kriterijum koji za isti obim uzorka, za dati nivo znaajnosti i konkretnu

alternativnu hipotezu Ha, ima veu mo (za takav kriterijum se kae da je efikasniji. Za
formiranje statistikih kriterijuma najbolje je koristiti takaste ojcene sa svojstvima
nepristrasnosti, stabilnosti i efikasnosti, jer tada kriterijumi imaju najveu mo. Naravno, nije
uvijek mogue izabrati kriterijum koji e biti najmoniji za sve alternativne hipoteze.
Ponekad se uvodi funkcija gubitka koja odreuje tetu koja se javlja kao rezultat bilo
koje od greaka dva tipa. Najee se oblast
odreuje tako da teta od oba tipa greaka
bude priblino jednaka. Naravno, to zavisi od konkretne situacije. Tako, naprimjer, ako se
ispituje tetnost lijeka na ljudsko zdravlje i ako je H o: Lijek nije tetan, a Ha: Lijek je
tetan, tada je mnogo vea teta proglasiti ga za dobar (greka II vrste). U tom sluaju treba
to vie smanjiti vjerovatnou greke II vrste.

U teoriji statistike kontrole kvaliteta greka I vrste naziva se rizik proizvoaa


(dobar proizvod se proglaava loim), a greka II vrste rizik kupca (lo proizvod se
proglaava dobrim) (*ovdje je Ho: Proizvod je dobar; Ha: Proizvod je lo**).
Pri testiranju statistikih hipoteza neophodno je sprovesti proceduru koja se sastoji od
sljedeih 7 koraka:
1. Formulisati nultu hipotezu Ho i alternativnu Ha;
2. Zadati nivo znaajnosti

3. Izabrati kriterijum K;
4. Odrediti zakon raspodjele kriterijuma K u sluaju kada je Ho tano, tj. f)k/Ho) i oekivanu
vrijednost M(K)=ko;
5. Odrediti kritinu oblast W iz uslova (6.1)3;
6. Izraunati uzoraku vrijednost statistike K, tj. k (Kuz);
7. Na osnovu izraunate vrijednosti donijeti odluku o odbacivanju ili neodbacivanju
postavljene hipoteze. Naime,
a) Ako je
b) Ako je
znaajnosti

, hipoteza Ho se odbacuje na nivou znaajnosti


, tj.

, hipoteza Ho se ne odbacuje na nivou

c) Ukoliko bi se desilo da je k na granici kritine oblasti morala bi se vriti dopunska


uzoraka posmatranja i tek onda donijeti odluka. U protivnom ne izvodi se bilo kakav
zakljuak.

6.1

Testiranje parametarskih hipoteza

Postupak testiranja parametarskih hipoteza vri se na ve opisan nain.


Kod odreivanja kritine oblasti treba uzeti u obzir i alternativnu hipotezu. Naime,
:

ako je za

a) Alternativna hipoteza
, onda je kritina oblast dvostrana kao na grafikonima na
sljedeoj stranici4. Ovakva formulacija alternativne hipoteze znai da oblast odbacivanja
mora uzeti u obzir realizacije sluajne veliine K lijevo i desno od ko
zadani
je

nivo

znaajnosti

mogu

se

izabrati

dva

broja

. Za
i

tako

da

,
U ovom sluaju kriterijum K se naziva dvostrani kriterijum znaajnosti.
Grafiki prikaz dvostrane kritine oblasti

b) Alternativna hipoteza
, onda je kritina oblast lijevostrana. Ovakva formulacija
alternativne hipoteze znai da kritina oblast uzima u obzir samo vrijednosti sluajne veliine
K lijevo od ko (sl. 6.3a i sl. 6.3b). Za zadani nivo znaajnosti moe se odrediti
kvantil

raspodjele sluajne promjenljive K, tako da je

U ovom sluaju kriterijum K se naziva jednostrani kriterijum znaajnosti.

Grafiki prikaz lijevostrane kritine oblasti

c)

Alternativna

hipoteza
, onda je kritina oblast desnostrana. Ovakva formulacija alternativne
hipoteze znai da kritina oblast uzima u obzir samo vrijednosti sluajne promjenljive K
desno od ko .
Za zadani nivo znaajnosti
K tako da

moe se odrediti kvantil

raspodjele sluajne veliine

.
Grafiki prikaz desnostrane kritine oblasti

Pri testiranju parametarske hipoteze

mogue je za konkretne

vrijednosti parametra
u alternativnoj hipotezi izraunati mo testa
prethodnoj slici. Ako je alternativna hipoteza sloena, onda se

za

vrijednosti

moi.

izmeu

izraunava
i

mo

testa

tako

dobija

tzv.

funkcija

kao na
razliite
Veza

predstavlja operativnu karakteristiku.

Ukoliko su

fiksirani, moe se odrediti minimalan obim uzorka koji je

neophodan za testiranje statistike hipoteze

protiv

Dalje e biti izloeni konkretni statistiki kriterijumi znaajnosti za testiranje hipoteza o parametrima normalnog zakona
raspodjele. Izloeni kriterijumi za provjeru parametarskih hipoteza mogu se smatrati priblinim, ukoliko se koriste za osnovni skup sa

raspodjelom razliitom od normalne. Odstupanje od normalnog zakona koriste priblini kriterijumi umesto tanih, treba se stroe odnositi
prema izvedenim zakljucima. Priblini kriterijumi se koriste za vei obim uzorka.

6.1.1 Testiranje hipoteze o srednjoj vrijednosti osnovnog skupa


Posmatra se osnovni skup sa normalnom raspodjelom
i nepoznatom
srednjom vrijednou . Na osnovu uzorka obima n, treba provjeriti hipotezu da je srednja
vrijednost osnovnog skupa (posmatranog obiljeja) jednaka nekoj hipotetikoj
vrijednosti

, tj.

uzorake sredine

. Drugim rijeima, treba utvrditi da li je razlika izmeu


i pretpostavljene vrijednosti

nastala kao posljedica sluajnih variranja

ili je uzorak izvuen iz osnovnog skupa sa srednjom vrijednou razliitom od

U zavisnosti od raspoloive informacije o varijansi osnovnog skupa, mogue je


formulisati dva osnovna modela i za njih odgovarajue kriterijume.
Model

1: Osnovni

skup

ima

normalnu

raspodjelu

sa

poznatom

i nepoznatom sredinom . Pretpostavlja se da je


tj.
. Za
varijansom
zadani nivo znaajnosti , na osnovu uzorka obima n, treba donijeti odluku o odbacivanju ili
neodbacivanju postavljene hipoteze.
Kao kriterijum za provjeru postavljene hipoteze Ho uzima se sluajna veliina

Uzoraka sredina
Ho tana onda

ima normalnu raspodjelu, tj.


. Dakle, ako je hipoteza

. Ako je hipoteza
tana, sluajna veliina

Z ima normiranu normalnu raspodjelu, tj.


. Oblik kritine oblasti za provjeru
postavljene hipoteze Ho zavisi od alternativne hipoteze Ha. Mogui su sljedei sluajevi:
a) Ako je alternativna hipoteza tipa
, kritina oblast je dvostrana.
Na osnovu tablica normalne raspodjele mogue je, za zadani nivo znaajnosti ,
nai
je

kvantile

normalne

raspodjele
.

tako

da

Dvostrana kritina oblast za z-kriterijum

Kritina

oblast

za

kriterijum
. Ako

je
vrijednost

van kritine oblasti, tj. ako je


hipotezi. Ako je
odbacuje.

je

uzoraka

podaci su saglasni postavljenoj

, tj.

ili

b) Ako je alternativna hipoteza tipa

, Ho se

kritina oblast za kriterijum

Z je levostrana. Za zadani nivo znaajnosti


raspodjele, odreuje se kvantil

, na osnovu tablica normalne

tako da je

Lijevostrana kritina oblast za z-kriterijum

Kritina oblast je

Hipoteza Ho se odbacuje u korist alternativne


kriterijuma

ako je uzoraka vrijednost

c) Ako je alternativna hipoteza tipa


Z je desnostrana. Za zadani nivo znaajnosti
raspodjele, odreuje se kvantil iz uslova

, kritina oblast za kriterijum


, na osnovu tablica normalne
:

Desnostrana kritina oblast za z-kriterijum

Kritina oblast je
alternativne

. Nulta hipoteza Ho se odbacuje u korist


ako je uzoraka vrijednost

Primjer 6.1 Iz osnovnog skupa sa normalnom raspodjelom

uzet

. Na nivou znaajnosti 0,05 provjeriti

je sluajan uzorak obima 25 i izraunato

hipotezu da je srednja vrijednost osnovnog skupa 2, tj.


alternativne da je manja od 2, tj.

, protiv

Za testiranje hipoteze
protiv
, koristi
se model 1.
S obzirom na vid alternativne hipoteze kritina oblast je lijevostrana. Iz
uslova

iz

se

tablica

normalne
, pa je

raspodjele

ita

Kako je:

na osnovu uzorakih vrijednosti izraunava se realizacija kriterijuma Z:

Kako je z=-0,67>-1,65 nema osnova da se odbaci hipoteza Ho.


Model 2: Osnovni skup ima normalnu raspodjelu
parametrima

sa nepoznatim

. Pretpostavlja se da je srednja vrijednost osnovnog skupa jednaka

tj.
. Postavljenu hipotezu treba provjeriti na zadanom nivou znaajnosti
osnovu uzorakih posmatranja obima n.

,
, na

Na osnovu uzorakih posmatranja nalaze se nepristrasne takaste ocjene napoznatih


parametara

Kao kriterijum znaajnosti za provjeru nulte hipoteze

Ako je hipoteza Ho tana,

uzima se statistika:

ima normalnu raspodjelu

, pa statistika T

ima Studentovu t-raspodjelu sa


oblik kritine
. Za zadani nivo znaajnosti
oblasti odreuje se u zavisnosti od tipa alternativne hipoteze. Mogui su sljedei sluajevi:
a) Ako je alternativna hipoteza
, kritina oblast je dvostrana. Za
zadani nivo znaajnosti , na osnovu tablica t raspodjele, odreuju se kvantili
Studentove

raspodjele

tako

da

je
Dvostrana kritina oblast za t-kriterijum

Kritina oblast za T je
je uzoraka vrijednost

. Ako

kriterijuma T pripada kritinoj oblasti, Ho se odbacuje. Ako je


saglasni postavljenoj hipotezi i nema osnova za njeno odbacivanje.
b) Ako je tip alternativne hipoteze
je levostrana. Za zadani nivo znaajnosti
se kvantil Studentove raspodjele

, kritina oblast kriterijuma T


, na osnovu tablica t raspodjele, odreuje
iz uslova

Kritina oblast za T je
kriterijuma T manja od
osnova za njeno odbacivanje.

, podaci su

. Ako je uzoraka vrijednost t


, tj.

, Ho se odbacuje. U protivnom nema

Lijevostrana kritina oblast za T-kriterijum

c) Ako je tip alternativne hipoteze


desnostrana. Za zadani nivo znaajnosti
kvantil

, kritina oblast je
, na osnovu tablica t raspodjele, odreuje se

Studentove raspodjele iz uslova

Kritina oblast kriterijuma T je


vrijednost
hipoteze Ho.

Za

, hipoteza Ho se odbacuje. Ako je

, nema osnova za odbacivanje

Desnostrana kritina oblast za T-kriterijum

dovoljno

hipoteze
varijanse

. Ako je uzoraka

veliki

obim

uzorka

(n>30),

za

testiranje

moe se koristiti model1, tj. kriterijum Z. Umesto poznate


uzima se uzoraka varijansa

Primjer 6.2 Da bi se odredila norma radnika pri izradi nekog proizvoda, posmatran je
rad 26 radnika. Dobijeni su uzoraka srednja produktivnost rada,
pr./as, i
2
uzoraka varijansa s =0,16. Treba provjeriti hipotezu da e pri masovnoj proizvodnji srednja
produktivnost rada biti

pr./as, pri alternativnoj hipotezi da je srednja

produktivnost manja od 5,4 pr./as. Nultu hipotezu testirati na nivou znaajnosti


Ovdje je:

S obzirom na tip alternativne hipoteze kritina oblast W je lijevostrana, pa je

Uzoraka vrijednost statistike T je:

S obzirom da je
, hipoteza da je produktivnost rada jednaka 5,4
pr./as. odbacuje se u korist alternativne hipoteze da je produktivnost rada manja od 5,4
pr./as.
Kriterijumi zasnovani na prethodno objanjenim statistikama, najbolji su, jer
obezbjeuju maksimalnu mo za zadani nivo znaajnosti i obim uzorka n. Mo kriterijuma
se izraunava za prostu alternativnu hipotezu
moi
kriterijuma
Z
koristi
se
raspodjelu
ima

normalnu

. Kod modela 1 za izraunavanje


injenica
da
ima
normalnu

kada je tana hipoteza

, pa Z

raspodjelu

kada

je

tana

hipoteza
. Za dovoljno veliko n (n>30) mo kriterijuma T ( model 2) se
izraunava kao kod modela 1.

6.1.2 Testiranje hipoteze o jednakosti srednjih


vrijednosti dva osnovna skupa
Sluaj nezavisnih uzoraka
U mnogim istraivanjima, pri obradi statistikih podataka, esto se javlja potreba
poreenja dva osnovna skupa, tj. dva obiljeja. Tako, naprimjer, esto treba porediti novu i
staru tehnologiju, uspjenost dva naina ishrane, dva naina obuke, dvije serije eksperimenata
i sl. Veina zadataka poreenja svodi se na provjeru statistike hipoteze o jednakosti
srednjih vrijednosti dva obiljeja, tj. dva osnovna skupa, sa normalnom raspodjelom.
Testiranjem ovako postavljene hipoteze provjerava se da li je razlika uzorakih sredina
posljedica sluajnih kolebanja ili uzorci potiu iz osnovnih skupova sa razliitim srednjim
vrijednostima.
U zavisnosti od raspoloive informacije o parametrima osnovnog skupa mogu se
formirati dva osnovna modela testiranja i za svaki od njih odgovarajui kriterijum
znaajnosti.
Model 1 (poznate varijanse): Posmatraju se dva obiljeja X i Y, svaki sa normalnom
raspodjelom:

Pretpostavlja

se

da

su

poznati,

a i
nepoznati parametri posmatranih osnovnih skupova. Na osnovu dva nezavisna
uzorka obima n1 i n2, izvuena iz ispitivanih skupova, treba provjeriti nultu
hipotezu

, protiv alternativne

, ili

, ili

Uzorake

sredine

imaju

normalne

raspodjele
i
. Njihove realizacije i izraunavaju se na
osnovu nezavisno izvuenih uzoraka iz posmatranih osnovnih skupova. S obzirom da su
uzorci nezavisni, nezavisne su i srednje vrijednosti
i . Sluajna veliina
, kao
razlika dvije nezavisne normalno rasporeene sluajne veliine, ima normalnu raspodjelu,
tj.

.
Kada je hipoteza

tana sluajna veliina, D ima normalnu raspodjelu sa

sredinom 0, jer je

, tj.

Kao kriterijum za testiranje postavljene hipoteze uzima se statistika

koja ima normalnu raspodjelu N(0;1) kada je tana hipoteza Ho.


Ukoliko je

tada je:
_
_

Za zadani nivo znaajnosti


alternativne hipoteze Ha:
a) Ako je

oblik kritine oblasti odreuje se u zavisnosti od

, kritina oblast je dvostrana. Za zadani nivo znaajnosti

tablica normalne raspodjele nalaze se kvantili normalne raspodjele


uslova

iz
iz

. Kritina
.

oblast je

Ako uzoraka vrijednost


pripada kritinoj oblasti, Ho se odbacuje. U protivnom, uzorak je saglasan sa postavljenom
hipotezom.
b) Ako je
znaajnosti

iz tablica

, kritina oblast je lijevostrana. Za zadani nivo


normalne raspodjele odreuje se granica kritine

oblasti

tako da je

je

. Kritina oblast

Ukoliko je uzoraka vrijednost


je

hipoteza Ho se odbacuje. Kada

, Ho se ne odbacuje.
c) Ako je
znaajnosti

, kritina oblast je desnostrana. Za zadani nivo


iz

tablica

uslova

normalne

raspodjele

. Kritina oblast je

odreuje

se

kvantil

iz

,.

Ako je uzoraka vrijednost


Ho se odbacuje, a ako je
smatra se da su uzoraki podaci saglasni sa postavljenom hipotezom.

Primjer 6.3 Za testiranje uticaja nove i stare tehnologije na prinos penice, izabrano
je po 50 gazdinstava na kojima su primijenjene stara i nova tehnologija. Na osnovu dobijenih
uzoraka utvreni su prosjeni prinosi od

t/ha i

t/ha. Ako se zna da su

varijanse u osnovnim skupovima


i
, testirati na
nivou znaajnosti 0,05 da se ove dve tehnologije ne razlikuju protiv alternativne, i da nova
tehnologija daje bolje rezulate.
Ovdje je nulta
Uzoraka informacija je:

hipoteza

alternativna

Poto je n1, n2>30, za testiranje ove hipoteze moe se moe se koristiti Z kriterijum,
bez obzira to se ne raspolae informacijom o raspodjeli osnovnog skupa, pa je

obzirom

na

tip

alternativne

hipoteze,

kritina

oblast

je

lijevostrana,

tj.
Kako
, nulta hipoteza se odbacuje u korist alternativne,
tj, moe se smatrati da je bolja nova tehnologija.
Model 2 (nepoznate varijanse): Posmatraju se dva obiljeja X i Y, sa normalnim
raspodjelama
parametrima
,
izvuena
iz

nepoznatim

,
i
. Na osnovu dva nezavisna uzorka, obima n1 i n2
posmatranih
osnovnih
skupova,
treba
provjeriti

,
nultu

hipotezu

protiv

alternativnih

neke

ili
nivou znaajnosti

od

. Testiranje se vri uz pretpostavku da je

, na zadanom

Kriterijum znaajnosti za provjeru date nulte hipoteze bazira se na statistici

koja ima Studentovu t-raspodjelu sa


5

Ho tana, tj.

stepeni slobode kada je nulta hipoteza

. Veliina

je nepristrasna ocjena za iste varijanse sluajnih veliina X i Y, tj. za


Veliine

za varijansu

su odgovarajue uzorake varijanse, a

se obino naziva zdruena ocjena

Za zadani nivo znaajnosti


hipoteze Ha:
a) Ako je
raspodjele

oblik kritine oblasti zavisi od tipa alternativne


, kritina oblast je dvostrana. Na osnovu tablica t

odreuju

se

uslova

kvantili

Studentove

t-raspodjele

. Kritina

iz
oblast

je

Ako uzoraka vrijednost


pripada kritinoj oblasti, tj. ako je
hipoteze

. U protivnom Ho se ne odbacuje.

b) Ako je
raspodjele
je
Ako je

, Ho se odbacuje u korist alternativne

, kritina oblast je lijevostrana. Na osnovu tablica t


odreuje

se
. Kritina oblast je

, Ho se odbacuje. Ako je

kvantil

tako
,

, Ho se ne odbacuje.

da

c)

Ako je

, kritina oblast je desnostrana. Na osnovu tablica t

raspodjele

odreuje

se

uslova

granica

kritine

oblasti

. Kritina

je

iz
oblast

Ako

je

je
odbacivanje.

uzoraka

vrijednost

Ho se

odbacuje.

Ako

,podaci su saglasni postavljenoj hipotezi Ho i nema osnova za njeno

U sluaju kada su n1 i n2 dovoljno veliki


, umjesto statistike T kao
kriterijum se moe koristiti Z kriterijum MODELA 1. U tom sluaju se nepoznate
varijanse

zamenjuju uzorakim varijansama

Primjer 6.4 Na jednom poljoprivrednom dobru provjerava se uticaj nove vrste


prihrane na prinos penice. Izdvojene su 24 parcele iste povrine i na 12 njih je stavljena
prihrana, a na drugih 12 nije (kontrolna grupa). Ostali uslovi su bili isti. Prosjean prinos na
prihranjenim

parcelama

varijansom

je

bio

(000)

kg/ha

sa

uzorakom

, a na neprihranjenjim parcelama prosjean prinos je

bio
(000) kg/ha sa uzorakom varijansom
. Da li je nova
vrsta prihrane znaajno uticala na porast prinosa penice? Postavljenu hipotezu testirati na
nivou znaajnosti 0,05.
Ovdje je nulta hipoteza
, protiv alternativne
. S
obzirom na tip alternativne hipoteze kritina oblast je desnostrana. Na osnovu uzorake
informacije odreuju se granica kritine oblasti ili uzoraka realizacija statistike T, koja se
koristi za provjeru postavljene hipoteze. Na osnovu uzorake informacije

granica kritine oblasti za


je

jer je zdruena varijansa

i
, a uzoraka vrijednost statistike T

st. sl.

S obzirom da je
hipoteza Ho se odbacuje. Moe se smatrati
da nova vrsta prihrane znaajno utie na porast prinosa penice.
Primjer 6.5 Za ispitivanje uticaja dva naina prihranjivanja na prinos jedne sorte
jabuke, na 50 stabala je primijenjen prvi, a na 40 stabala drugi nain prihranjivanja. Na
osnovu

podataka

uzorka

izraunate

su

sredine

kg/st.

i
kg/st, i varijanse
i
znaajnost razlike ova dva naina prihranjivanja na nivou znaajnosti 0,01.

Testirati

Nulta hipoteza je
a alternativna
.S
obzirom na tip alternativne hipoteze, kritina oblast je dvostrana. Poto je n1>30 i n2>30 za
provjeru ove hipoteze moe se koristiti statistika Z, kod koje su varijanse zamijenjene
ocjenama. Za

odreuje se kvantil

, pa je kritina

oblast

.
Na osnovu uzorake informacije

izraunava se realizacija z statistike Z

S obzirom da
znai da se hipoteza Ho o jednakosti sredina odbacuje,
moe se zakljuiti da je razlika u prinosu pod uticajem dva naina prihranjivanja statistiki
znaajna.
Kod izloenih kriterijuma greka druge vrste se kontrolie samo ako je poznata
razlika
, to najee nije sluaj. Dakle, kod ovih kriterijuma uglavnom se
kontrolie samo vjerovatnoa
realizacije greke prve vrste.
Kada bi nulta hipoteza bila
alternativnih

, protiv neke od
,

ili

ili
, postupak testiranja bi bio isti, samo bi se umesto statistike u modelu
1 koristila statistika

a umjesto statistike u modelu 2 statistika:

ima

Kada je hipoteza
normalnu
raspodjelu

sa

N(0;1),

tana, prva od prethodnih statistika


druga
Studentovu
t-raspodjelu

stepeni slobode

6.1.3 Testiranje hipoteze o proporciji u osnovnom skupu


esto se pri obradi statistike informacije sreu svojstva koja se ne mogu
kvantitativno ocijeniti. Naprimjer, sposobnost studenata, kvalitet proizvoda i sl. U takvim
sluajevima pogodno je odrediti procenat ili proporciju p elemenata osnovnog skupa koji
imaju odreeno svojstvo. Na osnovu uzorake informacije treba provjeriti hipotezu da je
proporcija u osnovnom skupu jednaka nekoj vrijednosti po, tj.

Testiranje hipoteze o proporciji osnovnog skupa p bazira se na Binomnoj raspodjeli sa


parametrom p. Postoji vie metoda za provjeru hipoteze o proporciji.
U sluaju uzorka velikog obima
proporcija
raspodjelu

koristi se injenica da je uzoraka

nepristrasna ocjena parametra p, i da ima priblino normalnu


sa

tj.

Zadovoljavajui

binomne raspodjele normalnom se postiu za

rezultati

aproksimacije

. Na osnovu dobijene uzorake informacije treba provjeriti

ili
hipotezu

hipoteza

, ili

protiv

neke
, ili

od

alternativnih
.

Kao kriterijum za provjeru nulte hipoteze koristi se statistika

koja ima normalnu raspodjelu N(0;1) kada je tana nulta hipoteza


Za zadani nivo znaajnosti
Ha.

oblik kritine oblasti zavisi od tipa alternativne hipoteze

Ako je

, kritina oblast dvostrana. Na osnovu tablice normalne

raspodjele

odreuju

se

granice

kritine

oblasti

iz

. Kritina oblast

uslova
je

.
Ako je uzoraka realizacija statistike Z

pripala

kritinoj

oblasti,

je
postavljenoj hipotezi.
Ako

tj.

ne

odbacuje.

Ako

nema osnova za odbacivanje Ho, tj. podaci su saglasni

je

uslova

kritina
,

oblast

je

lijevostrana.

Iz

na osnovu tablica normalne raspodjele, odreuje


.

se kritina vrijednost. . Kritina oblast je


Ako je uzoraka vrijednost statistike
protivnom nema osnova za odbacivanje nulte hipoteze.
Ako je
normalne

Ho se

, hipoteza Ho se odbacuje, u

, kritina oblast je desnostrana. Na osnovu tablica


za
zadani
nivo
znaajnosti , iz

raspodjele

uslova

odreuje se kritina vrijednost. Kritina oblast

je

Ako je
odbacuje.

, nema osnova za odbacivanje Ho, a ako je

, Ho se

Primjer 6.6 Proizvoa tvrdi da preparat za poveanje prirasta pilia u 5% sluajeva


izaziva neeljene pratee efekte. Ako je u uzorku od 200 pilia 12 imalo neeljene pratee
efekte, da li se moe prihvatiti tvrdnja proizvoaa na nivou znaajnosti 0,05?
Treba
alternativne

testirati

nultu

hipotezu

Na osnovu raspoloive uzorake informacije je


,
pa je uzoraka realizacija statistike Z za po=0,05

protiv

S
Za

ozbirom

na

tip

kritina

alternativne

hipoteze

kritina

vrijednost

oblast

je

desnostrana.

je

. Kako je z<1,65 nema osnova za odbacivanje nulte hipoteze,


tj.
tj. moe se prihvatiti tvrdnja proizvoaa.

Primjer 6.7 Prema pisanom standardu proporcija neispravnih proizvoda u isporuci


iznosi 4%. Koliko treba uzeti proizvoda u sluajan uzorak, ako se postavljena hipoteza testira
na nivou znaajnosti
m, a kupac postavlja uslov da je vjerovatnoa da
primi partiju sa vie od 8% karta 0,10.
Treba odrediti obim uzorka za testiranje hipoteze

protiv

alternativne ,
na nivou znaajnosti 0,05, tako da mo testa bude
0,9, tj, da vjerovatnoa greke II vrste bude 0,10. S obzirom da je kritina oblast desnostrana
bie

Uzorak treba da sadri najmanje 282 proizvoda. Ovako veliki obim uzorka posljedica
je relativno male razlike pa-po.

6.1.4 Testiranje hipoteze o jednakosti proporcija dva osnovna skupa


Posmatraju se dva osnovna skupa u kojima se pojavljuje neko odreeno svojstvo A.
Neka su p1 i p2 nepoznate vjerovatnoe pojavljivanja svojstva A u prvom i drugom skupu,
respektivno. Na osnovu dva nezavisna uzorka iz posmatranih skupova treba provjeriti da li su
proporcije pojavljivanja svojstva A u posmatranim skupovima iste, tj.

Uzorak velikog obima


Ako su izvueni nezavisni uzorci obima n1 i n2, moe se koristiti aproksimacija
binomne raspodjele normalnom. Neka se svojstvo A pojavilo u prvom uzorku m1, a u drugom

m2 puta.

Uzorake

p2 su

vrijednosti

nepristrasnih

ocjena

nepoznatih

vjerovatnoa

Kao kriterijum za provjeru nulte hipoteze

koristi se statistika

koja ima normalnu raspodjelu N(o;1). Zaista, ako je tana hipoteza za


je
razlika

dvije

p1 i

i
nezavisne

sluajne

veliine

pa
sa

normalnom

onda

raspodjelom.

kao
Dakle,

kada je Ho tano8.

statistika

S obzirom da je u prethodnom izrazu parametar p nepoznat, koristi se njegova


nepristrasna ocjena
dobijena na osnovu dva nezavisna uzorka.
Za zadani nivo znaajnosti
oblik kritine oblasti kriterijuma Z.

Ako je

, tj. uzoraka realizacija

, na osnovu tipa alternativne hipoteze Ha, odreuje se

, kritina oblast je desnostrana. Pomou tablica normalne

raspodjele, iz uslova

, odreuju se granice kritine


.

oblasti

Izraunava se uzoraka vrijednost statistike Z

i ako je

, Ho se odbacuje, a u protivnom nema osnova za njeno odbacivanje.


Ako je

, kritina oblast je lijevostrana. Granica kritine oblasti odreuje

se iz uslova

pomou tablica normalne raspodjele. Kritina oblast

je

.
Ako je uzoraka vrijednost

je

, nulta hipoteza Ho se odbacuje, a ako

, podaci su saglasni postavljenoj hipotezi i nema osnova za njeno odbacivanje.

Ako je

, kritina oblast je desnostrana. Granica kritine oblasti se, za

zadani nivo znaajnosti

, odreuje se iz uslova

pomou tablica normalne

raspodjele. Kritina oblast je

Ako je uzoraka vrijednost


za odbacivanje Ho.

, Ho se odbacuje, a ako je

, nema osnova

Primjer 6.8 Efikasnost dva preparata za zatitu ispitivana je na 500 biljaka. Od 300
biljaka tretiranih prvim preparatom oboljelo je 15, a od 200 biljaka tretiranih drugim
preparatom oboljelo je 8. Testirati da li su ova dva naina zatite jednako efikasna. Za
vjerovatnou greke I vrste uzeti 0,01.
Na osnovu uzorake informacije n1=200; n2=200; m1=15; m2 =8 izraunava
se

, pa je uzoraka vrijednost statistike Z:

obzirom

da

je

. Kako
tj.
mogu smatrati jednako efikasnim.

kritina

oblast

dvostrana

nema osnova za odbacivanje Ho, tj. preparati se

6.2 Analiza varijanse


Pri ispitivanju vie osnovnih skupova, za testiranje hipoteze o istovremenoj jednakosti
svih sredina koristi se metod analize varijanse. Naime, poreenje sredina vie osnovnih
skupova moglo bi se vriti uzajamnim poreenjem dvije po dvije sredine, ali sa porastom
broja osnovnih skupova raste i broj moguih poreenja. Zbog te injenice koristi se metod
analize varijanse, koji se bazira na poreenju varijansi osnovnih skupova.
Metod analize varijanse primjenjuje se u razliitim oblastima nauke i tehnike pri
ispitivanju uticaja vie faktora na posmatrano obiljeje. Faktori su obino spoljni uslovi koji
utiu na obiljeje, naprimjer; temperatura, atomosferske padavine, prihrana, nain ishrane itd.
Pri sprovoenju eksperimenta faktori variraju, pa se ovim metodom ispituje njihov uticaj.
Razliite vrijednosti faktora nazivaju se nivoi. Tako naprimjer, pri ispitivanju prinosa neke
poljoprivredne kulture, mogu se posmatrati faktori: prihrana, sorta, navodnjavanje i sl, gdje
su razliite vrste gnojiva, sorte, naini navodnjavanja itd, nivoi posmatranih faktora. Metod
analize varijanse omoguuje da se provjere uticaji ispitivanih faktora i njihovih meudejstava
na sredinu osnovnog skupa X, da se izdvoje najvaniji od njih i ocijeni stepen njihovog
uticaja.
U zavisnosti od broja ispitivanih faktora kriterijum znaajnosti se naziva
jednofaktorska, dvofaktorska, trofaktorska, viefaktorska analiza varijanse.

Kriterijum analize varijanse je jedan od osnovnih pojmova vane oblasti statistike


teorije planiranja eksperimenta. Nain kombinovanja nivoa faktora i poredak njihove
realizacije za dobijanje maksimalne mogue informacije iz eksperimenta, predmet su teorije
planiranja eksperimenta.
Metod analize varijanse ponekad se koristi za ispitivanje homogenosti nekoliko
skupova. Varijanse tih skupova su jednake po pretpostavci, i ako se pokae da su jednake i
srednje vrijednosti, tada su osnovni skupovi u tom smislu homogeni. Homogene skupove je
mogue objediniti u jedan, pa samim tim dobiti potpuniju informaciju i izvesti pouzdanije
zakljuke.
Bie izloeni najjednostvniji modeli jednofaktorske analize varijanse sa fiksiranim i sa
sluajnim nivoima faktora i dvofaktorski model analize varijanse sa fiksiranim nivoima
faktora u potpuno sluajnom poretku9

6.2.1 Jednofaktorska analiza varijanse sa fiksiranim nivoima faktora

Kada se ispituje uticaj svih moguih nivoa nekog faktora A na kvantitativno obiljeje
X sa normalnom raspodjelom, smatra se da svakom od k razliitih nivoa faktora A odgovara
jedan

osnovni

Parametri

skup

sa

normalnom

raspodjelom,

tj.

i=1,2,,k10.

k osnovnih skupova su nepoznati, ali se pretpostavlja da su varijanse

meusobno jednake, tj.


. Cilj ispitivanja je da se utvrdi da li postoji
znaajna razlika izmeu srednjih vrijednosti posmatranih skupova, tj. da se provjeri nulta
hipoteza
, protiv alternativne Ha da postoji bar jedan osnovni skup
sa razliitom sredinom. Ukoliko se hipoteza Ho ne odbaci, k osnovnih skupova se posmatra
kao jedan osnovni skup sa sredinom
, tj.
. Ukoliko se hipoteza
Ho odbaci, onda se nekom od metoda grupnog poreenja izdvajaju skupovi sa razliitim
sredinama, tj. izdvajaju se nivoi faktora A koji najvie utiu na obiljeja X.
Osnova za formiranje kriterijuma znaajnosti analize varijanse je mogunost
razbijanja ukupne (totalne) sume kvadrata na faktorsku sumu kvadrata i sumu kvadrata
greke, tj.

Ukupna suma kvadrata

izraava odstupanje posmatranja od opte uzorake sredine, a karakterie variranje u


objedinjenom osnovnom skupu od opte sredine
.
Faktorska suma kvadrata

izraava odstupanje uzorakih sredina od opte uzorake sredine, a karakterie variranje


sredina osnovnih skupova

, tzv. meugrupno variranje.

Suma kvadrata greke

izraava odstupanje posmatranja u uzorku od uzorake sredine, a karakterie variranje u


okviru svakog od osnovnih skupova, tkz. unutargrupno variranje.
Za izraunavanje sume kvadrata koriste se pogodnije formule izvedene iz prethodnih
formula za sume.

Statistike SSU, SSF i SSG mogu se koristiti za ocjenu odgovarajuih varijansi: ukupne,
faktorske i varijanse greke11.

Na osnovu pretpostavki prethodno izloenog modela moe se pokazati da je

Dakle, ako je tana hipoteza Ho onda su MSU, MSF i MSG nepristrasne ocjene za
nepoznati parametar

. Kao to je pokazano u prethodnim relacijima, i ove tri ocjene nisu

nezavisne, ali su dvije od njih,


bie
kritina oblast jednostrana12.

, nezavisne. Dakle, kada

, a ako Ho nije tano, onda je

je Ho tano

, to znai da je

Kao

kriterijum

znaajnosti

hipoteze

za

provjeru

koristi se statistika

koja ima F raspodjelu sa

tana hipoteza Ho,

ima

protivnom necentralnu
stepeni slobode.

stepeni slobode. Ako je


-raspodjelu sa k-1 stepeni slobode, a u

-raspodjelu.

Za zadani nivo znaajnosti

ima

-raspodjelu

sa

N-k

kritina oblast kriterijuma F se odreuje iz

uslova

, pomou tablica F-raspodjele. Kritina oblast

je
Ako
tj.

je

uzoraka

vrijednost

statistike

pripala

kritinoj

oblasti

W,

, hipoteza Ho se odbacuje i smatra se da faktor A utie na obiljeje

X. Ukoliko je

, nema osnova za odbacivanje Ho.

Uobiajeno je da se rezultati izraunavanja prikau u tz. tabeli analize varijanse:


Tabela analize varijanse

Ukoliko su uzorci istog obima, tj.


onda su formule za izraunavanje suma kvadrata neto jednostavnije:

i N=nk,

Primjer 6.9 Na relativno homogenom polju, podijeljenom na 20 jednakih parcela,


zasijane su 4 sorte penice, svaka na 5 parcela. Razmjetaj sorti po dijelovima vren je
potpuno sluajno. Rezultati posmatranja dati su u tabeli:
DIO

Na nivou znaajnosti 0,01 testirati hipotezu o jednakom prosjenom prinosu razliitih


sorti.
U ovom primjeru je n=5; k=4; N=nk=20

Za
z

tablica

;
F-raspodjele

ita

i
se

kritina

vrijednost

i
.

Kako

je
odbacuje se hipoteza o jednakom prinosu posmatranih sorti.
Razlika izmeu sorti je statistiki vrlo znaajna.
Rezultati t-testa izraunati su po formuli:

i prikazani u tabeli. S obzirom da je nivo znaajnosti


je
je

kritina vrijednost

Ako

ili , onda se sredine znaajno razlikuju.

Iz tablice uzorakih realizacija tij statistike T, vidi se da tri vrijednosti tAD, tBD i
tCD prelaze tabline. Dakle, samo se sorta D razlikuje od tri ostale sorte na nivou znaajnosti
0,01.

Primjer 6.10 Ispituje se uticaj radnog staa na produktivnost pri proizvodnji nekog
proizvoda. Rezultati posmatranja dati su u sljedeoj tabeli:

Pod pretpostavkom da je produktivnost rada normalno rasporeena, sa istom


varijansom za sva tri skupa, metodom analize varijanse provjeriti hipotezu da radni sta ne
utie na produktivnost rada. Hipotezu testirati na nivou znaajnosti 0,05 i 0,01.

Na osnovu raspoloive uzorake informacije treba izraunati realizaciju statistike F.


Bie:

k=3

pa je

Tabela analize varijanse je:

a
je
je

Za
se

,
kritina

vrijednost

iz

i
tablica

F-raspodjele,

it
pa

obzirom

da

, Ho se odbacuje na nivou znaajnosti 0,01.


Rezultati testiranja se vre na nivou znaajnosti

raspodjele ita se kritina vrijednost

. Iz tablica
.

t-

Na osnovu dobijenih rezultata moe se zakljuiti da se drugi nivo posmatranja faktora


statistiki znaajno razlikuje od ostala dva, a da izmeu prvog i treeg nivoa posmatranog
faktora ne postoji statistiki znaajna razlika.

6.2.2

kriterijum za provjeru hipoteze


o raspodjeli osnovnog skupa

Kriterijum
je jedan od starijih statistikih kriterijuma. Razradio ga je K. Pearson
poetkom ovog veka. On se primjenjuje za provjeru hipoteza o raspodjeli osnovnog skupa, a
moe se primjenjivati i za provjeru hipoteze o nezavisnosti dve sluajne veliine, tj. dva
obiljeja.
Na osnovu empirijske funkcije raspodjele treba provjeriti nultu hipotezu da osnovni
skup ima odreenu funkciju raspodjele F(x) definisanu u potpunosti ili sa tanou do njenih
parametara.
Iz osnovnog skupa sa nepoznatom funkcijom raspodjele izvlai se sluajan uzorak
obima n
. Na osnovu dobijenih uzorakih posmatranja formira se empirijska funkcija
raspodjele:
Empirijska funkcija raspodjele
Vrijednosti
obiljeja
Frekvencije

Ukoliko je posmatrano obiljeje prekidno, umjesto intervala, u prethodnoj tabeli su


odgovarajue realizacije prekidnog obiljeja x1, x2,,xk.
Korienjem raspoloive uzorake informacije treba provjeriti postavljenu hipotezu o
vidu funkcije raspodjele osnovnog skupa. Provjera hipoteze vri se na zadanom nivou .
Da bi se definisao

kriterijum za testiranje postavljene hipoteze, treba izraunati

pod pretpostavkom da je tana hipoteza Ho, tj. da


teorijske frekvencije
osnovni skup ima pretpostavljenu funkciju raspodjele Fo(x). Ukoliko funkcija raspodjele
Fo(x) ima m nepoznatih parametara, oni se ocjenjuju takastim ocjenama na osnovu
raspoloive uzorake informacije iz prethodne tabele. Za tim se prelazi na izraunavanje
teorijskih frekvencija.
Na osnovu hipotetike funkcije raspodjele Fo(x) izraunavaju se vjerovatnoe pi;
i=1,2,,k, da obiljeje X uzme odreenu vrijednost, tj.

Pomou

izraunatih

vjerovatnoa

pi odreuju

se

teorijske

(oekivane)

, za uzorak obima n

frekvencije

Ukoliko je nulta hipoteza tana oekuje se da teorijske frekvencije budu bliske


empirijskim kao u prethodnoj tabeli.
Kao kriterijum za provjeru postavljene hipoteze koristi se statistika

ili

Moe se pokazati da za
statistike

ne

zavisi

od

tipa

i tanu nultu hipotezu, zakon raspodjele uzorake


funckije

raspodjele

Fo(x)

tei

-raspodjeli

sa
stepeni slobode (k- je broj intervala; m - broj nepoznatih parametara
funkcije raspodjele ocjenjenih na osnovu uzorakih podataka).
-kriterijum moe se smatrati mjerom odstupanja empirijskih frekvencija od
oekivanih, teorijskih. Dakle, to je uzoraka vrijednost statistike blia nuli to je vjerovatnije
da je nulta hipoteza tana. Zbog toga se za testiranje nulte hipoteze koristi desnostrana
kritina oblast

kriterijuma. Za zadani nivo znaajnosti

, iz tablica

raspodjele nalazi se kritina vrijednost iz uslova


je

. Kritina oblast

.
Na

osnovu

uzorakih

podataka

izraunava

se

uzoraka

realizacija

prethodne
statistike20. Ako je
smatra se da nema osnova za odacivanje nulte
hipoteze, tj. da je hipotetika funkcija raspodjele saglasna sa uzorakim posmatranjima. Ako
je
nulta hipoteza se odbacuje, tj. smatra se da hipotetika funkcija raspodjele nije
saglasna sa uzorakim posmatranjima.
kriterijum moe se primjenjivati samo kada su oekivane frekvencije vee od 4,
tj.
; i=1,2,,k. Ukoliko su oekivane frekvencije manje od 5 preporuuje se saimanje
intervala21.
Primjer 6.11 Na osnovu rezultata 50 posmatranja treba provjeriti hipotezu da
obiljeje X ima normalnu raspodjelu. Postavljenu hipotezu treba testirati na nivou znaajnosti
0,05. Rezultati posmatranja dati su u tabeli:

Treba provjeriti hipotezu

Hipotetika funkcija raspodjele ima dva nepoznata parametra


takaste ocene su

izraunati i uzoraku realizaciju statistike

Teorijske vjerovatnoe intervala


raspodjele. Naime,

. Njihove

. Na osnovu uzorake informacije treba


.

odreuju se pomou tablica normalne

pa je
Da bi zbir vjerovatnoa bio jedan, uzima se da je donja granica prvog intervala
gornja granica posljednjeg intervala
.

,a

Tako, naprimjer, za interval (70-76) odgovarajua vjerovatnoa je:

a teorijska (oekivana) frekvencija


.
Za interval (76-82) vjerovatnoa i oekivana frekvencija su:

U sljedeoj tabeli data su neophodna izraunavanja za

Prva dva i posljednja dva intervala se saimaju da bi


bilo vee od 5. Poslije
saimanja intervala broj klasa je k=5. Broj nepoznatih parametara koje treba ocijeniti na

osnovu uzorake informacije je m=2.Broj stepeni slobode je


Uzoraka vrijednost

Iz

tablica

-statistike je:

-raspodjele

ita

se

kritina

vrijednost

za

tj.
. Kako je
nema osnova ze odbacivanje nulte hipoteze, tj.
moe se smatrati da posmatrano obiljeje ima normalnu raspodjelu.

Primjer 6.12 Pri polaganju ispita student dobija samo jedno pitanje iz jedne od tri
oblasti kursa. Analiza pitanja, koje su imali studenti, pokazala je da su 43 studenta dobili
pitanje iz prvog dijela kursa, 52 iz drugog dijela i 25 iz treeg dijela. Da li se na osnovu
dobijenih rezultata moe izvesti zakljuak da studenti sa istom vjerovatnoom dobijaju
pitanja iz sve tri grupe? Postavljenu hipotezu testirati na nivou znaajnosti 0,05.
U ovom sluaju teorijske vjerovatnoe su p1=p2 =p3=1/3. Funkcija raspodjele nema
nepoznatih parametara. Teorijske frekvencije i uzoraka vrijednost
sljedeoj tabeli

-statistike dati su u

Hipoteza Ho se odbacuje, To znai da studenti ne dobijaju pitanja iz sve tri oblasti sa


istom verovatnoom.

Primjer 6.13 Treba ispitati da li vrijeme kanjenja radnika na posao zavisi od godina
radnog staa. Podaci za 1000 radnika dati su u sljedeoj tabeli:
Vrijeme kanjenja
min.

Postavljenu hipotezu testirati na nivou znaajnosti 0,05.


Postavlja se nulta hipoteza da su radni sta (Y) i vrijeme kanjenja (X) nezavisna
obiljeja. Na osnovu uzorake informacije treba izraunati realizaciju
prethodnim primjerima.

statistike kao u

Posljednje dvije vrste se saimaju da bi oekivana frekvencija bila vea od 5, pa je


r=c=4. Oekivane frekvencije

raunaju se po formuli

Rezultati izraunavanja oekivanih frekvencija dati su u tabeli.


, pa se za

Broj stepeni slobode je


tablica

-raspodjele

Kritina oblast je

ita

kritina

vrijednost

iz
.

Na osnovu izraunatih oekivanih frekvencija pod pretpostavkom da su X i Y


nezavisni, dobija se uzoraka vrijednost:

Hipoteza Ho se odbacuje na nivou znaajnosti 0,05 jer je


, tj.
smatra se da postoji zavisnost izmeu vremena zakanjavanja na posao i duine radnog staa.
Koeficijentom kontingencije moe se izraunati zavisnost ove dve pojave. Bie

7. REGRESIJA I KORELACIJA
7.1 Pojam korelacione zavisnosti

Razliite pojave u prirodi najee su, u manjoj ili veoj mjeri, povezane meu
sobom. Tako, na primjer, prinos neke ratarske kulture zavisi od pedolokih, klimatskih,
agrotehnikih i niza drugih faktora, finansijski rezultat preduzea zavisi od mnotva
organizaciono-ekonomskih inilaca i td. Jedan od zadataka statistike jeste da ispita stepen
zavisnosti i da utvrdi konkretan tip veze koji postoji izmeu dvije ili vie pojava. Oblast
statistike koja se bavi ovim problemima naziva se korelaciona i regresiona analiza.
Posmatrajmo neke dvije promjenljive (obiljeja) X i Y. Ako su promjenljive
deterministike, izmeu njih postoji funkcionalna veza oblika Y=f(X). To znai da za svaku
vrijednost promjenljive X iz oblasti definisanosti postoji jedna i samo jedna vrijednost
promjenljive Y. Ako su, pak, X i Y dvije sluajne promjenljive, kao to smo vidjeli u
poglavlju (3), one mogu biti ili nezavisne ili zavisne, pri emu ta zavisnost nije funkcionalna
ve stohastika. To znai da promjene vrijednosti sluajne promjenljive X izazivaju promjene
zakona
raspodjele
sluajne
promjenljive
Y.
Drugim
rijeima,
svakoj
vrijednosti x promjenljive X odgovara zakon raspodjele f(y/x) sluajne promjenljive Y.
Poseban vid stohastike zavisnosti je tzv. korelaciona zavisnost. Kod korelacione
veze izmeu dviju sluajnih promjenljivih, promjene jedne sluajne promjenljive povlae
oekivane vrijednosti druge sluajne promjenljive. To znai da razliitim
vrijednostima x sluajne promjenljive X odgovaraju razliite vrijednosti M(Y/x)
matematikog oekivanja sluajne promjenljive Y.
Utvrivanje stepena kvantitativnog slaganja varijacija promjenljivih predmet je
korelacione analize. Odreivanjem funkcionalnog oblika zavisnosti izmeu jedne
promjenljive i prosjenog nivoa druge promjenljive bavi se regresiona analiza. Izabrani tip
funkcije naziva se regresiona funkcija ili jednostavnoregresija. U sluaju dvije promjenljive
koristi se jo termin prosta regresija ili parna regresija.
Ispitivanje zavisnosti izmeu veeg broja promjenljivih predmet je viestruke
korelacione i regresione analize. Jasno je da vei broj promjenljivih adekvatnije opisuje
posmatranu zavisnost, ali isto tako uslonjava analizu. Stoga je jedan od najvanijih zadataka
viestruke korelacione i regresione analize da izabere to je mogue manji broj promjenljivih
koje u velikoj mjeri determiniu ispitivanu zavisnu promjenljivu.
Ispitivanje odnosa pojava nemogue je izvesti na svim jedinicama osnovnih skupova.
Korelaciona i regresiona analiza se obino baziraju na manjem broju jedinica, tj. na uzorcima.
Zbog toga, pri donoenju zakljuaka o ispitivanom odnosu, treba posebno voditi rauna o
mogunosti uoptavanja zakljuaka na cijele osnovne skupove.
7.2 Prosta linearna regresija
Pretpostavimo da ispitujemo zavisnost neka dva obiljeja X i Y. U tu svrhu iz
osnovnog skupa (X, Y) uzet je izvjestan broj parova uzorakih vrijednosti (Xi , Yi).
Realizacije parova vrijednosti (xi, yi) mogu se grafiki predstaviti takama u pravougaonom

koordinatnom sistemu u ravni. Odgovarajui grafiki prikaz naziva se dijagram


rasturanja. Na sljedeoj slici predstavljeno je est razliitih oblika dijagrama rasturanja.

Dijagram
rasturanja

Na
osnovurasturanja ta
aka
na
dijagramima (1) i
(2) vidi se da
postoji tendencija
ka
linearnorastuoj zavisnosti
posmatranih
obiljeja.
Veza
promjenljivih je vra u sluaju prikazanom na dijagramu (2), jer su take zbijenije i blie
zamiljenoj pravoj liniji kojom se veza moe predstaviti. Dijagramom (3) prikazana je takoe
linearna, ali za razliku od prva dva sluaja, linearno-opadajua zavisnost izmeu posmatranih
vrijednosti. Veza moe biti i krivolinijska kao to se vidi sa dijagrama (4) i (5). Konano, na
dijagramu (6) se ne zapaa bilo kakva pravilnost u slaganju varijacija ove dvije promjenljive,
to ukazuje na mogunost njihove nezavisnosti.
Ovdje je ematski prikazano samo nekoliko tipskih, od velikog broja moguih oblika
korelacione zavisnosti, koje su predmet izlaganja.

7.2.1 Jednaina regresije


Neka sluajna promjenljiva (X,Y) ima dvodimenzionu normalnu raspodjelu sa
parametrima mX, mY,X2, Y2 i XY, tada je uslovni zakon raspodjele sluajne promjenljive
Y/X=x takoe normalan sa parametrima

Odavde se vidi da izmeu promjenljivih X i Y postoji linearna


korelaciona zavisnost, pri emu je prethodnim izrazom predstavljena jednaina regresije. Ovo
je linearna funkcija sa koeficijentom pravca

i slobodnim lanom

Za ilustraciju korelacione zavisnosti sluajnih promjenljivih iz osnovnog skupa sa


normalnom raspodjelom, na sljedeoj slici je dat ematski prikaz uslovnih gustina raspodjele
sluajne promjenljive Y kad sluajna promjenljiva X uzima vrijednosti xi; i= 1, 2,...,n, kao i
grafik linearne regresije

Linearni odnos sredina uslovnih


rasporeda Y za nekoliko nivoa X
Vidi se da svakoj vrijednosti x sluajne promjenljive X odgovara beskonano mnogo
vrijednosti y sluajne promjenljive Y. Poto vrijednosti sluajne promjenljive Y odstupaju od
oekivanih vrijednosti M(Y/x), izmedju njih i odgovarajuih vrijednosti sluajne
promjenljive X moe se uspostaviti relacija

Ovdje su a i b konstante, a za svaku vrijednost xi velicine Yi i , su sluajne


promjenljive. Poto sluajna promjenljiva Y, ima normalnu raspodjelu Yi,: N(a+bxi; Y/x2)
sluajne promjenljive ei , imaju normalnu raspodjelu N(0; Y/x2). Uobiajeno je da se
sluajne promjenljive ei nazivaju sluajnom grekom ili jednostavno grekom.
U praktinim zadacima ispitivanja zavisnosti izmedju obiljeja X i Y nisu poznati
parametri dvodimenzione normalne raspodjele (X,Y). Na osnovu uzorka se mogu izraunati
njihove takaste ocjene i na taj nain ocijeniti linearna veza izmedju ovih obiljeja.
Medjutim, esto nije poznat ak ni tip raspodjele dvodimenzione sluajne promjenljive
(X,Y). Dalje e biti pokazano da se i ovakvi problemi mogu uspjeno rijeiti u sluaju
linearne zavisnosti po parametrima uz, odreena, dovoljno opta, ogranienja.
Pretpostavimo da izmeu obiljeja X i Y postoji linearna zavisnost oblika

pri emu su a i b nepoznate konstante, a ei sluajne promjenljive sa nepoznatom


raspodjelom. Sluajne promjenljive ei, se nazivaju odstupanja ili greke. Za svaku fiksiranu
vrijednost Xi veliine Yi su sluajne promjenljive. Drugim rijeima, svakoj vrijednosti X,
odgovara jedan raspored vjerovatnoa sluajne promjenljive Yi. U skladu sa tim, dalje emo
smatrati da veliine Xi, nisu sluajne, ve odreene, pa e njihove vrijednosti biti oznaene
malim slovima, tj. sa xi, da bi se naglasila njihova nesluajnost.
Posmatrajmo n parova vrijednosti (xi,Yi) ; i =1,2, . . . ,n iz osnovnog skupa
(X,Y). Na osnovu prethodnog izraza je

Nepoznati parametri a i b mogu se ocijeniti metodom najmanjih kvadrata. Naime,


suma kvadrata greke za uzorake vrijednost (xi,Yi)

predstavlja funkciju dvije nezavisne promjenljive a i b koju treba minimizovati. Poto


kvadratna forma u gornjem izrazu ima minimum, uzorake ocjene i nepoznatih
parametara a i b dobijamo iz potrebnog uslova za minimum. Dobija se sistem od dvije
linearne jednaine, tzv. normalne jednaine:

ijim se rjeavanjem dobijaju uzorake ocjene

Na osnovu ovih uzorakih ocjena nepoznatih parametara a i b relacija se moe


napisati u obliku:

gde je

, uzoraka ocjena sluajne promjenljive ei ;i=l,2, ...,n, koja se naziva i-tim ostatkom.
Jednaina

predstavlja uzoraku ocjenu regresije i naziva se jednaina najbolje prilagoene linije ili
jednaina regresije.Iz posljednje dvije relacije se vidi da je

Uzorake ocjene, kao funkcije sluajnih veliina Yi, su sluajne veliine. Njihove
realizacije bie oznaene sa a, b i ei ; za
parova (xi,yi) normalne jednaine su

respektivno, tj. za konkretne vrijednosti

konkretna jednaina regresije je


i vrijednost greke je

Na sljedeoj slici prikazane su vrijednosti


x2 nezavisno-promjenljive X.

neke dve vrijednosti x1 i

Odstupanje taaka na dijagramu rasturanja


od najbolje prilagodjene prave

Vrijednosti koeficijenata a i b u jednaini regresije mogu se direktno interpretirati: a


kao ocjena prosjenog poetnog nivoa zavisno-promjenljive (jer je za xi=0 = a) i b kao
ocjena prosjene promjene zavisno-promjenljive na jedinicu promjene nezavisnopromjenljive (jer je b koeficijent pravca prave).
Pomou regresionih ostataka
naziva standardna greka regresije, tj.

; i=l,2,...,n moe se dobiti statistika koja se

Za konkretne vrijednosti (xi, yi) rjeenje sistema sa prethodne stranice bie

gdje je

. Lako se pokazuje da je:

Vrijednost standardne greke regresije je

Vrijednost standardne greke regresije predstavlja mjeru odstupanja empirijskih


podataka od jednaine regresije. to je standardna greka regresije manja, linearni regresioni
model bolje opisuje zavisnost posmatranih obiljeja.
Primjer 7.1 Na osnovu podataka o broju grla u leglu i tjelesnoj masi grla, ocijeniti
jednainu regresije i izraunati standardnu greku.
Veliina legla, x: 8
Prosjena masa
grla kg, y: 1,30

10

11

12

13 14

1,25 1,17 1,12 1,05 1,00 0,95

Na dijagramu rasturanja vidi se da izmeu posmatranih obiljeja postoji linearna zavisnost.

Potrebne sume za ocjenu koeficijenata u jednaini regresije prikazane su u radnoj


tabeli

1,30

64

1,6900

10,40

1,25

81

1,5625

11,25

10

1,17

100

1,3689

11,70

11

1,12

121

1,2544

12,32

12

1,05

144

1,1025

12,60

13

1,00

169

1,0000

13,00

14

0,95

196

0,9025

13,30

77

7,84

875

8,8808

84,57

Iz zbirnog reda tabele izraunati su potrebni pokazatelji za serije podataka zavisne i


nezavisne promjenljive i formirane su normalne jednaine:

Sistem normalnih jednaina, ijim se rjeenjem dolazi do ocjena parametara linearne


regresije, je:

Zamjenom vrijednosti b u prvu jednainu dolazi se do rjeenja za a:

Ocjena prosjenog poetnog nivoa zavisno-promjenljive je priblino l,78 kg. Prema


vrijednosti regresionog koeficijenta b zakljuuje se da se sa poveanjem veliine legla
smanjuje prosjena masa grla.Prosjeno smanjenje je oko 0,06kg. za svako grlo u leglu vie.
Na osnovu dobijenih ocjena formira se ocjena linearne regresije posmatranog odnosa

Prilagoenost regresione jednaine odnosu posmatranih pojava je vrlo velika, to se


vidi na slici.
Linija regresije je ucrtana na osnovu taaka T1(0; a=1,78) i T2(
;
).
Interpolirana linija je vrlo dobro prilagoena, jer su take originalnih podataka u njenoj
neposrednoj blizini. To znai da su stvarne vrijednosti podataka zavisno-promjenljive i njene
se ocjene malo razlikuju. Za izraunavanje standardne greke potrebno je izraunati
vrijednosti ordinata linije regresije za odgovarajue vrijednosti nezavisno-promjenljive. Te
ordinate (interpolirane, teorijske, ocjenjene) su:

Sve interpolirane ordinate linije regresije,


radne tabele

do

, upisane su u treoj koloni sljedee

8
9
10
11
12
13

1,30
1,25
1,17
1,12
1,05
1,00

1,29892
1,23928
1,17964
1,12000
1,06036
1,00072

0,00108
0,01072
-0,00964
0,00000
-0,01036
-0,00072

0,0000012
0,0001149
0,0000929
0,0000000
0,0001073
0,0000005

14

0,95

0,94108

0,00892

0,0000796

77

7,84

7,84000

0,00000

0,0003964

Na osnovu izraunatih vrijednosti u radnoj tabeli dobija se da je standardna greka


regresije:

Prosjeno odstupanje taaka na dijagramu rasturanja od linije regresije je 0,0089 kg.


Ovom mjerom je data ocjena varijacija prosjene mase grla u leglu u rasporedima legala
razliite veliine.
7.2.2 Testiranje znaajnosti regresionih koeficijenata
U prethodnom poglavlju je pokazano kako se mogu ocijeniti parametri a i b modela
Trei sabirak u ovom modelu, za svaku fiksiranu vrijednost obiljeja X, predstavlja sluajnu
promjenljivu ija raspodjela nije poznata.
Sluajne promjenljive Yi i Yj za i j takoe su nekorelirane i nezavisne.

Uzorake ocjene i (njihove realizacije su oznaene sa a i b) parametara a i b su,


kao funkcije uzorakih posmatranja, sluajne veliine.
Dakle,
varijansi 2.

je nepristrasna ocjena parametra b, sa varijansom koja je proporcionalna

Poto varijansa greke

nije poznata, ocjenjuje se pomou statistike

koja ima n-2 stepeni slobode. Broj stepeni slobode je umanjen za dva zbog dvije linearne
veze za ocjenu nepoznatih koeficijenata a i b. Zamjenom varijanse
prethodnom ocjenom
u relaciji dobljaju se uzorake ocjene varijansi sluajnih promjenljivih

Njihovi kvadratni korjeni nazivaju se standardne greke koeficijenata.

ima t-raspodjelu sa v = n-2 stepeni slobode. Ova injenica se moe iskoristiti za testiranje
hipoteze H0:b=b0 protiv jedne od alternativnih hipoteza Ha: bb0, ili Ha: b<b0, ili
Ha: b>b0.
Kada je u pitanju linearna funkcija esto je od interesa provjera hipoteze o
postojanju nagiba, odnosno, rastue ili opadajue tendencije. Zato se obino testira hipoteza
H0: b = 0, protiv alternativne Ha:b 0. Realizacija statistike T

uporeuje se sa tablinom vrijednou


, na nivou znaajnosti a. Ako je
,
hipoteza se odbacuje, to znai da postoji znaajan nagib. U protivnom hipoteza se ne
odbacuje.
Pomou prethodne statistike moe se odrediti i interval pouzdanosti za nepoznati
parametar b.Naime, sa 100 (l-a) % pouzdanosti moe se tvrditi da interval
pokriva nepoznati parametar b.

Slina procedura moe se primijeniti i za testiranje parametara a. Naime, statistika


ima t-raspodjelu sa v=n-2 stepeni slobode. Testiranje hipoteze H0: a =a0, protiv
neke od alternativnih hipoteza obino nema posebnog praktinog znaaja. Od veeg interesa
je odreivanje intervala pouzdanosti za ovaj parametar. Slino kao i gore, 100(1-a)%-ni
interval pouzdanosti je:

Vrijednosti ocjena

za (xi , yi) su

pa su konkretni intervali

Kao i ranije, u sluaju kada je n30, umesto t-raspodjele koristi se normalna


raspodjela.
Primjer 7.2 Testirati znaajnost koeficijenta b na nivou 0,01 i odrediti 95%-ne
Intervale pouzdanosti za a i b, na osnovu podataka iz primjera 7.1.
Za testiranje znaajnosti koeficijenta b, pored izraunate vrijednosti b = -0,05964,
potrebno je izraunati standardnu greku, na osnovu standardne greke regresije
i sume kvadrata odstupanja nezavisno-promjenljive od srednje vrijednosti

=0,00008

Za testiranje H0: b=b0 izraunava se realizacija T statistike pod pretpostavkom da je


H0 tano, tj.

Tabline vrijednosti za v = n-2 =7 -2 = 5 st. sl. su: t0,025; 5 = 2,57 i t0,005; 5 = 4,03. S
obzirom da je
hipoteza H0 se odbacuje u korist alternativne da je vrijednost
regresionog koeficijenta brazliita od nule. Dakle, prosjena masa grla u leglu se mijenja pri
promjeni veliine legla.
Interval pouzdanosti koji sa vjerovatnoom 0,99 pokriva nepoznati parametar b je:
-0,05964 4,032 0,00169 < b < -0,05964 + 4,032 0,00169
-0,06645 < b < -0,05283
Da bi se odredio interval pouzdanosti koji sa vjerovatnoom 0,95 pokriva nepoznati
parametar treba izraunati standardnu greku ocjene nepoznatog parametra a, tj.

;
Interval povjerenja koji sa vjerovatnoom l -a1=0,95 pokriva nepoznati parametar a je

7.2.3 Analiza varijanse


Ukupno variranje sluajne promjenljive Yi moe se ocijeniti pomou odstupanja
uzorakih vrijednosti od sredine. Oigledno se moe napisati da je

Prvi sabirak sa desne strane nastaje pri odreenom nivou nezavisno-promjenljive i


objanjava se njenim djelovanjem. Drugi sabirak je dio variranja zavisno-promjenljive koji se
pripisuje uticaju faktora koji nisu ukljueni u model.
Kvadriranjem lijeve i desne strane izraza i sumiranjem, dobijamo:

odnosno nakon sreivanja:

to znai da se suma kvadrata ukupnog variranja moe razloiti na sumu kvadrata


regresionog variranja i sumu kvadrata greke, Ako ove sume oznaimo sa SSU, SSR i SSF,
onda je
SSU = SSR + SSG
Jasno je da se komponente ukupnog variranja, regresiona i sluajna , mogu mijenjati
samo jedna na raun druge. Ako je regresiono variranje vee onda je sluajno manje, i
obrnuto.
Ako izmeu promjenljivih postoji funkcionalna veza, sve promjene u zavisnopromjenljivoj objanjavaju se nezavisno-promjenljivom pa sluajno variranje i ne postoji.
Ako pak nema uticaja nezavisno-promjenljive, dio regresionog variranja jednak je nuli, pa se
ukupni varljabilitet izjednaava sa sluajnim. Ova dva granina sluaja variranja prikazana su
na sljedeoj slici:

Sume kvadrata u prethodnoj relaciji podijeljene odgovarajuim brojevima stepeni


slobode predstavljaju ocjene varijansi. Suma kvadrata ukupnog variranja ima (n-1) stepeni
slobode, zbog jedne linearne veze i Yi; i = 1, 2, ...., n. Suma kvadrata greke, kao to je ve
reeno, ima n-2 stepeni slobode. Zaista, na osnovu relacije:

slijedi da je

Moe se pokazati da u sluaju kada je b = 0 statistika


ima F-raspodjelu sa v1=1 l v2= n-2 stepena slobode. Ova injenica se opet moe
iskoristiti za testiranje hipoteze H0:b = 0, protiv alternativne Ha:b 0. Ako je izraunata
vrijednost Fuz vea od tabline

, hipoteza H0 se odbacuje.

Uobiajeno je da se rezultati analize varijanse prikau u tabeli:


Tabela analize varijanse proste linearne regresije.
IZVORI
SUME
STEPENI SREDINE
FVARIJACIJE KVADRATA
SLOBODE KVADRATA KOLINIK
REGRESIJA
GREKA

1
SSG=SSU-SSR

FUZ=1245**

n-2

UKUPNO

n-1

Oigledno je da je je prethodna statistika identina sa ve opisanim kvadratom


statistike za b=0, tj. F=T2. Poto izmeu tablinih vrijednosti postoji ista relacija
:

oba testa daju identine rezultate.

Primjer 7.3 Za podatke iz primjera 7.1 testirati znaajnost koeficijenata b na nivou


znaajnosti 0,01, pomou analize varijanse.
Suma kvadrata ukupnog variranja je

Suma kvadrata regresionog variranja je

Suma kvadrata sluajnog variranja je:

Dalji postupak analize varijanse regresije dat je u tabeli:


IZVORI
SUME
STEPENI SREDINE
FVARIJACIJE KVADRATA
SLOBODE KVADRATA KOLINIK
REGRASIJA SSR=0,0996
1
MSR=0,0996 FUZ=1245**
GRE[KA
SSG=0,0004
7-2=5
MSG=0,00008
UKUPNO

SSU=0,1000

7-1=6

Uzoraka realizacija F-statistike FUZ=1245, vea je od tabline F0,01;1;5=16,26, to znai da se


hipoteza H0 : b=0 odbacuje.

7.2.4 Interpolacija i ekstrapolacija


Vidjeli smo da se pomou ocjenjene jednaine regresije

mogu dobiti

ocjene prosjenog nivoa zavisno-promjenljive za uzorake vrijednosti nezavisnopromjenljive xi. U praktinim zadacima esto je od interesa odreivanje prosjenog nivoa
zavisno-promjenljive za vrijednosti nezavisno-promjenljive, koje se razlikuju od uzorakih
vrijednosti.
Ako je vrijednost nezavisno-promjenljive u intervalu izmedju najmanje i najvee
uzorake vrijednosti, onda se postupak ocjenjivanja zavisno-promjenljive za takve vrijednosti
nezavisno-promjenljive naziva interpolacija, a ocjenjena vrijednost se naziva interpolirana
vrijednost.
Ako je vrijednost nezavisno-promjenljive izvan intervala izmeu najmanje i najvee
uzorake vrijednosti, onda se postupak ocjenjivanja zavisno-promjenljive za takve vrijednosti
nezavisno-promjenljive
naziva ekstrapolacija,
a
ocjenjena
vrijednost
se
naziva ekstrapolirana vrijednost.
Za testiranje znaajnosti interpoliranih i ekstrapoliranih. vrijednosti treba odrediti
zakon raspodjele sluajne promjenljive

Zamjenom nepoznate varijanse


korijen tzv.standardna greka promjenljive

ocjenom

dobija se ocjena varijanse, iji je

Statistika

Ima t-raspodjelu sa (n-2) stepeni slobode, pri emu je

Ova injenica se moe iskoristiti da se testira hipoteza o interpoliranoj ili


ekstrapoliranoj vrijednosti. Od veeg praktinog znaaja je odredjivanje intervala
pouzdanosti, sa vjerovatnoom (1-a) interval

pokriva nepoznatu uslovnu oekivanu vrijednost M(Y/X=x0).


Poto je standardna greka proporcionalna kvadratu odstupanja
, to su za
vrijednosti x0 bliske srednjoj vrijednosti intervali pouzdanosti ui. Udaljavanjem od
vrijednosti intervali pouzdanosti se ire.

Za x0=

je:

na osnovu ega slijedi:

Sve to je ovdje dosad reeno odnosi se na interpolaciju i ekstrapolaciju prosjenog


nivoa zavisno-promjenljive. Meutim, stvarne vrijednosti Yi odstupaju od prosjenih
vrijednosti
sa varijansom
.
Zamjenom nepoznate varijanse
standardna greka

ocenom

dobija se ocjena

, iji je korijen

Statistika

ima t-raspodjelu sa v = n-2 stepeni slobode.


Odavde, 100 (1-a)% - ni interval pouzdanosti za vrijednosti zavisno-promjenljive,
kad nezavisno-promjenljiva uzme novu vrijednost x0, ima oblik

U sluaju kada je n 30 umjesto kvantila


normalne raspodjele.
kvantil

t-raspodjele koristi se

Primjer 7.4 Za podatke iz primjera 7.1 odrediti 95%-tni interval pouzdanosti za


prosjenu masu grla u leglu sa 14 grla i stvarnu masu grla u leglu sa 15 grla.
Za

je

;
pa je

to znai da je sa 95% pouzdanosti prosjena masa grla u leglu izmeu 0,925 i 0,957 kg.
Za

je

;
pa je

7.3 Koeficijent korelacije

Pokazatelj
linearne
zavisnosti

, kao mjera zavisnosti sluajnih promjenljivih X i Y, u sluaju


naziva
se
koeficijentom
korelacije. I
vidi
se
da

je
odnosno
, to znai da je vrijednost koeficijenta korelacije izmedju -1 i 1.
Ako je koeficijent korelacije jednak nuli, promjenljive X i Y su nekorelirane, a ako su iz
skupa sa normalnom raspodjelom, to znai, kao to je ranije reeno, da su i nezavisne. Ako je
koeficijent korelacije po apsolutnoj vrijednosti jednak jedinici, izmeu promjenljivih X i Y
postoji funkcionalna zavisnost.
Kada raspodjela osnovnog skupa (X,Y) nije poznata, koeficijent korelacije se moe
ocijeniti na osnovu uzorka. Statistika pomou koje se moe dobiti ocjena koeficijenta
korelacije

naziva se uzoraki koeficijent korelacije. Ako se imenilac i brojilac prethodnog izraza


podijele sa n, dobija se da je

tj. uzoraki koeficijent korelacije jednak je koliniku izmedju uzorake kovarijanse i


proizvoda uzorakih standardnih devijacija.

Realizacija statistike
1, 2, ...,n jednaka je:

obino se oznaava sa rXY i za konkretan uzorak (xi, yi); i =

Vrijednost uzorakog koeficijenta korelacije odreuje jainu korelacione veze


posmatranih promjenljivih. to je ta vrijednost blia -l ili +1 zavisnost je jaa, a to je blia 0
zavisnost je slabija. Ako je vrijednost koeficijenta korelacije pozitivna, znai da su obe
promjenljive istog smjera, tj. obe istovremeno rastu ili opadaju. Ako je ta vrijednost
negativna, rast jedne promjenljive praen je opadanjem druge promjenljive.
Za interpretaciju vrijednosti koeficijenta korelacije konvencionalno se koristi
sljedea podjela:
- slaba zavisnost

- srednja zavisnost
- jaka zavisnost
- vrlo jaka zavisnost
Ovakvu interpretaciju treba uzeti uslovno, jer se o vrijednosti koeficijenta korelacije
moe pouzdano govoriti tek poslije testiranja znaajnosti, o emu e kasnije biti rijei.
Primjer 7.5 Za podatke iz primjera 7.1 izraunati vrijednost koeficijenta korelacije.
Na osnovu podataka o veliini legla (xi) i prosjenoj masi grla u leglu (yi), izraunat je
koeficijent korelacije premaprethodnom obrascu. Ovdje je:

Zavisnost veliine legla i mase grla pri roenju vrlo je jaka i negativna. Trebalo bi,
meutim, naglasiti da na osnovu koeficijenta korelacije nije utvreno ta je uzrok a ta
posljedica. Moe se rei da su u veim leglima grla manje mase, ali zakljuak moe biti i da u
leglima sa jedinkama vee mase ima manje grla.
Vidjeli smo da se na osnovu pokazatelja regresione i korelacione analize zavisnost
dva obiljeja sagledava na dva naina. S obzirom da je rije o jednoj istoj korelacionoj
zavisnosti, logino je oekivati da izmeu statistika pomou kojih se ocjenjuju ovi pokazatelji
postoje sljedee veze:

Vrijednost
naziva se koeficijent determinacije i oznaava se sa
. Ovaj
pokazatelj predstavlja proporcionalni dio ukupnog varijabiliteta zavisno-promjenljive,
objanjen uticajem nezavisno-promjenljive. Njegova dopuna do jedinice naziva se koeficijent
nedeterminacije i predstavlja proporcionalni dio ukupnog variranja zavisno-promjenljive koji
nije objanjen uticajem nezavisno-promjenljive, odnosno:

Dakle, ukupni varijabilitet se moe razloiti na komponenente u kojima figuriu


vrijednosti koeficijenata determinacije i nedeterminacije:
,
to se moe iskoristiti za analizu varijanse i testiranje znaajnosti regresionog koeficijenta.
Pomou koeficijenta korelacije moe se izraziti i standardna greka regresije:

To omoguava izraunavanje vrijednosti standardne greke bez korienja ocjenjenih


vrijednosti regresije.

7.3.1 Testiranje znaajnosti koeficijenta korelacije


Pretpostavimo da je sluajna promjenljiva (X,Y) iz osnovnog skupa sa normalnom
raspodjelom.Ako koeficijent korelacije
nije poznat, vidjeli smo da se moe ocijeniti
pomou statistike. esto je od interesa da se testira hipoteza da je koeficijent korelacije u
osnovnom skupu jednak nekoj vrijednosti. Postoji vie razliitih testova za razliite nulte
hipoteze.

Nulta hipoteza H0:


statistike

Ako

je

izraunata

0, moe se testirati pomou

=0, protiv alternativne Ha;

vrijednost

prethodne

T-statistike

vea

od

tabline

vrijednosti
hipoteza se odbacuje na nivou znaajnosti a. U protivnom, nema osnova za
odbacivanje nulte hipoteze.
Primjer 7.6 Na osnovu podataka iz primjera 7.1 i 7.5 :
a)

testirati znaajnost koeficijenta korelacije na nivou znaajnosti 0,01;

Na osnovu izraunatog koeficijenta korelacije


statistike

=0,998 izraunava se realizacija

Uzoraka vrijednost t=35,28 je vea od tabline t0,005;5=5,03, sto znai da se hipoteza


H0odbacuje, tj. koeficijent korelacije je znaajno razliit od nule.
7.4 Viestruka regresija i korelacija
U prethodnom poglavlju je pokazano da se kod korelacione zavisnosti dvije
promjenljive samo dio varijabiliteta zavisno-promjenljive objanjava uticajem nezavisnopromjenljive. Ostali dio varijabiliteta objanjava se uticajem svih ostalih faktora koji nisu
ukljueni u model. Drugim rijeima, umjesto prostog modela Y=f(x,e) opravdano je
posmatrati tzv. viestruki regresioni model Y=f(x1, x2,.....,xk,e).

Mnogi sluajevi korelacione zavisnosti u biologiji, biotehnici i agroekonomiji mogu


se modelirati viestrukim regresionim modelima. Tako, naprimjer, prinos nekog usjeva se
objanjava uticajem mnogih faktora, kao to su prihrana, temperatura, vlaga, sorta itd. Za
tranju nekog prehrambenog proizvoda pored njegove cijene, od presudnog su znaaja i
kvalitet, cijene drugih prehrambenih proizvoda, dohodak potroaa, navike u ishrani i slino.
Ukljuivanjem novih nezavisnih promjenljivih u regresioni model, uslonjava se
analiza. S obzirom na dananje stanje raunarske tehnike to ne predstavlja preveliki problem.
Mnogo vei problem je da se iz mnotva svih moguih objanjavajuih promjenljivih izabere
nekoliko onih, koje zajedno, u velikoj mjeri, determiniu ispitivano obiljeje. Sa stanovita
interpretacije rezultata i donoenja pravilnih zakljuaka od interesa je da broj ovih
promjenljivih bude to je mogue manji.
Ovdje emo se ograniiti na posmatranje linearne regresije i korelacije sa dvije
nezavisno-promjenljive. Analiza modela sa veim brojem nezavisno-promjenljivih vri se na
principijelno isti nain, s tim to zahteva korienje sloenijeg aparata linearne algebre.
7.4.1 Linearna regresija sa dvije nezavisno-promjenljive
Pretpostavimo da u osnovnom skupu (Xl,X2,Y) vai relacija
; i = 1, 2, ....
pri emu su a, b1 i b2, nepoznate konstante, X1i i X2i nesluajne nezavisne promjenljive (dalje
se koristi oznaka x1i i x2i da bi se istakla nesluajnost ovih promjenljivih u modelu, a
Yi i ei sluajne promjenljive. Za uzorak od n trojki (x1i, x2i, Yi) , i=1,2,,..,n iz osnovnog skupa
je
; i = 1, 2,....
Uzorake ocjene nepoznatih parametara mogu se dobiti metodom najmanjih
kvadrata. Suma kvadrata odstupanja je funkcija tri nezavisno-promjenljive a, b1 i b2:

Neka su

vrijednosti za koje su traeni parcijalni izvodi.

Traenje parcijalnih izvoda navedenih nezavisno-promjenljivih vrijednosti i njihovim


izjednaavanjem s nulom, izraz se transformie u sljedei sistem normalnih jednaina:

ijim se rjeavanjem dobijaju uzorake ocene

nepoznatih parametara

Na osnovu ovih ocjena relacija se moe napisati u obliku


; i = 1, 2,....

gdje je
i = 1,2, ....., n.

uzoraka ocjena sluajne promjenljive ei ;

Jednaina
; i = 1, 2,....
predstavlja uzoraku ocjenu jednaine regresije. Iz posljednje dvije relacije je
; i=1,2,.....,n
Relacija predstavlja jednainu ravni u prostoru. Prethodno su prikazane realizacije
i ei za neke parove vrijednosti (x1i,x2i).
Vidjeli smo da se, kao rezultat primjene metoda najmanjih kvadrata na prethodni
model problema, ocjenjivanje koeficijenata svodi na rjeavanje sistema od tri linearne
jednaine sa tri nepoznate veliine. Procedura ocjenjivanja se u izvjesnom smislu
pojednostavljuje ako se koriste uzorake vrijednosti u odstupanjima od sredine.
D - determinanta sistema je:

Kao mjera odstupanja uzorakih podataka od jednaine regresije koristi se statistika

koja se naziva standardna greka regresije. Njen kvadrat predstavlja uzoraku ocjenu
varijanse sluajnih odstupanja ei. Ova ocjena ima n-3 stepena slobode, zbog tri linearne veze
pri ocjeni nepoznatih parametara modela.
Primjer 7.7 Na osnovu podataka o prinosu penice, utroku prihrane i zasijanoj
povrini u 10 radnih organizacija, koji su prikazani u tabeli, ocijeniti jednainu regresije i
izraunati standardnu greku regresije:
Prosjean prinos Utroak prihrane,
Zasijana
Poljoprivredne
penice, t/ha
t/ha
povr. (00)ha
organizacije
yj
X1i
X2i
A
4,5
0,7
9
B
5,1
1,0
10
C
5,8
1,0
14
D
5,2
0,9
12
E
6,1
1,2
9
F
4,8
0,7
12
G
4,3
0,6
10
H
5,5
1,0
13
I
5,0
0,8
11
J
5,7
1,1
10
U trodimenzionalnom rasporedu ovih deset jedinica, prinos penice se uzima kao
zavisno-promjenljiva (Y), a utroak mineralnog gnojiva i veliine povrine pod penicom su
nezavisno-promjenljive(x1, x2).
Za formiranje prethodnog sistema jednaina potrebni su kvadrati i proizvodi
promjenljivih, prikazani u radnoj tabeli:
Red.
broj
1
2
3
4
5
6
7
8
9
10

x1

4,5
5,1
5,8
5,2
6,1
4,8
4,3
5,5
5,0
5,7
52,0

0,7
1,0
1,0
0,9
1,2
0,7
0,6
1,0
0,8
1,1
9,0

x2

y2

9
20,25
10 26,01
14 33,64
12 27,04
9
37,21
12 23,04
10 18,49
13 30,25
11 25,00
10 32,49
110 273,42

x1y
0,49
1,00
1,00
0,81
1,44
0,49
0,36
1,00
0,64
1,21
8,44

x1y

81
3,15 40,5
100 5,10 51,0
196 5,80 81,2
144 4,68 62,4
81
7,32 54,9
144 3,36 57,6
100 2,58 43,0
169 5,50 71,5
121 4,00 55,0
100 6,27 57,0
1236 47,76 574,1

x1x2
6,3
10,0
14,0
10,8
10,8
8,4
6,0
13,0
8,8
11,0
99,1

Aritmetike sredine, varijanse i standardne devijacije uzorakih vrijednosti su:


y=5,2 ;
=0,9 ;

=0,33556 ;

=0,57927

=0,3778 ;

=0,19436

=11 ;

=2,88889 ;

=1,69967

Sistem tri normalne jednaine je:


10 a + 9 b1 + 110 b2 = 52
9a + 8,44 b1 + 99,1 b2 = 47,76
110 a + 99,1 b1 + 1236 b2 = 574,1
Determinante sistema i nepoznatih su:
= 88,3 ;

= 168,4 ; = 247,5 ;

= 6,18

Odatle su vrijednosti koeficijenata ( b1 i b2 su ujedno i parcijalni koeficijent) jednake:

Ocjenjena regresiona jednaina je

Poevi od prosjenog poetnog nivoa l,91 t/ha, prinos se poveava pri promjeni
nivoa posmatranih inilaca. Prosjeno poveanje prinosa po hektaru je 2,8 t za tonu prihrane,
uz konstantan obim povrina. Prinos se, meutim, vrlo malo mijenja pri promjeni obima
povrina. Prosjena promjena je samo 0,07 t za poveani obim povrine od 100 ha, pri emu
je iskljueno djelovanje prihrane.
Do iste ocjene koeficijenata dolazi se i na osnovu vrijednosti promjenljivih, datih u
odstupanjima od aritmetike sredine.
Za formiranje sistema normalnih jednaina potrebno je izraunati sljedee sume
kvadrata i sume proizvoda promjenljivih:

Zamjenom se dobija:

Determinante sistema i determinante nepoznatih su:


;

;
; ij. Iz ove dvije pretpostavke slijedi da su ei i ej za ij i nezavisne.

nekorelirane, tj.

Ako se standardne devijacije zamijene ocjenom S e dobijaju se standardne greke


regresionih koeficijenata:

Statistika

; j=1,2
ima t-raspodjelu sa v = n - 3 stepeni slobode. Ova injenica se moe iskoristiti za testiranje
hipoteze H0:
Ha:

<

ili Ha:

,, j=l,2. esto je od interesa da se ispita znaajnost koeficijenata

testira hipoteza H0:


za

, protiv jedne od alternativnih hipoteza: Ha;


=0, protiv alternativne Ha:

>

, Ili

, tj. da se

0; j=l,2. Realizacija prethodne statistike

=0

uporeuje se sa tablinom vrijednou


. Ako je
hipoteza H0 se odbacuje na
nivou znaajnosti a, a u protivnom nema osnova za njeno odbacivanje.
Pomou prethodne statistike moe se dobiti 100(1-a)% interval pouzdanosti za
nepoznati koeficijent bj ; j=1,2, tj.:

Primjer 7.8 Testirati znaajnost regresionih koeficijenata b1 i b2, na osnovu


ocjenjenih vrijednostib1, i b2 iz primjera 7.7, na nivou znaajnosti 0,05 i 0,01. Odrediti 95%
interval povjerenja za nepoznate parametre b1 i b2.

Ovdje je

Treba testirati hipotezu H0:


j=l. S obzirom da je:

, na osnovu uzorake realizacije statistike za

i da je
i
, tj.
hipoteza H0 se odbacuje na oba zadana nivoa
znaajnosti. Odbacivanjem hipoteze H0 potvruje se uticaj promjenljive X1 (mineralnih
gnojiva) na prinos penice, pri konstantnom uticaju promjenljive X2 (obima zasijane
povrine).
Drugi individualni test odnosi se na testiranje nulte hipoteze H0:
obzirom da je

i da je

.S

, nema osnova za odbacivanje nulte hipoteze.


Interval pouzdanosti koji sa vjerovatnoom 0,95 pokriva nepoznati parametar

e interval pouzdanosti koji sa vjerovatnoom 0,95 pokriva nepoznati parametar

je

je:

7.4.1.1 Analiza varijanse

Slino kao to je pokazano kod proste linearne regresije, i ovdje se moe pokazati da
se ukupna suma kvadrata variranja moe razloiti na sumu kvadrata regresionog variranja i
sumu kvadrata greke:

odnosno
SSU = SSR + SSG
Suma kvadrata ukupnog variranja ima (n-l) stepeni slobode zbog jedne linearne
relacije izmedju iYi; i=l,2,...,n. Kao to smo rekli, suma kvadrata greke ima n-3 stepeni
slobode. Prema tome, suma kvadrata regresionog variranja ima 2 stepena slobode.

Moe se pokazati da u sluaju kada je b1=b2=0 statistika

ima F-raspodjelu sa v1=2 i v2=n-3 stepeni slobode. Ova injenica se moe iskoristiti za
testiranje hipoteze H0: b1=b2=0, protiv alternativne Ha: (b10)v(b20) . Ako je izraunata
vrijednost FUZ F-statistike vea od tabline na zadanom nivou znaajnosti a, tj Fuz>Fa/2;n-3,
nulta hipoteza se odbacuje. U protivnom nema osnova za odbacivanje nulte hipoteze.
Rezultati analize varijanse obino se predstavljaju u tabeli analize varijanse:
Tabela analize varijanse za linearnu regresiju dvije
nezavisno-promjenljive
IZVORI
SUME
VARIJANSE KVADRATA
REGRESIJA
(X1,X2)

STEPENI
SREDINE
FSLOBODE KVADRATA KOLINIK
2

GREKA

n-3

UKUPNO

n-1

7.4.1.2 Interpolacija i ekstrapolacija

Slino kao i kod proste regresije, i ovdje je mogue testirati hipoteze i formirati
intervale pouzdanosti za interpolirane i ekstrapolirane vrijednosti, pod pretpostavkom da je
osnovni skup (x1, x2,Y) normalno rasporeen.
Statistika

ima t-raspodjelu sa (n-3) stepeni slobode, pri emu je sa


X2=x20).

oznaeno M(Y/X1=x10,

Na osnovu prethodne statistike moe se testirati hipoteza o prosjenoj interpoliranoj


ili ekstrapoliranoj vrijednosti zavisno-promjenljive Y. Meutim, od veeg praktinog znaaja
je utvrivanje intervala pouzdanosti.
Interval

sa vjerovatnoom (1-a) pokriva nepoznati parametar


Za

je

, odnosno

Zamjenom varijanse s2 uzorakom ocjenom

dobija se kvadrat standardne greke:

Statistika

ima t-raspodjelu sa (n-3) stepeni slobode.


Odavde je 100(1-a)%-ni interval pouzdanosti za stvarnu vrijednost zavisnopromjenljive:
.
U sluaju kada je n 30 umesto t-raspodjele koristi se normalna raspodjela.

Primjer 7.9 Za podatke iz primjera 7.7 odrediti 95%-tni interval pouzdanosti za


prosjenu i stvarnu vrijednost zavisno-promjenljive za x10=0,6 i x20=10.
Interval povjerenja za prosjenu vrijednost zavisno-promjenljive rauna se na osnovu:

Dakle, za odreivanje 95%-tnog intervala pouzdanosti treba izraunati za za x10=0,6 i


x20=10 na osnovu ocjenjene jednaine regresije iz primjera 7.7, pa je:
Za a=0,05 i n=n-3=10-3=7 stepeni slobode kvantil t-raspodjele je t0,025;7=2,36.
Standardna greka regresione vrijednosti

za x10=0,6 i x20=10 prema je:

Granice intervala pouzdanosti su:

Prosjean prinos penice po hektaru, pri utroku 0,6 t prihrane i l000ha povrine,
procjenjuje se na izmeu 4 i 4,5t sa pouzdanou 95%.
Individualni prinos penice po hektaru za iste vrijednosti nezavisno-promjenljivih
izraunava se na osnovu:

Standardna greka ove ocjene je:

pa je:

Dakle, individualni prinos penice je pokriven intervalom (3,84t/ha; 4,47t/ha) sa


95% pouzdanosti.

7.4.2 Viestruka korelacija


U modelu sa dvije promjenljive jaina korelacione zavisnosti, kao to je pokazano,
mjeri se koeficijentom proste korelacije. Kada se u model ukljui jo jedna promjenljiva onda
se i broj pokazatelja korelacione zavisnosti poveava.
Tako se pomou koeficijenta proste korelacije moe mjeriti jaina korelacione
zavisnosti izmeu svake dvije od tri posmatrane promjenljive. Moe se mjeriti i jaina
zajednikog uticaja dvije promjenljive na treu. Odgovarajui pokazatelj se naziva koeficijent
viestruke korelacije. Takoe se moe mjeriti jaina korelacione zavisnosti izmeu dvije
promjenljive pri iskljuenom uticaju tree promjenljive. U ovom sluaju odgovarajui
pokazatelji se nazivaju djelimini (parcijalni) koeficijenti korelacije. Za potpuno sagledavanje stepena korelacione zavisnosti treba izraunati sva tri tipa pokazatelja.
Proporcionalni udio ukupnog varijabiliteta zavisno-promjenljive Y objanjen je
uticajem nezavisno promjenljivih X1 i X2, a izraava se kao kolinik suma kvadrata
regresionog i ukupnog variranja, tj.

Ovaj pokazatelj predstavlja mjeru jaine zajednikog djelovanja promjenljivih X1 i


X2 na promjenljivu Y, i naziva se uzoraki koeficijent viestruke determinacije. Kvadratni
korijen ovog pokazatelja predstavlja uzoraki koeficijent viestruke korelacije:

Iz relacije (7.120) vidi se da je apsolutna vrijednost koeficijenta viestruke korelacije


izmeu 0 i 1. Vrijednost ovog pokazatelja moe se interpretirati slino kao i vrijednost
prostog koeficijenta korelacije.
Uzoraki koeficijent viestruke korelacije moe se izraziti pomou uzorakih
koeficijenata djelimine korelacije. Korienjem ve pomenutog izraza za SSR i uzorakih
ocjena koeficijenta regresije moe se pokazati da je:

Odavde se vidi da u sluaju funkcionalne linearne zavisnosti izmeu promjenljivih


X1 i X2 vrijednost koeficijenta viestruke korelacije nije definisana.

Primjer 7.10 Na osnovu podataka iz primjera 7.7 ocijeniti viestruki koeficijent


korelacije.
U posmatranom odnosu prinosa penice (Y) , primjene prihrane (X1) i zasijane
povrine (X2) koeficijenti proste korelacije su:
r01=0,94739; r02=0,23699; r12=0,03363
U navedenom primjeru, sume kvadrata objanjenog i ukupnog variranja ve su
izraunate i date u tabeli analize varijanse:
Na osnovu veliine korelacionog koeficijenta, zakljuuje se da je ukupni uticaj
nezavisno-promjenljivih na zavisno-promjenljivu vrlo veliki. Determinacija prinosa penice
utrokom mineralnih gnojiva i obimom povrine je:

Koeficijent viestruke korelacije se moe raunati i na osnovu koeficijenata proste


korelacije r01, r02 i r12, korienjem prethodno obraene relacije

Dobijena razlika nastala je zbog greke zaokruivanja brojeva.

Znaajnost koeficijenata viestruke korelacije moe se testirati pomou statistike

koja u sluaju kada je r012=0 ima F-raspodjelu sa n1=2 i n2=n-3 stepeni slobode. Za
testiranje hipoteze H0: r012=0 protiv alternativne Ha: r0120 izraunata F-vrijednost se
uporedjuje sa tablinom vrijednou
. Ako je F>
nulta hipoteza se odbacuje na
nivou znaajnosti a, u korist alternativne hipoteze. U protivnom, nulta hipoteza se ne
odbacuje. Ovaj test je identian testu hipoteze H0: b1=b2=0 kod viestruke regresije.

Primjer 7.11 Testirati znaajnost koeficijenata korelacije koji su ocjenjeni u primjeru


7.10.
Za koeficijent viestruke korelacije uzoraka vrijednost F statistike, na osnovu
prethodne statistike je:

Tabline vrijednosti za a=0,05 i a=0,01 i za n1=2 i n2=n-3=10-3=7 su F0,05;2;7=4,74 i


F0,01;2;7=9,55, to znai da se odbacuje nulta hipoteza H0:r012=0 da ni jedna objanjavajua
promjenljiva (Xl,X2) nema uticaja na zavisno-promjenljivu (Y). Isti rezultati su dobijeni pri
analizi varijanse regresije.
Prema prethodno izvedenim t-testovima, jasno je, meutim, da znaajne promjene
zavisno-promjenljive potiu samo od jedne nezavisno-promjenljive.
7.5 Krivolinijska regresija i korelacija
U prethodnim poglavljima razmatrali smo modele linearne korelacione zavisnosti.
Posmatrane jednaine regresije bile su linearne po promjenljivima, ali, takoe, i po
nepoznatim parametrima. Linearnost po nepoznatim parametrima, kao to je pokazano,
omoguuje da se oni ocijene metodom najmanjih kvadrata. Linearnost po promjenljivima
omoguuje da se, polazei od pretpostavki vezanih za raspodjelu greke, izvedu zakoni
raspodjele uzorakih statistika, koji su potrebni za testiranje hipoteza i debljanje intervala
pouzdanosti. Moe se pokazati da ako se pretpostavka o normalnoj raspodjeli greke izostavi,
pri dovoljno optim uslovima, dobijeni zakoni raspodjele uzorakih statistika vae u
asimptotskom sluaju,
tj. za dovoljno veliki
obim uzorka.
Prilikom
ispitivanja korelacione
zavisnosti izmedju dva
obiljeja esto se deava
da dijagram rasturanja
sugerie
razliite
krivolinijske
oblike
zavisnosti. Neki od tih
oblika ematski su prikazani na prethodnoj
slici.
Na
osnovu
ovakvih rasporeda taaka jasno je da pravolinijski regresioni model nije adekvatan. Primjena
tog modela bila bi pogrena, a dobijene ocjene liene bilo kakvog smisla. Jasno je da bi, za
odgovarajue podatke, trebalo ocijeniti neki od krivolinijskih modela.
Ako je krivolinijski model linearan po nepoznatim parametrima i sa aditivnom
sluajnom komponentom, moe se analizirati pomou procedure koja je izloena u
prethodnim poglavljima. Neki modeli koji ne ispunjavaju ovaj uslov, transformacijama
promjenljivih takoe se mogu dovesti u oblik linearan po nepoznatim parametrima, i
analizirati slinom metodologijom.

7.5.1 Prosta kvadratna regresija i korelacija


Kvadratni model
; i=1,2,....
jednostavnom smjenom
; i=1,2,...
moe se dovesti na oblik:
; i=1,2,....
Normalne jednaine, za ocjenu nepoznatih parametara a, b i g pomou uzorakih
posmatranja (Xi;Yi) postaju:

Ocjene i testovi kod ovog modela isti su kao i kod viestruke linearne regresije i
korelacije, s tim to je uobiajeno da se umjesto koeficijenta viestruke korelacije r012, ija
se uzoraka ocjena oznaavala sa
, a vrijednost uzorake ocjene sa r012, ovdje koristi
termin indeks korelacije , ija je uzoraka ocjena I, a vrijednost uzorake ocjene i. Vrijednosti
uzorakih ocjena a, b i g obino se oznaavaju sa a, b i c, respektivno.
Primjer 7.12 Podaci o koliini jednog aditiva koji se koristi u ishrani pilia i
dnevnom prirastu mase dati su u tabeli.
Izvriti regresionu i korelacionu analizu zavisnosti ova dva obiljeja. Testiranja
izvriti na nivou znaajnosti a=0,05.
Odrediti 95%-tne intervale povjerenja za prosjenu i individualnu vrijednost prirasta
pri upotrebi 7gr aditiva po kg hrane.

Grafiki prikaz odnosa nezavisno-promjenljive (koliine preparata) i zavisnopromjenljive (dnevnog prirasta) dat je na slici (a). Prema dijagramu rasturanja na slici (a)
oigledna je krivolinijska tendencija promjena prirasta pri poveanju koliine preparata.
Koliina preparata
gr/kg hrane
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0

Dnevni
prirast kg
0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76

Za formiranje normalnih jednaina koriste se podaci radne tabele:


0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0

0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76

0,25
1,00
2,25
4,00
6,25
9,00
12,25
16,00
20,25
25,00
30,25
36,00

0,125
1,000
3,375
8,000
15,625
27,000
42,875
64,000
91,125
125,000
166,375
216,000

0,0625
1,0000
5,0625
16,0000
39,0625
81,0000
150,0625
256,0000
410,0625
625,0000
915,0625
1296,0000

0,270
0,600
0,945
1,300
1,800
2,070
2,555
3,080
3,375
3,950
4,235
4,560

39,0 8,40 162,50 760,000 3794,3750 28,740

0,1350
0,6000
1,4175
2,6000
4,5000
6,2100
8,9425
12,3200
15,1875
19,7500
23,2926
27,3600

0,2916
0,3600
0,3969
0,4225
0,5184
0,4761
0,5329
0,5929
0,5625
0,6241
0,5929
0,5776

122,3150 5,9484

Na osnovu dobijenih suma sistem normalnih jednaina postaje:

12,0 a + 39,0 b + 162,500 c = 8,400


39,0 a + 162,5 b + 760,500 c = 28,740
162,5 a + 760,5 b + 3794,375 c = 122,315
Determinante sistema i nepoznatih parametara a, b i c su:
D=35785,755; Da=17779,012; Db=3658,2975; Dc=-341,055
Ocjene parametara kvadratne regresije su:
;

Ocjena jednaine regresije na osnovu uzorake informacije je:

Koliko je ocjenjena kvadratna funkcija prilagoena stvarnom odnosu pojava moe se


vidjeti na slici (b). Ocjenjena linija ucrtana je na osnovu izraunatih vrijednosti za
uzorake vrijednosti nezavisno-promjenljive:

Stvarne i ocjenjene vrijednosti zavisno-promjenljive, njihove razlike i kvadrati razlika


prikazani su u tabeli.
Ocjena standardne greke regresije je:

Za analizu varijanse kvadratne regresije sume kvadrata se raunaju na uobiajeni


nain:

SSG=SST SSR = 0,0684 0,0656 = 0,0028

0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
8,0

0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76

0,54554
0,58952
0,62872
0,66315
0,69282
0,71773
0,73787
0,75324
0,76385
0,76970
0,77077
0,76709

-0,00554
0,01048
0,00128
-0,01315
0,02718
-0,02773
-0,00787
0,01676
-0,01385
0,02030
-0,00077
-0,00709

0,0000307
0,0001098
0,0000016
0,0001729
0,0007388
0,0007690
0,0000619
0,0002809
0,0001918
0,0004121
0,0000006
0,0000503

8,40

8,40000

0,00000

0,0028204

U regresionom variranju ocjenjenom prema modelu kvadratne funkcije postoje dvije


komponente: linearna i kvadratna, tj. SSR se moe napisati kao:
SSR = SSRL + SSRK
Ako se izrauna ocjena koeficijenta linearne regresije

Dobija se suma kvadrata linearne komponente, tj.

pa je

SSRK = SSR SSRL = 0,0656-0,0580 = 0,0076


Analiza dobijenih rezultata prikazana je u tabeli analize varijanse.
Na osnovu tablinih vrijednosti F-raspodjele, F0,05;2;9=4,26 i F0,01;2;9=8,02 i izraunate
realizacije Fuz, hipoteza Ho : b=g=0 se odbacuje.
IZVORI

SUME KVADRATA

VAR I J A N S E
REGRESIJA (X,X2)
LINEARNA (X)
2

KVADRATNA (X )

SREDINE
KVADRATA

FKOLINIK
FUZ=105,8**

FK =24,52**

SSR=
SSRL=0,0580
SSRK=0,0076

0,0656 2
1

MSR=0,0328
MSRL=0,0580
MSRK=0,0076

SSG= 0,0028

MSG=0,0003

GRE[KA
UKUPNO

ST. SL.

FL =187,1**

9
SSu = 0,0684

11

Proste hipoteze Ho : b=0 i Ho : g=0 testiraju se t-testom. Za provjeru Ho : b=0


vrijednost T-statistike je

jer je:

Vrijednost T statistike za provjeru nulte hipoteze Ho : g=0 je

jer je:

Iz tablica t-raspodjele ita se kritina vrijednost ta/2;n-3 za a=0,05 i a=0,01


(t0,025;9=2,26; t0,005;9=3,25) i dobija se da je t > ta/2;n-3 , to znai da se nulte hipoteze
odbacuju na oba nivoa znaajnosti. Dakle, jednaina regresije mora da sadri i linearni i
kvadratni lan.
Vrijednost koeficijenta determinacije krivolinijske regresije je:
(95,91%)

Indeks krivolinijske korelacije je:

Na osnovu vrijednosti koeficijenta determinacije zakljuuje se da dodavanje preparata


u ishrani objanjava variranje prirasta sa 96%. Moe se zakljuiti da je stepen slaganja
posmatranih pojava sa izabranim tipom regresione funkcije vrlo visok.
Za provjeru nulte hipoteze Ho : i=0 treba izraunati realizaciju F-statistike

S obzirom da su kritine vrijednosti, F0,05;2;9=4,26 i F0,01;2;9=8,02 manje od izraunate,


postavljena hipoteza Ho se odbacuje.
Za ocjenu intervala povjerenja prosjene i individualne vrijednosti nezavisnopromjenljive, treba izraunati vrijednost ocjene zavisno-promjenljive i greku te ocjene, u
zavisnosti od tipa intervala povjerenja.
Za xo=7 ocjena zavisno-promjenljive je:

Prosjena vrijednost zavisno-promjenljive u (1-a) 100% sluajeva pokrivena je


intervalom
, odnosno
0,74546-2,260,0304<Y0<0,74546+2,260,0304
0,677<Y0<0,814
Dnevni prirast pojedinih grla bie u 95% sluajeva pokriven intervalom od 0,677 do
0,814gr.

8. RELATIVNI BROJEVI
- STATISTIKO ISPITIVANJE DINAMIKE POSLOVANJA 8. 1 Indeksi
Indeksni statistiki pokazatelji su numerike karakteristike strukture i dinamike
socioekonomskih masovnih pojava i procesa kao to su: obim i dinamika radnih i
materijalnih resursa, planiranje, struktura i dinamika proizvodnih snaga, produktivnost rada,
visina zarada, drutvena proizvodnja, nacionalni dohodak i fiziki obim proizvodnje,
proizvodni rashodi, cijene, njihovo formiranje i ponaanje, fiziki obim prometa, kretanje
ivotnog standarda, trokovi ivota itd.
Za izuavanje masovnih pojava i procesa poslovna statistika koristi integralne
pokazatelje koji predstavljaju jednoznano standardizovanu kvantitativnu mjeru izraavanja
opte tendencije promjena i parcijalne iji zbir kvantitativno izraenih dinamikih ocjena
procesa ili pojave se koristi kao baza za integralni pristup.
8.1.1 Individualni indeksi
Individualni indeksi su relativni pokazatelji odnosa individualnih podataka, a koriste
se u dinamikoj analizi statistikih skupova i procesa ije se promjene posmatraju kao
sluajne funkcije jednog argumenta (promjenljive) u vremenu, oblika

U empirijskim istraivanjima obino se umjesto analitike interpretacije sluajne


funkcije sluimo skupom sluajnih veliina koje obrazuju dinamiki niz za skup sukcesivnih
vremenskih intervala ili momenata ,
i
. Dinamikom promjena
ekonomskih pojava, koje se prate pomou nizova podataka i njihovih varijacija u funkciji
vremena, ispituju se razvojne tendencije i vri prosuivanje o njenom tempu promjena. To
ispitivanje daje odgovor na pitanje kako moemo originalnim podacima vremenske serije
prilagoditi jedan oblik matematike funkcije koji u konkretnom sluaju izraava zakon
razvitka pojave. Upravo konstrukcijom individualnih indeksa statistiki podaci (nivoi pojave)
se meusobno (referentno) uporeuju prema odreenom kriteriju, iskazujui individualno i u
prosjeku poslovni ritam. Ako se uporeivanje podataka vri u odnosu na jedan odabrani
podatak koji proglaavamo za bazu poreenja, tada se izraunati indeksi nazivaju bazni, tj.
indeksi sa stalnom bazom. Ako je izbor baze otean zbog ekstremnih vrijednosti, za bazu se
preporuuje prosjek serije, jer se time izravnavaju individualna kolebanja, tj. vremenski niz.
Ako se vri uporeivanje svakog tekueg sa susjednim prethodnim nivoom pojave,
koji se uzima kao baza prethodnog, tada se izraunati indeksi nazivaju lanani, tj. indeksi sa
promjenljivom bazom.
Bazni indeksi: Relativni brojevi kojima se izraavaju promjene apsolutnih
vrijednosti vremenskog niza u odnosu na baznu veliinu, koja je skalarna i razliita od nule,
nazivaju se bazni indeksi. Ako se pojedinane vrijednosti posmatrane pojave u vremenskom

nizu oznae sa

, a za baznu vrijednost se odredi izvjesna vrijednost iz skupa i

oznai sa
, onda se bazni indeksi izraunavaju primjenom relacije:
, gdje
je broj podataka u vremenskoj seriji, a oznaka niza baznih indeksa, tj. individualnih
relativnih promjena.
Lanani indeksi: Ako se nivoi pojave meusobno uporeuju tako da se za osnovu ili
bazu uporeivanja koristi svaki prethodni podatak u odnosu na naredni tj. ako se svaki
podatak relativizuje prema prethodnom, koji se ponaa kao njegova baza, tada izraunati
individualni indeksi imaju promjenljivu bazu i zovu se lanani (verini) indeksi. Lananim
indeksima se izraavaju sukcesivne stope rasta, gdje se sukcesivnom promjenom baze
izravnavaju periodine varijacije. Kada se za baznu vrijednost uzme podatak iz prethodnog
perioda,
dobija
se
lanani
indeks
koji
se
izraunava
na
osnovu
relacije:
,
, gdje je
oznaka niza lananih indeksa, a broj nivoa
(podataka) vremenskog niza. Lanani indeksi pokazuju tempo razvoja tj. brzinu kretanja
(promjenu) posmatranih vrijednosti u odnosu na bazne, a njihova numerika vrijednost varira
oko broja 100. I lanani i bazni indeksi predstavljaju raunsko praenje promjena pojave koja
se zasniva na tom da se apsolutne vrijednosti zamijene relativnim.
Primjer 8.1: Izraunati bazne i lanane indekse i iste grafiki prikazati na osnovu
slijedeih podataka:
Godine

Proizvodnja

Bazni indeksi
1995=100
2000=100

Lanani
indeksi

1995
1996
1997
1998
1999
2000
2001
2002
2003
2004

13,8
14,6
12,6
11,8
12,1
10,8
11,4
10,6
11,3
11,1

100,0
105,8
91,3
85,5
87,7
78,2
82,6
76,8
81,9
80,4

105,8
86,3
93,7
102,5
89,3
105,6
93,0
106,6
98,2

127,7
135,2
116,7
109,3
112,0
100,0
105,6
98,2
104,6
102,8

a) Bazni indeksi grafiki prikaz

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004

b) Lanani indeksi grafiki prikaz

Pomou lananih indeksa moe se utvrditi prosjena stopa rasta posmatrane pojave
preko izraunavanja njihove geometrijske sredine, tako da u navedenom primjeru imamo:

; to znai da je u prosjeku prodaja u periodu od 1995 do 2004.


godine opadala za 2,39 indeksnih poena. Takoe se moe vriti transformacija
(preraunavanje) baznih indeksa u lanane i obrnuto, transformacija baznih indeksa po jednoj
bazi u bazne indekse po drugoj bazi itd. Lanani indeksi preraunavaju se u bazne
primjenom relacije:
koje slijede izabranoj bazi.

za godine koje prethode izabranoj bazi i:

za godine

Preraunavanje baznih indeksa po jednoj bazi u bazne indekse po drugoj vri se na


slijedei nain:
period (godina) koji odredimo za bazni oznaavamo sa 100,
novi bazni indeks za bilo koji period dobiemo ako dijelimo raniji bazni indeks tog
perioda sa baznim indeksom po ranijoj bazi iz perioda koji je odabran za novu
bazu, mnoei pri tom dobijeni rezultat sa 100.
Individualni indeksi mogu biti vremenski ili dinamiki, prostorni ili geografski,
indeksi planskih zadataka i indeksi izvrenja plana.
8.1.2 Grupni indeksi
Grupni indeksi se primjenjuju pri izraavanju zajednike varijacije tj. zajednikih
relativnih promjena vie srodnih pojava ili procesa koji se ponaaju kao sloen kompleks. To
u ekonomskim istraivanjima mogu biti neke kategorije kao to su cijena, fiziki obim
proizvodnje i prometa, vrijednost uvoza i izvoza itd. Zajednike varijacije vie srodnih pojava
mogu se u prosjeku izraavati na dva naina:
metodom srednjih vrijednosti, tj. izraunavanjem srednjih grupnih indeksa i
metodom agregata tj. konstrukcijom agregatnih indeksa.
Metoda srednjih grupnih indeksa tj. metoda prosjenih odnosa se primjenjuje na
dinamiki niz dat u obliku individualnih indeksa koji zamjenjuju originalne apsolutne
vrijednosti uz koritenje aritmetike, geometrijske, harmonijske, medijalne i drugih sredina,
odnosno drugih postupaka uprosjeavanja.
injenica da sve komponente nemaju isti udio u ukupnom varijabilitetu koji treba
imati u vidu prilikom izraunavanja individualnih indeksa, nalae potrebu uvoenja metode
ponderacije. Izborom odgovarajueg podesnog pondera za svaku od sastavnih komponenti
sloene pojave daje se odgovarajui znaaj (teina) koju ona ima u strukturi pojave koju
posmatrani srednji indeks treba da izraava. Cilj ponderacije je postizanje reprezentativnosti
grupnog indeksa kao kvantitativno sintetike mjere varijabiliteta. Ako se za ponder
individualnih indeksa, grupe srodnih pojava, uzme vrijednost u baznoj godini (
se grupni indeksi izraunavaju u vidu ponderisanja aritmetike sredine:

) onda

to izraava strukturu u baznoj godini.


Ako se za ponder individualnih indeksa uzme vrijednost proizvodnje tekue godine
(
) onda se grupni indeksi izraunavaju u vidu harmonijske sredine individualnih
indeksa:

to pokazuje strukturu pojave u posmatranom periodu.


Grupni indeks na osnovu prosjeka zasniva se na individualnim indeksnim brojevima,
pa mu je primjena ograniena na male grupe srodnih proizvoda. Za vee grupe srodnih
proizvoda koriste se obraunski agregati kao zbirovi zdruenih elemenata (
) koji se za
svaki proizvod sabiraju, to daje obraunski agregat (

):

Ovaj agregat je homogen, poto su njegovi elementi iz istog (baznog) perioda, tako
da predstavlja realnu knjigovodstvenu veliinu. Zbog heterogenog agregata (
) kao
nedostatka navedenog obrasca, za izraunavanje grupnog indeksa koristi se harmonijska
sredina individualnih indeksa:

U ovom obrascu heterogeni agregat (


) zasnovan je na poznavanju strukture
proizvodnje u baznoj godini i tekuoj cijeni koja se uzima iz cjenovnika, tako da je komforan
za primjenu. Oba obrasca imaju istu analitiku vrijednost, ali ne daju istu numeriku
vrijednost grupnog indeksa zbog razliitog izbora cijena. Agregatni (grupni) indeksi koji se
najee javljaju i izraunavaju primjenom navedena dva metoda su:
1. grupni indeksi fizikog obima proizvodnje i prometa:
metodom prosjenih odnosa:

ili
metodom agregata (totalnih odnosa):
ili
2. Grupni indeks cijena
Mjerenje relativnih promjena u nivou cijene za vie proizvoda je zadatak grupnih
indeksa cijena iji osnov za izraunavanje ine sljedea dva obrasca:

Metodom prosjeka:

, odnosno
Metodom agregata:

, Laspaerov indeks

,Paeov indeks

Aditivnom ili aplikativnom metodom navedena dva indeksa izraunava se idealni


agregatni indeks ( ) cijena:

ili

3. grupni indeks trokova ivota:


metodom srednjih vrijednosti:

gdje
usluga, a

predstavlja strukturu vrijednosti nabavljenih proizvoda i


i

prosjene cijene u tekuem (baznom) periodu

4. grupni indeksi vrijednosti proizvodnje i prometa:


metodom agregata (totalni odnosi):

5. grupni indeks ispunjenja plana proizvodnje (prometa):


metodom srednjih vrijednosti:

, gdje kao ponder (


) slui planirana vrijednost proizvodnje
metodom agregata (totalnih odnosa):
ili

, gdje kao ponder (p1q1) slui ostvarena vrijednosti

Primjer 8.2 Na bazi podataka iz sljedee tabele izraunati:


1. grupni indeks fizikog obima proizvodnje:
metodom srednjih vrijednosti
metodom agregata
2. grupni indeks cijena:
metodom srednjih vrijednosti
metodom agregata

3. grupni indeks vrijednosti proizvodnje:


metodom agregata
4. grupni indeks ispunjenja plana proizvodnje
po vrijednosti
po fizikom obimu
Napomena: za pondere uzimati bazne vrijednosti.
PROIZVODNJA
III '94. (
A
B
C
D

III '95. ( )

CIJENA
III
III '94. ( )
(

200
300
400
150

450
500
600
350

60
55
35
50

'95.
)
110
90
60
80

Apsolutne promjene obima proizvodnje i cijena u posmatranim i baznim periodima


za proizvode A, B, C i D zamijeniti sa relativnim, primjenom zadanih indeksa.
Izrada:

1.

a)

,
to znai da se fiziki obim proizvodnje 1995. g. u odnosu na 1994. u prosjeku
poveao za 86%.

;
provjera prosjenog poveanja fizikog obima proizvodnje metodom agregata
b)

2.

a)

, to znai da se cijena 1995. u odnosu na 1994. g.

u
prosjeku poveala za 70%

b)

; provjera prosjenog poveanja cijene metodom agregata

, to pokazuje da se vrijednost proizvodnje 1995. u


odnosu na 1994. u prosjeku poveala 317%

3.

a)

4.

a)

, to znai da je plan po vrijednosti prebaen u prosjeku

b)

, to pokazuje da je plan po fizikom obimu proizvodnje

za 4 %

u prosjeku podbaen za 8%.

8.1.3 Testiranje indeksa


Prilikom izbora formule koja najbolje odgovara smislu izraunavanja indeksa moe se
primijeniti testiranje dosljednosti svakog indeksa pojedinano, koristei test vremenske
reverzbilnosti, test faktorske reverzibilnosti i test cirkularnosti.
Test vremenske reverzibilnosti, tj. obrnutog odnosa, zasniva se na injenici da
koritena formula za indeks mora ispunjavati sljedei uslov:
.
Iz navedenog uslova se vidi da se inverzijom bazne i tekue vrijednosti ostvaruje
recipronost indeksa, a u obrnutom sluaju pojavila bi se izvjesna mjera pristrasnosti.
Kod individualnih indeksa ovaj uslov je uvijek ispunjen, a time i zadovoljen test
vremenske reverzibilnosti. Od neponderisanih grupnih indeksa vremensku reverzbilnost
ispunjavaju svi agregatni indeksi, dok od indeksa izraunatih po metodu srednjih vrijednosti
samo geometrijski. Proizvod aritmetikih indeksa je uvijek iznad, a harmonijskih ispod
jedinice.
Uslov faktorske reverzibilnosti treba da zadovolje individualni i grupni indeksi jer
indeks koliina pomnoen indeksom cijena treba da da indeks vrijednosti, zato to koliina
robe (q) pomnoena cijenom (p) daje vrijednost (pq), odnosno:

Test faktorske reverzibilnosti takoe zadovoljavaju individualni indeksi, kao i


Fisherov idealni indeks, dok grupni indeksi, ponderisani ponderacionim faktorima iz baznog
ili posmatranog perioda, pokazuju pristrasnost.
Test cirkularnosti zadovoljavaju indeksi iji je proizvod jednak odnosu nivoa
posmatrane pojave u krajnjem i poetnom periodu, to znai:
Ip (krajnji period x poetni) = Ip (krajnji period x srednji) Ip (srednji period x poetni)
Kada je ovaj test zadovoljen, indeksi se mogu preraunavati sa jedne na drugu bazu.
Ovaj test takoe zadovoljavaju agregatni indeksi sa baznim ponderima, aritmetiki i

geometrijski neponderisani indeksi, kao i oni sa baznim ponderima, dok Fisherov idealni
indeks ne ispunjava ovaj uslov.
8.2 Ekonomski pokazatelji dinamike
Pokazatelji strukture su takvi relativni brojevi koji procentualno predstavljaju odnos
dijela neke masovne pojave prema cjelini i primjenjuju se u datom momentu, pa kaemo da
pripadaju instrumentima statike analize. Oni ipak omoguavaju da kroz neke dinamike
pokazatelje uporeujemo istorodne pojave po strukturi u raznom prostornom i vremenskom
rasporedu, kao i da pratimo razvoj strukture pojave u raznim periodima. Izraunavaju se na
sljedei nain:

gdje je:

- dio pojave
- pojava u cjelini

Pokazatelji stepena ili intenziteta slue nam da izraunavamo meusobne odnose


raznorodnih skupova, a primjenjuju se u statistikoj kvantitativnoj analizi, u cilju izraavanja
brojanog odnosa dijelova jednog skupa prema dijelovima drugog. Nazivamo ih statistiki
koeficijenti ili stope, a primijenjeni su uglavnom u demografskoj statistici; npr. stopa
nataliteta, stopa mortaliteta, kao i u redovnim statistikim publikacijama; npr. gustina
naseljenosti. Izraavaju se kao prost broj ili procentualni odnos uporeenih veliina; npr. 76
stanovnika na 1 kvadratni kilometar povrine, ili 225 mukaraca prema 185 ena itd.
Pokazatelji dinamike predstavljaju najvaniju grupu ekonomskih pokazatelja koja se
koristi za analizu dinamike masovnih pojava, a za teorijsko izuavanje i praktinu primjenu
znaajni su slijedei:
Nivo ( ) - predstavlja statistiki brojani podatak o vrijednosti nekog obiljeja i
istovremeno ini osnovu za odreivanje ostalih ekonomskih pokazatelja
Apsolutni porast ( ) - predstavlja varijaciju kao razliku dva uzastopna nivoa, odnosno
podatka (uvijek prethodni oduzimamo od narednog (
))
Tempo razvitka ( ) - predstavlja koeficijent dinamike izraen kao odnos dva
uzastopna stanja, tj. varijaciju kao kolinik koja se dobija stavljanjem u odnos
posmatranog podatka prema prvom prethodnom (
Tempo porasta (

) - predstavlja odnos apsolutnog porasta prema prvom prethodnom

nivou, tako da nije identian sa tempom razvitka a izraava se kao procentni broj ( )
Srednji tempo razvitka ( ) - predstavlja geometrijsku sredinu svih individualnih
tempa razvitka ili kolinik izmeu posljednjeg i prvog podatka u nizu.
Pokazatelji dinamike mogu se uoptavajui ematski prikazati sljedeim zapisom:
Nivo(

Apsolutni

Tempo

Tempo porasta (

porast (

razvitka (
-

)
-

Srednji tempo razvitka:

Srednji tempo porasta:


Stp= Str-1,
Primjer 8.3 Izraunati pokazatelje dinamike na bazi podataka o prometu nekog
proizvoda po danima u
preduzeu, koji se kretao kako slijedi:
Nivo (

Apsolutni porast (

Pozitivan apsolutni porast (


apsolutni porast (
odraava stagnaciju.
Tempo razitka:

) odraava kvantitativan porast pojave, negativan

) odraava opadanje pojave, a apsolutni porast jednak nuli (

Tempo porasta:

Tempo razvitka moe da zauzme vrijednost od nule do beskonano i ne moe biti


negativan. Vrijednost tempa razvitka moe da bude izmeu 0 i 1 (
) i tada izraava
opadanje pojave, jednako 1 (
) i tada izraava stagnaciju i vea od 1 (
) to
upuuje da pojava raste.

Tempo porasta (Tp) moe da poprimi negativnu vrijednost i tada izraava pad pojave,
pozitivnu vrijednost i tada izraava porast pojave i vrijednost jednaku nuli to je naznaka da
ne postoji varijabilitet.
Srednji tempo razvitka:

Srednji tempo rasta:

Ocjena dinamike promjena posmatrane pojave za naznaeni period ispitivanja


podrazumijeva izraunavanje srednjeg tempa razvoja i srednjeg tempa rasta. Srednji tempo
razvoja izraunava se iz individualnih tempoa razvoja, pomou geometrijske sredine, a
srednji tempo rasta (prosjena stopa rasta) izraunava se tako to se od srednjeg tempa
razvoja oduzme stotinu.
Pozitivna stopa rasta pokazuje koliko se procenata prosjeno, iz godine u godinu,
pojava poveavala, a negativna stopa rasta izraava, u procentima, prosjeno godinje
opadanje pojave u posmatranom intervalu. Individualni tempi razvoja, predstavljaju
pojedinane promjene, dok srednji tempo razvoja proizvodnje i prometa predstavlja
prosjenu relativnu promjenu, koja se utvruje ili kao koeficijent ili u procentima, kao indeks.
Individualni tempoi rasta, kao i srednji tempo rasta, su sintetiki relativni pokazatelji
dinamike pojave i mogu se takoe izraziti kao koeficijenti ili u procentima, kada dobijaju
nazivstope rasta.
Dakle, srednji tempo razvoja i srednji tempo rasta izraunavaju se zato da bi se
vidjelo, odnosno saznalo, kakva je bila prosjena promjena u kretanju proizvodnje ili prometa
za dati period posmatranja.

8.3 Statistika analiza dinamike produktivnosti


8.3.1 Mjerenje produktivnosti
Produktivnost ili proizvodnost rada predstavlja prosjean radni ili vremenski uinak,
koji definiemo kao odnos proizvodnje i rada utroenog za njeno stvaranje, to moemo
izraziti direktno i reciprono:

U prvom sluaju produktivnost rada prua informaciju o obimu proizvodnje po


jedinici utroenog rada a u drugom sluaju informaciju o koliini utroenog rada po jedinici
proizvoda. Ovako definisan pojam produktivnosti rada odnosi se na produktivnost
konkretnog rada koju posmatramo kao naturalni pokazatelj, tj. kao obim upotrebljenih
vrijednosti, koji se vee na jedinicu utroenog rada. Kako naturalno iskazivanje proizvodnje
nema zajedniki imenitelj, ovakav obraun pokazatelja produktivnosti rada je ogranien na
ona preduzea koja imaju homogen program tj. koja proizvode istovrsne proizvode. Veliina
kojom se izraava produktivnost rada zavisi od izabrane jedinice vremena koja moe bit as,
dan, mjesec i godina, tako da izraunavanje produktivnosti upotrebom pojedinih od
navedenih jedinica, daje pokazatelje razliite sadrine kao i razliite analitike vrijednosti.
Raunski, asovna produktivnost izraava prosjeni radni uinak u vremenu stvarnog rada i
predstavlja odnos koliine ostvarene proizvodnje i broja radnih asova. Dnevna
produktivnost se dobija iz odnosa proizvodnje i broja radnik-dana, a pored vremena stvarnog
rada sadri i vrijeme kada pojedini zaposleni nisu radili.
Mjesena i godinja produktivnost obuhvata i sve gubitke radnog vremena, nastale u
toku mjeseca odnosno godine, kao to su izostanci sa posla, prekidi rada, godinji odmori itd.
Ako se produktivnost rada mjeri veim jedinicama tada je ona apsolutno vea, a relativno
manja, tako da je dnevna produktivnost vea od asovne, mjesena od dnevne, a godinja od
mjesene. U statistikoj praksi se obino ne izraava dnevna produktivnost rada jer se dnevni
gubici radnog vremena ukljuuju u mjesene gubitke, a vrlo esto se i ne raspolae podacima
za njen obraun.
asovna produktivnost se obino izraunava samo prema uloenom radu lica
zaposlenih neposredno u proizvodnji, a rijee prema utroenom radu svih zaposlenih u
preduzeu. Mjesena produktivnost se izraunava kako prema utroenom radu radnika u
neposrednoj proizvodnji, tako i prema utroenom radu cjelokupnog zaposlenog osoblja u
preduzeu. Poreenjem ovih obrauna produktivnosti dobijamo nov analitiki pokazatelj koji
ukazuje da dok produktivnost rada po proizvodnom radniku raste, dotle po jednom
zaposlenom opada, to je posljedica neopravdanog udjela neproizvodnog osoblja. Znai,
ispitivanje produktivnosti rada u statistikoj praksi moe da se obraunava prema koliini
utroenog ivog rada na sljedee naine:
a) da utroenom vremenu rada (T) suprostavimo fiziki obim proizvodnje (q) iskazan u
naturalnim ili uslovno naturalnim jedinicama

gdje u prvom sluaju dobijamo produktivnost u vidu prosjene proizvodnje po jedinici


vremena a u drugom utroeno prosjeno vrijeme po proizvodnji jedinice proizvoda
b) da fiziki obim proizvodnje (q) stavimo u odnos sa brojem zaposlenih (R),

gdje u prvom sluaju imamo broj jedinica proizvoda po radniku a u drugom broj angaovanih
radnika po jedinici proizvoda
c) da se za mjerenje produktivnosti razliitih proizvoda koji se ne mogu zbirno prikazivati se
koristi vrijednosni ili radni izraz koji ima najiru primjenu i najvei analitiki znaaj kod
proizvoda sa priblinim ueem materijalnih trokova u cijeni, pa bi u tom sluaju
produktivnot rada bila:

gdje je:
Spq vrijednosni izraz
St ukupno utroeno vrijeme
Dakle, produktivnost rada predstavlja apsolutni izraz prosjene proizvodnje po
jedinici vremena ili prosjenog vremena potrebnog za jedinicu proizvoda. Ocjena ovih
apsolutnih vrijednosti jedino je mogua preko indeksa produktivnosti kao analitikog
pokazatelja iji je smisao da se produktivnost jednog perioda poredi sa produktivnou
drugog.
8.3.2 Individualni indeks produktivnosti
Ako stavimo u odnos produktivnost tekueg prema produktivnosti baznog perioda za
jedan proizvod (preduzee), dobijamo individualni indeks produktivnosti. Neka
produktivnost tekueg (posmatranog) perioda bude izraena sa q1/T1 a baznog q0/T0 tada e
indeks produktivnosti biti izraen sa:

Dobijeni indeks produktivnosti rada koji je odreen prosjenom koliinom


proizvodnje po jedinici vremena tj. po jednom radnik-asu pokazuje relativnu promjenu
proizvodnje i ako je on 100, znai da se produktivnost ne mjenja, dok svako odstupanje na
nie predstavlja opadanje, a na vie od 100 poveanje produktivnosti.
Individualni indeks dinamike produktivnosti se u praksi esto izraava preko
reciprone produktivnosti, na sljedei nain:

Dobijeni indeks produktivnosti rada odreen je prosjeno utroenim vremenom po jedinici


proizvoda, tako da pokazuje relativnu promjenu vremena datu kroz odgovarajue tumaenje.

8.3.3 Grupni indeks produktivnosti


Ispitivanje dinamike produktivnosti u jednom preduzeu koje proizvodi razliite
proizvode ili isti proizvod u vie preduzea, vri se primjenom grupnog indeksa
produktivnosti. Grupni indeks produktivnosti rada moe se obraunati na bazi stalnog obima i
strukture proizvodnje, ispitujui samo promjene koliine utroenog rada ili na bazi stalne
utroene koliine rada, ispitujui samo promjene obima i strukture proizvodnje. Najee
grupni indeks produktivnosti rada izraunavamo metodom agregata, ponderima iz baznog ili
posmatranog (tekueg) perioda i na osnovu produktivnosti definisane kao vrijeme potrebno
za proizvodnju jedinice proizvoda. Ovako izraunati grupni indeksi nazivaju se indeksi
produktivnostinepromjenjivog sastava strukture proizvodnje, jer odgovarajuim
ponderisanjem polazimo od pretpostavke da je struktura proizvodnje nepromijenjena tokom
posmatranog vremenskog razdoblja. Ako grupni indeksi sadre promjene u strukturi
proizvodnje tokom vremena, nazivamo ih indeksima produktivnosti sa promijenjenim
sastavom proizvodnje.
Grupni indeks produktivnosti na bazi nepromijenjenog sastava proizvodnje
izraunava se metodom agregata ako se ponderiu pojedinani vremenski uinci, a kao
ponder uzmu ostvarene koliine proizvodnje u baznom ili posmatranom periodu, to se moe
napisati na sljedei nain:
a) ponder iz baznog perioda

b) ponder iz posmatranog (tekueg) perioda.

, gdje je:
t0 i t1 prosjena vremena za izradu jedinice proizvoda u baznom i posmatranom periodu
q0 i q1 proizvedene koliine u baznom i posmatranom periodu
Grupni indeks dinamike produktivnosti rada promjenjivog sastava proizvodnje ima za
cilj da izmjeri ukupan efekt promjena poveane produktivnosti u uslovima izmjenjene
strukture, a izraava se formulom:

, gdje su :
T0 i T1 ukupno utroena vremena za cjelokupnu proizvodnju u baznom i
posmatranom periodu.
Obraun navedenih indeksa produktivnosti rada nepromjenjenog i promjenjenog
sastava proizvodnje utvruje se na osnovu naturalnog uzraza. Ako ne raspolaemo naturalnim

pokazateljima, tada indeks produktivnosti izraunavamo vrijednosnim izrazom iji je obrazac


za promjenjivi sastav proizvodnje sljedei:

,
a obraun vrijednosti indeksa produktivnosti rada na bazi nepromijenjenog sastava:

gdje su:
q0 p ponderi
I individualni indeks produktivnosti rada

Primjer 8.4 Graevinsko preduzee Astorija a.d. 2004. i 2005. godine ostvarilo je
proizvodnju s angaovanim proizvodnim radnicima prema sljedeim podacima:
Tip zgrade

Broj izgraenih zgrada


2004.
2005.
60
75
50
40
30
25

P+2
P+3
P+4

Broj radnika
2004.
2005.
720
750
750
720
600
500

Izraunati i protumaiti:
a) produktivnost mjerenu utroenim radom za jedinicu proizvoda, tj. brojem
angaovanih radnika po jednoj zgradi;
b) grupni indeks produktivnosti rada nepromjenljive proizvodnje (ako su ponderi bazni);
c) grupni indeks produktivnosti rada promjenljive proizvodnje.
Objasniti kako je promjena u strukturi proizvodnje uticala na produktivnost.
Postupak rada
-

Formira se radna tabela sa svim elementima potrebnim za obraun.


Radna tabela za obraun grupnih indeksa produktivnosti u preduzeu Astorija

Tip
zgrade
P+2
P+3
P+4
S

q0

q1
60
50
30
140

T0
75
40
25
140

T1
720
750
600
2070

750
720
500
1970

12
15
20
-

10
18
20
-

720
750
600
2070

600
900
600
2100

Na osnovu obrauna u tabeli dobija se:


a) produktivnost rada mjerena utroenim radom za jedinicu proizvoda kao t0 i t1

b)
to znai da se prosjeno utroeno vrijeme povealo za 1,45%, a produktivnost opala za
1,42% (100: 101,45x100=95,58; 95,58-100= - 1,42), 2005. u odnosu na 2004. godinu.
c)
to znai da se prosjeno utroeno vrijeme smanjilo za 4,9%, a produktivnost poveala za 5%
(100: 95,17 x 100 = 105; 105 100 = 5), 2005. u odnosu na 2004. godinu.
d) Indeks Pr nepromjenljive proizvodnje vei je od indeksa Pr promjenljive proizvodnje (kod
nepromjenljive produktivnost je opala za 1,42 %, a kod promjenljive porasla za 5%). To
znai da je promjena u strukturi proizvodnje povoljno uticala na produktivnost, jer je
poveala proizvodnju.
8.4 Statistika analiza dinamike zarada
Dinamiku trokova ivota uslovljavaju realne zarade koje predstavljaju pokazatelj
ivotnog standarda, iji porast ili pad zavisi od indeksa trokova ivota. Promjene u
trokovima ivota predstavljaju pomjene u cijenama artikala za podmirenje potreba
stanovnitva, a obuhvatamo ih indeksom trokova ivota koji se praktino svodi na indeks
cijena na malo.
Sumu trokova ivota sainjava zbir vrijednosti svih proizvoda i usluga sadranih u
tipskom budetu i utvrenih na osnovu cijena datog perioda. Tipski budet moe se odrediti
metodom porodinih budeta, metodom globalne potronje i metodom teorijskog budeta.
Utvrivanjem tipskog budeta odnosno liste proizvoda odgovarajuih cijena i pondera,
stvoreni su uslovi za izraunavanje indeksa trokova ivota po sljedeoj formuli:

Statistiki, a pogotovo knjigovodstveno, zarade se mogu posmatrati kao neto zarade


(primanje iz redovnog radnog odnosa) i bruto zarade (pored sume koju radnik primi obuhvata
doprinose i poreze iz zarada).
Statistiko istraivanje zarada vri se kako za potrebe drutvene zajednice, tako i za
preduzea u okviru svojih statistikih slubi, bez obzira na njihovu djelatnost i svojinski
odnos. Iz podataka o zaradama zaposlenih mogu da se utvrde odreeni statistiki pokazatelji,
kao to su suma isplaenih bruto zarada, prosjena bruto zarada, suma isplaenih neto zarada,
prosjena neto zarada, varijacija nivoa zarada, indeks nominalnih i realnih prosjenih neto
zarada, itd.

Budui da je zarada osnov mjerenja ivotnog standarda zaposlenih, potrebno je


razlikovati nominalne zarade koje se utvruju u bruto i neto novanom iznosu od realnih neto
zarada koje predstavljaju stvarnu vrijednost zarade zaposlenog, tj. njenu kupovnu
snagu. Realna zarada se utvruje na osnovu nominalne neto zarade i indeksa trokova ivota,
tako to se nominalna zarada u posmatranom periodu podijeli indeksom trokova ivota.
Time realna zarada zapravo izraava nivo ivotnog standarda, odnosno kupovnu mo
nominalne neto zarade, mjerenu cijenama na malo artikala line potronje.
Prosjena neto zarada izraunava se metodom proste ili ponderisane aritmetike
sredine, tj. dijeljenjem ukupno isplaenih neto zarada brojem zaposlenih. Da bi prosjena
neto zarada, kao pokazatelj nivoa zarada u preduzeu, bila to reprezentativnija, potrebno je
da se izraunava po kvalifikacionim grupama, a ne samo kao opti prosjek na osnovu kog su
neuoljive razlike.
8.4.1 Indeksi zarada
Statistika pomou indeksa neto zarada prati njihove relativne promjene tokom
odreenog vremena, a osnovu za njegovo izraunavanje ine prosjene nominalne zarade,
ije promjene u preduzeu uslovljava:
-

poveanje ili smanjenje prosjenih zarada pojedinih kategorija zaposlenih


izmjena strukture tj. sastava zaposlenih

Na osnovu toga promjene prosjenih neto zarada mogu da se prate ako se uzme u
obzir uticaj promjena u kvalifikovanom sastavu zaposlenih, kao i bez uticaja takvih
promjena, na osnovu ega razlikujemo dvije vrste grupnih indeksa nominalnih neto zarada:
a) Indeks neto zarada promjenljivog sastava zaposlenih
b) Indeks neto zarada nepromjenljivog sastava zaposlenih
Pored indeksa nominalnih neto zarada potrebno je izraunato i indekse realnih neto
zarada, pogotovo u sluaju kada se uporedo sa poveanjem nivoa neto zarada po istoj stopi
poveavaju trokovi ivota.
Indeks nominalnih prosjenih neto zarada promjenljivog sastava
zaposlenih izraunava se kao odnos prosjene neto zarade u posmatranom periodu i
prosjene neto zarade baznog perioda. Za utvrivanje i konkretnu primjenu indeksa zarada
potrebno je da se prvo izrauna prosjena neto zarada za bazni i tekui period na sljedei
nain:

Stavljanjem u odnos utvrenih prosjenih neto zarada tekueg i baznog perioda,


dobija se indeks nominalnih prosjenih neto zarada promjenljive strukture zaposlenih,
odnosno:

Ovako izraunat indeks neto zarada izraava promjene u veliini nominalnih


prosjenih neto zarada koje su nastale bilo zbog njenog porasta ili smanjenja, bilo zbog
izmjena kvalifikacionog sastava.
Indeks izraunat po datoj formuli pokazuje relativnu promjenu nastalu u nivou zarada
u posmatranoj godini u odnosu na baznu, uzimajui u obzir sve mogue promjene u strukturi
zaposlenih radnika. Ako elimo eliminisati uticaj promjena kvalifikacione strukture
zaposlenih na opti nivo zarada tada izraunavamo indeks zarada postojanog
(nepromjenljivog) sastava zaposlenih.
Indeks nominalnih prosjenih neto zarada nepromjenljivog sastava
zaposlenih iskljuuje uticaj promjena u kvalifikacionoj strukturi zaposlenih na promjene
prosjenih zarada. Izraunava se tako to se za svaku kategoriju zaposlenih, prema stepenu
strune spreme, utvrde prvo prosjene zarade, zatim se izraunavaju indeksi zarada svake
kategorije i na kraju se utvruje njihova ponderisana aritmetika sredina. Kao ponder kojim
se mnoi individualni indeks svake kategorije zaposlenih uzima se suma neto zarada u
baznom periodu. Ovaj indeks se raunski dobija koritenjem sljedeeg obrasca:

Konstrukcijom navedenog indeksa eliminie se dejstvo promjena u sastavu


zaposlenih na poveanje ili smanjenje visine prosjene zarade, ali ukoliko se ono eli
izmjeriti, stavlja se u odnos indeks neto zarada promjenljivog prema indeksu neto zarada
nepromjenljivog sastava zaposlenih.
Indeks realne prosjene neto zarade pokazuje dinamiku ivotnog standarda, tj.
kupovnu mo realnih zarada u prosjeku, a izraunava se kao odnos indeksa nominalne
prosjene neto zarade i indeksa trokova ivota.
Ukoliko su nastajale znaajnije promjene u kvalifikacionoj strukturi radnika, utoliko
se indeks zarada izraunat po ovoj formuli vie razlikuje od prethodnog. Zarade izraavaju
samo nominalnu veliinu raspoloivog primanja zaposlenih, ali mogunost podmirenja
potreba zavisi i od odnosa cijena onih roba koje ulaze u individulani konzument. Ispitivanje
stepena zadovoljavanja potreba pri datim nominalnim zaradama i datim trokovima ivota
dovodi nas na problematiku realnih zarada. Znai, realna zarada za razliku od nominalne koja
je samo novani iznos koji radnik primi, pokazuje kupovnu mo radnika ili stepen
zadovoljavanja njegovih potreba. Indeks nominalnih zarada se obraunava kao odnos
prosjenih nominalnih zarada u posmatranom periodu prema istim u baznom periodu.

Primjer 8.5
Prema podacima preduzea Aleksandar Impeks za juni i decembar 2005. godine
izraunati grupni indeks nominalnih neto zarada nepromijenjenog sastava zaposlenih. Podaci
potrebni za obraun nalaze se u tabeli:
Struna
sprema

0
VSS
VS
SSS
NS
VKV
KV
NK
SVEGA

Broj zaposlenih Prosjena neto


2005. plata u dinarima

VI
1
20
10
90
15
18
20
12
185

XII VI
XII
2
3
4
22
2520
3350
8
2240
2800
100
1920
2458
9
800
1000
18
2000
2600
22
1650
2112
6
900
1143
185 1823,78 2437,96

Indeks
Inz

5 (4:3)
133
125
128
125
130
128
127
134

Suma
neto
plata u
Inz x0
junu
2005. x0
6
50400
22400
172800
12000
36000
33000
10800
337400

7 (5 x 6 )
67032
28000
221184
15000
46800
42240
13716
433972

Postupak rada:
-

Prvo se izraunavaju individualni indeksi prosjenih neto plata po strunoj spremi,


uneseni u kolonu 5.
Zatim se ovi indeksi ponderiu, mnoe se sumom isplaenih zarada u baznom
periodu (inz x0),, to je dato u posljednjoj koloni tabele.
Na osnovu zbira prethodno izraunatih veliina i ukupne sume isplaenih neto zarada
u baznom periodu izraunava se grupni indeks nominalnih prosjenih neto zarada
nepromijenjenog sastava zaposlenih:

Prosjena neto zarada zaposlenih u decembru prema junu 2005. poveala se za 29%.
Eliminisan je uticaj promjena u strunom sastavu zaposlenih. Ako se eli utvrditi koliko su
promjene u sastavu zaposlenih uticale na porast ili pad prosjene neto plate, treba staviti u
odnos indeks neto zarada promjenljivog prema indeksu promijenjenog sastava zaposlenih.

Znai, u ovom primjeru treba utvrditi i indeks promjenljivog sastava zaposlenih


(Inz). Poto se podaci potrebni za obraun ve nalaze u zbirnom redu (kolone 3 i 4) tabele,
slijedi rezultat:

Uticaj promjena u strunom sastavu zaposlenih na promjene nominalnih prosjenih


zarada iznosi:

to znai da su promjene u strukturi zaposlenih uticale na poveanje neto plate po


zaposlenom za 4%.
Da bi se utvrdila stvarna promjena u ivotnom standardu zaposlenih izraunava se
indeks realne neto plate po zaposlenom (Irnz) . Ako je indeks trokova ivota za decembar
2005. godine 128, onda je:
to pokazuje da se kupovna mo po zaposlenom preduzea Aleksandar
Impeks poveala za 5% u decembru prema junu 2005.

9. ANALIZA VREMENSKIH SERIJA

Vremenska serija predstavlja niz vrijednosti nekog obiljeja u uzastopnim


vremenskim periodima (momentima). Pod analizom vremenskih serija podrazumijeva se
njihovo izuavanje statistikim metodama, sa ciljem utvrivanja zakonitosti razvoja u
posmatranim i predvianja u buduim periodima.
Vrijednosti obiljeja koje ine vremensku seriju obino se nazivaju nivoi serije. U
zavisnosti od strukture svojih nivoa, vremenska serija moe biti momentna ili intervalna.
Momentna je ona vremenska serija ije nivoe predstavljaju vrijednosti posmatranog
obiljeja u ekvidistantnim momentima vremena. Takvi momenti mogu biti odreeni dani u
nedjelji ili datumi u mesecu ili godini.
Nivoi intervalne vremenske serije predstavljaju kumulativne vrijednosti obiljeja za
neki interval vremena, duine mjeseca, kvartala, godine i sl. esto se, umjesto zbirnih
vrijednosti, za nivoe vremenske serije uzimaju srednje vrijednosti obiljeja u posmatranim
intervalima vremena.
U zavisnosti od vremenske distance izmeu perioda u kojima se iskazuju nivoi,
vremenske serije mogu biti nedjeljne, mjesene, kvartalne, godinje i viegodinje.
Vremenske serije se predstavljaju tabelarno i grafiki. Tabela sadri dvije kolone, pri
emu se u prvoj navode periodi za koje su nivoi registrovani a u drugoj sami nivoi. Grafiki,
vremenske serije se obino prikazuju linijskim grafikonom u pravouglom koordinatnom
sistemu u ravni. Na apscisu se nanose podjele koje odgovaraju vremenskim periodima, a na
ordinatnu osu nivoi. Grafiki prikaz je posebno znaajan, jer prua predstavu o razvoju
posmatrane pojave a esto sugerie i metod analize.
Danas postoji veliki broj metoda za analizu vremenskih serija. Veina njih se bazira
na jednom od dva mogua pristupa: vremenskom i frekventnom. Vremenski pristup polazi od
stanovita da se promjene u vremenskoj seriji mogu izraziti u funkciji vremena. Frekventni
pristup se zasniva na injenici da su varijacije u vremenskoj seriji rezultat superpozicije
harmonika razliitih perioda, odnosno frekvencija. Dalje e biti rijei samo o nekim, iz
mnotva procedura analize vremenskih serija u vremenskom domenu.
U optem sluaju, nivoi vremenske serije se mogu posmatrati kao rezultat djelovanja
sljedeih komponenti: trend, cikline, sezonske i sluajne. Trend komponentu predstavlja
dugorona tendencija razvoja posmatrane pojave. Ciklinu komponentu ine viegodinje,
obino periodine oscilacije u odnosu na dugoronu tendenciju. esto se ciklina
komponenta posmatra zajedno sa trendom, kao trend-ciklina komponenta. Dalje, ciklinu
komponentu neemo razmatrati kao posebnu komponentu. Sezonsku komponentu
predstavljaju kolebanja u pravilnim vremenskim razmacima kraim od godine, npr.
mjesecima ili kvartalima. Sluajna ili iregularna komponenta predstavlja sluajne promjene
nivoa vremenske serije.
Od naina na koji su ove komponente ukomponovane u vremenskoj seriji, razlikuju
se modeli vremenskih serija.

Oznaimo sa Y nivo vremenske serije, sa T trend-ciklinu komponentu, sa S


sezonsku komponentu i sa I sluajnu komponentu. Aditivni model vremenske serije ima
oblik:
Y=T+SI
a multiplikativni:
Y = TSI
Ako se komponente kombinuju na druge naine nastaju razliiti oblici mjeovitih modela.
Jedan od moguih je npr.
Y = TS + I
Na sljedeoj slici ematski su prikazani prethodni modeli, sastavljeni od istih komponenti.

ematski prikaz aditivnog i


multiplikativnog modela
Analiziranje pojedinih komponenti vremenske serije omoguuje da se sagledaju
inioci koji uzrokuju promjene nivoa u vremenu. Stoga je jedan od osnovnih postupaka u
analizi vremenske serijedekompozicija, tj. izdvajanje njenih komponenti.
Prilikom dekompozicije vremenske serije polazi se od modela za koji se
pretpostavlja da dobro opisuje vremensku seriju. Od stepena adekvatnosti modela u velikoj
mjeri zavisi kvalitet dekompozicije. U praktinim situacijama obino se sreemo sa
vremenskim serijama ije se komponente meusobno mijeaju na razliite naine, koji esto

odudaraju od jednostavnih modela kojima se opisuju. Zbog toga, u veini sluajeva,


izdvojene komponente nisu iste, ve sadre u sebi i primjese drugih komponenti.

9.1 Trend komponenta


Trend komponenta nastaje pod uticajem sistematskih faktora, koji, na dui rok,
odreuju osnovni pravac razvoja posmatrane pojave. Prisustvo trend komponente esto se
moe uoiti na grafikonu vremenske serije, mada, grafiki prikaz ne prua uvijek sigurnu
garanciju o postojanju trenda. Naime, druge komponente vremenske serije predstavljaju
regularne i iregularne oscilacije oko osnovne tendencije, to zamagljuje vizuelni utisak o
njenom postojanju. Zbog toga je pouzdanije primijeniti neki od statistikih testova za
ispitivanje prisustva trend komponente. Jedan od takvih testova je test znaajnosti razlike
sredine.
Ako vremensku seriju podijelimo na dva dijela i svaki od njih smatramo uzorkom iz
skupa sa normalnim vrijednostima i jednakim varijansama, na osnovu statistike moemo
testirati hipotezu o jednakosti sredina. Ako se hipoteza odbaci, znai da su sredine razliite i
da postoji znaajna tendencija u seriji.
Ovaj test polazi od pretpostavke da varijansa ostaje nepromijenjena u vremenu, to
esto nije sluaj. ak i tada, kada ne postoji tendencija promjene varijanse, ovaj test je
pogodan samo kod serija sa monotonim trendom. Ako to nije sluaj, moe se dogoditi da
sredine dva izdvojena dijela serije budu bliske, i da test ne moe da ustanovi postojanje
trenda.
Prisustvo trend komponente moe se ispitati i pomou kriterijuma znakova koji je
objanjen ranije u knjizi. Za primjenu ovog kriterijuma vremensku seriju treba podijeliti na
dva jednaka dela i primjeniti proceduru iz pomenutog poglavlja. Ako serija ima neparan broj
lanova, jedan od njih, npr. prvi ili posljednji, treba iskljuiti iz testa. Ako se donese odluka o
odbacivanju nulte hipoteze, smatra se da je ustanovljeno postojanje trenda.
Iako je test znakova pogodan zbog jednostavnosti i zbog toga to ne postavlja uslove
koji se odnose na vrijednost osnovnog skupa, i on ima nedostataka. Slino kao i kod
prethodnog testa, u sluaju promjene smjera monotonije moe se desiti da brojevi pozitivnih i
negativnih razlika budu priblino isti i da test ne ustanovi prisustvo trenda.
Izdvajanje trend komponente iz vremenske serije esto se svodi na otklanjanje ili
priguivanje oscilacija oko trenda. Metode pomou kojih se to postie nazivaju se metode
izravnanja. Ovaj naziv potie od vizuelnog utiska da se primjenom ovih metoda serija glaa,
tj. izravnava. Postoji veliki broj metoda za izdvajanje trend komponente, od sasvim
jednostavnih, koje su heuristikog karaktera, do vrlo sloenih, koje se baziraju na vrstim
statistikim principima. Jedan od najjednostavnijih metoda je metod pokretnih prosjeka.

9.1.1 Metod pokretnih prosjeka


Ovaj metod se zasniva na ideji da se uprosjeavanjem uzastopnih lanova vremenske
serije odstranjuju sezonska i sluajna kolebanja oko osnovne tendencije vremenske serije.
Posmatrajmo vremensku seriju sa nivoima y1,y2,...,yn. Ako je m neparan broj (m<n),
pokretni prosjek duine m koji odgovara lanu yi definie se kao:

=
; i=k+1,...,n-k
gdje je k=(m-1)/2. Tako npr. pokretni prosjek duine 5, za neki lan vremenske serije yi,
predstavlja aritmetiku sredinu tog lana, dva prethodna i dva naredna lana. Jasno je da prva
dva i posljednja dva lana vremenske serije nemaju pokretne prosjeke duine 5.
Ako je m paran broj, pokretni prosjeci duine m za lan yi mogli bi se definisati kao

; i=k+1,...,n-k

ali i kao

=
; i=k+1,...,n-k
gdje je k=m/2. Umjesto bilo kog od ova dva pokretna prosjeka, kao pokretni prosjek koji
odgovara lanu yi uzima se njihova aritmetika sredina ( + )/2 pa je:

; i=k+1,...,n-k
Pokretni prosjeci tipa prethodnog tipa nazivaju se centrirani pokretni prosjeci, jer su
konstruisani tako da srednji lan pokretnog prosjeka bude ba vrijednost yi. Kao i kod
pokretnih prosjeka sa neparnom duinom, po k-lanova sa poetka i kraja serije nemaju
centrirane pokretne prosjeke.
to je duina pokretnog prosjeka vea, to se pomou njih, obino bolje otklanjaju
oscilacije oko trenda. To znai da za serije sa izraenijim kolebanjima oko osnovne
tendencije treba izabrati due pokretne prosjeke. Pri tome treba imati na umu da je duina
pokretnih prosjeka ograniena duinom serije, s obzirom na gubitak izvjesnog broja poetnih
i krajnjih pokretnih prosjeka. Ako su kolebanja oko trenda periodina, onda se ona najvie
priguuju pomou pokretnih prosjeka ija je duina priblino jednaka periodu kolebanja.
Primjer 9.1 Na osnovu podataka o otkupu jednog proizvoda u periodu od 1990. do
2005. godine, izraunati su pokretni prosjeci duine 3 i duine 4 (centrirani pokretni
prosjeci).
Za m=3 je k=1, pa je na osnovu prethodnih izraza:

; i=2,3,...,15

tj.

=23,7
=22,3
Za m=4 je k=2, pa je na osnovu prethodnih izraza:

; i=3,4,...,14
tj.

=22,6

=23
U sljedeoj tabeli dati su rezultati izraunavanja:
Godina
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005

Otkup
000t
22
26
23
18
25
30
28
25
27
32
31
27
28
35
33
30

Pokretni prosjeci
m=3
m=4

23,7

22,3
22,6
22,0
23,5
24,3
24,6
27,7
26,1
27,7
27,2
26,7
27,8
28,0
28,4
30,0
29,0
30,0
29.4
28,7
29,9
30,0
30,5
32,0
31,1
32,7

Na sljedeoj slici prikazane su originalne vrijednosti, i trogodinji i etvorogodinji


pokretni prosjeci. Vidi se da etvorogodinji centrirani prosjeci potpuno otklanjaju kolebanja
oko osnovne tendencije, to sugerie da je perioda kolebanja jednaka etiri.

9.2 Metod trenda


Za modeliranje trend komponente esto se koriste i matematike funkcije. Nivoi
vremenske serije posmatraju se kao funkcije vremena, pa se metodama regresione analize
ocjenjuje najbolje prilagoena linija. Ocjenjene regresione vrijednosti predstavljaju izdvojenu
trend komponentu, koja se, kao glatka kriva, moe smatrati izglaanom vremenskom serijom.
Osnovni problem koji se javlja kod ovakve analize vremenske serije jeste izbor
adekvatne matematike funkcije. Poto metod sam po sebi nije adaptivan, kao, recimo, metod
eksponencijalnog izravnjanja, subjektivan izbor u osnovi odreuje tendenciju. Da bi taj izbor
bio adekvatan, mora se poznavati priroda pojave koja je predstavljena vremenskom serijom.
Prilikom ocjenjivanja funkcije trenda, za uzorake vrijednosti za zavisno-promjenljivu
uzimaju se nivoi vremenske serije, a za nezavisno-promjenljivu vrijeme (mjeseci, godine i
sl.). Mi emo za vrijednosti nezavisno-promjenljive uzimati prirodne brojeve od 1 do n, gdje
je n - duina vremenske serije. Alternativna mogunost je da se za vrijednosti nezavisnopromjenljive uzmu cijeli brojevi, tj....,-2,-1,0,1,2,..., za seriju sa parnim brojem lanova. Pri
tome 0, odnosno -1 i 1, odgovaraju nivoima u sredini serije.
Kao to je reeno, za modeliranje trenda matematikim funkcijama koristi se
metodologija regresione analize. Treba naglasiti da kod vremenskih serija uzorake statistike
obino nemaju ista statistika svojstva kao kod regresione analize. Naime, pretpostavke o
normalnosti i nezavisnosti, u veini praktinih situacija nisu ispunjene. U skladu sa tim,
postoje razliite metode za provjeru valjanosti pretpostavki regresione analize kod
vremenskih serija, kao i alternativne metode kada te pretpostavke nisu ispunjene. Dalje e biti
rijei o nekim numerikim specifinostima modela trenda u odnosu na odgovarajue
regresione modele.

9.2.1 Linearni trend


Jednaina linearnog trenda ima oblik:
= a + bti; i=1,2,...,n
gdje su a i b ocjenjene vrijednosti koeficijenata dobijene metodom najmanjih kvadrata:

Rjeavanjem ovog sistema jednaina dobija se da je:

Pomou prve od prethodnih jednaina moe se izvriti ekstrapolacija, tj. prognoziranje


buduih vrijednosti.
Oznaimo sa
ocjenjenu vrijednost dobijenu na osnovu jednaine regresije
= a + bto
Vrijednost standardne greke prognoze Sp je:

gdje je vrijednost standardne greke

Se =
Na osnovu standardne greke 100(1-a)% interval povjerenja za buduu vrijednost je
,

gdje je ta/2;n kvantil t-vrijednosti za n = n-2 stepeni slobode.


S obzirom da su vrijednosti nezavisno-promjenljive prirodni brojevi od 1 do n, tj.
ti=i; i=1,2,...,n, lako se moe pokazati da je:

po sistemu jednaina sa prethodne stranice postaje:

Rjeavanjem ovog sistema jednaina dobija se da je:


b=

Oznaimo sa n+k period za koji treba izvriti prognozu, tj. t o=n+k, a


sa
ocjenjenu vrijednost dobijenu na osnovu jednaine trenda, tj.:
= a + b(n+k)
Ova vrijednost predstavlja prognozu za k-koraka od kraja vremenske serije.
Vrijednost standardne greke prognoze Sp, na osnovu prethodnog izraza je:

Kako je:

to je

pa je 100(1-a)% interval pouzdanosti za budue vrijednosti trenda:


sti. To
znai da sa udaljavanjem od kraja serije opada preciznost prognoze.

Primjer 9.2 Na osnovu podataka o broju traktora u naoj zemlji u periodu od 19992005. godine ocijeniti jednainu
linearnog trenda. Nai 95%-ne intervale za
broj traktora u 2006, 2007. i 2008. godini.
Godina Broj traktora
1999
595
2000
622
2001
706
2002
809
2003
882
2004
955
2005
1017
Ovdje je
i
1
2
3
4
5
6
7

yi
595
622
706
809
882
955
1017
5586

iyi
595
1244
2118
3236
4410
5730
7119
24452

b=

572,16
647,45
722,74
798,03
873,32
948,61
1023,90

521,6656
647,7025
280,2276
120,3409
75,5161
40,8321
47,6100
1733,8948

=75,28571
= 496,87312

Ocjenjena jednaina linearnog trenda je:


= 496,87 + 75,29i
a standardna greka je:

Se =
=
=18,62
a=0,5; n=n-2=7-2=5 ta/2;n=t0,025;5=2,57
2006: k=i; to=i=n+k=7+1=8;

= 496,87+75,298 = 1099,19
=

=18,621,31=24,39

1099,19-24,392,57<y8<1099,19+24,392,57
1036,51<y8<1161,87

2007: k=2;
= 1174,48; Sp=26,57
1106,20<y8<1242,76
2008: k=3;
=1249,77; Sp=29,02
1175,19<y10<1324,35

9.2.2 Kvadratni trend


Kvadratni trend je funkcija oblika:
= a + bti + c ; i=1,2,...,n
gdje su a, b i c koeficijenti ocjenjeni metodom najmanjih kvadrata:

Za ti=i; i=1,2,...,n je:

pa uzimajui u obzir sistem sa prethodne stranice, postaje:

Rjeavanjem ovog sistema dobija se da je:

Na osnovu jednaine trenda moe se izvriti prognoza za neki budui period n+k:
Korienjem prethodnih relacija u ovom poglavlju moe se pokazati da standardna
greka prognoze postaje:

gdje je:

a Se standardna greka trenda:

Ako je ta/2;n kvantil t-vrijednosti za n = n-3 stepeni slobode, onda je (1-a)100%-ni


interval pouzdanosti za prognoziranu vrijednost trenda dat sa:

Primjer 9.3 Na osnovu podataka o proizvodnji penice u vremenu od 1996. do 2006.


godine, iz sljedee tabele ocijeniti jednainu kvadratnog trenda i nai 95%-ni interval
pouzdanosti za proizvodnju u 2006. godini.
U radnoj tabeli data su neophodni podaci:
i
1
2
3
4
5
6
7
8
9
10

yi
20
26
24
27
30
28
26
21
18
25
245

iyi
20
52
72
108
150
168
182
168
162
250
1332

i2 yi
20
104
216
432
750
1008
1274
1344
1458
2500
9106

Dakle, ocjenjena jednaina kvadratnog trenda je:


a standardna greka:

2006: k=1; i=n+k=10+1=11;

21,79
23,95
25,51
26,47
26,83
26,59
25,75
24,31
22,27
19,63
-

3,2041
4,2025
2,2801
0,2809
10,0489
1,9881
0,0625
10,9561
18,2329
28,8369
80,0930

Za a=0,05 i n=n-3=10-3=7 je:


ta/2;n=t0,025;7=2,365

pa je 95%-ni interval pouzdanosti:

16,36-12,35<y11<16,36+12,35
4,01<y11<28,71

9.2.3 Eksponencijalni trend


Ocjenjeni eksponencijalni trend
; i=1,2,...,n
se, logaritmovanjem lijeve i desne strane, svodi na polulogaritamski oblik:

Ako se uvedu smjene:


;
relacija postaje:

; i=1,2,...,n
Koeficijenti a1 i b1 se dobijaju rjeavanjem sistema normalnih jednailna:

Za ti=i; i=1,2,...,n je:

Prognoziranje za model ve je opisano kod linearnog trenda.


Primjer 9.4 Izvoz jedne organizacije u periodu od 1990-1998. godine kretao se prema
sljedeim podacima:
Ocijeniti jednainu eksponencijalnog trenda i odrediti 95%-ni interval pouzdanosti za
izvoz u 1999. godini
Godina

Izvoz
000$

1990
1991
1992
1993
1994
1995
1996
1997

215
384
350
490
622
775
1020
1550

Ovdje je:
i
yi
1
215
2
384
3
350
4
490
5
622
6
775
7 1020
8 1550

wi=lnyi
5,37064
5,95064
5,85793
6,19441
6,43294
6,65286
6,92756
7,34601
50,73299

ilnyi
5,37064
11,90128
17,57379
24,77764
32,16470
39,91716
48,49292
58,76808
238,96621

5,45175
5,70600
5,96025
6,21450
6,46875
6,72300
6,97725
7,23150

0,00658 233,17
0,05985 300,66
0,01047 387,70
0,00040 499,94
0,00128 644,67
0,00492 831,29
0,00247 1071,94
0,01311 1382,26
0,09908

Ocjenjena jednaina je:


pa je:
;
odnosno, ocjenjena jednaina eksponencijalnog trenda:

Standardna greka ocjenjenog modela je:

1998: k=1; i=n+k=8+1=9;

=5,19750+0,254299=7,48575

Za a=0,05 i n=n-2=8-2=6 je:


ta/2;n=t0,025;6=2,447
pa je interval pouzdanosti:
7,08708<w8<7,88442
e7,08708< y8<e7,88442
1196,41< y8<2655,58

Osim pomenutih, u praktinim situacijama se primjenjuju i mnoge druge funkcije za


modeliranje trend komponente. Neke od njih se transformacijama svode na sluajeve linearne
po nepoznatim parametrima, koji se zatim ocjenjuju metodom najmanjih kvadrata. Kod nekih

to nije mogue, pa se za ocjenu parametara koriste razliite pribline metode koje dovode do
uzorakih statistika sa loim statistikim svojstvima[2].
Za modeliranje trenda esto se koriste krive sa asimptotama. Meu takve, iji se
parametri ne mogu ocijeniti linearnim metodom najmanjih kvadrata, spadaju i modifikovana
eksponencijalna, Gompercova i ligistika kriva.
9.3 Korelaciona zavisnost izmedju vremenskih serija
U praktinim zadacima esto se javlja potreba da se ispita jaina korelacione
zavisnosti izmeu dva obiljeja, koja su predstavljena vremenskim serijama. Stvarna
saglasnost varijacija ovih obiljeja moe biti uveana ili umanjena uticajem trend
komponente. U takvim situacijama, ocjenjena vrijednost koeficijenta korelacije daje pogrenu
predstavu o jaini korelacione veze. Da se ovo ne bi dogodilo prije ispitivanja korelacione
zavisnosti, mora se iskljuiti uticaj trenda iz posmatranih vremenskih serija.
Neka su y1i i y2i; i=1,2,...,n nivoi vremenskih serija a i
; i=1,2,...,n ocjenjene
vrijednosti njihovih trend komponenti. U sluaju aditivnog modela otklanjanjem trenda
dobijaju

se

nivoi

i
i

multiplikativnog,

i=1,2,...,n,

sluaju

; i=1,2,...,n. Dalje se korelaciona zavisnost izmeu

obiljeja ispituje sa vrijednostima


i ; i=1,2,...,n. ovakvu proceduru treba primijeniti i u
sluaju viestruke korelacione zavisnosti.
Primjer 9.5 Broj traktora na drutvenim i individualnim
gazdinstvima u naoj zemlji u periodu od 1991. do 1997. godine
kretao se prema podacima datim u tabeli.
Ispitati stepen korelacione zavisnosti ova dva obiljeja.
Zanemarujui, za trenutak, trend komponentu u obe serije,
izraunajmo koeficijent korelacije. U radnoj tabeli data su
neophodna izraunavanja:
y1i
27
28
30
31
32
32
32
212

y2i
568
594
676
778
850
923
985
5374

Drustv.

Godina sektor
1991
27
1992
28
1993
30
1994
31
1995
32
1996
32
1997
32

y1i y2i
729
784
900
961
1024
1024
1024
6446

322624
352836
456976
605284
722500
851929
970225
4282374

15336
16632
20280
24118
27200
29536
31520
164622

Indiv.
sektor

568
594
676
778
850
923
985

Ovako visok stepen korelacione zavisnosti vjerovatno je uslovljen uticajem trenda na


oba obiljeja.Zbog toga bi trebalo u obe serije otkloniti trend komponentu.
Za broj traktora u drutvenom sektoru ocjenjena je funkcija trenda

=26,71+0,891,

=470,14+74,391; i=1,2,...,n. Originalni podaci,


a za broj traktora u individualnom sektoru
trend komponenta i rezidualna komponenta (iskazana procentualno kao to je uobiajeno) za
multiplikativni model, prikazani su u tabeli.
y1i
27
28
30
31
32
32
32

9570,71
9658,96
10426,45
10487,81
10547,29
9968,03
9438,12
70097,37

10880,58
9210,24
9506,25
10269,80
10188,88
10142,50
9980,36
70078,61

y2i
27,60
28,49
29,38
30,27
31,16
32,05
32,94

97,83
98,28
102,11
102,41
102,70
99,84
97,15
700,32

568
594
676
778
850
323
985

544,53
618,92
693,31
767,70
842,09
916,48
990,87

104,31
95,97
97,50
101,34
100,94
100,71
99,40
700,17

10204,65
9431,93
9955,72
10378,23
10366,54
10054,89
9656,71
70048,67

Odavde se vidi da je korelaciona zavisnost posmatranih obiljeja veoma slaba.

9.4 Sezonska komponenta


Kod mjesenih ili kvartalnih vremenskih serija, razliitih pojava, esto se mogu uoiti
kolebanja koja se periodino ponavljaju iz godine u godinu. Ova kolebanja nastaju kao
rezultat uticaja sezone i predstavljaju sezonsku komponentu vremenske serije. Sezonski uticaj
je prisutan kod mnogih pojava u poljoprivredi. Tako, napr., skoro sve aktivnosti u biljnoj
proizvodnji imaju stabilan sezonski karakter. Potronja sjemenskog materijala, sredstava za
zatitu, mineralnih gnojiva, goriva i maziva za mehanizaciju, takoe. Prerada i potronja
velikog broja prehrambenih artikala izloene su znaajnom uticaju sezone.
Poznavanje sezonske komponente veoma je znaajno u zadacima planiranja
proizvodnje (repromaterijal, radna snaga, maine) i realizacije (ponuda, tranja, cijene).
Ponekad postoji potreba da se ona otkloni ili prigui zbog ravnomjernijeg korienja resursa i
ujednaavanja toka proizvodnih procesa. Zbog toga je poznavanje sezonske komponente
vano, barem onoliko koliko i poznavanje trend komponente.
Postoji vie razliitih metoda za analizu sezonske komponente. Dalje emo razmatrati
neke od njih.
9.4.1 Metod sezonskih indeksa
Intenzitet sezonske komponente najee se izraava pomou sezonskih indeksa.
Sezonski indeksi mogu biti specifini i tipini. Specifini sezonski indeksi izraavaju
intenzitet sezonske komponente u svakoj sezoni jedne godine, dok tipini izraavaju
intenzitet sezonske komponente u svakoj sezoni za vie godina zajedno.
Da bi se sezonski indeksi mogli izraunati, potrebno je prethodno otkloniti trend
komponentu. Za kvartalne podatke trend komponenta se izraunava pomou centriranih
pokretnih prosjeka duine etriri, a za mjesene pomou centriranih pokretnih prosjeka
duine 12. Polazei od multiplikativnog modela vremenske serije, dijeljenjem nivoa sa
izraunatim pokretnim prosjecima dobijaju se specifini sezonski indeksi. Ukoliko ovi
indeksi pokazuju stabilnost iz godine u godinu, njihovim uprosjeavanjem po sezonama
dobijaju se tipini sezonski indeksi za svaku sezonu. Naime, uprosjeavanjem se vri
otklanjanje sluajne komponente iz specifinih indeksa.
Osim pomou pokretnih prosjeka, trend komponenta se moe otkloniti i pomou neke
od funkcija trenda. U tom sluaju, za dobijanje specifinih sezonskih indeksa, nivoi
vremenske serije se dijele sa vrijednostima koje su ocjenjene pomou jednaine trenda.
Ako specifini sezonski indeksi po sezonama pokazuju linearnu tendenciju iz godine
u godinu, treba ocijeniti linearne trendove za sve sezone. Pomou njih se moe izvriti
interpolacija i ekstrapolacija sezonske komponente.
Prognozirana vrijednost pojave moe se dobiti tako to se ekstrapolirana vrijednost
mnoi sa tipinim ili ekstrapoliranim sezonskim indeksom za odgovarajuu sezonu.

Primjer 9.6 Na osnovu podataka o proizvodnji jaja po kvartalima u periodu od 2000 2005. godine, izraunati sezonske indekse i izvriti prognozu za 2006. godinu.

Proizvodnja jaja '000 komada


I
II
III
IV
30
38
33
28
34
41
37
31
36
48
42
35
42
51
47
36
45
58
55
40
4B
65
60
46

Godina
2000
2001
2002
2003
2004
2005

Za izdvajanje trend komponente koriste se centrirani pokretni prosjeci duine 4, tj.:

Izraunati pokretni prosjeci prikazani su u sljedeoj tabeli:


CENTRIRANI POKRETNI PROSJECI

m=4

GODINA

2000
2001
2002
2003
2004
2005
Dijeljenjem nivoa serije
sezonski indeksi:

I
II
III
IV
_
_
32,75
33,62
34,50
35,38
36,00
37,12
38,62
39,75
41,00
42,12
43,12
43,88
44,38
45,62
47,50
49,00
49,88
51,12
52,62
54,00
odgovarajuim pokretnim prosjecima, dobijaju se specifini

GODINA

2000
2001
2002
2003
2004
2005
TIPINI
SEZONSKI
INDEKSI

SPECIFINI SEZONSKI INDEKSI

0,99
0,93
0,37
0,35
0,91

II

1,16
1,21
1,16
1,18
1,20

III
1,01
1,03
1,02
1,06
1,10

IV
0,83
0,84
0,63
0,79
0,78

0,95

1,182

1,044

0,814

Oigledno je da specifini sezonski indeksi ne pokazuju stabilnost, jer u prvom i


etvrtom kvartalu imaju opadajuu, a u drugom i treem rastuu tendenciju. Zbog toga je
bolje, umjesto njihovog uprosjeavanja po kvartalima, ocijeniti linearni trend za svaki
kvartal.

Ocjenjene funkcije su:


= 0,992 0,014i
= 1,167 + 0,005i
= 0,981 + 0,021i
= 0,859 0,015i
Iz svake od ovih jednaina za i=3 mogu se dobiti tipini indeksi koji su prikazani u
gornjoj tabeli.
Za prognoziranje proizvodnje u 2006. godini, na osnovu originalnih podataka
ocjenjena je jednaina linearnog trenda:
=29,51+1,06i.
Ekstrapolirane vrijednosti trenda za 2006. godinu dobijaju se kada se u jednaini
linearnog trenda zamijene vrijednosti: i=25; 26; 27 i 28 (ovdje je n=24, a k=1,2,3 i 4):
= 29,51 + 1,0625 = 56,01
= 29,51 + 1,0626 = 57,07
= 29,51 + 1,0627 = 58,13
= 29,51 + 1,0628 = 59,19
Oekivane kvartalne indekse dobiemo za 2006. godinu ekstrapolacijom kvartalnih
trendova za i=6 (ovdje je n=5, a k=1 za sve etiri ocjenjene linije trenda.
= 0,992 0,0146 = 0,908
= 1,167 + 0,0056 = 1,197
= 0,981 + 0,0216 = 1,107
= 0,859 0,0156 = 0,769
S obzirom da se pretpostavlja multiplikativnost modela, prognozirane vrijednosti
proizvodnje jaja dobijaju se mnoenjem ekstrapoliranih vrijednosti opteg trenda i kvartalnih
trendova. Bie:
= 56,010,908 = 50,86
= 57,071,197 = 68,31
= 58,131,107 = 64,35
= 59,190,769 = 45,51

DODATAK TABLICE

You might also like