Professional Documents
Culture Documents
Statistika Djuro Mikulic
Statistika Djuro Mikulic
Dr Neboja Ralevi
BANJA LUKA
EDICIJA:
SADRAJ
1. UVOD ............................................................................................................................8
1.1 POJAM, DEFINISANJE I RAZVOJ STATISTIKE I STATISTIKE DJELATNOSTI
1.2 PREDMET, CILJ, ZADACI I METODI STATISTIKOG ISTRAIVANJA
1.3 KOMPJUTERSKI PRILAZ - PROGRAMSKA PODRKA
1.3.1 Izbor i vrednovanje programskih statistikih paketa
1.4 OSNOVNI STATISTIKI POJMOVI I KATEGORIJE
1.4.1 Statistiki skup
1.4.2 Statistika obiljeja
1.4.3 Statistike jedinice
1.4.4 Varijacija
2. PRISTUP STATISTIKOM ISTRAIVANJU
2.1 STATISTIKO POSMATRANJE I PRIKUPLJANJE PODATAKA
2.1.1 Cilj, predmet, jedinica i obiljeja posmatranja i prikupljanja
2.1.2 Izvori prikupljanja podataka
2.1.3 Naini prikupljanja podataka
2.1.4 Obim i oblik (metode) obuhvatanja jedinica posmatranja
2.1.5 Sredstva prikupljanja podataka
2.1.6 Kontrola i provjera podataka
2.2 GRUPISANJE I SREIVANJE PODATAKA
2.2.1 Statistike serije
2.2.1.1 Numerike serije strukture
2.2.1.2 Atributivne serije struktur
2.2.1.3 Vremenske serije
2.2.1.4 Prostorne serije
2.3 PRIKAZIVANJE STATISTIKIH PODATAKA
2.3.1 Tabelarno prikazivanje (statistike tabele)
2.3.2 GRAFIKO PRIKAZIVANJE
2.3.2.1 Linijski dijagrami
2.3.2.2 Povrinski dijagrami
2.4 DESKRIPTIVNE MJERE STATISTIKE ANALIZE
2.4.1 Srednje vrijednosti (mjere centralne tendencije)
2.4.2 Izraunate srednje vrijednosti sredine
2.4.2.1 Aritmetika sredina
2.4.2.2 Harmonijska sredina
2.4.2.3 Geometrijska sredina
2.4.3. Pozicione vrijednosti
2.4.3.1 Modus (Mo)
2.4.3.2 Medijana (Me)
2.5 MJERE VARIJABILITETA (DISPERZIJE)
2.5.1 Apsolutne mjere varijabiliteta
2.5.1.1 Interval varijacije
2.5.1.2. Srednje apsolutno odstupanje
2.5.1.3 Varijansa (
)
2.5.1.4 Standardna devijacija ( )
2.5.2 Relativne mjere varijabiliteta
2.5.2.1 Koeficijent varijacije
2.5.2.2 Normalizovano (standardno) odstupanje
2.5.2.3 Mjere oblika rasporeda
132
7. REGRESIJA I KORELACIJA
7.1 POJAM KORELACIONE ZAVISNOSTI
7.2 PROSTA LINEARNA REGRESIJA
7.2.1 Jednaina regresije
7.2.2 Testiranje znaajnosti regresionih koeficijenata
7.2.3 Analiza varijanse
232
7.2.4 Interpolacija i ekstrapolacija
7.3 KOEFICIJENT KORELACIJE
7.3.1 Testiranje znaajnosti koeficijenta korelacije
7.4 VIESTRUKA REGRESIJA I KORELACIJA
7.4.1 Linearna regresija sa dvije nezavisno-promjenljive
7.4.1.1 Analiza varijanse
7.4.1.2 Interpolacija i ekstrapolacija
7.4.2 Viestruka korelacija
7.5 KRIVOLINIJSKA REGRESIJA I KORELACIJA
7.5.1 Prosta kvadratna regresija i korelacija
8. RELATIVNI BROJEVI
8. 1 INDEKSI
8.1.1 Individualni indeksi
8.1.2 Grupni indeksi
8.1.3 Testiranje indeksa
8.2 EKONOMSKI POKAZATELJI DINAMIKE
8.3 STATISTIKA ANALIZA DINAMIKE PRODUKTIVNOSTI
8.3.1 Mjerenje produktivnosti
8.3.2 Individualni indeks produktivnosti
8.3.3 Grupni indeks produktivnosti
8.4 STATISTIKA ANALIZA DINAMIKE ZARADA
8.4.1 Indeksi zarada
9. ANALIZA VREMENSKIH SERIJA
9.1 TREND KOMPONENTA
9.1.1 METOD POKRETNIH PROSJEKA
9.2 METOD TRENDA
9.2.1 Linearni trend
9.2.2 Kvadratni trend
9.2.3 Eksponencijalni trend
9.3 KORELACIONA ZAVISNOST IZMEDJU VREMENSKIH SERIJA
9.4 SEZONSKA KOMPONENTA
9.4.1 Metod sezonskih indeksa
DODATAK TABLICE .....................................................................................................
LITERATURA ..................................................................................................365
339
1. UVOD
1.1 Pojam, definisanje i razvoj statistike i statistike djelatnosti
Izuavanje fenomena varijacije i primjena naunih rezultata u cilju stvaranja
upravljakih informacija na zadacima odluivanja, uslovili su potrebu sistemskog pristupa u
afirmaciji pojedinih naunih disciplina. Sistemski pristup posmatranja masovnih pojava sa
aspekta otkrivanja njihove zakonomjernosti ponaanja, pretpostavlja kombinaciju empirije
sa matematikom teorijom algoritama i modela. U sutini to je pragmatian prilaz koji
pripada klasi sistemskih disciplina, meu kojima je nala put za afirmaciju i statistika. Rije
"statistika" prvi put je upotrijebljena u prvoj polovini 18. vijeka u radovima Gotfrida
Ahenvala na univerzitetu u Getingenu. Smatrao je da taj naziv preuzima od latinske rijei
"status" to znai stanje. Kao porijeklo rijei statistika navodi se takoe italijanska rije
"stato" to znai drava.
Statistika kao nauni metod kvantitativnog i kvalitativnog istraivanja varijacija
obiljeja statistikih jedinica masovnih pojava ima znaaj, kako u matematici, saobraaju,
tehnici, sociologiji itd, tako i u ekonomiji. Novi trini uslovi u modernoj ekonomiji
zahtijevaju stalno prikupljanje, ureivanje, grupisanje, obradu i tumaenje dobijenih
rezultata s ciljem donoenja kvalitetnih poslovnih odluka. Prvi poslovi statistike djelatnosti
odnosili su se na prebrojavanje i popis stanovnitva i imovine, registraciju roenih,
vjenanih i umrlih, popis vojnika, poreskih obaveznika itd, jer su vladari htjeli da znaju
demografsku i ekonomsku mo svoje drave. Uvoenjem rauna vjerovatnoe statistika
dobija u punoj mjeri sadrinu, jer mnotvo pojava koje su predmet statistikog istraivanja,
odlikuju se elementima sluajnosti i neizvjesnosti, gdje teorija vjerovatnoe nalazi svoju
punu primjenu.
Statistika istraivanja odnose se samo na mjerljive elemente, jer mjerenjem,
registracijom, popisom i prebrojavanjem odreenih injenica, statistika kvantitativno
obuhvata obim posmatrane pojave. Istie njen znaaj i vri kvantitativno istraivanje uz date
teorijske pretpostavke i naznake o postojanju odreene pravilnosti u pogledu njenog
ponaanja. Tako npr. statistikom analizom moe se utvrditi podudarnost u varijabilitetu
dviju ili vie pojava, ali to nije dokaz meusobne zavisnosti jer moe biti i koincidencija
dogaaja. Statistika analiza je skup metoda i tehnika kvantitativne analize masovnih pojava i
dogaaja koji se deavaju u sloenim dinamikim sistemima kao to su socio-ekonomski,
bioloki, proizvodni itd. Zadatak statistike je dobijanje relevantne informacije iz raspoloive
baze podataka sa unaprijed odreenom vjerovatnoom pouzdanosti, odnosno rizika
pogrenog zakljuivanja.
Statistiki metod razlikuje se od ostalih kvantitativnih metoda jer je prilagoen za
istraivanje varijabiliteta kao opteg svojstva pojava. Varijabilitet u neorganskom svijetu ne
moe se primijetiti jer se posmatra velika masa atoma i tako uoava samo ono to je opte.
Varijabilitet u organskom svijetu je uoljiv, ali poto se posmatra velika masa elija, dobija se
predstava monotone ujednaenosti. Varijabilitet je naroito prisutan i intenzivan u okviru
drutveno-ekonomskih procesa, gdje se posmatraju jedinke i njihovo pojedinano ponaanje.
Razvoj metoda i tehnika statistikog posmatranja masovnih pojava generisani su
upravljakim zadacima i potrebama njihovog konkretnog rjeavanja, naroito u toku
posljednjih pedeset godina. Meutim, prvi pisani tragovi statistike prakse, koja je krila put
statistikoj teoriji, pojavili su se oko 3000. god. p.n.e. u Kini i Egiptu, tada najrazvijenijim
dravama svijeta, a odnosili su se na popise stanovnitva i imovine. Statistika kao nauna
disciplina nastajala je istovremeno u Njemakoj i Engleskoj u 17. vijeku, kada se javljaju
dvije koncepcije: njemaka univerzitetska statistika, inspirisana radovima G. Ahenvala
(sistematizacija podataka o stanovnitvu i privredi) i engleska politika aritmetika koja je
isticala zahtjev za matematikom obradom statistikih podataka u cilju otkrivanja zakonitosti
u ponaanju posmatrane pojave.
Statistika teorija se naglo razvila u 18. vijeku zahvaljujui razvoju teorije
vjerovatnoe kao grane matematike analize. Znaajan korak u razvoju statistike u 19. vijeku
napravio je belgijski fiziar i astronom F. Ketle uvoenjem teorije vjerovatnoe, a daljem
razvoju statistike misli doprinijeli su Gaus, Poasan, Pirson, Markov, ebiov i drugi. Bri
napredak i iru primjenu statistike tokom 20. vijeka omoguio je razvoj raunarske
tehnologije i softverskih kapaciteta. Raunari velikom brzinom prihvataju, obrauju i emituju
blokove informacija koji se telekomunikacijama dostavljaju do mjesta korienja, inei tako
bazu informatike infrastrukture. Ekspanzija informacija postavlja pred statistiku nove i sve
brojnije zahtjeve, ali istovremeno prua sve ire mogunosti za primjenu sloenih analitikih
metoda kao i provjeru njihovih teorijskih rezultata. Danas se pomou statistikih metoda vre
ocjene, odmjeravaju rizici, ispituju tendencije, analiziraju odnosi i faktori koji ih odreuju,
testiraju odreene hipoteze, itd.
Postoji itav niz pokuaja definisanja statistike, to pokazuje da je ona relativno mlada
nauka. Uvaavajui sve znaajne elemente koji predstavljaju osnov za definisanje statistike
moe se kritiki prihvatiti sljedea definicija: "Statistika je nauka o varijacijama obiljeja,
zakonitostima razvoja i odnosa masovnih pojava i njihovih elemenata u vremenu i
prostoru".
1.2 Predmet, cilj, zadaci i metodi statistikog istraivanja
Statistika djelatnost u svojim rudimentarnim oblicima bila je predmetno vezana za
masovne pojave, to znai da je u svom istorijskom razvoju nastala iz potreba prakse da se
varijabilne pojave posmatraju na velikom broju. Masovne pojave nisu samo predmet
statistikog istraivanja, ve predmet prouavanja tehnikih, drutvenih i drugih nauka, to
znai da je statistika samo komplementarna nauna disciplina. Kako je statistika jasno
odreena po svojim zadacima i ulozi u sklopu ostalih nauka, proizlazi da je njen predmet
istraivanja varijacija obiljeja jedinica posmatrane cjelokupnosti. Varijacija predstavlja
specifian oblik kretanja koje se ispoljava u raznim oblicima, u zavisnosti od vrste obiljeja
koje je nosilac te varijacije, odnosno jedinice koja je nosilac tog obiljeja.
Istraivanje masovnih pojava se zasniva na masovnosti i varijabilitetu, kao optim
svojstvima svih pojava, ije ponaanje nastaje i zavisi od kombinacije niza faktora koji su i
sami varijabilni. Najmanji varijabilitet individualnih sluajeva ispoljavaju elementarne pojave
u prirodi, pa se kod njih uspjeno moe primijeniti metod pojedinanog posmatranja
upotrebom klasinog eksperimentalnog rada. Sistemsko mijenjanje uticaja faktora, koji svoj
varijabilitet prenose na pojavu, zasnovano je na principima formalne logike, tako da statistika
koristi indukciju, dedukciju, analizu, sintezu, analogiju, reprezentativnost, grafiku itd, kao
metode istraivanja.
Kod pojava koje ispoljavaju vei varijabilitet ispitivanje jednog ili malog broja
sluajeva i generalizacija rezultata ne bi donosilo pouzdane zakljuke. Posmatranje ponaanja
ovih pojava u pogledu varijabiliteta na malom broju sluajeva izgleda bez reda i pravilnosti,
skoro haotino i sluajno. Prava predstava stie se posmatranjem veeg broja sluajeva, jer
tada dolaze do izraaja odreene pravilnosti i periodika zakonitosti koje autentino
odraavaju karakteristike pojave. Dakle, zadatak primjene statistikih metoda je da omogui
otkrivanje optih karakteristika varijabilnih pojava kao i njihove pravilnosti i tendencije koje
nazivamo statistikim zakonitostima. Ilustrativnu statistiku zakonitost zabiljeio je statistiar
Levi posmatranjem i obuhvatanjem velikog broja poroaja. Proirujui svoje posmatranje na
100 miliona dogaaja, konstatovao je stabilan sljedei odnos: na 81 sluaj raanja jedinki
dolazi 1 sluaj raanja dvojki; na 84 sluaja raanja dvojki dolazi 1 sluaj raanja trojki; na
85 sluajeva raanja trojki dolazi 1 sluaj raanja etvorki i na 85 sluajeva raanja etvorki
dolazi 1 sluaj raanja petorki. Dakle, zadatak statistike je da istrauje te pravilnosti i
varijacije, polazei od velikog broja sluajeva koje posmatra, uporeuje, grupie, opisuje,
obrauje, analizira i praktino provjerava kroz masovnost i varijabilitet.
Predmet statistike analize je kvantitativna analiza masovnih pojava kao skupova koji
se posmatraju sa aspekta teorije sistema sloene organizovane globalne koncepcije. U ovakve
sloene organizovane sisteme ubrajamo: privredu zemlje - skup privrednih preduzea;
zdravstvo - skup zdravstvenih institucija; stanovnitvo - svi graani jedne zemlje, itd. Ako ih
uzmemo kao predmet statistikog posmatranja, postaju osnovni statistiki skup ili populacija.
Cilj statistike analize je da se na osnovu podataka o promjenama obiljeja na
elementima statistikog skupa doe do pouzdanih informacija potrebnih za upravljanje
sloenim dinamikim sistemima. U ovim sistemima se pod uticajem sklopa unutranjih i
spoljnih faktora odvijaju izvjesne promjene preko kojih se tumai njihovo kretanje, otkrivaju
unutranje veze, kako izmeu elemenata tako i sa drugim sistemima iz okruenja i predvia
njihovo ponaanje u budunosti. U rjeavanju praktinih zadataka koristimo ograniene
empirijske podatke, tako da rezultati obrade i statistike ocjene nose u sebi element
stohastinosti. Uveanjem broja jedinica posmatranja kao i broja eksperimenata, izvedena
statistika ocjena na nivou osnovnog skupa postaje pouzdanija.
1.3 Kompjuterski prilaz - programska podrka
Programska podrka statistike obrade podataka sastoji se iz odreenog paketa
programa, kao niza logiki povezanih instrukcija, za rjeavanje odreenog zadatka. Sistemski
program, koji se stalno nalazi u operativnoj memoriji raunara, omoguava korisniku da
izvri svoje praktine aplikativne programe. Znai, programska podrka podrazumijeva
izradu i eksploataciju sopstvenih aplikativnih programa koji se obino piu na nekom od
programskih jezika prilagoenih konkretnom problemu. Takoe, postoji veliki broj gotovih
paketa statistikih programa, a u zavisnosti od sloenosti zadatka pojedini programi mogu da
sadre i potprograme, s tim to odreeni broj potprograma pojedinano korespondira s
osnovnim upravljakim programom. Ovakvi programi su univerzalni tj. mogu da se koriste za
rjeavanje ireg spektra zadataka. Problem razliitih n podataka lako se moe prikazati kao
statistiki niz od n nivoa, gdje je "n" ulazna konstanta koju korisnik unaprijed zadaje, ili se do
nje dolazi prebrojavanjem preko raunara. Za rjeavanje standardnih zadataka koriste se
softverski kapaciteti koji ine programski paket, a neki od znaajnijih paketa statistikih
programa su sljedei:
STATISTICA moan paket namijenjen statistikoj analizi sa veoma razvijenim
grafikim interfejsom
SPSS statistiki paket namijenjen analizi podataka iz oblasti drutvenih pojava,
razumljivost za korisnika,
statistika efektivnost i
podobnost za eksploataciju.
Znai, jedinice koje ga ine moraju biti istovrsne, a razlike mogu da pokazuju samo u
pogledu ispitivanih osobina, tj. statistiki skup je relativno homogen ali i diferenciran s
obzirom na odabrana svojstva iji se varijabilitet ispituje. Statistiki skup mora biti odreen
sutinski, prostorno, vremenski i pojmovno. Svojstva po kojima se jedinice posmatranog
statistikog skupa meusobno razlikuju, nazivaju se statistikim obiljejima, a njihovi
pojavni oblici - modalitetima.
1.4.2 Statistika obiljeja
Svojstva po kojima se razlikuju ili su sline statistike jedinice osnovnog statistikog
skupa predstavljaju njihova obiljeja koje ih oznaavaju (obiljeavaju).. Statistike jedinice
mogu imati vei broj obiljeja koja variraju, a promjene obiljeja predstavljaju varijaciju kao
predmet statistikog istraivanja. Sve mogue varijante ili potklase svojstva jednog obiljeja
koje se mogu jasno uoiti i rasporediti nazivamo modalitetima tog obiljeja. Npr. ako
posmatramo boju kao obiljeje, njeni modaliteti su crna, bijela, plava itd.
Postoji vie principa i ema podjele obiljeja, a na osnovu logike njihove prirodne
diferencijacije, proizilazi sljedea podjela:
1. Obiljeja prema sadrini:
Numerika - izraavaju se brojem (cifrom), a razlikujemo:
kontinuelna - mogu uzimati cijele i razlomljene vrijednosti
diskontinuelna - mogu uzimati samo cjelobrojne vrijednosti
Atributivna - izraavaju se rijeima (opisno)
Stalna - karakteriu nepromjenljivo stanje
Promjenljiva - karakteriu promjenljivo stanje
Faktorijalna - karakteriu faktore bitne za nastajanje pojave
Rezultativna - karakteriu konaan rezultat dejstva faktorijalnih
2. Obiljeja prema tipu:
obiljeja jedinica posmatranja statistikog skupa. Ovo mjerenje ima za rezultat dodjeljivanje
odgovarajueg broja, simbola, znaka, klase ili kategorije, odgovarajuem stanju osobine
statistike jedinice.
Empirijskim podacima mogu se oznaavati klase ili kategorije ili izraavati odreene
algebarske veliine, s tim to se u prvom sluaju ne mogu primjenjivati algebarske operacije,
dok je u drugom sluaju aritmetika dozvoljena. Jedinice, kao i skale mjerenja i vrednovanja,
mogu biti sasvim razliite. Razlikuju se etiri vrste mjernih skala i to: nominalna skala, skala
poretka, intervalna skala i skala odnosa.
Posmatrana obiljeja, na bazi ijeg varijabiliteta nastaju numeriki podaci, mogu biti
(diskretna) prekidna i (kontinuelna) neprekidna. U tom smislu identifikacione oznake i
oznake poretka uvijek su diskretne veliine, a intervalne oznake i oznake odnosa mogu biti i
diskretne i kontinuelne. Danas postoje brojni i raznovrsni metodi i tehnika sredstva koja nam
omoguavaju brza izraunavanja i izvoenje raznih aritmetikih operacija u realizaciji veih
statistikih akcija. Ovo podrazumijeva ukljuivanje savremene raunarske tehnike velike
memorije i brzine raunanja sa razliitim mogunostima predstavljanja izlaznih informacija.
Znai, svako konkretno statistiko istraivanje pojave, procesa ili dogaaja transferira se u
nizove empirijskih podataka, ureene prema zadanim kriterijumima, koje nazivano
empirijskim distribucijama, odnosno statistikim serijama.
1.4.3 Statistike jedinice
Elementi osnovnog statistikog skupa koji imaju bar jedno zajedniko obiljeje, koje
ih meusobno razlikuje ili izjednaava, nazivaju se statistike jedinice. Statistikim
jedinicama se vri mjerenje i iskazivanje obima, karakteristika i strukture posmatrane pojave.
Statistike jedinice su varijabilne (promjenljive) veliine, jer statistika istrauje mnotvo
razliitih pojava, tako da se njihov pojam ne moe shvatiti statino. Upravo u nejednakosti
statistikih jedinica u odreenom periodu ispoljavaju se varijacije njihovih obiljeja.
Varijaciju, kao specifian oblik kretanja, statistika prati sa tri osnovne vrste jedinica:
1.4.4 Varijacija
Varijacija kao specifian oblik kretanja se ispoljava u vidu promjena veliine ili
znaaja obiljeja statistikih jedinica. Do konkretnog pojma varijacije dolazimo
uporeivanjem podataka o veliini ili znaaju nekog obiljeja u vremenu ili prostoru za jednu
jedinicu ili za vie jedinica u posmatranom trenutku. Rezultat uporeivanja moe da se
posmatra kao razlika dva uzastopna stanja istog obiljeja - varijacija kao razlika i kao odnos
dva uzastopna stanja - varijacija kao kolinik.
Varijaciju kao razliku iskazujemo u aritmetikom obliku to znai da nas interesuje
njen predznak, a ne samo apsolutna vrijednost. Ako stanja o veliini nekog posmatranog
obiljeja tokom vie uzastopnih mjerenja oznaimo: N1, N2, N3...Ni (za i=1,2,3...n) tada e
varijacija kao razlika izraavati sljedea odstojanja:
gdje je
:
- sadanje stanje
- poetno stanje
- zbir svih pozitivnih i negativnih varijacija u
posmatranom periodu
- broj perioda
Koristei navedene jednaine mogue je prognozirati neko budue oekivano stanje
na osnovu vrste, obima i karaktera promjena koje predviamo.
Varijacija kao kolinik izraava odnos dva uzastopna stanja posmatranog obiljeja
statistikih jedinica, dajui ire mogunosti da se sagledaju kvalitativne karakteristike
I varijacija kao kolinik moe imati tri pojavna stanja, s tim to se ne moe kretati u zoni
negativnih vrijednosti:
Numerike serije
Atributivne serije strukture
Vremenske serije
Prostorne (geografske) serije, itd.
.
.
xn
b) Neintervalna numerika serija distribucije frekvencija (serija grupisanih podataka)
Opti prikaz:
Obiljeje
(Xi)
Frekvencije
.
.
.
.
.
.
i)
Ukupno:
Konkretan primjer:
Obiljeje
(Xi)
1
2
3
4
5
6
7
8
9
10
Ukupno:
Frekvencije
(fi)
2
3
5
7
9
11
8
6
4
1
56
K=1+3,32logN;
gdje je :
H - irina intervala
N - ukupan broj podataka
Frekvencije (i)
(c2 - c3)
.
.
.
.
.
.
(ci - ci+1)
.
.
.
.
.
.
(ck - ck+1)
Ukupno:
Starosne grupe
(Xi)
(obiljeje)
do
4
Apsolutne
frekvencije (fi)
Kumulanta
frekvencija
(rastua)
4 - 8
8 - 12
.
72 - 76
.
72 - 76
+
(
)+
.
+...+
76 i vie
Ukupno:
Primjer 2.1 Odrediti veliinu i broj grupa za 100 podataka koji variraju od 50 do
121,5.
Primjer 2.2
a) Prave granice
Godine
starosti (Xi)
do 18
18 - 24
24 - 39
39 - 49
49 i vie
Ukupno:
Broj
zaposlenih(fi)
65
70
90
50
45
320
b) Nominalne granice
Povrina
u km2 (Xi)
do 49
50 - 99
100 - 199
200 - 299
300 - 399
400 - 499
500 - 599
600 i vie
Ukupno:
Broj
optina(fi)
8
10
15
20
15
12
11
9
98
Broj
preduzea(fi)
5
6
9
7
3
30
Osnovni statistiki niz predstavlja polazni statistiki materijal koji se formira tako to
se iz razraene statistike dokumentacije preuzmu raspoloivi podaci o jednom obiljeju kao
izvorna obavjetenja.
Ralanjivanjem statistikih podataka prema atributivnom obiljeju i njegovim
modalitetima, nastaju atributivne grupe ijim se redanjem prema odreenom kriteriju
formiraju atributivne serije.
Neintervalna serija distribucije frekvencija se uvijek izraava u obliku dva niza
informacija, gdje prvi niz ine informacije o modalitetima obiljeja poredane po odreenom
redoslijedu, a drugi se uvijek izraava numeriki i oznaava ukupan broj jedinica posmatranja
pripadajuih odgovarajuim modalitetima.
Atributivne serije strukture: opti prikaz
Broj uenika (fi)
(C)
Vrlodobar
(U)
Dobar
(Z)
Dovoljan
(u)
Nedovolja
(j)
Ukupno:
Broj stanovnika
(u mil.)
12
13
15
16
45
-
Proizvodnja uglja
( u 000 t)
22
25
30
20
15
18
12
142
Broj uenika
Prijedor
6000
Gradika
5000
Dubica
4000
Prnjavor
3000
Ukupno:
28000
10000
Xii
Frekvencija
(i)
1
2
3
.
.
.
n
i
x11
x22
x33
.
.
.
xnn
Xi i
Frekvencija
(i1)
2
11
21
31
.
.
.
n1
i1
...
...
...
...
...
.
.
.
...
...
Frekvencija
(im)
m
1m
2m
3m
.
.
.
nm
ij
Naziv obiljeja A
Svega
...
C(b)
C1
C2
C3
Cm
1
2
3
4
...
m-1
m
...
x1
11
21
31
m1
j1
...
x2
12
22
32
m2
j2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
xn
in
2n
3n
mn
jn
...
Ukupno:
mi ij
1i
2i
3i
Prilikom tabelarnog prikazivanja pravilo je da sva polja u tabeli moraju biti
popunjena. Ukoliko je neki podatak nepoznat polje se popunjava konvencionalnim znakom
(:), ako nedostaje neki modalitet unosi se znak (-), ako je podatak nepotpun i neprovjeren
unosi se znak (//), ukoliko je ispravljan unosi se (*) u polje tabele itd.
2.3.2 Grafiko prikazivanje
Serije statistikih podataka, pored tabelarnog prikazivanja, mogu se, radi bolje
vizuelne prezentacije, predstaviti grafikim ilustracijama u vidu geometrijskih pojmova.
Grafiko prikazivanje statistikih podataka, pored ilustracije dobijenih rezultata statistike
analize, slui i za orijentaciju kada je u pitanju izbor najpodesnijeg tipa funkcije ili oblika
rasporeda. U grafikom prikazivanju statistikih serija koristi se uglavnom dvodimenzionalni
oblik unutar i van koordinatnog sistema, jer se tako postie tanost i preglednost. Grafikoni
oiglednim putem i na popularan nain prikazuju statistike veliine, njihovu strukturu,
kretanje i meusobne odnose. U grafikom metodu sluimo se raznim geometrijskim
pojmovima, slikama i likovima, crteima i figurama na liniji, povrini, u prostoru itd. Dakle,
statistiki grafikoni predstavljaju dopunu serijama i tabelama i istovremeno njihovog
najboljeg tumaa, jer na jednostavan vizuelan nain, jezikom slike, iskazuju karakteristine
osobine i promjene posmatrane pojave, te njene zakonomjernosti i tendencije u dinamici. S
obzirom na izbor elemenata i geometrijskih pojmova koji se upotrebljavaju za konstrukciju
grafikona kao statistikih publikacija, dijelimo ih na dijagrame, kartograme i slikovitopopularne grafikone.
Dijagrami kao geometrijski oblici konstruiu se na raznim skalama uz pomo taaka
(stigmogrami), linija (linijski dijagrami), povrina (histogrami) i oblika prostora
(stereogrami).
Broj
doma. (fi)
Rastua
kumulanta
Opadajua
kumulanta
2
5
10
15
8
4
3
1
48
2
7
17
32
40
44
47
48
-
48
46
41
31
16
8
4
1
-
Polarni linijski dijagram koristi se za prikazivanje vremenskih serija onih pojava koje
imaju izraeno sezonsko kretanje u duim ili kraim ciklusima (promet turista, potronja piva
po mjesecima). Konstruie se na taj nain da se vrijednosti obiljeja nanesu na radijalnu
mreu koja predstavlja zrakasto irenje vektor-radijusa od centra ka periferiji. Na jedan od
njih se oznai skala sa odabranim omjerom i kroz oznaene podioke opiu koncentrini
krugovi koji omoguavaju unos frekvencija. Kombinovani sa vektor-radijusima, obrazuju
polarnu mreu u kojoj je poloaj take takoe odreen parom (r,a) tj. udaljenou od centra
(r) i otklonom od nekog poetnog poloaja (a).
Primjer 2.4 Prodaja piva (u hl) u toku dvije godine
Mjeseci
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
2000.
2
3
5
10
20
30
40
50
35
25
10
5
2001.
1
2
4
8
15
20
35
40
30
20
10
5
Dijagram predstavlja izlomljenu liniju koja pokazuje komparativan razvoj pojave tokom dvije
godine, sa tumaenjem da svako udaljavanje ili pribliavanje linije centru znai vei ili manji
uticaj sezone na pojavu. Radi lake analize moe se u dijagram ucrtati i krug iji je
poluprenik jednak prosjenoj veliini pojave. Uporeivanjem izlomljene linije i ucrtane
krunice dobija se uvid u kolebanje i odstupanje pojave od svog regularnog toka iz kog je
potisnuta pod uticajem sezonskog faktora. Za sve take presjeka, koje pripadaju krugu,
pojava je bila ispod prosjeka, za one van kruga pojava je bila iznad prosjeka, a za one na
krugu pojava je jednaka prosjeku.
2.3.2.2 Povrinski dijagrami
Broj nezaposlenih
(u 000)
9
16
25
P1
Za 2001. god:
Za 2002. god:
Za 2003. god:
2003
2002
2001
Primjer 2.7
Godine
2001.
2002.
2003.
Broj nezaposlenih
(u 000)
9
16
25
Za 2001. god:
Za 2002. god:
Za 2003. god:
2003
2002
2001
Strukturni krug - slui da prikaemo strukturu neke pojave po sastavnim elementima tako
to cjelokupnu pojavu (100%) preslikavamo na puni krug (360o), pri emu 1% brojnosti serije
odgovara 3,6okruga. Dakle, prethodno se utvrdi struktura serije u procentima, a zatim se u
krug proizvoljnog poluprenika unesu segmenti iji su uglovi odreeni procentualnim
ueem pojedinih struktura u seriji.
Primjer 2.8
Ocjena
(Xi)
1
2
3
4
5
Ukupno:
Broj
uenika (fi)
20
30
100
40
10
200
Broj stepeni
(a)
36
54
180
72
18
360
Rjeenje:
gdje je:
a2
a3
a1
a5
a4
Provjera rjeenja:
360:200 = 1,8
a1= 20 x 1,8 = 36,
a2= 30 x 1,8 = 54 ,
a4 = 40 x 1,8 = 72 , a5= 10 x 1,8 = 18
, pri emu je
Ako
pretpostavimo
da
su
xi tj.
empirijske
vjerovatnoe
jednake
za
svako
aritmetika sredina:
odnosno
kod
sljedeeg
Broj
studenata (i)
10
20
30
25
5
90
rasporeda
xi i
60
140
240
225
50
715
frekvencija
numerikog
dok
zbir
frekvencija
i
12,5
65,8
82,0
73,4
52,1
10,1
7,1
310,0
rii
2012,5
18095,0
26650,0
27525,0
22142,5
4797,5
3727,5
106175,
(xi)ri
225
275
325
375
425
475
525
-
, odnosno:
tj.
individualnih
za
vrijednosti
negrupisane
ne
od
podatke,
i
meusobno
za
grupisane
podatke
zbir kvadrata odstupanja vrijednosti xi od pripadajue aritmetike sredine je
minimalan, tj. manji je od zbira kvadrata odstupanja od bilo koje vrijednosti
obiljeja, kao i srednjih vrijednosti ako se ne podudaraju sa , odnosno:
za negrupisane podatke
za grupisane podatke
Primjer 2.12 Provjeriti posljednja dva svojstva, na osnovu podataka iz sljedee serije:
i
3
4
13
21
11
5
3
60
xi
2
3
4
5
6
7
8
S
a) Zbir odstupanja individualnih vrijednosti od
od
za svako
razliito od
Kada je zadana statistika serija sa grupisanim podacima ili intervalna numerika serija
distribucije frekvencija, tada se izraunava ponderisana harmonijska sredina na osnovu
formule:
Primjer 2.13 Za izvrenje odreenog posla etiri grupe radnika su utroile sljedea vremena:
5 radnika - 35 minuta
6 radnika - 38 minuta
4 radnika - 48 minuta
8 radnika - 25 minuta
i
2
5
6
4
3
20
logxi
0,77815
1,00000
1,14613
1,27875
1,34242
-
i logxi
1,55630
5,00000
6,87678
5,11500
4,02726
22,57534
; gdje je:
- donja granica modalnog intervala
- veliina modalnog intervala
- frekvencija prethodnog intervala - predmodalni
- frekvencija modalnog intervala - modalni
- frekvencija narednog intervala postmodalni
Primjer 2.15 Odrediti modus na bazi podataka sljedeeg rasporeda vrijednosti
obiljeja
:
Ci
i
2- 8
4
8 - 14
6
14 - 20
13
20 - 26
21
26 - 32
32 - 38
Prema
15
3
= 20+6
= 23,6,
; gdje je:
5
6
7
8
9
10
11
12
3
7
11
12
15
13
10
4
75
Kumulanta
(rastua)
3
10
21
33
48
61
71
75
-
2- 8
8 - 14
14 - 20
20 - 26
26 - 32
32 - 38
4
6
13
21
15
3
62
Kumulanta
(rastua)
4
10
23
44
59
62
-
Interval varijacije (Iv) ili amplituda kolebanja vrijednosti obiljeja iskazuje se kao
razlika izmeu najvee i najmanje oznaene vrijednosti obiljeja: Iv=xmax-xmin. Interval
varijacije ima smisla samo za konane razmake disperzije serije, jer na njega iskljuivo utiu
krajnje vrijednosti, tako da se ne moe uzeti kao dovoljno informativna mjera varijacije.
Direktan je rezultat razlike ekstremnih vrijednosti koje su najee opredijeljene sluajnim
okolnostima, tako da u sebi nosi mjeru pouzdanosti samo ukoliko mu je gustina vea, a koju
moemo izraunati na sljedei nain:
; gdje je:
Gi - gustina intervala varijacije,
interkvartilna razlika
gdje je:
- interkvartilna razlika
- trei kvartil
- prvi kvartil
2.5.1.2. Srednje apsolutno odstupanje
2.5.1.3 Varijansa (
Posmatrajmo lan
pri emu
da je:
tako
Konano imamo:
, to omoguava izraunavanje varijanse kroz vjerovatnou
2.5.1.4 Standardna devijacija (
Primjer 2.18 Odabran je uzorak od 645 stambenih jedinica i posmatran prema broju
nastanjenih lica, na osnovu ega je sreivanjem i grupisanjem formirana sljedea serija
distribucije frekvencija.
Br.li.
(X)
1
2
3
4
5
6
Br.
(f)
85
150
140
130
65
35
st.
85
300
420
520
325
210
- 2,32
- 1,32
- 0,32
0,7
1,7
2,7
5,38
1,74
0,10
0,46
2,82
7,18
457,3
261,0
14,0
59,8
183,3
251,3
1
4
9
16
25
36
85
600
1260
2080
1625
1260
7
Ukupno
40
645
280
2140
3,7
-
13,54
-
541,6
1768,3
49
-
1960
8870
Interval varijacije:
Iv= x max x min = 7 1 = 6
Varijansa:
Standardna devijacija:
Koeficijent varijacije:
U ovom primjeru disperzija je velika. Aritmetika sredina nije dovoljno reprezentativna jer je
relativno visok varijabilitet.
2.5.2 Relativne mjere varijabiliteta
2.5.2.1 Koeficijent varijacije
Primjer 2.19
Uporediti produktivnost rada radnika A i radnika B koji rade u razliitim grupama,
ako su poznati sljedei podaci:
I grupa
II grupa
mA = 52
A=5
XA=47
mB=75
B=7
XB=60
momenat (
momenat (
) je mjera spljotenosti.
Na bazi navedenih statistikih momenata odreujemo:
70 75
75 80
80 85
85 90
72,5
77,5
82,5
87,5
2
5
10
17
-15
-10
-5
0
-6700
-5000
-1250
0
101250
50000
6250
0
90 95
95 100
100 - 105
Ukupno
92,5
97,5
102,5
-
1125
4000
10125
1125
5
10
15
-
9
4
3
50
5625
40000
151875
355000
Posmatrani
raspored
je
vrlo
slabo
desno
asimetrian,
jer
je
koeficijent
Da se radi o desnoj asimetriji, iako slabo izraenoj, vidi se iz odnosa aritmetike
sredine, modusa i medijane ovog rasporeda:
Prema koeficijentu spljotenosti,
(srednje spljoten).
.
.
.
pri emu je
x1
p1
x2
p2
xn
pn
Ovaj zakon raspodjele moe se predstaviti i grafiki pomou tzv. poligona raspodjele
kao na sljedeoj slici:
Poligon raspodjele
.
Ponekad je zakon raspodjele mague zadati pomou analitikog izraza
konvergira ka jedinici.
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6
odnosno
X
P
0
1/8
1
3/8
2
3/8
3
1/8
a kolinik centralnog momenta etvrtog reda i etvrtog stepena standardne devijacije mjeru
spljotenosti:
, to je detaljnije objanjeno u prvom poglavlju.
3.1.2
Binomna raspodjela
Lako se moe vidjeti da je ovim izrazom zadan jedan zakon raspodjele. Naime, na
osnovu binomnog obrasca je:
zbog p+q=1:
tj.
Iz ove dvostruke nejednakosti vide se da binomna sluajna promjenljiva moe biti ili
unimodalna ili bimodalna, zavisno od toga da li je p(n+1) razlomljen ili cijeli broj.
Poto binomni zakon raspodjele zavisi od dva parametra n i p, njihove razliite
kombinacije odreuju i razliite binomne zakone. Iz prethodnog izraza vidi se da je p=q
raspodjela simetrina, dok je za
raspodjela nesimetrina u desnu ili levu stranu
zavisno od toga da li je q>p ili q<p. Kad
mjera
ka simetrinoj, a
tei ka tri, odnosno raspodjela tei mezokurtinoj. To se vidi iz poligona
raspodjele na sljedeoj slici:
Poligon binomnog zakona raspodjele za razne vrijednosti p (a) i za
razne vrijednosti n (b)
Primjer 3.3 Odrediti pokazatelje raspodjele broja kinih dana u mjesecu junu, ako je
vjerovatnoa kinog dana p=0,2.
Oigledno je da je n=30 i p=0,2. Dalje je:
, odnosno:
Modus
hipergeometrijske
uslova
raspodjele
se
dobija
iz
Moe se pokazati da je
1.
i
Ovo svojstvo slijedi iz injenice da je
a
potpuno izvjestan dogaaj.
2.
za x1<x2
Zaista, iz x1<x2 slijedi da je
odnosno
tj.
3.
F(x) je neprekidna9
Vrijednost x0 za koju je
gde je
neka unaprijed zadana vjerovatnoa,
naziva se kvantil raspodjele definisane funkcijom F(x).
Na osnovu navedenih svojstava funkcije raspodjele lako je pokazati da je
vjerovatnoa da neprekidna sluajna promjenljiva X uzme vrijednost x jednaka nuli, tj.
P(X=x)=0
Neprekidna promjenljiva X se moe zadati na jo jedan nain, pomou tzv. gustine
raspodjele.
Gustina raspodjele f(x) sluajne promjenljive X predstavlja prvi izvod funkcije
raspodjele, tj:
to, geometrijski, predstavlja mjerni broj povrine ispod grafika funkcije gustine u intervalu
(x1,x2):
Zamjenom u prethodnom izrazu
odnosno
Gustina raspodjele
dobija se da je
a odavde
jer je
3.2.2 Numeriki pokazatelji neprekidne sluajne promjenljive
Numeriki pokazatelji neprekidne sluajne promjenljive X definiu se analogno kao i
kod diskretne sluajne promjenljive, s tim to vjerovatnoe pi zamjenjuju vjerovatnoe f(x)dx
a sumu, integral.
Tako je matematiko oekivanje jednako:
a varijansa:
odnosno:
matematiko
oekivanje
varijansu
normalno
sluajna promjenljiva:
je:
Pomou tablica vrijednosti funkcije, za t=1;2;3 mogu se odrediti tzv. sigma pravila:
prvo
drugo
tree
-pravilo za t=2:
Normalna raspodjela ima veliku primjenu u statistikoj analizi. Ova tvrdnja proistie
iz tzv. centralne granine teoreme koja se u grubim crtama moe formulisati na sljedei
nain: Zbir velikog broja nezavisnih sluajnih promjenljivih od kojih svaka ima mali udio u
zbiru ima priblino normalnu raspodjelu.10
U poljoprivrednim istraivanjima pojava je esto slina uslovima centralne granine
teoreme. Veliki broj sloenijih biolokih obiljeja predstavlja kumulaciju prostijih svojstava
na elijskom nivou. Pri mjerenju razliitih kvantitativnih veliina greka mjerenja je
Odrediti
vjerovatnoe
P(X<6),
Pored normalne raspodjele veliku primjenu u statistici imaju tri teorijske raspodjele
, t i F raspodjela. S obzirom da se na
koje su izvedene iz normalne raspodjele. To su
osnovu ove tri raspodjele formiraju kriterijumi za testiranje statistikih hipoteza, esto ih
nazivaju i kriterijumske raspodjele. Zbog sloenosti izraza kojima se zadaju njihove gustine,
ovdje se neemo uputati u izvoenje numerikih pokazatelja, to, u krajnjoj liniji, nije bitno
za njihovu praktinu primjenu o kojoj e dalje biti rijei.
3.2.4
- raspodjela
ima tzv.
promjenljiva x ima
gde je
gama funkcija:
se za n>30 smatra da je
-raspodjela veoma slina normalnoj i da se, u praktinim
zadacima, moe zamijeniti normalnom raspodjelom.
Grafik gustine
sljedei nain:
Gustina
raspodjele
Kvantil
raspodjele
-raspodjelu sa n1 i
.
Moe se pokazati da se gustina raspodjele zadaje funkcijom:
za koju je
kao na sljedeoj slici, koristi se tabela F-raspodjele u kojoj su izraunati kvantili za razliite
vrijednosti n1, n2 i . Tako, naprimjer, ako se kod F-raspodjele sa n1=5 i n2=10 stepeni
slobode trai odgovarajui kvantil, takav da je
proitati da je
, iz tablica se moe
Kvantil F-raspodjele
4. METOD UZORKA
istu ansu da bude ponovo izvuen kao i svi ostali elementi. Kod potpuno sluajnog izbora
bez vraanja jednom izvuen element vie se ne vraa u osnovni skup. Jasno je da se razlika
izmeu ova dva postupka anulira u sluaju beskonanih ili jako velikih osnovnih skupova.
Sama procedura formiranja uzorka realizuje se na sljedei nain. Da bi se formirao
uzorak svi objekti osnovnog skupa se numeriu brojevima od 1 do N, a zatim se vri
izvlaenje n brojeva kao kod igre loto. Svaki broj ima istu ansu da bude izvuen. Ukoliko se
izvuen broj vraa, tj. moe biti ponovo izvuen, formira se uzorak sa vraanjem, u
protivnom uzorak je bez vraanja.
Zbog velikog obima osnovnog skupa nije uvijek mogue formirati uzorak izvlaenjem
brojeva. U takvim sluajevima koriste se tablice sluajnih cifara ili generator sluajnih
brojeva na raunaru.
Tablice sluajnih cifara koriste se tako to se kolone grupiu da dobijeni brojevi u
vrstama budu reda veliine broja N. Zatim se redom izdvaja n brojeva manjih od N. Ako je
uzorak bez vraanja, izdvojeni brojevi moraju biti meusobno razliiti.
Primjer 4.1 Iz osnovnog skupa obima N=121, datog u tabeli - broj traktora po
poljoprivrednim organizacijama:
tj.
gde je
gde je Z:N(0;1).
4.3 Odreivanje obima uzorka
Neophodan obim uzorka za ocjenu nepoznatog parametra osnovnog skupa obima N
odreuje se u zavisnosti od izabranog naina formiranja uzorka, zadane tanosti (gornje
granice apsolutne greke)
i eljene pouzdanosti
I VARIJANSA
a)
bie:
a)
Na
dato
osnovu
izvedene
formule
za
tanost
ocjene
dobija
se,
za
, potreban obim:
.
Ukoliko je izraunati obim uzorka n manji od obima preliminarnog uzorka
no
, ocjena nepoznatog parametra moe se dobiti na osnovu ve formiranog uzorka. U
protivnom, treba izvriti dodatna posmatranja, kako bi se uzorak proirio do traenog obima.
Za ocjenu nepoznate varijanse koristi se izraunata vrijednost
iz preliminarnog uzorka.
pa je:
a) za
b) za
, da
jer je
jer je
, pa je:
a)
.
b)
.
II U sluaju kad ne postoji nikakva informacija o nepoznatoj proporciji postavlja se
da je p(1-p)=1/4, pa je
a)
dom.
b)
dom.
Primjer 4.8 Iz dnevne produkcije od 10000 proizvoda treba izabrati uzorak za ocjenu
broja neispravnih proizvoda sa vjerovatnoom 0,99. Odrediti neophodan obim uzorka, ako je
u ranijim ispitivanjima procenat neispravnih proizvoda bio 2% i ako se trai da uzoraka
proporcija ne odstupa od stvarne vie od 2%. Posmatrati sluajeve uzorka sa vraanjem i bez
vraanja.
Na osnovu postavljenih uslova je:
I uzorak sa vraanjem
proiz.
II uzorak bez vraanja
vjerovatnoom 0,95 moglo tvrditi, da dobijeni interval duine 0,10 pokriva stvarnu vrijednost
procenta unitene penice, ako je na osnovu preliminarnog uzorka dobijeno
dobijanje
ocjene
obino se oznaava sa
nepoznatog
parametra
.
V
posmatra
se
funkcija
oblika
, koja se naziva uzoraka funkcija ili statistika (predikator,
ocjenjiva). Zadatak ocjene nepoznatog parametra svodi se na nalaenje takvih uzorakih
funkcija
nepoznatog parametra
parametara
odreena
je
dijele
se
na
jednim
takaste
brojem
i
intervalne.
.
Takasta
Intervalna
ocjena
ocjena
svojstva
koja
treba
da
ima
dobra
ocjena
nepoznatog
Ocjena
nepoznatog parametra naziva se nepristrasnom (bez
sistematske greke) ako je njeno matematiko oekivanje jednako ocjenjivanom parametru,
tj. ako je
i pristrasnost
(5.4)
kad
Dakle, ako je
i
tanost zavisi od obima uzorka.
S obzirom, da je ocjena
nepoznatog parametra
je bolja kada je
ili
manje. Jasno je da
Vjerovatnoa
Vjerovatnoa
naziva
se
pouzdanost
, suprotnog dogaaja
ili
vjerovatnoa
povjerenja.
pouzdanost
Kada je
dovoljno blisko jedinici
greka takaste ocjene nepoznatog parametra .
je granina apsolutna
, koji sa vjerovatnoom
pokriva nepoznati
Interval
2
parametar , naziva se interval povjerenja ili interval pouzdanosti . Dakle, pri formiranju
vie
uzoraka
interval
obima
iz
jednog
osnovnog
skupa
,au
sluajeva
sluajeva ga ne pokriva.
2.
sastoji se u
nepoznatog parametra
Na osnovu dobijene takaste ocjene formira se neka sluajna veliina koja je funkcija
nepoznatog
naprimjer
parametra,
naprimjer
ima
poznatu
gustinu
raspodjele,
;
;
3.
Zadaje se pouzdanost
4.
sluajne
veliine
biraju
je
se,
po
pravilu,
tako
da
Nejednakost
nejednakost
6.
transformie
se
, tj.
jednakoverovatnu
, tj.
Za
sa vraanjem.
, pri emu
je
poznato a nepoznato. Za ocjenu nepoznatog parametra
iz osnovnog skupa izvlai
se sluajan uzorak. U sluaju konanog osnovnog skupa, uzorak e biti sa vraanjem. Na
osnovu dobijenog uzorka izraunava se uzoraka sredina kao realizacija takaste ocjene
nepoznatog parametra , tj.
zadani
nivo
i varijansom
znaajnosti
mogue
je
nai
kvantile
normalne
, tj.
da je tanost
zbog
nepoznati parametar
tanost ocjene
tj,
za
primjenjuju
se
se primjenjuje ukoliko
gore
izvedene
formule,
Ukoliko se zna obim osnovnog skupa N, moe se pomou prve od gore navedenih
formula odrediti interval povjerenja za ukupnu vrijednost posmatranog obiljeja X na
posmatranom osnovnom skupu. Naime, ukupna vrijednost
pokrivena je intervalom
odnosno
Dalje je:
pa je:
Dakle,
prosjena
teina
paketia
putera
cijele
proizvodnje
intervalu
sa pouzdanou 95%.
Tanost dobijene ocjene je:
gr,
bie
Primjer 5.2 Na osnovu sluajnog uzorka obima 100 treba ocijeniti prosjenu masu
pilia u osnovnom skupu, ako se zna da je varijansa mase pilia 0,3. Nai, sa poudanou
0,99 (uz rizik 1%), tanost sa kojom uzoraka sredina ocjenjuje srednju vrijednost osnovnog
skupa.
Na osnovu uzorake informacije je:
kg
Pri
mjer 5.3 Iz
osnovnog
skupa
od
2000 ovaca izabran je uzorak obima 100 za ocjenu prosjene mase ostriene vune. Rezultati
mjerenja dati su u tabeli:
Ako se zna da je raspodjela koliine ostriene vune normalna, sa varijansom 2,
ocijeniti, sa pouzdanou 0,99, prosjenu teinu ostriene vune u cijelom osnovnom skupu.
Kolika je tanost dobijene ocjene? Odrediti ukupnu koliinu ostriene vune. Odrediti
vjerovatnou da odstupanje prosjene koliine ostriene vune u uzorku od prosjene ostriene
vune u osnovnom skupu ne bude vee od 0,2 kg.
Ovdje je N=2000; n=100, n/N=100/2000=0,05>0,04. Zbog n/N=0,04 koriste se
formule iz prethodnih primjera, pa je:
to znai da e uzoraka sredina, pri istim uslovima, odstupati od sredine osnovnog skupa
najvie
. Kako
to je na osnovu:
, pa je:
i nepoznatim
parametrima i
. Za ocjenu nepoznatog parametra
iz osnovnog skupa izvlai se
sluajan uzorak obima n. U sluaju konanog osnovnog skupa uzorak je sa vraanjem. Na
osnovu uzorakih vrijednosti izraunava se nepristrasna takasta ocjena nepoznatih
parametara, tj.
a nepristrasna ocjena za
je
pa je
;
ili
Statistika
ima Studentovu t-raspodjelu sa (n-1) stepeni slobode. Ona se koristi za odreivanje intervala
povjerenja nepoznatog parametra .
Za
kvantile
zadani
nivo
znaajnosti
iz
tablica
je
mogue
t-raspodjele,
je
tako
nai
da
Dakle,
sa zadanom pouzdanou
a duina intervala
Dobijeni interval ima ista svojstva kao i interval povjerenja za srednju vrijednost
osnovnog skupa pri poznatoj varijansi.
U sluaju konanog osnovnog skupa, kada se uzorak formira bez vraanja,
nepristrasna ocjena varijanse osnovnog skupa je
pa je nepristrasna ocjena varijanse uzorake sredine
uzorake
i
gr
Zbog
pa je interval pouzdanosti
Primjer 5.5 Nova sorta penice zasijana je na 10 opitnih parcela. Poslije etve
dobijeni su sljedei prinosi:
Treba ocijeniti prosjean prinos nove sorte penice sa pouzdanou od 99% (uz rizik
1%). Kolika je tanost ocjene?
pa je interval pouzdanosti:
Sa pouzdanou 99% moe se tvrditi da e prosjean prinos nove sorte penice biti
pokriven
intervalom
Zbog
pouzdanosti:
pa
je
interval
Dakle, sa 99% pouzdanosti moe se rei da e prosjean prinos na cijelom polju biti
od 62,02 00kg/ha do 64,23 00kg/ha.
Tanost dobijene ocjene je
je:
Sa pouzdanou 95% (uz rizik 5%) moe se tvrditi da e prosjena povrina imanja
biti pokrivena intervalom
, tj.
koja ima N(0;1) kada je n dovoljno veliko i kada p nije blisko 0 ili 1.
Zbog jednostavnijeg izraunavanja, kod dovoljno velikih uzoraka, za varijansu
ocjene
Tanost ocjene je
a duina intervala
U sluaju konanog osnovnog skupa i uzorka bez vraanja koristi se sljedea ocjena
za
kada je n/N>0,04.
Ukupan broj jedinica u osnovnom skupu koje imaju svojstvo A bie, za konkretne
uzorake vrijednosti, sa pouzdanou
pokriven intervalom:
a
je
gde je
je
kvantil
gdje je
F-raspodjele
sa
st.
sl.
takav
da
kvantil F-raspodjele sa
Kako je
nepoznatu proporciju u osnovnom skupu:
to je interval pouzdanosti za
Primjer 5.9 Pri provjeri nekog lijeka na 17 ivotinja, kod 3 ivotinje javili su se
pratei efekti.Odrediti 05% interval povjerenja za procenat ivotinja koje imaju pratee
efekte.
Vrijednost takaste ocjene za nepoznatu proporciju je:
pa je:
Za
je
donju
,
granicu
i
pa je
Dakle, 95% interval povjerenja je 3,8% - 43,5%. Ovaj interval je dosta irok, to je
uzrokovano malim obimom uzorka.
tj.
Interval pouzdanosti je
pa je
parametar jednak nekoj konkretnoj vrijednosti, npr. . Alternativna hipoteza moe biti
prosta, kada se pretpostavlja da parametar ima neku drugu, konkretnu, vrijednost,
npr.
ili
Neka je
ako
oblast neodbacivanja
(oblast saglasnih rjeenja)
kritina oblast (oblast
odbacivanja)
Funkcija raspodjele sluajne veliine K, bez obzira da li je tana ili priblina, mijenja
se u zavisnosti od pretpostavke o karakteristikama osnovnog skupa, tj. u zavisnosti od
pretpostavljene hipoteze. Ukoliko se zna funkcija raspodjele kriterijuma K, mogu se odrediti
vjerovatnoe dogaaja
i
. Vjerovatnoe ovih dogaaja
zavise od konkretne raspodjele sluajne veliine K. Kriterijum K bi trebalo izabrati tako da
vjerovatnoa dogaaja (**
/kada je Ho tano)** bude vrlo mala. Pod izrazom
vrlo mala podrazumijeva se sa verovatnoom 0,01 (1%) ili sa verovatnoom 0,05
(5%). Naime, to znai da se hipoteza Ho odbacuje, kada je stvarno tana, samo pri pojavi
malovjerovatnih uzoraka. S druge strane, kriterijum K bi trebalo birati tako da vjerovatnoa
dogaaja (**
/kada je Ho netano)*** bude vrlo mala. Naime, to znai da se
hipoteza Ho ne odbacuje kada u stvari nije tana samo pri pojavi malovjerovatnih uzoraka.
Dakle, pri testiranju statistikih hipoteza, u dva sluaja se moe donijeti pravilno rjeenje, a u
dva nepravilno, to je posljedica zakljuivanja na osnovu uzorakih vrijednosti (mali obim
uzorka, nedostatak metodike eksperimenta i sl.). U vezi sa tim se u statistici definiu greka I
vrste i greka II vrste.
, tj.
vjerovatnoa
kada je netana.
PRAVILNO
RJEENJE
Ho
NE ODBACUJE SE
Ha
manja
NEPOZNATA ISTINA
Ho TANO
Ho NETANO
Ha NETANO
Ha TANO
PRAVILNO
GREKA
RJEENJE
II VRSTE
1-a
b
GREKA
II VRSTE
a
PRAVILNO
RJEENJE
1-b
, a
Dakle, greku I i II vrste nije mogue istovremeno smanjiti, ako se mijenja samo
podjela oblasti . O ovome treba voditi rauna pri izboru kriterijuma K za provjeru
statistike hipoteze.
Jedan od naina klasifikacije statistikih kritetijuma K, za provjeru konkretne hipoteze
Ho u odnosu na konkretnu alternativnu hipotezu Ha, je prema njihovoj moi. Naime, treba
izabrati onaj kriterijum koji za isti obim uzorka, za dati nivo znaajnosti i konkretnu
alternativnu hipotezu Ha, ima veu mo (za takav kriterijum se kae da je efikasniji. Za
formiranje statistikih kriterijuma najbolje je koristiti takaste ojcene sa svojstvima
nepristrasnosti, stabilnosti i efikasnosti, jer tada kriterijumi imaju najveu mo. Naravno, nije
uvijek mogue izabrati kriterijum koji e biti najmoniji za sve alternativne hipoteze.
Ponekad se uvodi funkcija gubitka koja odreuje tetu koja se javlja kao rezultat bilo
koje od greaka dva tipa. Najee se oblast
odreuje tako da teta od oba tipa greaka
bude priblino jednaka. Naravno, to zavisi od konkretne situacije. Tako, naprimjer, ako se
ispituje tetnost lijeka na ljudsko zdravlje i ako je H o: Lijek nije tetan, a Ha: Lijek je
tetan, tada je mnogo vea teta proglasiti ga za dobar (greka II vrste). U tom sluaju treba
to vie smanjiti vjerovatnou greke II vrste.
3. Izabrati kriterijum K;
4. Odrediti zakon raspodjele kriterijuma K u sluaju kada je Ho tano, tj. f)k/Ho) i oekivanu
vrijednost M(K)=ko;
5. Odrediti kritinu oblast W iz uslova (6.1)3;
6. Izraunati uzoraku vrijednost statistike K, tj. k (Kuz);
7. Na osnovu izraunate vrijednosti donijeti odluku o odbacivanju ili neodbacivanju
postavljene hipoteze. Naime,
a) Ako je
b) Ako je
znaajnosti
6.1
ako je za
a) Alternativna hipoteza
, onda je kritina oblast dvostrana kao na grafikonima na
sljedeoj stranici4. Ovakva formulacija alternativne hipoteze znai da oblast odbacivanja
mora uzeti u obzir realizacije sluajne veliine K lijevo i desno od ko
zadani
je
nivo
znaajnosti
mogu
se
izabrati
dva
broja
. Za
i
tako
da
,
U ovom sluaju kriterijum K se naziva dvostrani kriterijum znaajnosti.
Grafiki prikaz dvostrane kritine oblasti
b) Alternativna hipoteza
, onda je kritina oblast lijevostrana. Ovakva formulacija
alternativne hipoteze znai da kritina oblast uzima u obzir samo vrijednosti sluajne veliine
K lijevo od ko (sl. 6.3a i sl. 6.3b). Za zadani nivo znaajnosti moe se odrediti
kvantil
c)
Alternativna
hipoteza
, onda je kritina oblast desnostrana. Ovakva formulacija alternativne
hipoteze znai da kritina oblast uzima u obzir samo vrijednosti sluajne promjenljive K
desno od ko .
Za zadani nivo znaajnosti
K tako da
.
Grafiki prikaz desnostrane kritine oblasti
mogue je za konkretne
vrijednosti parametra
u alternativnoj hipotezi izraunati mo testa
prethodnoj slici. Ako je alternativna hipoteza sloena, onda se
za
vrijednosti
moi.
izmeu
izraunava
i
mo
testa
tako
dobija
tzv.
funkcija
kao na
razliite
Veza
Ukoliko su
protiv
Dalje e biti izloeni konkretni statistiki kriterijumi znaajnosti za testiranje hipoteza o parametrima normalnog zakona
raspodjele. Izloeni kriterijumi za provjeru parametarskih hipoteza mogu se smatrati priblinim, ukoliko se koriste za osnovni skup sa
raspodjelom razliitom od normalne. Odstupanje od normalnog zakona koriste priblini kriterijumi umesto tanih, treba se stroe odnositi
prema izvedenim zakljucima. Priblini kriterijumi se koriste za vei obim uzorka.
, tj.
uzorake sredine
1: Osnovni
skup
ima
normalnu
raspodjelu
sa
poznatom
Uzoraka sredina
Ho tana onda
. Ako je hipoteza
tana, sluajna veliina
kvantile
normalne
raspodjele
.
tako
da
Kritina
oblast
za
kriterijum
. Ako
je
vrijednost
je
uzoraka
, tj.
ili
, Ho se
tako da je
Kritina oblast je
Kritina oblast je
alternativne
uzet
, protiv
Za testiranje hipoteze
protiv
, koristi
se model 1.
S obzirom na vid alternativne hipoteze kritina oblast je lijevostrana. Iz
uslova
iz
se
tablica
normalne
, pa je
raspodjele
ita
Kako je:
sa nepoznatim
tj.
. Postavljenu hipotezu treba provjeriti na zadanom nivou znaajnosti
osnovu uzorakih posmatranja obima n.
,
, na
uzima se statistika:
, pa statistika T
raspodjele
tako
da
je
Dvostrana kritina oblast za t-kriterijum
Kritina oblast za T je
je uzoraka vrijednost
. Ako
Kritina oblast za T je
kriterijuma T manja od
osnova za njeno odbacivanje.
, podaci su
, kritina oblast je
, na osnovu tablica t raspodjele, odreuje se
Za
dovoljno
hipoteze
varijanse
. Ako je uzoraka
veliki
obim
uzorka
(n>30),
za
testiranje
Primjer 6.2 Da bi se odredila norma radnika pri izradi nekog proizvoda, posmatran je
rad 26 radnika. Dobijeni su uzoraka srednja produktivnost rada,
pr./as, i
2
uzoraka varijansa s =0,16. Treba provjeriti hipotezu da e pri masovnoj proizvodnji srednja
produktivnost rada biti
S obzirom da je
, hipoteza da je produktivnost rada jednaka 5,4
pr./as. odbacuje se u korist alternativne hipoteze da je produktivnost rada manja od 5,4
pr./as.
Kriterijumi zasnovani na prethodno objanjenim statistikama, najbolji su, jer
obezbjeuju maksimalnu mo za zadani nivo znaajnosti i obim uzorka n. Mo kriterijuma
se izraunava za prostu alternativnu hipotezu
moi
kriterijuma
Z
koristi
se
raspodjelu
ima
normalnu
, pa Z
raspodjelu
kada
je
tana
hipoteza
. Za dovoljno veliko n (n>30) mo kriterijuma T ( model 2) se
izraunava kao kod modela 1.
Pretpostavlja
se
da
su
poznati,
a i
nepoznati parametri posmatranih osnovnih skupova. Na osnovu dva nezavisna
uzorka obima n1 i n2, izvuena iz ispitivanih skupova, treba provjeriti nultu
hipotezu
, protiv alternativne
, ili
, ili
Uzorake
sredine
imaju
normalne
raspodjele
i
. Njihove realizacije i izraunavaju se na
osnovu nezavisno izvuenih uzoraka iz posmatranih osnovnih skupova. S obzirom da su
uzorci nezavisni, nezavisne su i srednje vrijednosti
i . Sluajna veliina
, kao
razlika dvije nezavisne normalno rasporeene sluajne veliine, ima normalnu raspodjelu,
tj.
.
Kada je hipoteza
sredinom 0, jer je
, tj.
tada je:
_
_
iz
iz
. Kritina
.
oblast je
iz tablica
oblasti
tako da je
je
. Kritina oblast
, Ho se ne odbacuje.
c) Ako je
znaajnosti
tablica
uslova
normalne
raspodjele
. Kritina oblast je
odreuje
se
kvantil
iz
,.
Primjer 6.3 Za testiranje uticaja nove i stare tehnologije na prinos penice, izabrano
je po 50 gazdinstava na kojima su primijenjene stara i nova tehnologija. Na osnovu dobijenih
uzoraka utvreni su prosjeni prinosi od
t/ha i
hipoteza
alternativna
Poto je n1, n2>30, za testiranje ove hipoteze moe se moe se koristiti Z kriterijum,
bez obzira to se ne raspolae informacijom o raspodjeli osnovnog skupa, pa je
obzirom
na
tip
alternativne
hipoteze,
kritina
oblast
je
lijevostrana,
tj.
Kako
, nulta hipoteza se odbacuje u korist alternativne,
tj, moe se smatrati da je bolja nova tehnologija.
Model 2 (nepoznate varijanse): Posmatraju se dva obiljeja X i Y, sa normalnim
raspodjelama
parametrima
,
izvuena
iz
nepoznatim
,
i
. Na osnovu dva nezavisna uzorka, obima n1 i n2
posmatranih
osnovnih
skupova,
treba
provjeriti
,
nultu
hipotezu
protiv
alternativnih
neke
ili
nivou znaajnosti
od
, na zadanom
Ho tana, tj.
. Veliina
za varijansu
odreuju
se
uslova
kvantili
Studentove
t-raspodjele
. Kritina
iz
oblast
je
. U protivnom Ho se ne odbacuje.
b) Ako je
raspodjele
je
Ako je
se
. Kritina oblast je
, Ho se odbacuje. Ako je
kvantil
tako
,
, Ho se ne odbacuje.
da
c)
Ako je
raspodjele
odreuje
se
uslova
granica
kritine
oblasti
. Kritina
je
iz
oblast
Ako
je
je
odbacivanje.
uzoraka
vrijednost
Ho se
odbacuje.
Ako
parcelama
varijansom
je
bio
(000)
kg/ha
sa
uzorakom
bio
(000) kg/ha sa uzorakom varijansom
. Da li je nova
vrsta prihrane znaajno uticala na porast prinosa penice? Postavljenu hipotezu testirati na
nivou znaajnosti 0,05.
Ovdje je nulta hipoteza
, protiv alternativne
. S
obzirom na tip alternativne hipoteze kritina oblast je desnostrana. Na osnovu uzorake
informacije odreuju se granica kritine oblasti ili uzoraka realizacija statistike T, koja se
koristi za provjeru postavljene hipoteze. Na osnovu uzorake informacije
i
, a uzoraka vrijednost statistike T
st. sl.
S obzirom da je
hipoteza Ho se odbacuje. Moe se smatrati
da nova vrsta prihrane znaajno utie na porast prinosa penice.
Primjer 6.5 Za ispitivanje uticaja dva naina prihranjivanja na prinos jedne sorte
jabuke, na 50 stabala je primijenjen prvi, a na 40 stabala drugi nain prihranjivanja. Na
osnovu
podataka
uzorka
izraunate
su
sredine
kg/st.
i
kg/st, i varijanse
i
znaajnost razlike ova dva naina prihranjivanja na nivou znaajnosti 0,01.
Testirati
Nulta hipoteza je
a alternativna
.S
obzirom na tip alternativne hipoteze, kritina oblast je dvostrana. Poto je n1>30 i n2>30 za
provjeru ove hipoteze moe se koristiti statistika Z, kod koje su varijanse zamijenjene
ocjenama. Za
odreuje se kvantil
, pa je kritina
oblast
.
Na osnovu uzorake informacije
S obzirom da
znai da se hipoteza Ho o jednakosti sredina odbacuje,
moe se zakljuiti da je razlika u prinosu pod uticajem dva naina prihranjivanja statistiki
znaajna.
Kod izloenih kriterijuma greka druge vrste se kontrolie samo ako je poznata
razlika
, to najee nije sluaj. Dakle, kod ovih kriterijuma uglavnom se
kontrolie samo vjerovatnoa
realizacije greke prve vrste.
Kada bi nulta hipoteza bila
alternativnih
, protiv neke od
,
ili
ili
, postupak testiranja bi bio isti, samo bi se umesto statistike u modelu
1 koristila statistika
ima
Kada je hipoteza
normalnu
raspodjelu
sa
N(0;1),
stepeni slobode
tj.
Zadovoljavajui
rezultati
aproksimacije
ili
hipotezu
hipoteza
, ili
protiv
neke
, ili
od
alternativnih
.
Ako je
raspodjele
odreuju
se
granice
kritine
oblasti
iz
. Kritina oblast
uslova
je
.
Ako je uzoraka realizacija statistike Z
pripala
kritinoj
oblasti,
je
postavljenoj hipotezi.
Ako
tj.
ne
odbacuje.
Ako
je
uslova
kritina
,
oblast
je
lijevostrana.
Iz
Ho se
, hipoteza Ho se odbacuje, u
raspodjele
uslova
je
Ako je
odbacuje.
, Ho se
testirati
nultu
hipotezu
protiv
S
Za
ozbirom
na
tip
kritina
alternativne
hipoteze
kritina
vrijednost
oblast
je
desnostrana.
je
protiv
alternativne ,
na nivou znaajnosti 0,05, tako da mo testa bude
0,9, tj, da vjerovatnoa greke II vrste bude 0,10. S obzirom da je kritina oblast desnostrana
bie
Uzorak treba da sadri najmanje 282 proizvoda. Ovako veliki obim uzorka posljedica
je relativno male razlike pa-po.
m2 puta.
Uzorake
p2 su
vrijednosti
nepristrasnih
ocjena
nepoznatih
vjerovatnoa
koristi se statistika
dvije
p1 i
i
nezavisne
sluajne
veliine
pa
sa
normalnom
onda
raspodjelom.
kao
Dakle,
kada je Ho tano8.
statistika
Ako je
raspodjele, iz uslova
oblasti
i ako je
se iz uslova
je
.
Ako je uzoraka vrijednost
je
Ako je
, odreuje se iz uslova
, Ho se odbacuje, a ako je
, nema osnova
Primjer 6.8 Efikasnost dva preparata za zatitu ispitivana je na 500 biljaka. Od 300
biljaka tretiranih prvim preparatom oboljelo je 15, a od 200 biljaka tretiranih drugim
preparatom oboljelo je 8. Testirati da li su ova dva naina zatite jednako efikasna. Za
vjerovatnou greke I vrste uzeti 0,01.
Na osnovu uzorake informacije n1=200; n2=200; m1=15; m2 =8 izraunava
se
obzirom
da
je
. Kako
tj.
mogu smatrati jednako efikasnim.
kritina
oblast
dvostrana
Kada se ispituje uticaj svih moguih nivoa nekog faktora A na kvantitativno obiljeje
X sa normalnom raspodjelom, smatra se da svakom od k razliitih nivoa faktora A odgovara
jedan
osnovni
Parametri
skup
sa
normalnom
raspodjelom,
tj.
i=1,2,,k10.
Statistike SSU, SSF i SSG mogu se koristiti za ocjenu odgovarajuih varijansi: ukupne,
faktorske i varijanse greke11.
Dakle, ako je tana hipoteza Ho onda su MSU, MSF i MSG nepristrasne ocjene za
nepoznati parametar
je Ho tano
, to znai da je
Kao
kriterijum
znaajnosti
hipoteze
za
provjeru
koristi se statistika
ima
protivnom necentralnu
stepeni slobode.
-raspodjelu.
ima
-raspodjelu
sa
N-k
uslova
je
Ako
tj.
je
uzoraka
vrijednost
statistike
pripala
kritinoj
oblasti
W,
X. Ukoliko je
i N=nk,
Za
z
tablica
;
F-raspodjele
ita
i
se
kritina
vrijednost
i
.
Kako
je
odbacuje se hipoteza o jednakom prinosu posmatranih sorti.
Razlika izmeu sorti je statistiki vrlo znaajna.
Rezultati t-testa izraunati su po formuli:
kritina vrijednost
Ako
Iz tablice uzorakih realizacija tij statistike T, vidi se da tri vrijednosti tAD, tBD i
tCD prelaze tabline. Dakle, samo se sorta D razlikuje od tri ostale sorte na nivou znaajnosti
0,01.
Primjer 6.10 Ispituje se uticaj radnog staa na produktivnost pri proizvodnji nekog
proizvoda. Rezultati posmatranja dati su u sljedeoj tabeli:
k=3
pa je
a
je
je
Za
se
,
kritina
vrijednost
iz
i
tablica
F-raspodjele,
it
pa
obzirom
da
. Iz tablica
.
t-
6.2.2
Kriterijum
je jedan od starijih statistikih kriterijuma. Razradio ga je K. Pearson
poetkom ovog veka. On se primjenjuje za provjeru hipoteza o raspodjeli osnovnog skupa, a
moe se primjenjivati i za provjeru hipoteze o nezavisnosti dve sluajne veliine, tj. dva
obiljeja.
Na osnovu empirijske funkcije raspodjele treba provjeriti nultu hipotezu da osnovni
skup ima odreenu funkciju raspodjele F(x) definisanu u potpunosti ili sa tanou do njenih
parametara.
Iz osnovnog skupa sa nepoznatom funkcijom raspodjele izvlai se sluajan uzorak
obima n
. Na osnovu dobijenih uzorakih posmatranja formira se empirijska funkcija
raspodjele:
Empirijska funkcija raspodjele
Vrijednosti
obiljeja
Frekvencije
Pomou
izraunatih
vjerovatnoa
pi odreuju
se
teorijske
(oekivane)
, za uzorak obima n
frekvencije
ili
Moe se pokazati da za
statistike
ne
zavisi
od
tipa
raspodjele
Fo(x)
tei
-raspodjeli
sa
stepeni slobode (k- je broj intervala; m - broj nepoznatih parametara
funkcije raspodjele ocjenjenih na osnovu uzorakih podataka).
-kriterijum moe se smatrati mjerom odstupanja empirijskih frekvencija od
oekivanih, teorijskih. Dakle, to je uzoraka vrijednost statistike blia nuli to je vjerovatnije
da je nulta hipoteza tana. Zbog toga se za testiranje nulte hipoteze koristi desnostrana
kritina oblast
, iz tablica
. Kritina oblast
.
Na
osnovu
uzorakih
podataka
izraunava
se
uzoraka
realizacija
prethodne
statistike20. Ako je
smatra se da nema osnova za odacivanje nulte
hipoteze, tj. da je hipotetika funkcija raspodjele saglasna sa uzorakim posmatranjima. Ako
je
nulta hipoteza se odbacuje, tj. smatra se da hipotetika funkcija raspodjele nije
saglasna sa uzorakim posmatranjima.
kriterijum moe se primjenjivati samo kada su oekivane frekvencije vee od 4,
tj.
; i=1,2,,k. Ukoliko su oekivane frekvencije manje od 5 preporuuje se saimanje
intervala21.
Primjer 6.11 Na osnovu rezultata 50 posmatranja treba provjeriti hipotezu da
obiljeje X ima normalnu raspodjelu. Postavljenu hipotezu treba testirati na nivou znaajnosti
0,05. Rezultati posmatranja dati su u tabeli:
. Njihove
pa je
Da bi zbir vjerovatnoa bio jedan, uzima se da je donja granica prvog intervala
gornja granica posljednjeg intervala
.
,a
Iz
tablica
-statistike je:
-raspodjele
ita
se
kritina
vrijednost
za
tj.
. Kako je
nema osnova ze odbacivanje nulte hipoteze, tj.
moe se smatrati da posmatrano obiljeje ima normalnu raspodjelu.
Primjer 6.12 Pri polaganju ispita student dobija samo jedno pitanje iz jedne od tri
oblasti kursa. Analiza pitanja, koje su imali studenti, pokazala je da su 43 studenta dobili
pitanje iz prvog dijela kursa, 52 iz drugog dijela i 25 iz treeg dijela. Da li se na osnovu
dobijenih rezultata moe izvesti zakljuak da studenti sa istom vjerovatnoom dobijaju
pitanja iz sve tri grupe? Postavljenu hipotezu testirati na nivou znaajnosti 0,05.
U ovom sluaju teorijske vjerovatnoe su p1=p2 =p3=1/3. Funkcija raspodjele nema
nepoznatih parametara. Teorijske frekvencije i uzoraka vrijednost
sljedeoj tabeli
-statistike dati su u
Primjer 6.13 Treba ispitati da li vrijeme kanjenja radnika na posao zavisi od godina
radnog staa. Podaci za 1000 radnika dati su u sljedeoj tabeli:
Vrijeme kanjenja
min.
statistike kao u
raunaju se po formuli
-raspodjele
Kritina oblast je
ita
kritina
vrijednost
iz
.
7. REGRESIJA I KORELACIJA
7.1 Pojam korelacione zavisnosti
Razliite pojave u prirodi najee su, u manjoj ili veoj mjeri, povezane meu
sobom. Tako, na primjer, prinos neke ratarske kulture zavisi od pedolokih, klimatskih,
agrotehnikih i niza drugih faktora, finansijski rezultat preduzea zavisi od mnotva
organizaciono-ekonomskih inilaca i td. Jedan od zadataka statistike jeste da ispita stepen
zavisnosti i da utvrdi konkretan tip veze koji postoji izmeu dvije ili vie pojava. Oblast
statistike koja se bavi ovim problemima naziva se korelaciona i regresiona analiza.
Posmatrajmo neke dvije promjenljive (obiljeja) X i Y. Ako su promjenljive
deterministike, izmeu njih postoji funkcionalna veza oblika Y=f(X). To znai da za svaku
vrijednost promjenljive X iz oblasti definisanosti postoji jedna i samo jedna vrijednost
promjenljive Y. Ako su, pak, X i Y dvije sluajne promjenljive, kao to smo vidjeli u
poglavlju (3), one mogu biti ili nezavisne ili zavisne, pri emu ta zavisnost nije funkcionalna
ve stohastika. To znai da promjene vrijednosti sluajne promjenljive X izazivaju promjene
zakona
raspodjele
sluajne
promjenljive
Y.
Drugim
rijeima,
svakoj
vrijednosti x promjenljive X odgovara zakon raspodjele f(y/x) sluajne promjenljive Y.
Poseban vid stohastike zavisnosti je tzv. korelaciona zavisnost. Kod korelacione
veze izmeu dviju sluajnih promjenljivih, promjene jedne sluajne promjenljive povlae
oekivane vrijednosti druge sluajne promjenljive. To znai da razliitim
vrijednostima x sluajne promjenljive X odgovaraju razliite vrijednosti M(Y/x)
matematikog oekivanja sluajne promjenljive Y.
Utvrivanje stepena kvantitativnog slaganja varijacija promjenljivih predmet je
korelacione analize. Odreivanjem funkcionalnog oblika zavisnosti izmeu jedne
promjenljive i prosjenog nivoa druge promjenljive bavi se regresiona analiza. Izabrani tip
funkcije naziva se regresiona funkcija ili jednostavnoregresija. U sluaju dvije promjenljive
koristi se jo termin prosta regresija ili parna regresija.
Ispitivanje zavisnosti izmeu veeg broja promjenljivih predmet je viestruke
korelacione i regresione analize. Jasno je da vei broj promjenljivih adekvatnije opisuje
posmatranu zavisnost, ali isto tako uslonjava analizu. Stoga je jedan od najvanijih zadataka
viestruke korelacione i regresione analize da izabere to je mogue manji broj promjenljivih
koje u velikoj mjeri determiniu ispitivanu zavisnu promjenljivu.
Ispitivanje odnosa pojava nemogue je izvesti na svim jedinicama osnovnih skupova.
Korelaciona i regresiona analiza se obino baziraju na manjem broju jedinica, tj. na uzorcima.
Zbog toga, pri donoenju zakljuaka o ispitivanom odnosu, treba posebno voditi rauna o
mogunosti uoptavanja zakljuaka na cijele osnovne skupove.
7.2 Prosta linearna regresija
Pretpostavimo da ispitujemo zavisnost neka dva obiljeja X i Y. U tu svrhu iz
osnovnog skupa (X, Y) uzet je izvjestan broj parova uzorakih vrijednosti (Xi , Yi).
Realizacije parova vrijednosti (xi, yi) mogu se grafiki predstaviti takama u pravougaonom
Dijagram
rasturanja
Na
osnovurasturanja ta
aka
na
dijagramima (1) i
(2) vidi se da
postoji tendencija
ka
linearnorastuoj zavisnosti
posmatranih
obiljeja.
Veza
promjenljivih je vra u sluaju prikazanom na dijagramu (2), jer su take zbijenije i blie
zamiljenoj pravoj liniji kojom se veza moe predstaviti. Dijagramom (3) prikazana je takoe
linearna, ali za razliku od prva dva sluaja, linearno-opadajua zavisnost izmeu posmatranih
vrijednosti. Veza moe biti i krivolinijska kao to se vidi sa dijagrama (4) i (5). Konano, na
dijagramu (6) se ne zapaa bilo kakva pravilnost u slaganju varijacija ove dvije promjenljive,
to ukazuje na mogunost njihove nezavisnosti.
Ovdje je ematski prikazano samo nekoliko tipskih, od velikog broja moguih oblika
korelacione zavisnosti, koje su predmet izlaganja.
i slobodnim lanom
gde je
, uzoraka ocjena sluajne promjenljive ei ;i=l,2, ...,n, koja se naziva i-tim ostatkom.
Jednaina
predstavlja uzoraku ocjenu regresije i naziva se jednaina najbolje prilagoene linije ili
jednaina regresije.Iz posljednje dvije relacije se vidi da je
Uzorake ocjene, kao funkcije sluajnih veliina Yi, su sluajne veliine. Njihove
realizacije bie oznaene sa a, b i ei ; za
parova (xi,yi) normalne jednaine su
gdje je
10
11
12
13 14
1,30
64
1,6900
10,40
1,25
81
1,5625
11,25
10
1,17
100
1,3689
11,70
11
1,12
121
1,2544
12,32
12
1,05
144
1,1025
12,60
13
1,00
169
1,0000
13,00
14
0,95
196
0,9025
13,30
77
7,84
875
8,8808
84,57
do
8
9
10
11
12
13
1,30
1,25
1,17
1,12
1,05
1,00
1,29892
1,23928
1,17964
1,12000
1,06036
1,00072
0,00108
0,01072
-0,00964
0,00000
-0,01036
-0,00072
0,0000012
0,0001149
0,0000929
0,0000000
0,0001073
0,0000005
14
0,95
0,94108
0,00892
0,0000796
77
7,84
7,84000
0,00000
0,0003964
koja ima n-2 stepeni slobode. Broj stepeni slobode je umanjen za dva zbog dvije linearne
veze za ocjenu nepoznatih koeficijenata a i b. Zamjenom varijanse
prethodnom ocjenom
u relaciji dobljaju se uzorake ocjene varijansi sluajnih promjenljivih
ima t-raspodjelu sa v = n-2 stepeni slobode. Ova injenica se moe iskoristiti za testiranje
hipoteze H0:b=b0 protiv jedne od alternativnih hipoteza Ha: bb0, ili Ha: b<b0, ili
Ha: b>b0.
Kada je u pitanju linearna funkcija esto je od interesa provjera hipoteze o
postojanju nagiba, odnosno, rastue ili opadajue tendencije. Zato se obino testira hipoteza
H0: b = 0, protiv alternativne Ha:b 0. Realizacija statistike T
Vrijednosti ocjena
za (xi , yi) su
pa su konkretni intervali
=0,00008
Tabline vrijednosti za v = n-2 =7 -2 = 5 st. sl. su: t0,025; 5 = 2,57 i t0,005; 5 = 4,03. S
obzirom da je
hipoteza H0 se odbacuje u korist alternativne da je vrijednost
regresionog koeficijenta brazliita od nule. Dakle, prosjena masa grla u leglu se mijenja pri
promjeni veliine legla.
Interval pouzdanosti koji sa vjerovatnoom 0,99 pokriva nepoznati parametar b je:
-0,05964 4,032 0,00169 < b < -0,05964 + 4,032 0,00169
-0,06645 < b < -0,05283
Da bi se odredio interval pouzdanosti koji sa vjerovatnoom 0,95 pokriva nepoznati
parametar treba izraunati standardnu greku ocjene nepoznatog parametra a, tj.
;
Interval povjerenja koji sa vjerovatnoom l -a1=0,95 pokriva nepoznati parametar a je
slijedi da je
, hipoteza H0 se odbacuje.
1
SSG=SSU-SSR
FUZ=1245**
n-2
UKUPNO
n-1
SSU=0,1000
7-1=6
mogu dobiti
ocjene prosjenog nivoa zavisno-promjenljive za uzorake vrijednosti nezavisnopromjenljive xi. U praktinim zadacima esto je od interesa odreivanje prosjenog nivoa
zavisno-promjenljive za vrijednosti nezavisno-promjenljive, koje se razlikuju od uzorakih
vrijednosti.
Ako je vrijednost nezavisno-promjenljive u intervalu izmedju najmanje i najvee
uzorake vrijednosti, onda se postupak ocjenjivanja zavisno-promjenljive za takve vrijednosti
nezavisno-promjenljive naziva interpolacija, a ocjenjena vrijednost se naziva interpolirana
vrijednost.
Ako je vrijednost nezavisno-promjenljive izvan intervala izmeu najmanje i najvee
uzorake vrijednosti, onda se postupak ocjenjivanja zavisno-promjenljive za takve vrijednosti
nezavisno-promjenljive
naziva ekstrapolacija,
a
ocjenjena
vrijednost
se
naziva ekstrapolirana vrijednost.
Za testiranje znaajnosti interpoliranih i ekstrapoliranih. vrijednosti treba odrediti
zakon raspodjele sluajne promjenljive
ocjenom
Statistika
Za x0=
je:
ocenom
dobija se ocjena
, iji je korijen
Statistika
t-raspodjele koristi se
je
;
pa je
to znai da je sa 95% pouzdanosti prosjena masa grla u leglu izmeu 0,925 i 0,957 kg.
Za
je
;
pa je
Pokazatelj
linearne
zavisnosti
je
odnosno
, to znai da je vrijednost koeficijenta korelacije izmedju -1 i 1.
Ako je koeficijent korelacije jednak nuli, promjenljive X i Y su nekorelirane, a ako su iz
skupa sa normalnom raspodjelom, to znai, kao to je ranije reeno, da su i nezavisne. Ako je
koeficijent korelacije po apsolutnoj vrijednosti jednak jedinici, izmeu promjenljivih X i Y
postoji funkcionalna zavisnost.
Kada raspodjela osnovnog skupa (X,Y) nije poznata, koeficijent korelacije se moe
ocijeniti na osnovu uzorka. Statistika pomou koje se moe dobiti ocjena koeficijenta
korelacije
Realizacija statistike
1, 2, ...,n jednaka je:
- srednja zavisnost
- jaka zavisnost
- vrlo jaka zavisnost
Ovakvu interpretaciju treba uzeti uslovno, jer se o vrijednosti koeficijenta korelacije
moe pouzdano govoriti tek poslije testiranja znaajnosti, o emu e kasnije biti rijei.
Primjer 7.5 Za podatke iz primjera 7.1 izraunati vrijednost koeficijenta korelacije.
Na osnovu podataka o veliini legla (xi) i prosjenoj masi grla u leglu (yi), izraunat je
koeficijent korelacije premaprethodnom obrascu. Ovdje je:
Zavisnost veliine legla i mase grla pri roenju vrlo je jaka i negativna. Trebalo bi,
meutim, naglasiti da na osnovu koeficijenta korelacije nije utvreno ta je uzrok a ta
posljedica. Moe se rei da su u veim leglima grla manje mase, ali zakljuak moe biti i da u
leglima sa jedinkama vee mase ima manje grla.
Vidjeli smo da se na osnovu pokazatelja regresione i korelacione analize zavisnost
dva obiljeja sagledava na dva naina. S obzirom da je rije o jednoj istoj korelacionoj
zavisnosti, logino je oekivati da izmeu statistika pomou kojih se ocjenjuju ovi pokazatelji
postoje sljedee veze:
Vrijednost
naziva se koeficijent determinacije i oznaava se sa
. Ovaj
pokazatelj predstavlja proporcionalni dio ukupnog varijabiliteta zavisno-promjenljive,
objanjen uticajem nezavisno-promjenljive. Njegova dopuna do jedinice naziva se koeficijent
nedeterminacije i predstavlja proporcionalni dio ukupnog variranja zavisno-promjenljive koji
nije objanjen uticajem nezavisno-promjenljive, odnosno:
Ako
je
izraunata
vrijednost
prethodne
T-statistike
vea
od
tabline
vrijednosti
hipoteza se odbacuje na nivou znaajnosti a. U protivnom, nema osnova za
odbacivanje nulte hipoteze.
Primjer 7.6 Na osnovu podataka iz primjera 7.1 i 7.5 :
a)
Neka su
nepoznatih parametara
gdje je
i = 1,2, ....., n.
Jednaina
; i = 1, 2,....
predstavlja uzoraku ocjenu jednaine regresije. Iz posljednje dvije relacije je
; i=1,2,.....,n
Relacija predstavlja jednainu ravni u prostoru. Prethodno su prikazane realizacije
i ei za neke parove vrijednosti (x1i,x2i).
Vidjeli smo da se, kao rezultat primjene metoda najmanjih kvadrata na prethodni
model problema, ocjenjivanje koeficijenata svodi na rjeavanje sistema od tri linearne
jednaine sa tri nepoznate veliine. Procedura ocjenjivanja se u izvjesnom smislu
pojednostavljuje ako se koriste uzorake vrijednosti u odstupanjima od sredine.
D - determinanta sistema je:
koja se naziva standardna greka regresije. Njen kvadrat predstavlja uzoraku ocjenu
varijanse sluajnih odstupanja ei. Ova ocjena ima n-3 stepena slobode, zbog tri linearne veze
pri ocjeni nepoznatih parametara modela.
Primjer 7.7 Na osnovu podataka o prinosu penice, utroku prihrane i zasijanoj
povrini u 10 radnih organizacija, koji su prikazani u tabeli, ocijeniti jednainu regresije i
izraunati standardnu greku regresije:
Prosjean prinos Utroak prihrane,
Zasijana
Poljoprivredne
penice, t/ha
t/ha
povr. (00)ha
organizacije
yj
X1i
X2i
A
4,5
0,7
9
B
5,1
1,0
10
C
5,8
1,0
14
D
5,2
0,9
12
E
6,1
1,2
9
F
4,8
0,7
12
G
4,3
0,6
10
H
5,5
1,0
13
I
5,0
0,8
11
J
5,7
1,1
10
U trodimenzionalnom rasporedu ovih deset jedinica, prinos penice se uzima kao
zavisno-promjenljiva (Y), a utroak mineralnog gnojiva i veliine povrine pod penicom su
nezavisno-promjenljive(x1, x2).
Za formiranje prethodnog sistema jednaina potrebni su kvadrati i proizvodi
promjenljivih, prikazani u radnoj tabeli:
Red.
broj
1
2
3
4
5
6
7
8
9
10
x1
4,5
5,1
5,8
5,2
6,1
4,8
4,3
5,5
5,0
5,7
52,0
0,7
1,0
1,0
0,9
1,2
0,7
0,6
1,0
0,8
1,1
9,0
x2
y2
9
20,25
10 26,01
14 33,64
12 27,04
9
37,21
12 23,04
10 18,49
13 30,25
11 25,00
10 32,49
110 273,42
x1y
0,49
1,00
1,00
0,81
1,44
0,49
0,36
1,00
0,64
1,21
8,44
x1y
81
3,15 40,5
100 5,10 51,0
196 5,80 81,2
144 4,68 62,4
81
7,32 54,9
144 3,36 57,6
100 2,58 43,0
169 5,50 71,5
121 4,00 55,0
100 6,27 57,0
1236 47,76 574,1
x1x2
6,3
10,0
14,0
10,8
10,8
8,4
6,0
13,0
8,8
11,0
99,1
=0,33556 ;
=0,57927
=0,3778 ;
=0,19436
=11 ;
=2,88889 ;
=1,69967
= 168,4 ; = 247,5 ;
= 6,18
Poevi od prosjenog poetnog nivoa l,91 t/ha, prinos se poveava pri promjeni
nivoa posmatranih inilaca. Prosjeno poveanje prinosa po hektaru je 2,8 t za tonu prihrane,
uz konstantan obim povrina. Prinos se, meutim, vrlo malo mijenja pri promjeni obima
povrina. Prosjena promjena je samo 0,07 t za poveani obim povrine od 100 ha, pri emu
je iskljueno djelovanje prihrane.
Do iste ocjene koeficijenata dolazi se i na osnovu vrijednosti promjenljivih, datih u
odstupanjima od aritmetike sredine.
Za formiranje sistema normalnih jednaina potrebno je izraunati sljedee sume
kvadrata i sume proizvoda promjenljivih:
Zamjenom se dobija:
;
; ij. Iz ove dvije pretpostavke slijedi da su ei i ej za ij i nezavisne.
nekorelirane, tj.
Statistika
; j=1,2
ima t-raspodjelu sa v = n - 3 stepeni slobode. Ova injenica se moe iskoristiti za testiranje
hipoteze H0:
Ha:
<
ili Ha:
>
, Ili
, tj. da se
=0
Ovdje je
i da je
i
, tj.
hipoteza H0 se odbacuje na oba zadana nivoa
znaajnosti. Odbacivanjem hipoteze H0 potvruje se uticaj promjenljive X1 (mineralnih
gnojiva) na prinos penice, pri konstantnom uticaju promjenljive X2 (obima zasijane
povrine).
Drugi individualni test odnosi se na testiranje nulte hipoteze H0:
obzirom da je
i da je
.S
je
je:
Slino kao to je pokazano kod proste linearne regresije, i ovdje se moe pokazati da
se ukupna suma kvadrata variranja moe razloiti na sumu kvadrata regresionog variranja i
sumu kvadrata greke:
odnosno
SSU = SSR + SSG
Suma kvadrata ukupnog variranja ima (n-l) stepeni slobode zbog jedne linearne
relacije izmedju iYi; i=l,2,...,n. Kao to smo rekli, suma kvadrata greke ima n-3 stepeni
slobode. Prema tome, suma kvadrata regresionog variranja ima 2 stepena slobode.
ima F-raspodjelu sa v1=2 i v2=n-3 stepeni slobode. Ova injenica se moe iskoristiti za
testiranje hipoteze H0: b1=b2=0, protiv alternativne Ha: (b10)v(b20) . Ako je izraunata
vrijednost FUZ F-statistike vea od tabline na zadanom nivou znaajnosti a, tj Fuz>Fa/2;n-3,
nulta hipoteza se odbacuje. U protivnom nema osnova za odbacivanje nulte hipoteze.
Rezultati analize varijanse obino se predstavljaju u tabeli analize varijanse:
Tabela analize varijanse za linearnu regresiju dvije
nezavisno-promjenljive
IZVORI
SUME
VARIJANSE KVADRATA
REGRESIJA
(X1,X2)
STEPENI
SREDINE
FSLOBODE KVADRATA KOLINIK
2
GREKA
n-3
UKUPNO
n-1
Slino kao i kod proste regresije, i ovdje je mogue testirati hipoteze i formirati
intervale pouzdanosti za interpolirane i ekstrapolirane vrijednosti, pod pretpostavkom da je
osnovni skup (x1, x2,Y) normalno rasporeen.
Statistika
oznaeno M(Y/X1=x10,
je
, odnosno
Statistika
Prosjean prinos penice po hektaru, pri utroku 0,6 t prihrane i l000ha povrine,
procjenjuje se na izmeu 4 i 4,5t sa pouzdanou 95%.
Individualni prinos penice po hektaru za iste vrijednosti nezavisno-promjenljivih
izraunava se na osnovu:
pa je:
koja u sluaju kada je r012=0 ima F-raspodjelu sa n1=2 i n2=n-3 stepeni slobode. Za
testiranje hipoteze H0: r012=0 protiv alternativne Ha: r0120 izraunata F-vrijednost se
uporedjuje sa tablinom vrijednou
. Ako je F>
nulta hipoteza se odbacuje na
nivou znaajnosti a, u korist alternativne hipoteze. U protivnom, nulta hipoteza se ne
odbacuje. Ovaj test je identian testu hipoteze H0: b1=b2=0 kod viestruke regresije.
Ocjene i testovi kod ovog modela isti su kao i kod viestruke linearne regresije i
korelacije, s tim to je uobiajeno da se umjesto koeficijenta viestruke korelacije r012, ija
se uzoraka ocjena oznaavala sa
, a vrijednost uzorake ocjene sa r012, ovdje koristi
termin indeks korelacije , ija je uzoraka ocjena I, a vrijednost uzorake ocjene i. Vrijednosti
uzorakih ocjena a, b i g obino se oznaavaju sa a, b i c, respektivno.
Primjer 7.12 Podaci o koliini jednog aditiva koji se koristi u ishrani pilia i
dnevnom prirastu mase dati su u tabeli.
Izvriti regresionu i korelacionu analizu zavisnosti ova dva obiljeja. Testiranja
izvriti na nivou znaajnosti a=0,05.
Odrediti 95%-tne intervale povjerenja za prosjenu i individualnu vrijednost prirasta
pri upotrebi 7gr aditiva po kg hrane.
Grafiki prikaz odnosa nezavisno-promjenljive (koliine preparata) i zavisnopromjenljive (dnevnog prirasta) dat je na slici (a). Prema dijagramu rasturanja na slici (a)
oigledna je krivolinijska tendencija promjena prirasta pri poveanju koliine preparata.
Koliina preparata
gr/kg hrane
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
6,0
Dnevni
prirast kg
0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76
0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76
0,25
1,00
2,25
4,00
6,25
9,00
12,25
16,00
20,25
25,00
30,25
36,00
0,125
1,000
3,375
8,000
15,625
27,000
42,875
64,000
91,125
125,000
166,375
216,000
0,0625
1,0000
5,0625
16,0000
39,0625
81,0000
150,0625
256,0000
410,0625
625,0000
915,0625
1296,0000
0,270
0,600
0,945
1,300
1,800
2,070
2,555
3,080
3,375
3,950
4,235
4,560
0,1350
0,6000
1,4175
2,6000
4,5000
6,2100
8,9425
12,3200
15,1875
19,7500
23,2926
27,3600
0,2916
0,3600
0,3969
0,4225
0,5184
0,4761
0,5329
0,5929
0,5625
0,6241
0,5929
0,5776
122,3150 5,9484
0,5
1,0
1,5
2,0
2,5
3,0
3,5
4,0
4,5
5,0
5,5
8,0
0,54
0,60
0,63
0,65
0,72
0,69
0,73
0,77
0,75
0,79
0,77
0,76
0,54554
0,58952
0,62872
0,66315
0,69282
0,71773
0,73787
0,75324
0,76385
0,76970
0,77077
0,76709
-0,00554
0,01048
0,00128
-0,01315
0,02718
-0,02773
-0,00787
0,01676
-0,01385
0,02030
-0,00077
-0,00709
0,0000307
0,0001098
0,0000016
0,0001729
0,0007388
0,0007690
0,0000619
0,0002809
0,0001918
0,0004121
0,0000006
0,0000503
8,40
8,40000
0,00000
0,0028204
pa je
SUME KVADRATA
VAR I J A N S E
REGRESIJA (X,X2)
LINEARNA (X)
2
KVADRATNA (X )
SREDINE
KVADRATA
FKOLINIK
FUZ=105,8**
FK =24,52**
SSR=
SSRL=0,0580
SSRK=0,0076
0,0656 2
1
MSR=0,0328
MSRL=0,0580
MSRK=0,0076
SSG= 0,0028
MSG=0,0003
GRE[KA
UKUPNO
ST. SL.
FL =187,1**
9
SSu = 0,0684
11
jer je:
jer je:
8. RELATIVNI BROJEVI
- STATISTIKO ISPITIVANJE DINAMIKE POSLOVANJA 8. 1 Indeksi
Indeksni statistiki pokazatelji su numerike karakteristike strukture i dinamike
socioekonomskih masovnih pojava i procesa kao to su: obim i dinamika radnih i
materijalnih resursa, planiranje, struktura i dinamika proizvodnih snaga, produktivnost rada,
visina zarada, drutvena proizvodnja, nacionalni dohodak i fiziki obim proizvodnje,
proizvodni rashodi, cijene, njihovo formiranje i ponaanje, fiziki obim prometa, kretanje
ivotnog standarda, trokovi ivota itd.
Za izuavanje masovnih pojava i procesa poslovna statistika koristi integralne
pokazatelje koji predstavljaju jednoznano standardizovanu kvantitativnu mjeru izraavanja
opte tendencije promjena i parcijalne iji zbir kvantitativno izraenih dinamikih ocjena
procesa ili pojave se koristi kao baza za integralni pristup.
8.1.1 Individualni indeksi
Individualni indeksi su relativni pokazatelji odnosa individualnih podataka, a koriste
se u dinamikoj analizi statistikih skupova i procesa ije se promjene posmatraju kao
sluajne funkcije jednog argumenta (promjenljive) u vremenu, oblika
nizu oznae sa
oznai sa
, onda se bazni indeksi izraunavaju primjenom relacije:
, gdje
je broj podataka u vremenskoj seriji, a oznaka niza baznih indeksa, tj. individualnih
relativnih promjena.
Lanani indeksi: Ako se nivoi pojave meusobno uporeuju tako da se za osnovu ili
bazu uporeivanja koristi svaki prethodni podatak u odnosu na naredni tj. ako se svaki
podatak relativizuje prema prethodnom, koji se ponaa kao njegova baza, tada izraunati
individualni indeksi imaju promjenljivu bazu i zovu se lanani (verini) indeksi. Lananim
indeksima se izraavaju sukcesivne stope rasta, gdje se sukcesivnom promjenom baze
izravnavaju periodine varijacije. Kada se za baznu vrijednost uzme podatak iz prethodnog
perioda,
dobija
se
lanani
indeks
koji
se
izraunava
na
osnovu
relacije:
,
, gdje je
oznaka niza lananih indeksa, a broj nivoa
(podataka) vremenskog niza. Lanani indeksi pokazuju tempo razvoja tj. brzinu kretanja
(promjenu) posmatranih vrijednosti u odnosu na bazne, a njihova numerika vrijednost varira
oko broja 100. I lanani i bazni indeksi predstavljaju raunsko praenje promjena pojave koja
se zasniva na tom da se apsolutne vrijednosti zamijene relativnim.
Primjer 8.1: Izraunati bazne i lanane indekse i iste grafiki prikazati na osnovu
slijedeih podataka:
Godine
Proizvodnja
Bazni indeksi
1995=100
2000=100
Lanani
indeksi
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
13,8
14,6
12,6
11,8
12,1
10,8
11,4
10,6
11,3
11,1
100,0
105,8
91,3
85,5
87,7
78,2
82,6
76,8
81,9
80,4
105,8
86,3
93,7
102,5
89,3
105,6
93,0
106,6
98,2
127,7
135,2
116,7
109,3
112,0
100,0
105,6
98,2
104,6
102,8
1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
Pomou lananih indeksa moe se utvrditi prosjena stopa rasta posmatrane pojave
preko izraunavanja njihove geometrijske sredine, tako da u navedenom primjeru imamo:
za godine
) onda
):
Ovaj agregat je homogen, poto su njegovi elementi iz istog (baznog) perioda, tako
da predstavlja realnu knjigovodstvenu veliinu. Zbog heterogenog agregata (
) kao
nedostatka navedenog obrasca, za izraunavanje grupnog indeksa koristi se harmonijska
sredina individualnih indeksa:
ili
metodom agregata (totalnih odnosa):
ili
2. Grupni indeks cijena
Mjerenje relativnih promjena u nivou cijene za vie proizvoda je zadatak grupnih
indeksa cijena iji osnov za izraunavanje ine sljedea dva obrasca:
Metodom prosjeka:
, odnosno
Metodom agregata:
, Laspaerov indeks
,Paeov indeks
ili
gdje
usluga, a
III '95. ( )
CIJENA
III
III '94. ( )
(
200
300
400
150
450
500
600
350
60
55
35
50
'95.
)
110
90
60
80
1.
a)
,
to znai da se fiziki obim proizvodnje 1995. g. u odnosu na 1994. u prosjeku
poveao za 86%.
;
provjera prosjenog poveanja fizikog obima proizvodnje metodom agregata
b)
2.
a)
u
prosjeku poveala za 70%
b)
3.
a)
4.
a)
b)
za 4 %
geometrijski neponderisani indeksi, kao i oni sa baznim ponderima, dok Fisherov idealni
indeks ne ispunjava ovaj uslov.
8.2 Ekonomski pokazatelji dinamike
Pokazatelji strukture su takvi relativni brojevi koji procentualno predstavljaju odnos
dijela neke masovne pojave prema cjelini i primjenjuju se u datom momentu, pa kaemo da
pripadaju instrumentima statike analize. Oni ipak omoguavaju da kroz neke dinamike
pokazatelje uporeujemo istorodne pojave po strukturi u raznom prostornom i vremenskom
rasporedu, kao i da pratimo razvoj strukture pojave u raznim periodima. Izraunavaju se na
sljedei nain:
gdje je:
- dio pojave
- pojava u cjelini
nivou, tako da nije identian sa tempom razvitka a izraava se kao procentni broj ( )
Srednji tempo razvitka ( ) - predstavlja geometrijsku sredinu svih individualnih
tempa razvitka ili kolinik izmeu posljednjeg i prvog podatka u nizu.
Pokazatelji dinamike mogu se uoptavajui ematski prikazati sljedeim zapisom:
Nivo(
Apsolutni
Tempo
Tempo porasta (
porast (
razvitka (
-
)
-
Apsolutni porast (
Tempo porasta:
Tempo porasta (Tp) moe da poprimi negativnu vrijednost i tada izraava pad pojave,
pozitivnu vrijednost i tada izraava porast pojave i vrijednost jednaku nuli to je naznaka da
ne postoji varijabilitet.
Srednji tempo razvitka:
gdje u prvom sluaju imamo broj jedinica proizvoda po radniku a u drugom broj angaovanih
radnika po jedinici proizvoda
c) da se za mjerenje produktivnosti razliitih proizvoda koji se ne mogu zbirno prikazivati se
koristi vrijednosni ili radni izraz koji ima najiru primjenu i najvei analitiki znaaj kod
proizvoda sa priblinim ueem materijalnih trokova u cijeni, pa bi u tom sluaju
produktivnot rada bila:
gdje je:
Spq vrijednosni izraz
St ukupno utroeno vrijeme
Dakle, produktivnost rada predstavlja apsolutni izraz prosjene proizvodnje po
jedinici vremena ili prosjenog vremena potrebnog za jedinicu proizvoda. Ocjena ovih
apsolutnih vrijednosti jedino je mogua preko indeksa produktivnosti kao analitikog
pokazatelja iji je smisao da se produktivnost jednog perioda poredi sa produktivnou
drugog.
8.3.2 Individualni indeks produktivnosti
Ako stavimo u odnos produktivnost tekueg prema produktivnosti baznog perioda za
jedan proizvod (preduzee), dobijamo individualni indeks produktivnosti. Neka
produktivnost tekueg (posmatranog) perioda bude izraena sa q1/T1 a baznog q0/T0 tada e
indeks produktivnosti biti izraen sa:
, gdje je:
t0 i t1 prosjena vremena za izradu jedinice proizvoda u baznom i posmatranom periodu
q0 i q1 proizvedene koliine u baznom i posmatranom periodu
Grupni indeks dinamike produktivnosti rada promjenjivog sastava proizvodnje ima za
cilj da izmjeri ukupan efekt promjena poveane produktivnosti u uslovima izmjenjene
strukture, a izraava se formulom:
, gdje su :
T0 i T1 ukupno utroena vremena za cjelokupnu proizvodnju u baznom i
posmatranom periodu.
Obraun navedenih indeksa produktivnosti rada nepromjenjenog i promjenjenog
sastava proizvodnje utvruje se na osnovu naturalnog uzraza. Ako ne raspolaemo naturalnim
,
a obraun vrijednosti indeksa produktivnosti rada na bazi nepromijenjenog sastava:
gdje su:
q0 p ponderi
I individualni indeks produktivnosti rada
Primjer 8.4 Graevinsko preduzee Astorija a.d. 2004. i 2005. godine ostvarilo je
proizvodnju s angaovanim proizvodnim radnicima prema sljedeim podacima:
Tip zgrade
P+2
P+3
P+4
Broj radnika
2004.
2005.
720
750
750
720
600
500
Izraunati i protumaiti:
a) produktivnost mjerenu utroenim radom za jedinicu proizvoda, tj. brojem
angaovanih radnika po jednoj zgradi;
b) grupni indeks produktivnosti rada nepromjenljive proizvodnje (ako su ponderi bazni);
c) grupni indeks produktivnosti rada promjenljive proizvodnje.
Objasniti kako je promjena u strukturi proizvodnje uticala na produktivnost.
Postupak rada
-
Tip
zgrade
P+2
P+3
P+4
S
q0
q1
60
50
30
140
T0
75
40
25
140
T1
720
750
600
2070
750
720
500
1970
12
15
20
-
10
18
20
-
720
750
600
2070
600
900
600
2100
b)
to znai da se prosjeno utroeno vrijeme povealo za 1,45%, a produktivnost opala za
1,42% (100: 101,45x100=95,58; 95,58-100= - 1,42), 2005. u odnosu na 2004. godinu.
c)
to znai da se prosjeno utroeno vrijeme smanjilo za 4,9%, a produktivnost poveala za 5%
(100: 95,17 x 100 = 105; 105 100 = 5), 2005. u odnosu na 2004. godinu.
d) Indeks Pr nepromjenljive proizvodnje vei je od indeksa Pr promjenljive proizvodnje (kod
nepromjenljive produktivnost je opala za 1,42 %, a kod promjenljive porasla za 5%). To
znai da je promjena u strukturi proizvodnje povoljno uticala na produktivnost, jer je
poveala proizvodnju.
8.4 Statistika analiza dinamike zarada
Dinamiku trokova ivota uslovljavaju realne zarade koje predstavljaju pokazatelj
ivotnog standarda, iji porast ili pad zavisi od indeksa trokova ivota. Promjene u
trokovima ivota predstavljaju pomjene u cijenama artikala za podmirenje potreba
stanovnitva, a obuhvatamo ih indeksom trokova ivota koji se praktino svodi na indeks
cijena na malo.
Sumu trokova ivota sainjava zbir vrijednosti svih proizvoda i usluga sadranih u
tipskom budetu i utvrenih na osnovu cijena datog perioda. Tipski budet moe se odrediti
metodom porodinih budeta, metodom globalne potronje i metodom teorijskog budeta.
Utvrivanjem tipskog budeta odnosno liste proizvoda odgovarajuih cijena i pondera,
stvoreni su uslovi za izraunavanje indeksa trokova ivota po sljedeoj formuli:
Na osnovu toga promjene prosjenih neto zarada mogu da se prate ako se uzme u
obzir uticaj promjena u kvalifikovanom sastavu zaposlenih, kao i bez uticaja takvih
promjena, na osnovu ega razlikujemo dvije vrste grupnih indeksa nominalnih neto zarada:
a) Indeks neto zarada promjenljivog sastava zaposlenih
b) Indeks neto zarada nepromjenljivog sastava zaposlenih
Pored indeksa nominalnih neto zarada potrebno je izraunato i indekse realnih neto
zarada, pogotovo u sluaju kada se uporedo sa poveanjem nivoa neto zarada po istoj stopi
poveavaju trokovi ivota.
Indeks nominalnih prosjenih neto zarada promjenljivog sastava
zaposlenih izraunava se kao odnos prosjene neto zarade u posmatranom periodu i
prosjene neto zarade baznog perioda. Za utvrivanje i konkretnu primjenu indeksa zarada
potrebno je da se prvo izrauna prosjena neto zarada za bazni i tekui period na sljedei
nain:
Primjer 8.5
Prema podacima preduzea Aleksandar Impeks za juni i decembar 2005. godine
izraunati grupni indeks nominalnih neto zarada nepromijenjenog sastava zaposlenih. Podaci
potrebni za obraun nalaze se u tabeli:
Struna
sprema
0
VSS
VS
SSS
NS
VKV
KV
NK
SVEGA
VI
1
20
10
90
15
18
20
12
185
XII VI
XII
2
3
4
22
2520
3350
8
2240
2800
100
1920
2458
9
800
1000
18
2000
2600
22
1650
2112
6
900
1143
185 1823,78 2437,96
Indeks
Inz
5 (4:3)
133
125
128
125
130
128
127
134
Suma
neto
plata u
Inz x0
junu
2005. x0
6
50400
22400
172800
12000
36000
33000
10800
337400
7 (5 x 6 )
67032
28000
221184
15000
46800
42240
13716
433972
Postupak rada:
-
Prosjena neto zarada zaposlenih u decembru prema junu 2005. poveala se za 29%.
Eliminisan je uticaj promjena u strunom sastavu zaposlenih. Ako se eli utvrditi koliko su
promjene u sastavu zaposlenih uticale na porast ili pad prosjene neto plate, treba staviti u
odnos indeks neto zarada promjenljivog prema indeksu promijenjenog sastava zaposlenih.
=
; i=k+1,...,n-k
gdje je k=(m-1)/2. Tako npr. pokretni prosjek duine 5, za neki lan vremenske serije yi,
predstavlja aritmetiku sredinu tog lana, dva prethodna i dva naredna lana. Jasno je da prva
dva i posljednja dva lana vremenske serije nemaju pokretne prosjeke duine 5.
Ako je m paran broj, pokretni prosjeci duine m za lan yi mogli bi se definisati kao
; i=k+1,...,n-k
ali i kao
=
; i=k+1,...,n-k
gdje je k=m/2. Umjesto bilo kog od ova dva pokretna prosjeka, kao pokretni prosjek koji
odgovara lanu yi uzima se njihova aritmetika sredina ( + )/2 pa je:
; i=k+1,...,n-k
Pokretni prosjeci tipa prethodnog tipa nazivaju se centrirani pokretni prosjeci, jer su
konstruisani tako da srednji lan pokretnog prosjeka bude ba vrijednost yi. Kao i kod
pokretnih prosjeka sa neparnom duinom, po k-lanova sa poetka i kraja serije nemaju
centrirane pokretne prosjeke.
to je duina pokretnog prosjeka vea, to se pomou njih, obino bolje otklanjaju
oscilacije oko trenda. To znai da za serije sa izraenijim kolebanjima oko osnovne
tendencije treba izabrati due pokretne prosjeke. Pri tome treba imati na umu da je duina
pokretnih prosjeka ograniena duinom serije, s obzirom na gubitak izvjesnog broja poetnih
i krajnjih pokretnih prosjeka. Ako su kolebanja oko trenda periodina, onda se ona najvie
priguuju pomou pokretnih prosjeka ija je duina priblino jednaka periodu kolebanja.
Primjer 9.1 Na osnovu podataka o otkupu jednog proizvoda u periodu od 1990. do
2005. godine, izraunati su pokretni prosjeci duine 3 i duine 4 (centrirani pokretni
prosjeci).
Za m=3 je k=1, pa je na osnovu prethodnih izraza:
; i=2,3,...,15
tj.
=23,7
=22,3
Za m=4 je k=2, pa je na osnovu prethodnih izraza:
; i=3,4,...,14
tj.
=22,6
=23
U sljedeoj tabeli dati su rezultati izraunavanja:
Godina
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
Otkup
000t
22
26
23
18
25
30
28
25
27
32
31
27
28
35
33
30
Pokretni prosjeci
m=3
m=4
23,7
22,3
22,6
22,0
23,5
24,3
24,6
27,7
26,1
27,7
27,2
26,7
27,8
28,0
28,4
30,0
29,0
30,0
29.4
28,7
29,9
30,0
30,5
32,0
31,1
32,7
Se =
Na osnovu standardne greke 100(1-a)% interval povjerenja za buduu vrijednost je
,
Kako je:
to je
Primjer 9.2 Na osnovu podataka o broju traktora u naoj zemlji u periodu od 19992005. godine ocijeniti jednainu
linearnog trenda. Nai 95%-ne intervale za
broj traktora u 2006, 2007. i 2008. godini.
Godina Broj traktora
1999
595
2000
622
2001
706
2002
809
2003
882
2004
955
2005
1017
Ovdje je
i
1
2
3
4
5
6
7
yi
595
622
706
809
882
955
1017
5586
iyi
595
1244
2118
3236
4410
5730
7119
24452
b=
572,16
647,45
722,74
798,03
873,32
948,61
1023,90
521,6656
647,7025
280,2276
120,3409
75,5161
40,8321
47,6100
1733,8948
=75,28571
= 496,87312
Se =
=
=18,62
a=0,5; n=n-2=7-2=5 ta/2;n=t0,025;5=2,57
2006: k=i; to=i=n+k=7+1=8;
= 496,87+75,298 = 1099,19
=
=18,621,31=24,39
1099,19-24,392,57<y8<1099,19+24,392,57
1036,51<y8<1161,87
2007: k=2;
= 1174,48; Sp=26,57
1106,20<y8<1242,76
2008: k=3;
=1249,77; Sp=29,02
1175,19<y10<1324,35
Na osnovu jednaine trenda moe se izvriti prognoza za neki budui period n+k:
Korienjem prethodnih relacija u ovom poglavlju moe se pokazati da standardna
greka prognoze postaje:
gdje je:
yi
20
26
24
27
30
28
26
21
18
25
245
iyi
20
52
72
108
150
168
182
168
162
250
1332
i2 yi
20
104
216
432
750
1008
1274
1344
1458
2500
9106
21,79
23,95
25,51
26,47
26,83
26,59
25,75
24,31
22,27
19,63
-
3,2041
4,2025
2,2801
0,2809
10,0489
1,9881
0,0625
10,9561
18,2329
28,8369
80,0930
16,36-12,35<y11<16,36+12,35
4,01<y11<28,71
; i=1,2,...,n
Koeficijenti a1 i b1 se dobijaju rjeavanjem sistema normalnih jednailna:
Izvoz
000$
1990
1991
1992
1993
1994
1995
1996
1997
215
384
350
490
622
775
1020
1550
Ovdje je:
i
yi
1
215
2
384
3
350
4
490
5
622
6
775
7 1020
8 1550
wi=lnyi
5,37064
5,95064
5,85793
6,19441
6,43294
6,65286
6,92756
7,34601
50,73299
ilnyi
5,37064
11,90128
17,57379
24,77764
32,16470
39,91716
48,49292
58,76808
238,96621
5,45175
5,70600
5,96025
6,21450
6,46875
6,72300
6,97725
7,23150
0,00658 233,17
0,05985 300,66
0,01047 387,70
0,00040 499,94
0,00128 644,67
0,00492 831,29
0,00247 1071,94
0,01311 1382,26
0,09908
=5,19750+0,254299=7,48575
to nije mogue, pa se za ocjenu parametara koriste razliite pribline metode koje dovode do
uzorakih statistika sa loim statistikim svojstvima[2].
Za modeliranje trenda esto se koriste krive sa asimptotama. Meu takve, iji se
parametri ne mogu ocijeniti linearnim metodom najmanjih kvadrata, spadaju i modifikovana
eksponencijalna, Gompercova i ligistika kriva.
9.3 Korelaciona zavisnost izmedju vremenskih serija
U praktinim zadacima esto se javlja potreba da se ispita jaina korelacione
zavisnosti izmeu dva obiljeja, koja su predstavljena vremenskim serijama. Stvarna
saglasnost varijacija ovih obiljeja moe biti uveana ili umanjena uticajem trend
komponente. U takvim situacijama, ocjenjena vrijednost koeficijenta korelacije daje pogrenu
predstavu o jaini korelacione veze. Da se ovo ne bi dogodilo prije ispitivanja korelacione
zavisnosti, mora se iskljuiti uticaj trenda iz posmatranih vremenskih serija.
Neka su y1i i y2i; i=1,2,...,n nivoi vremenskih serija a i
; i=1,2,...,n ocjenjene
vrijednosti njihovih trend komponenti. U sluaju aditivnog modela otklanjanjem trenda
dobijaju
se
nivoi
i
i
multiplikativnog,
i=1,2,...,n,
sluaju
y2i
568
594
676
778
850
923
985
5374
Drustv.
Godina sektor
1991
27
1992
28
1993
30
1994
31
1995
32
1996
32
1997
32
y1i y2i
729
784
900
961
1024
1024
1024
6446
322624
352836
456976
605284
722500
851929
970225
4282374
15336
16632
20280
24118
27200
29536
31520
164622
Indiv.
sektor
568
594
676
778
850
923
985
=26,71+0,891,
9570,71
9658,96
10426,45
10487,81
10547,29
9968,03
9438,12
70097,37
10880,58
9210,24
9506,25
10269,80
10188,88
10142,50
9980,36
70078,61
y2i
27,60
28,49
29,38
30,27
31,16
32,05
32,94
97,83
98,28
102,11
102,41
102,70
99,84
97,15
700,32
568
594
676
778
850
323
985
544,53
618,92
693,31
767,70
842,09
916,48
990,87
104,31
95,97
97,50
101,34
100,94
100,71
99,40
700,17
10204,65
9431,93
9955,72
10378,23
10366,54
10054,89
9656,71
70048,67
Primjer 9.6 Na osnovu podataka o proizvodnji jaja po kvartalima u periodu od 2000 2005. godine, izraunati sezonske indekse i izvriti prognozu za 2006. godinu.
Godina
2000
2001
2002
2003
2004
2005
m=4
GODINA
2000
2001
2002
2003
2004
2005
Dijeljenjem nivoa serije
sezonski indeksi:
I
II
III
IV
_
_
32,75
33,62
34,50
35,38
36,00
37,12
38,62
39,75
41,00
42,12
43,12
43,88
44,38
45,62
47,50
49,00
49,88
51,12
52,62
54,00
odgovarajuim pokretnim prosjecima, dobijaju se specifini
GODINA
2000
2001
2002
2003
2004
2005
TIPINI
SEZONSKI
INDEKSI
0,99
0,93
0,37
0,35
0,91
II
1,16
1,21
1,16
1,18
1,20
III
1,01
1,03
1,02
1,06
1,10
IV
0,83
0,84
0,63
0,79
0,78
0,95
1,182
1,044
0,814
DODATAK TABLICE