Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 9

STATISTIKA

TEMELJNI POJMOVI STATISTIKE

-Osnovna definicija: znanstvena disciplina koja se bavi prikupljanjem, analizom I tumačenjem podataka
masovnih pojava.

Također, može se reći da je znanost o prikupljanju, uređivanju, analizi I tumačenju brojčanih podataka ,
ali I da ona predstavlja skup podataka o pojavama , odnosno svaki uređen, analiziran I objavljen skup.
Omogućuje nam primjenu izračunatih parametara u opisivanju stvarnih I očekivanih problem ate
procjenu vjerojatnosti valjanosti ishoda u njihovim rješenjima.

-Statistički skup – čine ga neuređeni podaci čiji će elmenti biti predmet statističke analize.
Opseg statističkog skupa(N) određena je brojem elemetnat u statističkom skupu. Prema njemu se
skupovi dijele na konačne(mogu se prebrojati) I beskonačne.
-može biti realan(sastavljen od jedinica koje postoje) I hipotetički(jedinice koje se definiraju nekim
modelom)
-definirati statistički skup znači odrediti obilježja koja mora imati svaka jedinica da bi se mogla smatrati
elementom tog skupa
Definiramo ga pojmovno-definiranje onih veličina koje nnužno mora imate(npr.starost stanovništva)

Prostorno-određivanje prostora na kojem se promatra jedinica skupa

Vremenski- kritičan trenutak ili razdoblje u kojeu je promatran stat.skup. Oni skupovi čiji
elementi imaju svojstvo istovremenog nastajanja I nestajanja te time gube svojstvo kumulativnosti
definira se kritični trenutak.

-Statističko obilježje-svojstvo po kojemu jedinice stat.skupa međusobno nalikuju ili se razlikuju =


varijabla.
-Modaliteti obilježja-variranje svojstava. Na temelju toga se formiraju stat.skupine.
-Skup podataka o promatranom obilježju za sve jedinice predstavlja osnovni skup ili populaciju(N), a
skup podataka o promatranom obilježju za dio jedinica skupa predstavlja uzorak(n) koji služi kao osnova
za zaključivanje o populaciji. Parametar je brojčana karakteristika populacije, odnosno konstanta
određena pomoću svih članova N, vrijednost mu je gotovo uvijek nepoznata. Zaključci se često donose
na na tebemlju rezultata iz uzorka(koristi se kada njegova primjena ima financijsku, vremensku I
tehničku opravdanost)

►PODJELA STATISTIČKIH METODA


Statistička obilježja mjere se pomoću ljestivca

○ METODE DESKRIPTIVENE STATISTIKE

-opisuju se statistički podaci. Koristimo brojčane I grafičke metode kako bi prikazali podatke.
-pod pojmom DS najčešće se podrazumijeva konstriranje grafikona I tablica te računanje I tumačenje
mjera središnje tendencije, mjere disperzije, mjere asimetrije te mjera zaobljenosti.
-Deskriptivna statistika predstavlja skup metoda koje omogućavaju opis, prezentaciju i rekapitulaciju
podataka koji su najčešće vrlo brojni.

○ METODE INFERENCIJALNE STATISTIKE(matemrička, induktivna, analitička)

-donose se zaključci o populaciji na temelju analize jednog ili više uzoraka te podrazumijeva uporabu
stat.metoda kojima se na temelju izabranih uzoraka donose predviđanja o populaciji. Tu koristimo
procjene, testiranje hipoteza, određivanje veza između varijabli te predviđanje o populaciji.
metode ove statistike zasnivaju se na teoriji vjerojatnosti.
-pomoću metoda IS moguće je ocijniti osobine osnovng sukupa uz odgovarajući nivo pouzdanosti

►VRSTE VARIJABLI
Varijable- obilježja po kojima se razlikuju jedinice stat.skupa. Mjeriti ju znači konstruirati podatak
koji se nalazi na mjersnoj ljestvici
Kvalitativna I Kvantitativna(op.Omjerna)
○ Kvalitativna ordinalna varijabla
-ako je moguće klasirati njene modlitete prema nekom redoslijedu koji ima smisla, npr.varijabla
ocjena izražena sljedećim modalitetima:odličan,vrlodoar,dobar, dovoljan, nedovoljan
○Kvantitativna varijable
-ako se njeni modaliteti mogu klasificirati I ako su brojčano izraženi(broj studenata na fakultetu,
broj soba u domu, plaća, broj članova obitelji…)
○○Kvantitativna prekidna varijabla- v.koja može poprimiti konačan broj diskretno
raspoređenih vrijednosti. V.je prekidna ako su njeni modaliteti prebrojivi I njačešće
cjelobrojni(broj zaposlenih, broj prisutnih na predavanju)… ne može nečega biti pola
Grafički ju prikazujemo histogramom, I kumulativnom krivuljom
○○Kvantitativna neprekidna varijabla- v je kontinuirana ako su vrijednosti njenih
modaliteta neprebrojive. Može uzimati bilo koju vrijednost iz intervala koji pripada skupu realnih
brojeva. Ona je kvantintativna kontinuirana ako su vrijednosti njihi modaliteta dobijene na
osnovu mjerenja.(visina, težina).. može biti cijeli ili decimalan broj
Grafički ju prikazujemo dijagramom sa stupcima , možemo kumulativnom
krivuljom. Također se može , kontinuirana v. može prikazati histogramom

►MJERNE LJESTVICE
○ Nominalna (a=b)
-predstavljena u obliku liste obilježja po kojema se razlikuju elementi stat.skupa.
-nominalna obilježja mogu biti atributivna I geografska.
-skala može predstavljava dva ili više modaliteta. Modalitetima se mogu pridružiti brojevi koji
služe kao identifikator ili kodovi.
Modaliteti obiljeežja zapisuju se abecedom, veličinom frekvencija I nomenklaturom.
Matematičke operacije nisu dozvoljenje. Jedino se može primjeniti prborjavanje. Ne možemo
uspoređivati
Podaci ne mogu biti uređeni rediskijednom shemom te ne postoji kriteriji po kojemu bi se mogle
uspoređivati
Najmanje razvijena razina mjerenja koja uključuje društveno osjetljiva obilježja
Nomenklatura je uređen popis modaliteta nominalne varijable, kojim se pripisuje nomenklaturni
broj.
Primjer- broj studenata prema rodu (M-40,Ž-60, U-100) , nije dopušteno računati prosjek 40
muškaraca. Mogu se kodirati npr kodom 1-muški spol, 2-ženski
Primjer2- Odgovori ankete(mogu se kodirati 1-da,2-ne,--ne znam)
○ Ordinalna (a<b; a=b; a>b)
-pridružuje brojeve, slova ili simbole elementima stat.skupa prema stupnju nekog svojstva
-pridružuje elementima skupa obilježja koja se mogu usporediti, rangirati I klasirati prema
nekom logičnom redoslijedu. Mogu se prebrojavati I uspoređivati, stoga se koriste
operatori(<,=,>), ali matemtičke operacije nisu dozvoljene.
-primjer ordinalne varijable(varijable ranga) : varijabla ekonomske razvijenosti zemalja prema
sljedećim modalitetima:razvijene zemlje, zemlje u razvoju, nerazvijene zemlje.
Modalitete možemo kodirati. Dozvoljena je I njihova transformacija uz uvjet da se s njom ne
mijenja poredak modaliteta
-s njom se bilježe relativne razlike mjerenja, bez točnog stupnja tih razlika.
Primjer:ocjena razvijenosti zemlje, primanja zaposlenika(iznad, ispodproječna)
○ Intervalna (a-b)
-na ovoj sklai se obilježjima elemenata populacije pridružuju brojevi pri čemu jednake razlike
brijevea na mjernoj ljestvici predstavljaju jednake razlike mjernog svojstva.
Razlike u mjernim obilježjima elemenata su prestavljene razlikama brojeva na skali.
Nulu na skali možemo postaviti gdje želimo, ali se mora uvijek zadovoljiti da razlike među
mjernim obilježjima odgovaraju razlikama brojeva na int.skali. Primjer Celzijusova ljestivca
-nema apsolutnu već samo relativnu nulu-dogovorena veličinakoja označava stanje ili
intenzitet svojstva (npr. 0°C ne znači odsustvo topline već intentzitet, ta 0 je dogovorena)
-Dozvoljeno prebrojavanje, uspoređivanje I oduzimanje
-primjeri temperaturna, meridijani, paralele, vodostaj, nadmorska visina, godina rođenja(ona se
nalazi na skali)
○ Odnosna (a/b)
-odlkuju je jednake razlike brojeva koje predstavljaju jednake razlike mjernog svojstva.
Početna točka mjerenjadaje značenje odnosu vrijednosti između podataka=odnossna
-Ima “prirodnu nulu” – ukazuje na odsustvo promatranog obilježja- apsolutna nula
-Svojstva: vrijednosti se mogu uredditi redoslijedno; moguć je izračun razlika između jedinica;
apsolutna nula; mjerljive razlike između vrijednosti podataka I njihovi odnosi; jednaki brojčani
omjeri znače I jednake odnose u mjernoj pojavi
-najviši stupanj razvrstavanja podataka
- vrijednosti pridružene elementima predstavljaju numeričke varijable.
-dozvoljene su osnovne matematičke operacije- omogućava najširu I najprecizniju analizu
-razlike I mjeri između mjernih obilježa su izražena numerički I imaju precizno značenje.
VArijable mogu biti prekidne(diskretne-prebrojivo mnogo cjelobrojnih vrijednosti) I
neprekidne(kontinuirane)
-primjeri diskretne(broj članova u obitelji, broj upisanih studenata)
Numerička varijabla je kontinuirana ako može poprimiti neograničen broj vrijednosti(visina,
težina)
Statističke varijable mjerene na nominalnoj I ordinarnoj ljestvici nazivaju se kvalitativne varijable.
Varijable na intervalnoj I numeričkoj su kvantitativne.
Razvrstavnje podataka
-pri razvrstavnju podataka moraju se primjeniti dva načela:
iscrpnosti – svaki pojedinac, object ili mjerenje može se pojaviti samo u jednoj kategoriji
tj. Razredu razvrstavanja
isključivosti – svaki pojedinac, object ili mjerenje može se razvrstati u samo jednu od
predloženih kategorija, skupina, rezreda
Za Vježbu 1 još potrebno

►VRSTE TABLICA
Tablica je prikaz podataka sastavlje od redova I kolona. Svaka tablica mora imati naslov,
zaglavlje I predkolonu
-Jednostavna- prikazuje samo jednu statističku seriju npr. Broj upisanih studenata 1.godine
unazad nekoliko godina
-Složena- prikazuje više statističkih serija. Npr Broj stanovnika unazad nekoliko godina, broj
živorođenih I broj mrtvorođenih
-Kombinirane-prikazuju serije podataka dobivenih Spajanjem dva ili više obilježja
Npr. Broj oboljevlih I zdravih cijepljenih ljudi ,podijeljenih prema spolu
►VRSTE GRAFIKONA
Grafikoni predstavljuju vizualnu ilustraciju tabela, ali nisu ima zamjena već dopuna. NJihov
nedostatak je što njihova konstrukcija ovisi od postavljenih omjera te što ponekad u istom
razmjeru nije moguće prikazati sve vrijednosti.. npr najveće I najmanje
-Točkasti-predtavljaju parove vrijednosti dva obilježja u pravokutnom koordinatnom sustavu
kako bi se prikazao odnos između ovih obilježja kod svih jedinica promatranja.
Na x-os možemo unijeti I atributivno I numeričko obilježje, dok na y-os samo numeričko
Osim podataka u obliku točaka, podatke možemo prikazati I regresijskom linijom
-Linijski-dijeli se na polygon I kriva frekvencija, vremeski linijski dijagram, kumulativni I polarni
dijagram
-kriva frekvancija-koristi se za kontinuirana obilježja, na apcisu se unose mali intervali,
formira se niz točaka, čijim se spajanjem formira kriva linije. Primjer Gausova krivulja
-vremenski linijski dijagram-prati jedno ili više obilježja kroz vrijeme(min,sate,godine). Na
apcisu se unosi vrijem, na ordinatu vrijednosti obilježja. Upotrebljava se za praćenje trenda
-površinski dijagrami:
-štapićasti-sastoji se od stupića iste širine čija visina predstavlja frekvenciju
različitih modaliteta atributivnih obilježja ili različitih vrijednosti diskontinuiranih numeričkih
obilježja. Uvijek razmak između stupića
-histogram-tip površinskog dijagrama kojim se prikazuje numerička kontinuirana
obilježja. Sastoji se od niza spojenih stupića gdje širina stupića predstavlja širinu klasnog
intervala, a visina frekvenciju. Ukoliko se spoje sredine stupića formira se polygon frekvancije
-kružni-koristi se za prikazivanje dijelova neke structure. Cijeli krug predstavlja
100% structure.
‚ -kartogrami-dijagrami po geografskoj karti, gdje se za svaku regiju ili područje
upisuje vrijednost ipitivane pojave.
►RELATIVNI BROJEVI
Vrijednosti kvalitativne varijeble jesu kategorije. Mjere kojima opisujemo zastupljenost jedne
kategorije u uzorku jesu frekvencije kategorije I relativna frekvencija kategorije.
Frekvencija kategorije je broj izmjernih vrijednosti varijable koje pripadaju danoj kategroiji.

Relativna frekvencija kategroije broj je izmjerenih vrijednosti varijable koje pripadaju danoj
kategoriji podijeljen ukupnim brojem izmerenih vrijednosti za ispitanu kategroiju
k-vrijednost kategroji; n-broj izmjerenih vrijednosti za varijablu. Fi – frekvencija i kategorije te
relativnu frekvenciju dobijamo kao:

𝑓𝑖
𝑘=
𝑛

Relativna frekvencija kategorije mjere je zastupljenosti koja daje informaciju o udjelu kategorije
u uzorku poznate veličine I često se izražava kao postotak. Frekvencije I relatvine frekvencije
pojedinih kategorija prikazujemo tablično I grafički(stupičasti dijagram frekvencija I stupičasti
relativnih, također I kružni obje frekvencije)
2.ANALIZA I SNTEZA PODATAKA
○ FREKVENCIJE I KUMULATIVNE FREKVENCIJE
Apsolutna frekvencija je broj(učestalost)ponavljanja jednog modaliteta
Kumulativna rastuća apsolutna frekvencija jednog modaliteta je jednaka zbroju frekvencija
modaliteta za koje varijabla ima vrijednost manju ili jednaku od tog modaliteta
Kumulativna opadajuća apsolutna frekvencija jednog modaliteta je jedanaka zbiru
frekvencija modaliteta za koje varijabla ima vrijsdnost striktno veću od tog modaliteta
Relativna frekvencija jednaka je apsolutnoj frekvenciji modlaiteta podijeljenoj sa totalnom
frekvenciju. Predstavlja proporcijujedinica osnovnog skupa koji imaju promatrani modalitet
Kumulativna rastuća relativna frekvencija jednog modaliteta je jednaka proporciji modaliteta
za koje varijabla ima vrijednost manju ili jadnaku od tog modaliteta.
Kumulativna opadajuća rel.frekv. jednog modlaiteta je jednaka proporciji modaliteta za koje
varijabla ima vrijdnost striktino veću od tog modaliteta.
Prema navedenim definicijama zbir kumulativne rastuće rel.f. I k.opadajuće r.f. jistog modaliteta
je jednak jedinici (ili 100%)
fi apsolutna frekvencija
𝑓𝑖
pi relativna frekvencija – struktura 𝑝𝑖
𝑁
𝑗
Sj apsolutna kumulativna frekvencija 𝑆𝑗 = ∑𝑖=0 fi

𝑗
Fj relativna kumulativna frekvencija 𝐹𝑗 = ∑𝑖=1 pi

N broj podataka
NUMERIČKI NIZ I GRAFIČKO PRIKAZIVANJE PODATAKA

Statističke tablice osnovni elementi : Naslov tablice(objašnajva statistički niz I statističko obilježje
podataka iz tablice); Zaglavlje (opisuje sadržaj stupaca); Predstupac (donosi naziv obilježja kao I puni
naziv modaliteta promatranog obilježja) ; Zbirni red (upisuje se zborj vrijednosti pojedinog stupca,
pojavljuje se u kombiniranim tablicama- pokazuje strukturu statističkog niza s obzirom na modalitete
obilježja zapisane u predstupcu) ; Izvor (navodi se ispod tablice, obavezan)
Vrste tablica
-jednostavna samo jedan statistički niz kada je razvrstavanje podataka prema jednom obilježu
(npr. Diplomirani student prema rod una visokim uč u RH, stupac rod(M, Ž) I broj studenata)

-skupne prikazuju dva ili više statističkih nizova gdje se podaci grupiraju prema jednom obilježju
(npr. Broj učitelja I učenika upisanih određene godine po županijama- učenici, učitelji(niz) prema
županija)

-kombinirane prikazuju jedan niz preomatran prema više obilježja, imaju zbirni stupac (npr.
Doktori medicine određene godine prema rodu I izobrazbi -izobrazba I rod obilježja

Organiziranje podataka:
Grupiranje je raščlanjivanje jedinica stat.skupa prema modalitetima obilježja. Modaliteti mogu biti
mjereni prema odredinim mjernim ljestvicama te se tako I nazivaju. Negrupirani podaci su oni koji su
zapisani slijedom kojim su prikupljani. Podaci se razvrstavaju u tablice distribucije frekvencija te mora biti
isključivo I iscrpno.

Distribucija frekvencija – razdioba jedinica stat.skupa prema modalieteima jednog promatranog


obilježka(x,f)(x1,f1, su parovi modaliteta obilježja I pripadajuće frekvencije kojih je k te oni čine
distribuciju frekvencija)
𝑘

∑ fi = N
𝑖=
i=1,2,…k(modaliteti)
Sturgensovo pravilo služi za određivanje optimalnog broj redova(razreda) za grupiranje N podataka u k
numeričkim skupinama. To određujemo prema formuli k= 1+3,3logN (u kalkulator unosimo logN*3,3+1)
Nakon što smo dobili k, odnosno broj redova, aproksimativnu širinu razreda određujemo prema
formuli:
𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
∆𝑥 =
𝑘
Nakon što smo odredili broj I širinu razreda, sljedeće što trebamo jest prebrojat I razvrstati članove
stat.niza.. Kada I to napravimo, imamo kreiranu tablicu distribucije frekvencija

Frekvencija je broj učestalosti ponavljanja pojedinih modaliteta obilježja. Na temelju apsolutnih


frekvencija(f, broj koji smo dobili preborjavanjem, odnosno broj jedinica koje sadrži pojedina
stat.skupina) izračunavaju se relativne, korigirane I kumulativne frekvencije
Broj članova stat.niza (N) jednak je zbroju svih frekvencija stat.niza (∑f=N)
Relativne frekvencije(pi) nastaju diobom i-te apsolutne frekvencije s uupnim zborjem apsolutnih
frekvencija. Apsolutne I relativne frekvencije su upravno proporcionalne.
𝑓𝑖 𝑓𝑖
𝑝𝑖 = = 𝑘
𝑁 ∑𝑖=1 𝑓𝑖

Korigirane frekvencije(fci) korigiraju se diobom originalne frekvencije s pripadajućom veličinom razreda


ili njoj proporcionalonim vrijednostima. Frekvencije se korigraju ako su veličine razreda međusobno
različite a potrebne su nam za: crtanje polygon frekvencija I histograma te za izračun moda.
𝑓𝑖
𝑓𝑐𝑖 =
𝑖𝑖
fci-apsolutne korigirane frekvencije; fi – apsolutne frekvencije ; ii-veličina razreda
𝑝𝑖
𝑝𝑐𝑖 =
𝑖𝑖
pci-relativne korigirane; pi-relativna frekv.; ii-veličina rezreda

Kumulativna relativna frekvencija računa se postupnim zbarajanjem niza relativnih frekvencija


Kumulativna distribucija frekvencija objašnjava koliko je jedinica kumulativnog niza manje ili veće od
neke vrijednosti numeričkog obilježja. Uvijek iz nekorigiranih relativnih ili apsolutnih frekvencija.
Tumačenje distribucije k.f. vezano je za granice promatranih razreda I uz vrstu numeričkog obilježja
kod kontinuiranog num.obilježja distribucija k.f. “manje od” tumači se u odnosu na gornju granicu
promatranog razreda(više od tumači se u odnosu na donju g.promatranog razreda)
kod diskontinuiranog num, obilježja distribucija “manje od” tumači se u odnu na donju granicu
sljedećeg razreda(više od tumači se u odnosu na donju g promatranog razreda)
---str. 59,60

Razredi (sinonimi: redovi tablice, numeričke skupine, kategorije modaliteta obilježja!!) – zapisujemo
modalitete obilježja I pripadajuće frekvencije
Modaliteti obilježja zapisani intervalno posjeduju donji I gornju granicu razreda. Donja se označava
L1i(gdje je 1 oznaka za donju granicu, a I za ozbaku razreda), a Gornja L2i
Vrste granica:
-Nominalne – zadane granice, odnosno zabilježene popisom podataka, NE koriste se za izračune. Donja
gradinca sljedećeg I gornja granica promatranog razreda nisu jednake= nema kontinuiteta.
-Prave kri+eiraju se samo za kontinuirano numeričko obilježje. Na temelju njih dalje se izračunavaju
parametri I grafički se prikazuju podacii. Granice su jednakee!
-Precizne koristimo sa

You might also like