Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

PANEVROPSKI UNIVERZITET APEIRON

FAKULTET POSLOVNE INFORMATIKE

VANREDNE STUDIJE
SMJER: Poslovna informatika

PREDMET
POSLOVNA INTELIGENCIJA

NASLOV TEME
"HISTOGRAMI"

PREDMETNI NASTAVNIK
Prof. dr Gordana Radi

Student
xxx
Broj indeksa: xxx

Banja Luka, novembar 2015. godine


1

Sadraj

1.

Histogrami.............................................................................................................................. 1

2.

Kreiranje histograma .............................................................................................................. 2

3.

Primjena histograma .............................................................................................................. 4

4.

Primjer upotrebe histograma .................................................................................................. 5

5.

Sumarne statistike .................................................................................................................. 6

6.

Literatura ................................................................................................................................ 8

1. HISTOGRAMI
Histogram definiemo kao grafiki
prikaz raspodjele numerikih podataka. To je
statistiki pojam, a prvi ga je pomenuo Karl
Pirson (Karl Pearson) engleski matematiar i
osniva savremene matematike statistike.
Histogrami se koriste kako bi bolje razumjeli
koliko esto ili rijetko se odreene
vrijednosti javljaju u datom skupu podataka.
Histogram je prikaz statistikih podataka
pomou pravougaonika, da bi se pokazala
uestalost
podataka
u
uzastopnim
numerikim intervalima ije su veliine
jednake. U najeem sluaju, histogram je
predstavljen sa nezavisnom promjenljivom
smjeenom du horizontalne ose, dok je
zavisna promjenljiva prikazana du
vertikalne ose. Podaci su prikazani kao
obojeni ili osjeneni pravougaonici razliitih
veliina
Slika 1 - Karl Pirson (Karl Pearson)

Rije histogram izvedena je od grkih


rijei histos to znai mrea ili jarbol i rijei gramma to znai crte, zapis ili pisanje. Tako
da moemo rei da je histogram neega, etimoloki1 gledano, crte mree tog neega. Smatra se
da je Karl Pirson, koji je termin uveo 1891.godine, izveo naziv histogram od rijei
HISTOrical diaGRAM, u prevodu istorijski dijagram.

Etimologija je grana lingvistike koja prouava porijeklo rijei, dok se lingvistika bavi prouavanjem jezika.

2. KREIRANJE HISTOGRAMA
Prilikom kreiranja histograma, prvo moramo sakupiti podatke i razvrstati ih u neke
kategorije, a zatim utvrditi koje su nam promjenljive zavisne, a koje nezavisne. Osobinu na
osnovu kojih podatke grupiemo u kategorije oznaavamo kao nezavisnu promjenljivu, broj
vrijednosti (podataka) smjetenih u datoj kategoriji predstavlja zavisnu promjenljivu.
Da bi razumjeli nain izgradnje histograma, moemo zamisliti skup vrijednosti
rasporeenih du brojevne linije koja predstavlja neki vremenski interval. Da bi napravili
histogram, podjeliemo sekcije brojevne linije na jednake dijelove (mada to nije neophodno), a
zatim moemo i prebrojati koliko vrijednosti se nalazi u svakom od vremenskih intervala, to
predstavlja gustinu frekvencije u datom vremenskom intervalu.

Slika 2 - Skup vrijednosti rasporeenih u sekcije

Skup vrijednosti, tj. broj podataka u datoj kategoriji, moemo predstaviti i u uspravnom
obliku, kao to je prikazano na sljedeoj slici, radi lakeg.uoavanja broja vrijednosti.

Slika 3 - Skup vrijednosti koje su postavljene vertikalno rasporeenih u sekcije

Na osnovu broja dobijenih vertikalnih vrijednosti moemo formirati stupce, to vidimo


na sljedeoj slici, i to je razlog zato dobijamo stupce.

Slika 4 - Formiranje stubaca na osnovu broja vrijednosti

Nakon toga vidimo i kako izgleda gotov histogram koji podsjea na grafikon u obliku
stubaca.

Slika 5 - Prikaz gotovog histograma

Histogrami se esto mjeaju sa grafikonima u obliku stubaca (bar charts). Histogrami se


koriste za prikaz kontinuiranih podataka gdje sekcije predstavljaju nizove podataka i podruja
pravougaonika imaju smisla, dok kod stupiastih grafikona, povrina se sastoji od kategorijskih
promjenljivih i prekida predstavljenog prazninama izmeu pravougaonika.
Histogram moe posmatrati i kao grafikon u obliku stubaca, s tim da se vodi rauna da su
na horizontalno osi (apscisi) smjetene vrijednosti nezavisne promjenljive, dok se vrijednosti
zavisne promjenljive nalaze na vertikalnoj osi (ordinati).

3. PRIMJENA HISTOGRAMA
Primjena histograma je veoma iroka i to naroito za predstavljanje rezultata ispitivanja
kod kojih je broj uzoraka velik, tako da je problem da se prikae pojedinano vrijednost svakog
prikupljenog uzorka.
Histogrami se koriste u sljedeim sluajevima:

Kada upotrebljavamo numerike podatke,


Kada elimo da vidimo oblik distribucije podataka,
Pri analizi da li proces moe zadovoljiti zahtjeve kupaca,
Kada se analizira kako izgleda izlaz iz procesa nekog dobavljaa,
Kad elimo da vidimo da li je dolo do promjene procesa iz jednog
vremenskog perioda u drugi,
Prilikom utvrivanja da li su rezultati dva ili vie procesa razliiti.

4. PRIMJER UPOTREBE HISTOGRAMA


Kreiraemo histogram od 15 studenata koji su polagali ispit iz predmeta Menadment
poslovnih informacionih sistema. Radi se o malom broju zapisa tako da je kreiranje histograma
veoma jednostavno.
R.B.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

Ime studenta
Marina
Alen
Dalibor
Dejan
Sanja
Zoran
Sneana
Rajko
Armin
Nemanja
Sran I.
Bojan R.
Milorad
Sran P.
Bojan T.

Slovna ocjena
A
B
B
B
C
C
C
D
E
E
F
F
F
F
F

Slika 6 - Prikaz rezultata ispita na osnovu slovne ocjene

Na osnovu dobijenog histograma veoma brzo moemo uoiti da je veina studenata dobila
ocjenu F.
5

5. SUMARNE STATISTIKE
Na narednom histogramu (Slika 8) predstavljena je raspodjela osoba na osnovu njihove
starosti. Lako se moe uoiti da je veina osoba starija od 50 godina. Mogu se uoiti i drugi bitni
faktori kao to su:
Prosjena starost,
Najvea starost,
Najmanja starost,

Slika 7 - Histogram raspodjele osoba na osnovu starosne dobi

Ove faktore nazivamo sumarnim statistikama, a one najee ukljuuje sljedee pojmove:
Max predstavlja najveu vrijednost datog pokazatelja (prediktora),
Min predstavlja najmanju vrijednost datog pokazatelja (prediktora),
Mean prosjena vrijednost datog pokazatelja (prediktora),
Median vrijednost pokazatelja koja dijeli bazu podataka tako da dobijamo dvije
baze koje sadre priblino jednak broj slogova (zapisa),
Mode vrijednost pokazatelja koja se najee pojavljuje,
Variance mjera odstupanja datih vrijednosti od njihove prosjene vrijednosti.
U sluaju postojanja vie vrijednosti datog pokazatelja, histogram je ujednaeniji.
U mnogim sluajevima, raspodjele se opisuju upotrebom samo dvije vrijednosti, a to su
mean (aritmetika sredina) i variance (varijansa). Mean predstavlja aritmetiku sredinu
vrijednosti pokazatelja, tj. njihov zbir podijeljen sa ukupnim brojem pokazatelja, dok je variance

(varijansa) matematiko oekivanje koliko e iznositi odstupanje vrijednosti pokazatelja od


srednje vrijednosti, odnosno od aritmetike sredine.
Potrebno je izraunati prosjeno odstupanje svakog pokazatelja od aritmetike sredine za
sve zapise koji se nalaze u bazi podataka. Postoje dvije mogunosti i to:
Vrijednost varijanse je visoka to znai da su vrijednosti pokazatelja vrlo razliite,
Vrijednost varijanse je niska to znai da su vrijednosti veine podataka veoma
blizu njihove aritmetike sredine

Slika 8 - Formula za izraunavanje varijanse sa primjerom

6. LITERATURA
1. Gordana Radi Poslovna inteligencija, (Prezentacija Histogrami) , Univerzitet
Apeiron, Banja Luka, 2015.
2. Zlatko J. Kovai Analiza vremenskih serija, Univerzitet u Beogradu, Ekonomski
fakultet, Beograd, 1995.
3. http://www.britannica.com/biography/Karl-Pearson posjeeno 25.11.2015.
4. http://mathcentral.uregina.ca/QQ/database/QQ.09.99/raeluck1.html - posjeeno
25.11.2015.
5. http://ir.nmu.org.ua/bitstream/handle/123456789/138126/c564ad05926f2e3bf44871ef94
b8234d.pdf?sequence=1 posjeeno 25.11.2015.

You might also like