Download as pdf or txt
Download as pdf or txt
You are on page 1of 36

POSLOVNA INTELIGENCIJA

OLAP alati

Savo Stupar
Uvod u OLAP obradu podataka
2

 Menadžeri su u svom svakodnevnom radu „zatrpani“


mnoštvom različitih podataka i informacija, koje mogu
biti manje ili više upotrebljive. Samo uz korišćenje
savremenih softverskih alata za poslovnu analizu
podataka menadžeri mogu imati kvalitetan i brz uvid u
poslovanje. Oni informacije vide kao kritičan resurs i zato
traže sisteme, koji će im pomoći da raspoložive informacije
iskoriste kao konkurentsku prednost. Poznato je da
mnogo informacija ne znači ništa dobro. Ukoliko
korisnik prima mnogo informacija, a on od tih informacija
može i želi iskoristiti samo mali dio, to otvara problem
selekcije (filtriranja relevantnih informacija). Zato upravo
Poslovna inteligencija polazi od pretpostavke da korisnici
(menadžeri) ne vole nepotrebne informacije pa će rado
iskazati svoje preferencije u vezi sa vrstom informacija koje
žele dobivati.
Uvod u OLAP obradu podataka
3

 OLAP sistemi omogućavaju menadžerima da,


samostalno, bez znanja programiranja, u realnom
vremenu, obavljaju višedimenzionu analizu podataka
dobijajući pri tom informacije u preglednim
tabelarnim i grafičkim formama.
 Dimenziona struktura podataka sastoji se iz dimenzija i
mjera. Dimenzije predstavljaju strukturu kocke
(zaglavlja izveštaja), dok mjere predstavljaju
agregirane podatke po dimenzijama i članovima
dimenzija.
 Pored problema kompleksnosti izveštavanja OLAP kocka
riješava i probleme vremenskog kašnjenja pri dobijanju
izveštaja, tako što u svojoj strukturi čuva prethodno
agregirane podatke po dimenzijama i članovima dimenzija.
Proces transformacije podataka u informacije i znanje
4

R. Kelly Rainer Jr, Efraim Turban, Uvod u informacione sisteme, Data Status, 2009
(Prevod knjige Introduction to Information Systems, John Wiley & Sons)
Skladište podataka, kao osnova OLAP obrade
5
Šta je OLAP?
6

 OLAP kao jedna od metoda poslovne inteligencije se


najjednostavnije može definisati kao skup alata koji
služi za izvođenje znanja iz određenih skladišta
podataka.
 Svaki OLAP alat posjeduje multidimenzionalnost,
odnosno mogućnost pružanja korisniku da
određene podatke pregledava odnosno analizira
u različitim dimenzijama.
 Pod različitim dimenzijama se podrazumijeva
mogućnost da se određeni podaci analiziraju prema
određenom kriteriju (mjernim jedinicama) kao što
je vrijeme, dubina, količina, lokacija, itd.
Šta je OLAP?
7

Neke od karakteristika OLAP alata su:


 OLAP je konceptualni i intuitivni model koji će
razumjeti svi korisnici bez obzira da li su obrazovani i
specijalizovani za obavljanje analitičkih poslova.
 OLAP alati omogućuju obavljanje brzih analiza. Ova
karakteristika je bitna menadžerima jer dobijaju
odgovore na pitanja u relativno kratkom vremenskom
periodu, a to utiče na kvalitet odluke koja se donosi.
 OLAP alati uključuju vrlo moćne sposobnosti
računanja potrebne za zadovoljavanje specifičnih
proračunskih zahtijeva koje postavlja multidimenzijska
struktura.
 OLAP alati omogućavaju jednostavno pretraživanje i
navigaciju, proračune (kalkulacije), ozbiljne
analize poput analize vremenskih serija i
kompleksnog modeliranja.
Šta je OLAP ? {http://www.olapreport.com/index.htm[11]}
8

OLAP potiče od engleskih riječi On-Line Analytical Processing,


što u prevodu znači “interaktivno analitičko procesiranje”.
Prema definiciji Internet servisa The OLAP Report: Glossary,
OLAP je kategorija aplikacija (programskih rješenja) i
tehnologija koje omogućavaju skupljanje, obradu,
procesiranje i prezentaciju višedimenzionalnih
podataka za potrebe analize i upravljanja odlukama
 Naziv OLAP potiče od britanskog matematičara E.F. Codda,
koji je postavio osnove danas najpopularnijeg tipa baza
podataka – relacione baze podataka.
 Na ovom tipu baze su zasnovani tzv. OLTP sistemi (on-line
transaction processing) koji predstavljaju transakcijski
sistem čija je logika izgrađena tako da obrađuju poslovne
promjene. Postojanje OLTP sistema je uslov za izgradnju
OLAP sistema (on-line analytical processing) jer analitička
obrada nije moguća ako ne postoje transakcijski podaci.
Glavne karakteristike OLAP alata
9

Codd je 1993 godine definisao OLAP kao sistem koji je


komplementaran OLTP sistemu.
 Javlja se potreba da se poslovnim podacima dobivenim iz
operativnih i vanjskih izvora, a koji su obrađeni prema
specifičnim zahtjevima korisnika, pristupa interaktivno, brzo
i na jedinstveni način bez obzira na kompleksnost
postavljenih pitanja od strane menadžera. Zbog toga se
jednom od bitnih karakteristika OLAP alata smatra
jednostavnost korišćenja pa korisnici tih alata ne trebaju biti
posebno obučeni niti obrazovani za obavljanje analitičkih
poslova
 Brzina rada OLAP sistema omogućava menadžerima i
stručnjacima postavljanje pitanja i dobivanje odgovora u
vrlo kratkom vremenu.
 OLAP alati u sebi uključuju vrlo robusne sposobnosti
računanja, koje su neophodne za multidimenzinalni prikaz
podataka
Objašnjenje koncepta OLAP-a
10

Dva osnovna pojma koja treba objasniti da bi se shvatio koncept


OLAP-a su:
• Mjere ili varijable (Measures ili Variables)
• Dimenzije (Dimensions)
Mjera je numerička vrijednost koja je od presudnog interesa za
analizu. Napr. cijena proizvoda, količina prodatih
proizvoda, trajanje telefonskih poziva, trošak transporta,
ukupni prihod i sl. Pored nekih osnovnih mjera mogu se
posmatrati i mjere koje su iz njih izvedene, a fizički se ne
nalaze medu izvornim podacima. Napr., moguće je definisati
mjeru ukupan prihod kao umnožak cijene i količine. OLAP
sistem će tada takvu mjeru tretirati kao i sve ostale.
Dimenzija je opisna kategorija koja ima svoju hijerarhiju. Za
svaku mjeru u OLAP sistemu moguće je definisati jednu ili više
dimenzija koje joj daju kontekst posmatranja, odnosno koje
pobliže određuju vrijednosti mjere. Napr. dimenzije mogu biti
vrijeme, proizvod, lokacija, usluga, vrsta trgovine,
način plaćanja i sl.
Objašnjenje koncepta OLAP-a
11

 Logička struktura skladištenja OLAP baze podataka je u vidu


kocke.
 Kocka kombinuje dimenzije, kao kategoriju podataka (jedno
od obilježja podataka ili jedan aspekt posmatranja podata-
ka) i mjere kao numeričke vrijednosti koje korisnici
analiziraju, kako bi mogli da prave upite.
 Dimenzija može biti, i u pravilu ih ima, mnogo. OLAP sistem
omogućava praćenje vrijednosti mjera u odnosu na sve za
njih definisane dimenzije. Dimenzije imaju definisanu
hijerarhiju, a ponekad je definisano i više različitih
hijerarhija za istu dimenziju. Napr. dimenzija vrijeme može
imati dvije hijerarhije: jedna koja vrijeme posmatra po
hijerarhiji: sat – dan – sedmica – godina, i druga sa
hijerarhijom vremena: sat – dan – mjesec – godina.
 Iako su podaci sačuvani samo jednom i na jednom mjestu,
svaki korisnik može dobiti različite poglede na iste podatke.
Jedan od primjera dat je na sljedećoj slici: (Njeguš A.)
Različiti pogledi na iste podatke {Njeguš, A. [12]}
12
OLAP Kocka “Prodaja turističkih aranžmana – zimovanja”[12]
13

Kocka, “Prodaja aranžmana” sadrži tri dimenzije: vrijeme, proizvodi i


tržišta. Činjenice o prodaji skladištene su u presjecima svih dimenzija u
kocki. Korisnik koji analizira prodaju aranžmana „Doček Nove godine“ na
Kopaoniku želi, napr. upit za četvrti kvartal (Q4) prodajne vrijednosti.
Osnovne mogućnosti analize koje OLAP sistemi pružaju su:
14

 Biranje dimenzija (engl. “Selection of dimensions”) Tom je


tehnikom moguće iz mnoštva hijerarhijskih vijednosti
pojedinih dimenzija odabrati upravo one vrijednosti koje su
za daljnju analizu konstantne.
 Rotacija dimenzija (engl. «Rotation of dimensions») Tom je
tehnikom moguće istu mjeru posmatrati na različite načine,
zamjenom mjesta ili izbora dimenzija koje opisuju
posmatranu mjeru. Time se vrijednosti koje posmatrana
mjera poprima i značenje dobivenih informacija mijenjaju
 Pogled u dubinu (engl. «Drill down») Ovom je tehnikom
moguće vrijednosti iste mjere posmatrati na nižem stepenu
hijerarhije, odnosno agregacije. Napr. ako smo posmatrali
vrijednosti trajanja i količine telefonskih poziva iza 20h za
prvi kvartal neke godine, tada ovom tehnikom možemo
dobiti vrijednosti trajanja i količine telefonskih poziva iza
20h za svaki pojedini mjesec prvog kvartala. Sljedećim
korakom bismo dobili uvid u iste informacije za svaki
pojedini dan nekog od mjeseci prvog kvartala
Dimenzije i njihova hijerarhija omogućavaju
Dimenzije omogućavaju 15

 Slice (kriška ili podskup kocke) – izbor jednog člana iz


dimenzije, ukoliko želite, napr., da se fokusirate samo na jedan
proizvod, slice vam omogućava da ignorišete sve osim željenog
proizvoda.
 Dice (slično pivot-tabeli) – kada se primjenjuje dice na
kocki, onda se postavlja više članova iz jedne dimenzije na
jednu osu i više članova druge dimenzije na drugu osu. Ovakav
način omogućava sagledavanje međuodnosa članova različitih
dimenzija.
Hijerarhija omogućava:
 Drill Down – u ovom slučaju sve dimenzije sadrže hijerarhiju i
za većinu dimenzija ona se sastoji od više nivoa. Više nivoa
hijerarhije omogućava drill down po jednom članu hijerarhije.
Drill down omogućava fokusiranje samo na određene podatke ili
oblast problema.
 Drill Up – tu se vide samo zbirne informacije članova. Ovde je
omogućeno sagledavanje opšte slike.
Definisanje “kriške” (engl. slice) ili podskupa kocke [12]
16
Podjela OLAP alata
17

Postoje 4 vrste OLAP alata:

 MOLAP (engl. Multidimensional OLAP)


 ROLAP (engl. Relational OLAP)
 DOLAP (engl. Desktop OLAP)
 HOLAP (engl. Hybrid OLAP)
Podjela OLAP alata
18
Podjela OLAP Alata {The OLAP Report": Glossary [13]}
19

Relacioni OLAP alati (ROLAP)

 Ova arhitektura koristi postojeću relacionu bazu podataka,


(najčešće su to skladište podataka i Data Mart) za
pohranjivanje svih činjenica i agregacija, kao i
 Multidimenzionalnu bazu podataka, u kojoj se nalaze svi
podaci o dimenzijama i sve potrebne definicije mjera,
formula i sl.
 Odlikuje se mogućnošću rada sa neograničenim količinama
podataka, ali zaostaju u brzini davanja odgovora na
postavljena pitanja zbog limitiranost funkcionalnosti SQL-a
ROLAP
20
 ROLAP ili relacijski OLAP alati sve podatke koje dobiju
smještaju u standardne sisteme relacionih baza podataka.
ROLAP alati rade sa vrlo velikim skupom podataka.
Također, kompleksni su što dovodi do toga da su vrlo
skupi za implementaciju, a isto tako imaju spore
performanse izvođenja upita, te nisu sposobni izvoditi
složenije finansijske kalkulacije.
 Prednosti ROLAP alata su:
• analiza velike količine podataka i
• korišćenje funkcionalnosti sistema relacijskih baza
podataka.
 Nedostaci ROLAP alata:
 otežana primjena standardnih upitnih jezika (npr.
SQL-a), na koje su korisnici navikli.
 Izvođenje može biti zavisno od količine podataka.
Podjela OLAP Alata (MOLAP alati)
21

Multidimenzioni OLAP alati (MOLAP)


 Ova arhitektura se koristi isključivo uslugama
višedimenzionalne baze podataka, koja tada u sebi sadrži
sve potrebne činjenice, agregacije i ostalo.
 Multidimenzione baze podataka imaju ograničenje fizičke
veličine skupa podataka sa kojima mogu da rade i
ograničenje na broj dimenzija.
 Da bi se vršila bilo kakva analiza, potrebno je prvo učitati
podatke u višedimenzione strukture, pri čemu se vrše razni
proračuni da bi se kreirale agregacije i popunili podaci.
 Tek po završetku tog procesa, korisnik može započeti
analizu.
 Prednost MOLAP sistema je to što obezbjeđuje odlične
performanse sistema, naročito kada se radi sa već
izračunatim podacima (agregacijama)
 Nedostatak MOLAP sistema je teškoća dodavanja novih
dimenzija.
Podjela OLAP Alata (MOLAP alati)
22

 MOLAP predstavlja alate kod kojih su podaci spremljeni u


multidimenzionalne kocke (cubes).
 Pošto se ne mogu koristiti relacione baze podataka većinom
su ti podaci spremljeni u vlastite optimizirane baze
podataka multidimenzionalne matrične strukture.
 Ovi alati se teško prilagođavaju promjenama u veličini
sistema koji se pomoću njih želi analizirati i pratiti jer
se svi elementi tog sistema smatraju ravnopravnim i
nemoguće je utvrditi prioritet među njima.
 Prednosti MOLAP alata su:
• odlično izvođenje zbog korištenja multidimenzionalnih
OLAP kocki,
• brz pristup podacima
 Nedostataci ovih alata su zauzeće ogromnog memorijskog
prostora u slučaju postojanja većeg broja dimenzija.
Podjela OLAP Alata
23

Desktop OLAP alati (DOLAP)


 Desktop OLAP alati, odnosno OLAP alati za stolne
(desktop) računare predstavljaju jednostavne OLAP alate,
nižih cijena, koji su prilagođeni primjeni na desktop
računarima skromnijih memorijskih kapaciteta i
procesorskih kapaciteta u odnosu na velike server računare.
 DOLAP alati u pravilu podržavaju samo manje aplikacije čiji
je cilj zadovoljiti potrebe pojedinačnih korisnika.
 Postoje i verzije ovih alata namijenjene prenosnim
računarima.
 DOLAP alati su klijent bazirani alati te često koriste i
relacijske i multidimenzionalne baze podataka.
 Imaju ograničene funkcionalnosti u poređenju sa ostalim
OLAP alatima kao i kapacitet podataka koji se može
pohraniti.
Podjela OLAP Alata (Hibridni OLAP alati)
24
Hibridni OLAP alati (HOLAP)
 Kombinuje prednosti MOLAP i ROLAP alata.
 HOLAP predstavlja hibridni proizvod pomoću kojeg je
moguće sprovoditi multidimenzionalne analize simultano iz
podataka uskladištenih u multidimenzionalnoj bazi i onih iz
sistema upravljanja relacionim bazama podataka.
 Za informacije sumarnog tipa (agregacije) HOLAP se oslanja
na kocke podataka radi boljih performansi, dok se za
detaljnije podatke vrši uvid kroz relacione baze podataka.
 Cilj korišćenja HOLAP alata jeste da se iskoriste
prednosti MOLAP alata (kratko vrijeme odziva sistema i
analitičke mogućnosti) i ROLAP alata (dinamički pristup
podacima) ili drugačije rečeno
 Cilj je bio da se zadrže sve prednosti ROLAP-a, ali da se
pritom dodaju i neke nove mogućnosti za rad sa
višedimenzionim bazama podataka.
 HOLAP alati omogućuju veliku brzinu pristupa i relativno
malo zauzimaju prostor.
Dimenzioni model podataka
25
 Osnovna ideja multidimenzijske baze podataka jeste da se
skoro svaki tip poslovnih podataka može predstaviti kao dio
kocke (engl. cube) podataka gdje su
• ćelije kocke sadrže mjerljive vrijednosti (mjere), a
• ivice kocke određuju prirodne dimenzije podataka.
 Podrazumijeva se više od tri dimenzije u modeliranju tako da bi
se kocka trebala zvati hiperkocka, iako su termini kocka i
kocka podataka postali uobičajeni.
 Dimenzioni model pravi razliku između vrijednosti i atributa.
 Vrijednost je obično nešto što nije poznato unaprijed. Veći-nom
se pod vrijednostima podrazumijevaju numerički podaci, iako to
nije isključivo pravilo.
 DW je najčešće dizajnirano preko dimenzionog modela podata-
ka u obliku zvijezda (star) spajanja, koje razdvaja numeričke i
tekstualne podatke tako što su numerički podaci smješteni u
vrijednosnoj tabeli, za razliku od tekstualnih koji se nalaze u
dimenzionim tabelama
Dimenzioni model podataka
Osnovne karakteristike vrijednosne tabele 26

 Sadrži numeričke vrijednosti onoga što se mjeri. Npr.,


vrijednost 20 u vrijednosnoj tabeli znači da je prodato 20
proizvoda
 Svaka vrijednosna tabela sadrži ključeve za povezivanje sa
dimenzionim tabelama. Nazivaju se strani ključevi.
 U pravilu sadrži manji broj kolona i puno veći broj redova u
poređenju sa dimenzionim tabelama
 Informacija u vrijednosnoj tabeli ima sljedeće karakteristike:
• Numerička je i koristi se za formiranje agregacija i suma
• Podatkovne vrijednosti se moraju moći dodavati, ili
omogućiti sabiranje velikih brojčanih vrijednosti.
Razlike dimenzionog i relacionog modela podataka
27

 Osnova za razumijevanje razlike između relacionog i


dimenzionog modela podataka jeste način pohranjivanja i
predstavljanja podataka.

• Podaci su u relacionoj bazi podataka pohranjeni u


obliku tabela, gdje svaki red tabele predstavlja jedan
slog, a svaki slog je podijeljen na polja (kolone u tabeli)
u kojima su pohranjeni podaci.

• U dimenzijskoj bazi podataka osnovni način


predstavljanja podataka jeste matrica podataka ili
ukrštena tabela koja čini dimenziono područje (engl.
array). Područje je osnovna komponenta dimenzione
baze podataka.
Okvir i pregled skladišta podataka {Rainer & E.Turban, [14]}
28
Relaciona baza podataka [14]
29
Multidimenzionalna baza podataka [14]
30
Primjer strukture višedimenzionalne BP sa 4 dimenzije
31
Dijeljenje dimenzija
32
Operacije nad podacima u dimenzionom modelu BP
33

 Drill down (svrdlanje) po podacima (od globalne slike do


detalja)

 Drill up – (izronjavanje) od detalja do globalne slike

 Pivoting (rotacija) zaokretanje tabele tako da redovi i kolone


zamijene mjesta

 Slicing (raslojavanje) horizontalni presjek kocke

 Dicing (presijecanje) vertikalni presjek kocke, a naziva se


još i rangiranje podataka zato što se podaci grupisanjem
razlažu na podskupove
Literatura
34

[1] R. Kelly Rainer Jr, Efraim Turban, Uvod u informacione


sisteme, Data Status, 2009. (Prevod knjige Introduction to
Information Systems, John Wiley & Sons)
[2] Kelly, S. (1996) Data Warehouseing, New York, John Wiley
& Sons
[3] http://www.sdgcomputing.com/glossary.html
[4] Kimball Ralph, "The Data Warehouse Toolkit: Practical
Techniques for Building Dimensional Data Warehouses",
John Wiley & Sons, 1996
[5] Inmon, W.H., '' What is a Data Warehouse? '', 1995,
http://www.cait.wustl.edu/cait/papers/prism/vol1_no1/
[6] Ćurko, K.: Business intelligence technology: The Croatian
case, Ekonomski fakultet Split, Vol.7, No.2, 1-102, Split,
2002., str.66.
[7] Njeguš, A., Poslovni informacioni sistemi, Singidunum,
Beograd, 2009,
Literatura
35

[8] Ljubetić, V. Upravljanje znanjem primjenom alata Poslovne


inteligencije,
http://www.skladistenje.com/download/Visnja_Ljubetic.pdf
[9] Reinschmidt J., Francoise A, Business Intelligence
Certification Guide, e-book, IBM Redbooks, 2001
[10] Panian, Ž., Klepac, G.: Poslovna inteligencija, Masmedia,
Zagreb, 2003
[11] http://www.olapreport.com/index.htm
[12] http://www.singipedia.com/content/255-Znacaj-poslovne-
inteligencije-u-turistickom-poslovanju
[13] http//www.olapreport.com/glosarry.htm, 26.03.2004.
[14] Kelly Rainer Jr. & Efraim Turban, Introduction to
Information Systems, John Wiley & Sons, 2009
POSLOVNA INTELIGENCIJA

OLAP alati

Savo Stupar

You might also like