Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 15

WEB SERVISI

Dr Branislav Bogdanovic
Skripta za pripremu I kolokvijuma

Web servisi

Prema W3C konzorcijumu Web servis je softver razvijen da podri interoperatibilnu


interakciju izmeu maina preko mree. Web servisi se mogu smatrati specijalnim aplikacijskim
programskim interfejsima, koji se izvravaju na udaljenim raunarima, na kojima je hostovan
zahtevani Web servis. Servisima se moe pristupati preko mrea, kao to je Internet. SOA je
arhitektonski stil koji omoguava kreiranje aplikacija kombinujui, orkestrirajui,
interoperatibilne servise. Kako je kod servisno orijentisane athitekture osnovna jedinica
komunikacije poruka (message), a ne operacija, Web servisi moraju biti labavo povezani.
Opis funkcija koje Web servis podrava, kao i opis naina razmene poruka sa Web
servisom, predstavljaju vezu Web servisa sa spoljnim svetom, tj. njegov interfejs. Sam nain
implementacije funkcije servisa je inkapsuliran, sakriven, u telu servisa i moe se proizvoljno
menjati sve dok je interfejs konstantan. Sva dokumenta za opis Web servisa su izraena
korienjem standardizovanog, XML baziranog jezika, koji moe mainski da se obrauje
(WSDL Web Service Description Language). Drugi servisi ili aplikacije sarauju sa servisom
na unapred definisan nain i korienjem SOAP (Simple Object Access Protocol) poruka, koje se
prenose pomou HTTP (Hyper Text Transfer Protocol) protokola, uz korienje XML
serijalizacije i drugih Web standarda.
Web servisi omoguavaju standardan nain za interoperabilnost izmeu razliitih
softverskih aplikacija, koje se mogu izvravati na razliitim platformama i u razliitim radnim
okruenjima. Web servisi se mogu posmatrati i kao meunivo za interakciju (middleware), koji
povezuje dve ili vie aplikacija, tako da one mogu da razmenjuju podatke u heterogenom
distribuiranom okruenju. Na slici 01. prikazani su osnovni entiteti i ematski su predstavljeni
osnovni koraci u korienju jednog Web servisa.

Slika 01. Komponente Web servisa

1
U ovim osnovnim koracima obavljaju se sledee funkcije:
1. Sistem koji obezbeuje servis opisuje, tj. definie svoj servis korienjem WSDL
jezika. Ta definicija se objavljuje u katalogu servisa. Najee se koristi Universal Description,
Discovery, and Integration (UDDI) direktorijum, mada se sreu i drugaiji direktorijumi;
2. Korisnik servisa pretraivanjem direktorijuma locira eljeni servis i na osnovu WSDL
opisa servisa saznaje kako da komunicira sa servisom;
3. Deo WSDL opisa, koji je obezbedio snabdeva servisa, dostavlja se korisniku servisa i
na osnovu toga korisnik servisa saznaje parametre zahteva i odgovora konkretnog servisa;
4. Korisnik servisa koristi WSDL opis i alje zahtev servisu;
5. Servis u skladu sa svojom funkcijom obezbeuje odgovor i dostavlja ga korisniku
servisa.

Sve poruke izmeu servisa i korisnika servisa realizuju se korienjem SOAP protokola,
pri emu su SOAP poruke kao i WSDL dokumeti opisa servisa bazirani na XML jeziku. Kako je
XML baza za Web servise i kljuni faktor njihove nezavisnosti od hardverske platforme,
operativnih sistema ili jezika na kome su realizovani, esto se za servise Web servise kao
sinonim koristi termin XML Web servis.

Jezik za opis Web servisa - WSDL

Web Services Description Language (WSDL) je jedan od tri osnovna standarda Web
servisa i koristi se da definie vii nivo funkcionalnosti Web servisa, opisujui njegove eksterne
interfejse. Korienjem ovog jezika opisuju se detalji funkcionisanja Web servisa. Detaljne
informacije o nainu funkcionisanja servisa, u smislu kako treba da definie ulazne parametre i
ta moe da oekuje kao rezultat izvrenja servisa, korisnik Web servisa moe da dobije iz
WSDL dokumnta. WSDL dokument u potpunosti opisuje Web servis, ukljuujui operacije koje
servis podrava, poruke koje se razmenjuju i tipove podataka koji se pri tome koriste.
WSDL dokument je standardni XML dokument koji poinje definisanjem imenskih
prostora (namespaces) korienjem atributa korenog elementa <definitions> WSDL dokumenta.
Pored korenog elementa u WSDL dokumetu mogu se nai sedam primarnih elemenata koji se
svrstavaju u dve osnovne kategorije.
Elementi za opis saraja: to su XML elementi koji dokumentuju interfejs Web servisa
ukljuujui i metode koje servis podrava, ulazne parametre i povratne vrednosti. U
ovu grupu elemenata ubrajaju se XML elementi <types>, <message>, <operation> i
<portType>;
Elementi konkretne implementacije: ova grupa XML elemenata pokazuje klijentu
kako da se fiziki povee sa Web servisom i kako da koristi operacije koje servis
podrava. Elementi koji pripadaju ovoj grupi su <binding>, <port> i <service>.

Objavljivanje servisa

Jednu od osnovnih komponenti servisno orijentisane arhitekture predstavlja i mehanizam


za objavljivanje servisa, kako bi servis mogao da bude pronaen od strane potencijalnih
korisnika. Da bi se uspostavio taj deo radnog okruenja Web servisa, neophodan je centralni

2
registar, koji e sadrati opise servisa. Takav registar, Universal Description, Discovery, and
Integration (UDDI), moe biti deo infrastrukture kompanije, ili se moe koristiti javni registar,
koji je deo infrastrukture Internet zajednice.
Informacije u UDDI zapisu pripadaju jednoj od tri kategorije informacija. Bele strane
pruaju osnovne informacije o kompaniji (ime kompanije, adresa, sajt). ute strane pruaju
dodatne informacije o kompaniji (tip posla, razliite kategorizacije, identifikacija posla itd.).
Zelene strane pruaju tehnike informacije o servisima. Ove strane opisuju kako ostvariti
interakciju sa servisom, ukazaju na WSDL fajl, tj. opisuju mogunosti i funkcionalnost servisa.
Svi UDDI zapisi se realizuju korienjem XML elemenata <businessEntity>, <businessService>,
<bindingTemplate>, <tModel> i <publisherAssertion>.

SOAP Protokol razmene podataka

Simple Object Access Protocol je protokol koji se bazira na XML-u i slui za razmenu
strukturiranih i tipiziranih informacija izmeu labavo povezanih raunara na Web-u. SOAP
unapreuje mogunosti postojeih protokola ime omoguava slanje poruka, zahteva i odgovora,
korienjem standardnih protokola (HTTP, SMPT, FTP). Zahvaljujui korienju standardnih
transportnih protokaola, SOAP je u mogunosti da koristi sve prednosti otvorenih arhitektura na
Internetu i da omogui prolaz poruka kroz firewall-ove.
Osnovni nosioc SOAP informacija je XML fajl iji se bazini element zove koverta
(envelope). Element <Envelope> obuhvata korisni sadraj poruke i obavezno sadri element
<Body>, a opciono elemente <Header> i <Fault>. Element <Body> sadri ime metode i imena i
vrednosti parametara, dok element <Header> dodatno opisuje tip SOAP poruke. Za obradu
izuzetaka moe se u okviru <Body> elmentata pojaviti i element <Fault>.

Semantiki Web
Govorei o pronalaenju informacija 1996, Berners-Lee je posebno istaknuo injenicu
kako je vrlo teko pronai odreeni podatak ukoliko on nije izraen u obliku konkretnog
semantikog navoda, tj. u obliku u kojem je znanje prikazano kroz neki jezini navod
(Berners-Lee, 1996). S obzirom da se tragalo za efikasnijim i boljim reenjima za pronalazak
informacija na Web-u, Semantiki Web je nastao kao reenje problema, tj. rezultat traganja
te on predstavlja proirenje postojeeg Web-a gde je informaciji dato precizno definisano
znaenje i koji bolje omoguava saradnju izmeu raunara i korisnika, to je vrlo bitno.
Semantiki web je ideja o proirenju Web-a, u kojem je preciznije definisana semantika
informacije i servisa na Webu, to bi i raunarima omoguilo dublju analizu podataka -
sadraja, veza i transakcija izmeu ljudi i raunara. Osnovna ideja je pojednostaviti
pretraivanje informacija pa tako boljom standardizacijom meta-podataka pruiti pomo
korisnicima i inteligentnim softverskim agentima u pronalaenju skrivenih informacija na
Web-u. Za sintaktiku formu dokumenata i za njihov semantiki sadraj moraju biti
definisani standardi, ime se pretraivaima omoguuje da sami kontaktiraju sve dostupne
resurse i automatski pronalaze traene sadraje. Semantiku informacija koje pretrauju,
moraju razumeti programi koji se tom prilikom koriste. Do razumevanja semantike dolazi
se upotrebom odreenih programskih jezika kojima se vri tano semantiko oznaavanje
podataka i izvora tih podataka, meta-podataka (podatci o podatcima).

3
Glavni principi Semantikog Web-a
Glavni principi Semantikog Web-a su sledei:
Sve moe biti identifikovano uz URI (Uniform resource identifier)
Koristei niz identifikatora, ljudi, mesta i stvari u fizikom svetu mogu biti prepoznati u
Semantikom Web-u. Onaj ko ima kontrolu na delu prostora imena na Web-u (Web
namespace) moe kreirati URI i rei da on identifikuje neto u fizikom svetu. Fizikim
entitetima se takoe moemo obraati indirektno.

Resursi i linkovi mogu imati tipove

Trenutni Web sastoji se od resursa i linkova. Resursi su Web dokumenti namenjeni za


ljudsku upotrebu i obino ne sadre metapodatke koji opisuju emu slue i koje su njihove
relacije prema ostalim Web dokumentima. Korisnik moe nagaati koje veze ima resurs
itajui ga, dok je ureaju puno tee doi do tih rezultata jer on ne moe shvatiti da je jedan
resurs npr. pismo. Zato, kod Semantikog Web-a resursi i linkovi mogu imati tipove koji
definiu koncept koji daje vie informacija ureaju

Tolerie se parcijalna informacija

Semantiki Web je neogranien pa bilo ko moe rei bilo ta o bilo emu i stvarat i
razliite tipove ili linkove izmeu resursa, te e uvek postojati neto vie za otkrivanje. Neki
od povezanih resursa mogu prestati postojati ili adrese mogu biti ponovno upotrebljene za
neto drugo. Alati na Semantikom Web-u trebaju tolerisati taj raspad podataka (data decay) i
biti u mogunosti.

Nema potrebe za apsolutnom istinom

Sve to je pronaeno na Web-u nije nuno istinito i Semantiki Web ne menja to na


bilo koji nain. Verodostojnost ili istina se evaluira u svakoj aplikaciji koja procesira
informaciju na Web-u. Te aplikacije odluuju u ta da vjeruju koristei kontekst izjave (ko
je rekao ta i kada).

Podrana je evolucija

Normalno je da su koncepti sline tematike esto definisani razliitim grupama


ljudi na razliitim mestima na mrei ili istom grupom ljudi ali u razliita vremena.
Semantiki Web koristi opisne konvencije koje se mogu iriti kao to se i ljudsko
razumevanje proiruje. Konvencije doputaju efektivne kombinacije nezavisnih poslova
raznolikih zajednica ak i kad koriste razliite renike.

Minimalistiki dizajn

Semantiki Web ini jednostavne stvari jednostavnijim, a sloene stvari ini moguim.
Cilj W3C konzorcijuma je da se standardizuje samo ono nuno. Ovaj pristup omoguuje
implementaciju jednostavnih aplikacija sad kad se baziraju na ve standardizovanim

4
tehnologijama.

Slojevi Semantikog Web-a


Principi Semantikog Web-a su primenjeni na slojeve (slika 32.) Web tehnologija i
standarda:
1. Unicode i URI slojevi slue da omogue korienje internacionalnog skupa znakova
(character set) i prue nain za identifikovanje objekata u Semantikom Web-u.
2. XML sloj sa prostorom imena i emom definicija osiguravaju integraciju
definicije
3. Semantikog Web-a sa ostalim standardima baziranim na XML-u tj. osigurava
serijalizaciju.
4. RDF - Sa RDF-om (RDF) je mogue napraviti izjave o objektima sa URI-ovima i
definisati renike kojima se moe baratati preko URI-ova. Ovo je sloj u kojem
moemo dati tipove resursima i linkovima.
5. Ontoloki sloj podrava evoluciju renika, takoe moe definisati relacije izmeu
razliitih koncepata. Navedeni slojevi, zajedno sa slojem za detekciju promena kod
dokumenata (Digital Signature layer), trenutno se standardizuju u radnoj grupi W3C.
6. Slojevi na vrhu: Logic, Proof i Trust se trenutno razvijaju te se grade jednostavni
demonstrativni primeri. Logiki sloj omoguava pisanje pravila, dok Proof sloj
izvrava (executes) ta pravila i evaluira, zajedno sa Trust slojem, da li da se veruje
datom dokau (proof) ili ne.

Slika 32. Slojevi Semantikog web-a

Ontologija
Ontologija (gr. Ontos=bie, stvarnost; gr. logica=nauka) u svom izvornom
filozofskom znaenju, predstavlja nauku o biu, o onome to postoji, uenje o opim,
fundamentalnim i konstruktivnim odreenjima postojanja. U informatici ontologija znai

5
formalno definisani sistem od pojmova i/ili koncepata i relacija izmeu tih pojmova.
Ontologije mogu poveati funkcionalnost Web-a na mnogo naina. Mogu biti iskoriene na
jednostavan nain za poboljavanje preciznosti u pretraivanju Web-a (umesto da pronalaze
stranice koje koriste jednu od neodreenih kljunih rei, pretraivaki programi mogu traiti
samo one stranice koje se odnose na odreeni koncept). Naprednije aplikacije e koristiti
ontologije za povezivanje informacija na stranicama sa strukturama znanja i pravilima
zakljuivanja. Web dizajneri se slue ontologijama za odreivanje odnosa, relacija i
karakteristika objekata. Sistemi ontologija definiu termine, pojmove i njihove meusobne
veze. Ontologija je opis (kao formalna specifikacija programa) koncepata i veza koje mogu
postojati unutar hijerarhije u sistemu pojmova te one predstavljaju najvaniju komponentu
Semantikog web-a a samim tim i jednu od vanijih komponenti u informacionim poslovnim
sistemima. Ontologija se sastoji od konane liste termina i relacija izmeu tih termina.
Termini oznaavaju koncepte (klase ili objekte) nekog domena. Relacije se obino sastoje
od hijerarhije klasa. Pored relacije hijerarhije klasa, ontologije mogu sadrati i informacije
tipa:
svojstva (properties);
ogranienja vrednosti;
iskljuive izraze (engl., disjoint statements);
specifikacije logikih relacija meu objektima.

Odreena jezika podrka je nuna da bi se omoguila implementacija ontologija na


Web-u. Postoji vie jezika odnosno proirenja jezika, koji omoguavaju kodiranje
semantikih informacija primenom ontologija, kao to su npr. OIL ili DAML.
OIL (Ontology Inference Layer) predstavlja jezik za opis ontologija na web-u. U
velikoj meri OIL uzima kao polaznu taku RDF shemu. OIL je u potpunosti zasnovan na
XML sintaksi, dok je sa RDF-om u odreenoj meri i isprepleten pa OIL ontologije
predstavljaju i validne RDF dokumente. Ovo se postie proirivanjem definicije RDFS-a
dodatnim jezinim znakovima. Po miljenju autora OIL-a mala je verovatnoa da samo jedan
jezik za ontologije moe zadovoljiti sve potrebe korisnika i primene semantikog web-a.
Zato su se autori opredelili da OIL organizuju kao seriju slojeva koji e se stalno
razvijati. Specifikacija OIL-a : Core OIL i Standard OIL slojevi, Instance OIL i Heavy OIL.
Jedan od najznaajnijih pomaka na podruju ontologijskih mrenih jezika je DAML
(DAML - DARPA Agent Markup Language) koji je posebno osmiljen kao jezik i sredstvo
za ostvarenje ideje semantikog Weba a razvijen je kao proirenje XML-a i RDF-a. DAML
je karakteristian primjer standarda koji se slui web-kompatibilnim jezikom zajedno sa
logikom paradigmom iz podruja vetake inteligencije. Najnovija verzija tog jezika
(DAML + OIL) sastoji se od bogatog niza konstruktivnih elemenata pogodnih za
sastavljanje ontologija i detaljno oznaavanje informacija tako da one budu itljive i
razumljive ureaju. U njemu su spojeni mreni jezik, deskriptivna logika i sistem
rasuivanja utemeljenog na principu okvira sa slojevitim pristupom izgradnji jezika kako ju
propisuje OIL (The Ontology Inference Layer). DAML je uskladljiv sa RDF shemom
(RDFS) i sadri preciznu semantiku za opis znaenja pojmova (jednako tako pogodnu i za
opisivanje informacija koje se podrazumevaju) (Fensel, 2000).

Uloga ontologija na Web-u

6
Semantiki web e doneti strukturu smislenom sadraju Web stranica a ontologije se
izdvajaju kao kljuni mehanizam za predstavljanje znanja Semantikog web-a. Ontologija
prua mogunost generisanja novih injenica na osnovu injenica koje su eksplicitno date.
Ontologije omoguavaju postizanje vieg nivoa funkcionalnosti Web-a, kroz sledee funkcije
koje su razlog sve ee primene ontologija na Web-u:
1. poveanje preciznosti u pretraivanju Web-a;
2. povezivanje informacija na stranicama sa pridruenim im strukturama znanja i
pravilima zakljuivanja;
3. razmenu znanja izmeu ljudi i softvera;
4. razumevanje domena;
5. pruanje strukture za prenos informacija u Semantikom web-u ili u domenu
linkovanih podataka;
6. mogunost nadograivanja i menjanja u skladu s potrebama.

Takoe, postoje prednosti i nedostaci ontologija, koje se takoe mogu izdvojiti.


Prednosti ontologija:
1. koherentna navigacija, omoguava kretanje od koncepta do koncepta u strukturi
ontologije;
2. fleksibilne ulazne take, jer svaka specifina perspektiva u ontologiji moe se
pratiti I dovesti u vezu sa svim njegovim povezanim konceptima;
3. veze koje istiu relevantne informacije bez zahteva prethodnog znanja o
domenu ili njegovoj terminologiji;
4. sposobnost da predstavi bilo koji oblik informacija, ukljuujui i nestrukturirane,
polu- strukturirane i strukturirane podatke;
5. povezivanje koncepta;
6. integrisanje sadraja pravilnim povezivanjem i mapiranjem koncepata.
Nedostatci ontologija:

1. koncept koji je nov za mnoge korisnike tako da se esto javljaju greke;


2. problem mapiranja dobijene ontologije sa postojeim domenskim ontologijama;
3. problem gubitka semantike nakon transformacije.
Nedostatke je mogue otkloniti kroz kompleksniji razvoj ontologije i Semantikog web-a.

7
DATA WAREHOUSE
Heterogenost i sloenost poslovnog okruenja nameu neophodnost korienja sistema za
podrku odluivanju, naroito pri donoenju strategijskih odluka. Za strategijsko odluivanje
uglavnom se ne koriste neposredne informacije o svakodnevnom poslovanju, ve zbirni podaci iz
odreenog vremenskog perioda. Da bi kvalitet odluivanja bio zadovoljavajui potrebno je uzeti
u obzir veoma veliki broj podataka iz proteklog vremenskog perioda, jer su problemi koji se
reavaju u strategijskom odluivanju kompleksni, a podaci, uglavnom, nestruktuirani. To je
razlog da se koncept skladitenja podataka - Data Warehouse namee kao informaciona osnova
za podrku odluivanju.
Data Warehouse je posebno projektovano tehnoloko okruenje koje omoguava
objedinjavanje srodnih podataka u oblik pogodan za analizu, ime se olakava proces donoenja
odluka i daje nov pristup sistemima za podrku odluivanju. Ovaj koncept obezbeuje fleksibilan
i efikasan nain raspolaganja podacima u formatu pogodnom za savremene poslovne aplikacije.
Postojanje skladita podataka, kao informacijama bogatog integrisanog okruenja, omoguava
orijentaciju ka potrebama korisnika. Zahvaljujui postojanju skladita podataka menament i
radnici mogu, uz pomo alata za poslovno odluivanje, donositi pravovremene i kvalitetne
poslovne odluke. Data Warehouseing ili skladitenje podataka predstavlja proces integracije
podataka, koji se nalaze u celoj organizaciji, u jedinstveni renik iz koga krajnji korisnici mogu
dobiti izvetaje i sprovoditi ad-hoc analize podataka.
Data warehouseing je proces ekstrakcije podataka iz razliitih aplikacija (internih i
eksternih), transformacije tih podataka u format pogodan za analizu i smetanje podataka u
konsolidovan repozitorij, sa ciljem poslovne analize. Ovaj postupak zahteva kombinovanje
metodologija, tehnika, hardverskih i softverskih komponenti, koje zajedno obezbeuju
infrastrukturu sistema za implementaciju i postupno unapreivanje analitikih aplikacija, baze
poslovnog odluivanja.
Neke od tehnika i tehnologija, koje su kompanije meu prvima poele da primenjuju u
cilju unapreivanja procesa donoenja odluka, baziraju se na personalnim bazama podataka i
unakrsnim tabelama (spreadsheets). Pomou ovih tradicionalnih tehnologija poslovni analitiari
prikupljaju podatke iz operacionih IT sistema, i korienjem spreadsheet aplikacija generiu
izvetaje i dijagrame, koji se koriste u procesu donoenja odluka. Ovaj pristup je prilino
neefikasan, sa aspekta blagovremenog donoenja validnih odluka, jer ne obezbeuje sve
potrebne informacije u pravo vreme. Sem toga, razliiti podaci mogu biti ekstraktovani u
razliitim trenucima, transformisani razliitim postupcima od strane razliitih korisnika, to
podatke ini nekonzistentnim. Tako su donosioci odluka suoeni sa nunou donoenja odluka
na bazi veeg broja razliitih verzija istine.
Da bi se prevaziao ovaj problem, kompanije najee implementiraju centralizovano
skladite podataka, centralizovan repozitorijum podataka, data warehouse. Ovaj pristup
omoguava postojanje konzistentnih podataka njihovim prikupljanjem, tokom vremena iz svih
podruja poslovanja, i transformisanjem na jedinstven nain. Koncept data warehouse, i uloga
ETL postupaka (ETL Extraction, Transformation, Loading) prikazani su na slici.

8
Koncept centralizovanog kompanijskog skladita data warehouse

Danas su u upotrebi 3 osnovne arhitekture skladita podataka:


dvoslojna s jednim zajednikim skladitem podataka (Izvori podataka + Data Warehouse);
dvoslojna s veim brojem nezavisnih lokalnih spremita podataka (Izvori podataka + Data
Marts);
troslojna s jednim skladitem i veim brojem spremita (Izvori podataka + Data Warehouse
+ Data Marts).

Karakteristike troslojne arhitekture su:


vei broj lokalnih skladita podataka (Data Marts) povezanih u jedno skladite podataka
pozicionirano izmeu lokalnih skladita i izvora podataka;
u skladite se arhiviraju podaci iz baza podataka kompanije da bi se onda isporuivali
lokalnim skladitima;
u jedinstvenom, usklaenom formatu lokalna skladita podatke dobijene iz skladita
konvertuju prema kriterijumima koje diktiraju njihove lokalne aplikacije, drugim reima
uzimaju one podatke koji im trebaju i po potrebi ih analiziraju;
lokalna skladita su zavisna o kompanijska, zato to jedino preko njih dobijaju podatke.

U okviru troslojne arhitekture skladita podataka moe se govoriti i o prednostima i manama


pomenutih. Prednosti su:
radno optereenje informatiara se smanjuje jer su podaci ve usklaeni u skladitu, pa se u
spremitu samo preuzimaju;
vie mogunosti dodavanja novih aplikacija
unapreenje tanosti i preciznosti informacija jer sve potiu iz jednog skladita
manje potekoa u komunikaciji i saradnji organizacionih jedinica i delova kompanije na
poslovima koje treba obavljati zajedniki
mogue korienje aplikacija koje prevazilaze okvire kompanije.

Nedostaci su visoki trokovi uspostavljanja zajednikog skladita na nivou kompanije. Kako


bi se taj nedostatak otklonio, radi se postupna izgradnja skladita, najpre se kreira prvo skladite,

9
miniskladite, zatim se vri postupno dodavanje novih skladita i aktiviranje novih aplikacija
ime se vri osamostaljenje pravog skladita. Efikasnost arhitekture ogleda se u:

Komunikaciji - plan arhitekture je komunikacijsko sredstvo koje pomae u komunikaciji


prema gore, osiguravajui pomo menadmentu u shvatanju kompleksnosti projekta, ali i
prema dole kao komunikacijski kanal kako unutar tima, tako i izmeu tima i drugih IS
grupa;
Planiranju - plan arhitekture razotkriva tehnike zahteve i zavisnosti koje se obino ne vide
u delu planiranja procesa za odreeni projekat;
Fleksibilnosti u odravanju - kreiranje arhitekture je u stvari anticipiranje to je vie
mogue buduih pitanja i izgradnja sistema koji moe reavati ta pitanja kao deo ukupnog
sistema, a ne nakon to se ona izrode u problem;
Uenju - arhitektura ima znaajnu ulogu u dokumentovanju sistema. Ona pomae novim
lanovima tima da se mnogo bre ukljue u rad i shvate delove, sadraj i veze unutar
skladita podataka;
Produktivnosti - produktivnost se poveava jer arhitektura pomae u odabiru alata za
automatizaciju delova procesa vezanih za skladite podataka, umesto da insistira na
programiranju tih slojeva.

Centralizovano kompanijsko skladite podataka (EDW- Enterprise Data Warehouse)


omoguava odgovarajue i odgovorno upravljanje podacima o poslovnim procesima, jednim od
najznaajnijih resursa kompanije. Konzistentni podaci omoguavaju korisnicima da otkriju
ogdovore na kompleksna pitanja, da simuliraju poslovne procese i reakcije u sluaju
nepredvienih dogaaja. Sve to nudi velike pogodnosti kod strategijskih analiza, koje se najee
obavljau u off-line, batch reimu rada. Meutim, sloena struktura podataka u centralizovanom
kompanijskom skladitu podataka oteava generisanje analiza za pojedine segmente kompanije,
pogotovu kada se javi potreba za brzim parcijalnim analizama.
Ovaj problem je prevazien uvoenjem odseka za podatke data mart. Data mart se
bazira na ideji da poslovne jedinice organizuju informacije, koje su relevantne za njihove
specifine zahteve, u njihovoj smanjenoj verziji centralizovanog skladita. Data mart je podskup,
uproena verzija data warehouse, koja je prilagoena potrebama pojedinanih poslovnih
jedinica. Ekonomski faktori i tehnoloka unapreenja, kao to su pad cena i poveanje
mogunosti servera poslovnih jedinica, doprineli su irokoj rasprostranjenosti data mart
koncepta. Meutim, data warehouse ne predstavlja prost skup data martova poslovnih jedinica.
Kreiranje nezavisnih data martova, sa aspekta kompanije kao celine, vodi ka
nekonzistenciji podataka i oteava sprovoenje kompanijske strategije. Razlog tome je to je
svaki data mart projektovan da zadovolji specifine potrebe konkretne poslovne jedinice, bez
integracije podataka sa ostalim poslovnim jedinicama. Dodatni problem je to se podaci u data
mart mogu smetati i direktno iz transakcionih sistema, bez ETL procesa, to smanjuje tipove i
opseg analiza koji se mogu izvravati. Primena ETL procesa kod nezavisnih data martova
doprinosi poveanju mogunosti vrenja odreenih analiza, ali su podaci i dalje nesinhronizovani
sa podacima u drugim poslovnim jedinicama.
Koncept zavisnih data martova omoguava zadovoljenje specifinih potreba poslovnih
jedinica, uz ouvanje konzistentnosti podataka na nivou kompanije. Paralelno postojanje data
mart i data warehouse tehnologije omoguava zadovoljavanje, kako specifinih potreba

10
pojedinih poslovnih jedinica, tako i sagledavanje interakcije izmeu poslovnih jedinica i
kompanije sa okruenjem.

Troslojni model skladitenja podataka

ETL proces

Prilikom skladitenja podataka, bilo u centralizovano kompanijsko skladite ili u


skladite konkretne poslovne jedinice, neophodno je izvriti prilagoavanje podataka preuzetih iz
transakcionih sistema u oblik pogodan za vrenje analiza. To se postie ETL procesom
(Extraction, Transformation, Loading), koji podrazumeva ekstrakciju odgovarajuih podataka,
njihovu transformaciju i smetanje u skladite. Restruktuiranje podataka pri formiranju skladita
podrazumeva: dopunjavanje tabela, ienje od duplikata, dodavanje novih polja, kljueva i
idneksa, dodavanje eksternih podataka, ukljuivanje meta podataka, sumiranje, agregaciju,
filtriranje, selekciju i promenu formata podataka.

Implementacija skladitenja podataka

Razvoj i implementacija centralizovanog skladitenja podataka predstavlja dugotrajan,


kompleksan zadatak za iju realizaciju su neophodna i znaajna finansijska sredstva. Jedan od
praktinih pristupa je svakako sukcesivna izgradnja. Ukoliko se primeni ovaj pristup, zavrni
korak predstavlja kreiranje troslojnog modela skladitenja podataka, slika 36. Posupak obino
poinje izgradnjom nekoliko data martova koji podravaju troslojnu arhitekturu. Posle
odreenog vremena, kada je korektan rad data martova proveren u praksi, pristupa se kreiranju
centralnog kompanijskog skladita data warehouse.
U primeni ovog koncepa neophodna je stalna nadogradnja sistema, jer se stalno javlja
potreba za novim podacima, esto takvim, koje nije mogue obezbediti direktno iz transakcionih
sistema. Prema W. H. Inmonu1, ocu data warehousing-a, tradicionalni projekti poinju sa

11
zahtevima, a zavravaju podacima, projekti skladitenja podataka startaju sa podacima, a
zavravaju zahtevima. Konkretno, jednom kad korisnici skladita podataka uoe sve mogunosti
koje im prua ova tehnologija, oni trae sve vie i vie. Stoga prilikom projektovanja skladita
podataka, ne treba postavljati samo pitanje koje informacije se ele sada, ve i koje informacije
e biti potrebne u budunosti.
Centralizovana skladita najee se baziraju na relacionim bazama podataka, i prema
modelu tj.nainu pamenja podataka postoje dva osnovna koncepta realizacije: koncept zvezde
(engl. star schema) i koncept pahuljice (engl. snowflake schema). Za koncept zvezde je
karakteristian manji broj relacija, vea redudanca podataka i bri odziv. Za koncept pahuljice je
karakteristian vei broj relacija, manja redudanca i sporiji odziv. U oba sluaja skladite
podataka se gradi na osnovu jedne ili vie centralinih, injeninih relacija (engl. fact), koje se
nadograuju nizom dimenzijskih relacija, pri emu cela struktura nije do kraja normalizovana.
Data warehouse je tematski orijentisano, integrisano, vremenski dugotrajno i
nepromenljivo (pri tome se ne misli na podatke koji tek treba da se pojave u skladitu podataka)
skladite podataka, ija je osnovna namena da svojim analitikim mogunostima podri proces
donoenja odluka. Data warehouse se moe smatrati specijalizovanom bazom podataka, koja se
temelji na podacima iz operativnih baza podataka, i omoguava:
Lak i brz pristup konzistentnim podacima i mogunost njihove analize pri procesu
donoenja odluka;
Otkrivanje sakrivenih informacija o poslovnim procesima i sagledavanje trendova
poslovanja.

Potencijalne vrednosti centralnog kompanijskog skladita mogue je realizovati


korienjem:
Alata za pretraivanje i generisanje izvetaja. Ove tradicionalne tehnologije za rad sa
bazama podataka omoguavaju pristup i pretraivanja u okvru skladita podataka;
OLAP Online Analytical Processing alata za analizu podataka;
Data mining alata. Ovi alati omoguavaju pronalaeje novih relacija izmeu ve
uskladitenih podataka, i generisanje novih znanja o poslovnim procesima.

OLAP Kontinualno analitiko procesuiranje

Sa stanovita informatike infrastrukture, koncept poslovne inteligencije zapoinje


realizacijom centralnog kompanijskog skladita-data warehouse, u koje se slivaju svi podaci od
interesa za poslovanje kompanije. Bez obzira da li potiu iz internih ili eksternih izvora, podaci
prethodno prolaze kroz ETL ciklus, posle ega su formatirani u obliku pogodnom za razliite
analize.
Najprostiji vid analize prikupljenih podataka predstavlja generisanje izvetaja na osnovu
upita. Ovaj anlitiki nivo podrazumeva korienje tradicionalnih tehnologija: relacionog modela
podataka i SQL (Structured Query Language) jezika za generisanje upita. Utemeljeni na vrstim
matematikim osnovama, E. F Codd, i dugo godina tehnoloki usavravani, ovi alati
omoguavaju generisanje rutinskih, jednodimenzionalnih, periodinih analiza.
Danas, da bi opstale, kompanije moraju neprestano, brzo i mudro da transformiu svoje
poslovanje, prilagoavajui ga dinaminim promenama. To podrazumeva ispravan i
blagovremen uvid u uslove poslovanja i usaglaavanje poslovnih procesa sa poslovnim
12
ciljevima. Da bi razumele kretanja u heterogenim uslovima globalnog trita i bile proaktivne na
tritu, a ne samo da retroaktivno reaguju na dogaaje, kompanije moraju da obezbede pristup
informacijama i njihovu viedimenzionalnu analizu. To je preduslov donoenja validnih i
blagovremenih odluka, ime se doprinosi uspostavljanju poslovnog okruenja, koje kontinualno
podrava unapreivanja i inovacije poslovnih procesa. Upravo mogunost lakog generisanja
viedimenzionalnih analiza, osnovni je cilj i razlog rastue popularnosti OLAP alata.
Termin OLAP (On Line Analytical Processing) definisao je 1993. godine E. F. Codd, da
bi naglasio da je uloga ovih alata u itanju i analitici podataka, a ne u transakcionom upisu
podataka u bazu. OLAP predstavlja konceptualni i intuitivni model zasnovan na
multidimenzijskoj analizi podataka, tj. sagledavanju podataka kroz vei broj filtera, dimenzija.
OLAP alati omoguavaju brzo generisanje sloenih ad-hoc analiza, polazei od podataka, koji su
smeteni u kompanijskom skladitu podataka. Na taj nain OLAP alati postaju alati za
generisanje znanja iz kompanijskih podataka, tj. omoguavaju poveavanje intelektualnog
kapitala kompanije.

Principijelna arhitektura OLAP sistema

Polazei od naina skladitenja podataka razlikujemo tri osnovne arhitekture OLAP


sistema.
Relacioni OLAP sisremi ROLAP (Relation On Line Analytical Processing). Ovi sistemi
kao svoju osnovu koriste relacione baze podataka za pamenje svih injenica i agregacija. Ova
arhitektura se karakterie to podaci zauzimaju najmanje prostora, ali sa druge strane najsporije
odgovara na upite. Koristi se kada je prostor na disku ograniavajui faktor, kada se radi sa
velikim bazama podataka i kada se podaci relativno retko koriste.
Multidimenzionalni OLAP sistemi MOLAP (Multidimensional On Line Analytical
Processing). Ova arhitektura se iskljuivo koristi uslugama svoje vlastite, viedimenzionalne
baze podataka, koja u sebi sadri sve potrebne injenice, agregacije i ostalo. Ova arhitektura se
karakterie time da zauzima najvie prostora, najbre odgovara na upite i potpuno je nezavisna

13
od izvora podatka. Koristi se kada je brzina odgovora na upite kritina, za relativno male baze
podataka i kada se podaci esto koriste.
Hibridni OLAP sistemi HOLAP (Hybrid On Line Analytical Processing). Ova
arhitektura koristi relacionu bazu podataka (najee skladite podataka) za smetanje injenica,
dok se agregacija, dimenzije, mere i sve ostale potrebne definicije smetaju u viedimenzionalnu
bazu. Karakterie se prosenom brzinom i prosenim zauzimanjem prostora. Koristi se za baze
podataka srednje veliine, kada brzina odgovora na upite nije kritina, ali je bitna.

7. DATA MINING RUDARENJE


Kontinualni proces digitalizacije drutva dovodi do izuzetnog rasta obima podataka. koji
se smetaju u baze podataka. Razvojem informacionih sistema arhiviranje podataka u baze
podataka postalo je veoma jednostavno i po cenama vrlo dostupno. Istovremeno, sa rastom baza
podataka razvija se i potreba da se podaci u njima anliziraju, otkriju relacije meu podacima tj.
omogui izrada modela, koji bi mogli analizirati prethodna kretanja i, jo vanije, predvideti
kretanja u budunosti. U evoluciji od poslovnih podataka do poslovnih informacija i znanja,
svaki novi korak izgraivan je na prethodnom. Posmatrano hronoloki, mogu se uoiti etiri
osnovne faze razvoja, koje su prikazane u tabeli.

Period Faza Tip poslovnog upita Tehnologija Karakteristike


razvoja
1960-te Prikupljanje Koliki je ukupni prihod Datoteke Statika obrada
podataka kompanije u poslednjih pet hronolokih
godina? podataka.
1980-te Pristup Kolika je bila prodaja po Relacione baze Dinamika
podacima odreenim prodajnim podataka, SQL, isporuka
jedinicama na podruju ODBC hronolokih
Srbije u proteklom podataka.
mesecu?
1990-te Sistemi za Kolika je bila prodaja po Data warehouse, Dinamiko
podrku odreenim prodajnim OLAP, sagledavanje
donoenja jedinicama na podruju multidimenzion podataka sa
odluka Srbije u proteklom e baze podataka, vie aspekta.
mesecu? Istrai (drill
down) lokalitet Ni.
Danas Data ta se moe sledeeg Napredni Proaktivna
mining meseca dogoditi sa statistiki obrada
prodajom u Niu? algoritmi, informacija.
algoritmi
vetake
inteligencije

Tabela. Hronoloki prikaz puta obrade podataka

14
Kao to se iz tabele vidi, danas se analogno sa rudnicima zlata, za ekstrakciju znanja iz
ogromne koloiine podataka, najee iz baza podataka, upotrebljava termin otkrivanje,
rudarenje znanja - data mining. Data mining je proces otkrivanja novih smisaonih korelacija,
obrazaca i trendova, obradom ogromne koliine podataka, korienjem statistikih i
matematikih metoda za otkrivanje zakonitosti. Ovaj proces podrazumeva analizu posmatranog
skupa podataka da bi se pronale neoekivane relacije meu podacima, da se podaci redefiniu
na nov nain, koji je razumljiv i koristan vlasniku podataka. Data mining je interdisciplinarna
tehnologija koja podrzaumeva metode i tehnike iz mainskog uenja, statistike, baza podataka,
prepoznavanja oblika i relacija, sve u cilju ekstrakcije informacija iz mase podataka.
Reenja koja omoguavaju data mining ne predstavljaju gotov proizvod, ve
podrazumevaju kombinovanje rezultata veeg broja softverskih alata iz razliitih domena. Data
mining je kljuni lan poslovne inteligencije i data mining metode se mogu primeniti u bilo kojoj
fazi ivotnog veka podataka. Pored alata koji su deo data warehouse i OLAP tehnologija, data
mining metode ukljuuju i:
Softverske pakete za statistiku analizu (SAS - Statistical Analysis Software kao to je
softverski paket SPSS - Statistical Package for the Social Sciences);
Matematike softverske pakete (MathLab, Matematica);
Neutronske mree;
Metode fuzzy logike;
Specijalizovane alate za konkretne potrebe.

ivotni vek data mining procesa podrazumeva sledee korake: sakupljanje podataka,
filtriranje i transformaciju podataka, kreiranje modela, procenu kvaliteta modela, kreiranje
izvetaja, ocenjivanje modela, integraciju modela i upravljanje modelom [85].

15

You might also like