Professional Documents
Culture Documents
Hurtownie Danych - Starczewski&Zreda
Hurtownie Danych - Starczewski&Zreda
Autorzy
Marcin Starczewski
Marcin Zrda
Plan prezentacji
Wprowadzenie
Teoria hurtowni danych
Architektura
Zagadnienia zwizane
Technologia OLAP
Budowa i wdroenia hurtowni danych
Podsumowanie
Uporzdkowanie tematyczne
Dane przechowywane s niezalenie od
aplikacji, ktra je wygenerowaa np.: Obsuga
klientw jest realizowana przez rne aplikacje
w zalenoci od tego czy s to klienci
indywidualni czy tez instytucje. Natomiast w
hurtowni s to jedne dane Klienci (oczywicie
jest gdzie wyrnik jaki to typ klienta)
Zintegrowany
Rne aplikacje mog w rny sposb
interpretowa i zapisywa dane np.: pe
mog zapisywa jako M/K, M/F, 1/0. Natomiast
w hurtowni dane te musza by ujednolicone w
sposobie pomiaru ich wartoci tzn. dane
dotyczce pci musza by przetumaczone na
jeden typ zapisu nie jest istotne, ktry wane
aby by jednolity dla wszystkich danych.
6
Nieulotno danych
W hurtowniach danych moemy: adowa dane
albo korzysta z nich. W odrnieniu od
typowych aplikacji gdzie dane mog by
usuwane, aktualizowane i wprowadzane przez
cay czas.
Dziki temu w hurtowniach nie obowizuje nas
ju transakcyjno, zarzdzanie blokadami...
Menaderowie
Analitycy
Stratedzy firmy
Do zarzdzania taktycznego
Po co hurtownie danych
10
Statystyki
11
12
13
14
16
17
Agregaty 1/2
Agregaty (podsumowania) s generowane z
danych detalicznych i s tak przygotowywane
aby odpowiaday na najczciej zadawane
pytania przez uytkownikw hurtowni.
Agregaty mog by wielowarstwowe tzn.:
najpierw z danych detalicznych tworzymy dane
wstpnie zagregowane a nastpnie mocniej
zagregowane.
19
Agregaty 2/2
Dla umoliwienia waciwej analizy danych
agregaty generowane s w kilku przekrojach.
Jednak zawsze moe zdarzy si, e bd
potrzebne dane, ktrych nie ma agregacie
wtedy bdzie trzeba sign po archiwum (np.
tamowe) i wycign potrzebne informacje z
danych detalicznych. Jeeli takie zapotrze bowanie zdarza si czsto np. co kwarta warto
przemyle czy nie zmieni struktury agregatu.
20
Metadane 1/2
Powinny zawiera :
opis danych zawartych w hurtowni;
opis dostpnoci danych;
nazw systemu, z ktrego pochodz dane;
21
Metadane 2/2
22
23
24
Narzdzia wspomagajce
projektowanie 1/2
25
Narzdzia wspomagajce
projektowanie 2/2
26
Repozytoria metadanych.
Ta kategoria narzdzi cile wie si z poprzedni.
Zadaniem ich jest przechowywanie i zarzdzanie
metadanymi, nie tylko tymi powizanymi z hurtowni
lecz take tymi, ktre nale do innych systemw
informatycznych w przedsibiorstwie. Powinny by
zintegrowane z pozostaym oprogramowaniem do
zarzdzania hurtowni, ideaem jest sterowanie
systemem poprzez zmian metadanych (zmiana
metadanych powoduje zmian zasilania hurtowni).
Narzdzia wspomagajce
zasilanie hurtowni 1/4
Su do :
pozyskiwania i czyszczenia danych;
transferu danych przez sie;
adowania danych do hurtowni.
Dobrze aby potrafiy:
ujednolici sposb kodowania atrybutw z rnych
systemw;
dopasowa rozmiary pl do przychodzcych danych.
27
Narzdzia wspomagajce
zasilanie hurtowni 2/4
28
Narzdzia wspomagajce
zasilanie hurtowni 3/4
Systemy baz danych.
Najczciej do przechowywania danych stosuje si
relacyjne bazy danych. Niektrzy producenci
serwerw SQL umieszczaj w nich specjalne
narzdzia zwikszajce wydajno obsugi hurtowni.
Ale te wielu producentw (RedBrick) oferuje
wielowymiarowe bazy, ktre przechowuj dane w
postaci tzw. hiperszecianu, ktry umoliwia atwe
sporzdzanie przekrojw i analizy danych.
29
Narzdzia wspomagajce
zasilanie hurtowni 4/4
Narzdzia analityczne.
S przeznaczone dla kocowego uytkownika,
zazwyczaj jest to analityk biznesowy.
dla niewielkiej liczby danych np. Microsoft Excel;
dla wikszych wymaga np. Business Objects;
analiza matematyczna np. produkty SAS;
analiza geograficzna np. MapCAD.
30
31
Technologia OLAP
OLAP On-line Analytical Processing.
model wielowymiarowy, hiperkostka;
OLAP przeksztaca dane z hurtowni na strategiczn
informacj;
model bliszy rozumowaniu czowieka;
dane o firmie zgromadzone w jednej kostce;
hurtownie danych i systemy OLAP wzajemnie si
uzupeniaj;
dziki prostocie i szybkoci analizy zmniejsza si
zagubienie w informacji i jej bdna interpretacja.
32
Technologia OLAP
Relation-OLAP (ROLAP)
33
Technologia OLAP
Multidimensional-OLAP (MOLAP)
zoptymalizowane struktury danych (+);
dua wydajno analizy wielowymiarowej (+);
naturalna budowa struktur wielowymiarowych (+);
trudna modyfikacja danych (-);
mniejsza pojemno (-).
Dwa rodzaje baz wielowymiarowych:
disk Based (MDB);
RAM Based MDB lub RAM Cubes;
34
Technologia OLAP
Hybrid-OLAP (HOLAP)
Poczenie technologii ROLAP i MOLAP.
35
Analiza wielowymiarowa
36
37
38
39
40
41
42
43
44
45
BPH,
Wsplne dzieo BPH i Oracle Polska, wykorzystano
baz Oracle Express. Moliwoci generowania
raportw finansowych do NBP, dane finansowe
zapisywane na zasadzie fotografii.
Coca-Cola,
InfoViDE by odpowiedzialny za zaplanowanie i
budow systemu analiz i raportw dla firmy. Zakres
systemu to raportowanie zagadnie zwizanych ze
sprzeda oraz produkcj, prognozowanie i elementy
budetowania.
46
Podsumowanie 1/2
47
Podsumowanie 2/2
LITERATURA
Internet
48