Download as pdf or txt
Download as pdf or txt
You are on page 1of 16

9/19/2019

H1: Databanken inleiding


Basisbegrippen.

Vrij vertaald naar de slides horend bij het handboek.

Inleiding

In dit hoofdstuk
• Wie gebruikt databank(technologie)?
• Basisbegrippen
• Gegevensbeheer: ‘klassieke’ bestand <-> databank
• Delen van een databanksysteem
• Kenmerken van databanken en databankbeheer

1
9/19/2019

Inleiding

Wie gebruikt databank(technologie)?


• Traditionele bedrijfsapplicaties (loonberekening, tijdsregistratie, …)

• Biometrische applicaties (vingerafdrukken, resultaten scans)

• Sensor-applicaties (in kerncentrales, …)

• GIS applicaties (geografische informatie systemen (Google Maps, …)

• Big Data applicaties (Walmart, …)

• ‘Internet of Things (IoT)’ applicaties (Telematics, …)

•  opslag en terug ophalen van informatie (data)

Inleiding

Basisdefinities: databank.
Een gedeelde verzameling van logisch met elkaar verbonden gegevens en
hun beschrijving, ontworpen om aan de informatienoden van een
organisatie te voldoen (O. Connolly).

- digitaal opgeslagen

- specifiek bedrijfsproces

- specifieke groep (gebruikers en applicaties)

2
9/19/2019

Inleiding

Basisdefinities: DBMS.
• Een Database Management System (DBMS):
– een verzameling computerprogramma’s (softwaremodules)
– Nodig om een databank
• definiëren
• creëren
• wijzigen
• beheren
• gebruiken (gegevens invoeren en ‘lezen’).

• Databanksysteem: databank + DBMS

Inleiding

Gedecentraliseerd <-> gecentraliseerd.


Applicaties

Facturatie CRM GIS


opslag

Klantnummer Klantnummer Klantnummer


Klantnaam
Data

Klantnaam Klantnaam
BTWcode Omzet Postcode

Dubbel opgeslagen (redundante) data!

3
9/19/2019

Inleiding

Data management.
• Gedecentraliseerde aanpak:
– Dubbele of redundate opslag
– Risico op inconsistente data
– Sterke koppeling tussen applicaties en data
– Concurrente toegang moeilijk te realiseren
– Applicaties voor meerdere diensten/bedrijven
moeilijk te realiseren

Inleiding

Data management.
Applicaties

Facturatie CRM GIS

Gecentraliseerde data-opslag
opslag
Data

Data

4
9/19/2019

Inleiding

Data management.
Applicaties

Facturatie CRM GIS

DBMS
opslag
Data

data Catalog

Inleiding

Data management.

• Databank gerichte aanpak (gecentraliseerd):


– Efficiënter
– Consistente data
– Eenvoudiger te beheren
– Losse koppeling tussen applicaties en data
– DBMS biedt mogelijkheden bij het ‘lezen’ van data

10

5
9/19/2019

Inleiding

Data management.
• (Txt) Bestand • (Relationele) Databank (SQL)
Procedure FindCustomer;
begin
open file Customer.txt; SELECT *
Read(Customer)
FROM Customer
While not EOF(Customer)
If Customer.name='Bart' then WHERE
display(Customer); name = 'Bart'
EndIf
Read(Customer);
EndWhile;
End;

11

Inleiding

Elementen van een databanksysteem.


• Databankmodel versus instances
• Data model
• 3-lagen architectuur
• Catalog
• Databankgebruikers
• Databanktalen

12

6
9/19/2019

Inleiding

Databankmodel versus instances.


• Databankmodel = databankschema
– bevat
• beschrijving van de databankstructuur
• specificaties v/d elementen, hun eigenschappen,
relaties, beperkingen, ...
– Opgesteld tijdens databankontwerp
– Wijzigt niet om de haverklap
– Opgeslagen in de catalog
• Toestand van een databank
– Op dat ogenblik aanwezige data
– Wijzigt voortdurend
13

Inleiding

Databankmodel versus instances.


• Voorbeeld databankmodel :

Kunstenaar (naam, geboorteplaats,


geboortedatum)
Kunstwerk (naam, museum, jaar)
Museum (naam, stad)

14

7
9/19/2019

Inleiding

Databankmodel versus instances.


• Toestand van een databank :
MUSEUM KUNSTENAAR

KUNSTWERK

15

Inleiding

Datamodel.
• Databankmodel :
– Bevat datamodellen

• Datamodel
– Ondubbelzinnige beschrijving van de gegevens, de
onderlinge relaties, de beperkingen
– Vanuit een specifiek perspectief

16

8
9/19/2019

Inleiding

Gegevensmodel.
• Conceptueel gegevensmodel :
– algemene beschrijving gegevenselementen, kenmerken en
relaties
• Gebruikt door ‘IT’ en ‘business’
• Weergave hoe ‘de business’ de gegevens ziet
• Voorstelling: (E)ERD diagram
• Logisch gegevensmodel
– vertaling conceptueel gegevensmodel naar het type
databankmodel
• Relationeel, hiërarchisch, OO, XML, NoSQL

17

Inleiding

Gegevensmodel.
• Logisch gegevensmodel
– omzetten naar intern (fysiek) gegevensmodel
• Geeft informatie over fysieke opslag:
– waar worden welke gegevens opgeslagen
– Onder welke vorm
– Indexen die het ophalen versnellen
• Zeer DBMS afhankelijk
– Externe gegevensmodellen
• Deelverzameling van het logisch model
• Voor een specifieke doelgroep
• Ook ‘VIEWS’ genoemd.

18

9
9/19/2019

3-Lagen model.
Inleiding

19

3-Lagen model.
Inleiding

Kunstenaar Kunstwerk Museum

Naam Geboortedatum Naam Museum


Naam Stad

Geboorteplaats Jaar
Externe laag

Kunstenaar (naam, geboorteplaats,


geboortedatum) Logische laag

Kunstwerk (naam, museum, jaar)


Museum (naam, stad)

Interne laag

Brussel Parijs New York

20

10
9/19/2019

Inleiding

Catalog.
• Schatkist van DBMS

• Definities en beschrijving elementen in de DB (= metadata)

• Definities logisch gegevensmodel en intern gegevensmodel

• Zorgt voor synchronisatie en consistentie


van de gegevensmodellen

21

Inleiding

Databank gebruikers.
• IT Architect ontwerpt conceptueel gegevensmodel in samenspraak met de ‘business’

• Dbontwerper vertaalt conceptueel model naar logisch en intern model

• DBA (databankbeheerder of database administrator) implementeert en monitort DB

• Applicatieontwikkelaar schrijft databankprogramma’s/databankapplicaties

• ‘Business’ gebruikt databankapplicaties en


voert op die manier databankacties uit

22

11
9/19/2019

Inleiding

Taal relationale databanken.


• SQL (Structured query language)
= DDL + DML (+ DCL)
• DML (Data manipulation language): verzameling instructies om
gegevens in de databank toe te voegen, te wijzigen, te
verwijderen en te raadplegen
zowel via interactieve editor als vanuit applicatie
• DDL (Data Definition language): de kenmerken van de gegevens
en hun relaties beschrijven
definities opgeslagen in de catalog

23

Inleiding

Nog enkele belangrijke begrippen.


• Gegevensonafhankelijkheid
• Modellen
• Gestructureerde en ongestructureerde gegevens
• Integriteitsregels
• Redundante gegevens

DATABANKEN II
• Concurrency control
• Backup en recovery
• Beveiliging
• Performantie

24

12
9/19/2019

Inleiding

Gegevensonafhankelijkheid.
• = wijzigingen aan de gegevensbeschrijving hebben weinig tot geen
impact op de applicaties
• Fysieke gegevensonafhankelijkheid: wijzigingen van de
opslagspecificaties hebben geen invloed op logisch model noch op
de applicatie
wordt opgevangen door het DBMS

• Logische gegevensonafhankelijkheid: minimale aangepassingen


aan de applicaties bij wijzigingen logisch model

25

Inleiding

Modellen.
• Gegevensmodel: weergave gegevens met hun kenmerken en hun
relaties
• Conceptueel gegevensmodel: perfecte weergave van de
gegevensvereisten van de ‘business’
opgesteld met de business
omgezet naar logisch en intern model

• !!Veronderstellingen en ontbrekende informatie


duidelijk vermelden!!

26

13
9/19/2019

Inleiding

(On)gestructureerde gegevens.
• Gestructureerde gegevens
– Kunnen in logisch datamodel voorgesteld worden
– Integriteitsregels kunnen opgesteld en afgedwongen worden
– Vereenvoudigen opzoeken, verwerken en analyseren
– Voorbeelden: naam, geboortejaar, geboorteplaats van een kunstenaar
• Ongestructureerde gegevens
– kunnen niet op een zinvolle manier worden geïnterpreteerd door een applicatie
– Voorbeelden: gesprekken op social media, e-mails
– Let op: er bestaat veel meer ongestructureerde data
dan gestructureerde gegevens

27

Inleiding

(On)gestructureerde gegevens.
• Semi-gestructureerde gegevens
– De structuur van de gegevens is zeer onregelmatig of zeer
wisselend.
– Voorbeelden: webpagina's van individuele gebruikers op een
social media platform, samenvattende human resources
documenten

28

14
9/19/2019

Inleiding

Integriteitsregels.
• Integriteitsregels worden gedefinieerd op basis van het
conceptueel model en opgeslagen in de catalog
– Worden afgedwongen door het DBMS
• Vastleggen hoe gegevens worden opgeslagen (syntactische regel)
– Voorbeeld: geboortedatum, eenheidsprijs
• Vastleggen wanneer gegevens correct zijn (semantische regel)
– Voorbeeld: Eenheidsprijs > 0;
geboortedatum niet > vandaag

29

Inleiding

Redundante gegevens.
• Databank = centrale en eenmalige opslag gegevens

• Soms worden databanken gedupliceerd uit


veiligheidsoverwegingen of omwille van performantie
redundantie

• DBMS is verantwoordelijk voor de synchronisatie en garandeert de


juistheid van de gegevens

30

15
9/19/2019

Inleiding

Wat hebben we geleerd?

• Basisdefinities
• Elementen van een databanksysteem
• Kenmerken van een databanksystemen en databankmanagement

31

16

You might also like