Download as pdf or txt
Download as pdf or txt
You are on page 1of 84

Βασικές Αρχές

και Τεχνολογίες
στην Επιστήμη
της Πληροφόρησης
Μάρκος Δενδρινός
Δημήτρης Κουής

G Y
L O
N O
C H
T E
I O N
A T
R M
F O
IN
ΜΑΡΚΟΣ ΔΕΝΔΡΙΝΟΣ
Καθηγητής

ΔΗΜΗΤΡΗΣ ΚΟΥΗΣ
Καθηγητής

Βασικές Αρχές και Τεχνολογίες


στην Επιστήμη της Πληροφόρησης
Βασικές Αρχές και Τεχνολογίες
στην Επιστήμη της Πληροφόρησης

Συγγραφή
Μάρκος Δενδρινός
Δημήτρης Κουής

Κριτικός αναγνώστης
Χρήστος Σκουρλάς

ISBN: 978-960-603-519-7

Copyright © ΣΕΑΒ, 2015

Το παρόν έργο αδειοδοτείται υπό τους όρους της άδειας Creative Commons Αναφορά Δημιουργού -
Μη Εμπορική Χρήση - Όχι Παράγωγα Έργα 3.0.Για να δείτε ένα αντίγραφο της άδειας αυτής επισκεφτείτε
τον ιστότοπο https://creativecommons.org/licenses/by-nc-nd/3.0/gr/

ΣΥΝΔΕΣΜΟΣ ΕΛΛΗΝΙΚΩΝ ΑΚΑΔΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ


Εθνικό Μετσόβιο Πολυτεχνείο
Ηρώων Πολυτεχνείου 9, 15780 Ζωγράφου
www.kallipos.gr
Περιεχόμενα

Κεφάλαιο 1: Πληροφορία και Πληροφοριακοί Οργανισμοί ........................................................ 1


1.1 Μοντέλο ιεραρχίας DIKW ........................................................................................................... 1
1.1.1 Βασικοί ορισμοί για το DIKW ........................................................................................................... 2
1.1.2 Έρευνα της βιβλιογραφίας σχετικά με το μοντέλο DIKW από την Jennifer Rowly ......................... 8

1.2 Πληροφορία και γνώση στη φυσική γλώσσα και στη γλώσσα των Η/Υ ................................... 11

1.3 Η πληροφορία από την πλευρά της Φιλοσοφίας της Πληροφορίας


(Philosophy of Information - PI) ..................................................................................................... 13

1.4 Η αντικειμενοστραφής προσέγγιση της γνώσης – Η διαδικασία της μάθησης ......................... 15

1.5 Βιβλιοθήκες και Οργανισμοί Πληροφόρησης ........................................................................... 17


1.5.1 Μεσολαβητές (mediators) της πληροφορίας ................................................................................... 18

1.6 Βιβλιογραφικές αναφορές Κεφαλαίου 1 ................................................................................... 21

1.7 Βιβλιογραφία Κεφαλαίου 1 ....................................................................................................... 22

1.8 Ερωτήσεις – Ασκήσεις αξιολόγησης Κεφαλαίου 1 ................................................................... 23


1.8.1 Ερωτήσεις ........................................................................................................................................ 23
1.8.2 Ασκήσεις .......................................................................................................................................... 23

1.9 Πίνακας ακρωνυμίων και ορολογία Κεφαλαίου 1 ..................................................................... 24

Κεφάλαιο 2: Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ....................................... 29

2.1 Μοντέλο ιεραρχίας DIKW ......................................................................................................... 29

2.2 Δυαδικό σύστημα αρίθμησης ..................................................................................................... 30

2.3 Μονάδες πληροφορίας ............................................................................................................... 34

2.4 Κώδικες αναπαράστασης αλφαριθμητικών συμβόλων ............................................................. 36

2.5 Αναπαράσταση αριθμητικών δεδομένων ................................................................................... 42

2.6 Αναπαράσταση εικόνων ............................................................................................................. 43


2.6.1 Ψηφιογραφική μέθοδος .....................................................................................................................43
2.6.2 Διανυσματική μέθοδος ..................................................................................................................... 47
2.6.3 Συμπίεση αρχείων εικόνων .............................................................................................................. 48
2.6.4 Παράδειγμα αλγορίθμου Huffman Coding ...................................................................................... 50
2.6.5 Μορφότυπα GIF και PNG ............................................................................................................... 55
2.6.6 Μορφότυπα JPG και TIFF ............................................................................................................... 55
2.6.7 Μορφότυπο SVG ............................................................................................................................. 56

2.7 Οπτική Αναγνώριση Χαρακτήρων ............................................................................................. 57


2.8 Ήχος ........................................................................................................................................... 59
2.8.1 Παράδειγμα ψηφιοποίησης ήχου ..................................................................................................... 61
2.8.2 Παράδειγμα υπολογισμού αποθηκευτικού χώρου ψηφιοποίησης ηχητικού σήματος ..................... 63
2.8.3 Μορφότυπα ήχου ............................................................................................................................. 64

2.9 Τεχνολογίες φωνής ..................................................................................................................... 65


2.9.1 Αναγνώριση φωνής .......................................................................................................................... 65
2.9.2 Σύνθεση φωνής ................................................................................................................................ 66
2.9.3 Αποθορυβοποίηση φωνής ................................................................................................................ 66
2.9.4 Χρήση τεχνικών αναγνώρισης και σύνθεσης φωνής για ΑμεΑ ....................................................... 66

2.10 Βίντεο ....................................................................................................................................... 67


2.10.1 Παράδειγμα υπολογισμού απαιτούμενης χωρητικότητας για την ψηφιοποίηση βίντεο ................ 68
2.10.2 Κωδικοποίηση βίντεο και μορφότυπα ........................................................................................... 69

2.11 Βιβλιογραφικές αναφορές Κεφαλαίου 2 .................................................................................. 70

2.12 Βιβλιογραφία Κεφαλαίου 2 ..................................................................................................... 72

2.13 Ερωτήσεις – Ασκήσεις αξιολόγησης Κεφαλαίου 2 ................................................................. 72


2.13.1 Ερωτήσεις ...................................................................................................................................... 72
2.13.2 Ασκήσεις ........................................................................................................................................ 73

2.14 Πίνακας ακρωνυμίων και ορολογία Κεφαλαίου 2 ................................................................... 74


Κεφάλαιο 1

Πληροφορία και Πληροφοριακοί Οργανισμοί

Σύνοψη

Στο πρώτο μέρος του παρόντος κεφαλαίου πραγματοποιείται η παρουσίαση της ιεραρχίας DIKW
(Data-Information-Knowledge-Wisdom), με βάση τις απόψεις και τις θεωρήσεις σημαντικών φιλο-
σόφων που ασχολήθηκαν με την έννοια της Πληροφορίας, όπως ο Russell Ackoff, ο Milan Zeleny, η
Jennifer Rowley αλλά και άλλοι. Επίσης, παρουσιάζονται η Πληροφορία και η Γνώση στο πλαίσιο της
φυσικής γλώσσας αλλά και από την πλευρά του νέου και αναπτυσσόμενου κλάδου της Φιλοσοφίας της
Πληροφορίας. Επιπλέον, στο δεύτερο μέρος του κεφαλαίου παρουσιάζονται η διαδικασία της μάθησης,
καθώς και μια πρώτη προσέγγιση αναφορικά με τον ρόλο και τα χαρακτηριστικά των Βιβλιοθηκών και
των Οργανισμών Πληροφόρησης.

Προαπαιτούμενη γνώση

Το κεφάλαιο αυτό είναι εισαγωγικό.

1.1 Μοντέλο ιεραρχίας DIKW


Ο ποιητής Thomas Sterns Eliot (1888-1965 [1]), με κριτική ματιά μπροστά στις τεχνικές εξελίξεις
που συντελούν στην ανθρώπινη πρόοδο, αναφέρει στο θεατρικό του έργο The Rock (1934) τους
παρακάτω στίχους:

“Where is the Life we have lost in living?


Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?”

Ίσως, άθελά του, πραγματοποιεί μια ουσιαστική παρατήρηση, ότι δηλαδή η ολοένα αυξανόμενη
παραγωγή πληροφοριών -αποτέλεσμα της τεχνολογικής προόδου κυρίως- δεν συμβαδίζει με την
απόκτηση, εκ μέρους της ανθρωπότητας, ενός καλύτερου επιπέδου γνώσης ή, ακόμα περισσότερο,
του σημαντικότερου στόχου, που δεν είναι άλλος από την κατάκτηση της σοφίας [1].
Η παραπάνω διαπίστωση του Έλιοτ έρχεται, πολύ αργότερα, να τεκμηριωθεί και να μοντε-
λοποιηθεί από μια σειρά από σύγχρονους στοχαστές, με κυριότερο τον Russell Ackoff, μέσω του μο-
ντέλου ιεραρχίας DIKW (Data-Information-Knowledge-Wisdom) που εκείνος πρώτος εισήγαγε [2].
~2~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

1.1.1 Βασικοί ορισμοί για το DIKW


Σύμφωνα με τη γνωσιακή ιεραρχία DIKW, τα δεδομένα (data) είναι σύμβολα χωρίς άμεση χρησι-
μότητα, ανεπεξέργαστα, ανοργάνωτα και, συνεπώς, χωρίς σημασία (καθώς στερούνται συμφραζο-
μένων και ερμηνείας), η πληροφορία (information) είναι δεδομένα «εμπλουτισμένα» με σημασία, η
γνώση (knowledge) είναι πληροφορία (δεδομένα με σημασία) η οποία γίνεται αντιληπτή στο νου ως
δικαιολογημένη πίστη ότι πρόκειται για κάτι αληθές (είτε πραγματικά είναι είτε όχι), ενώ η σοφία
(wisdom) είναι η γνώση της ορθής δράσης.
Η ανοδική αυτή σειρά των εννοιών έρχεται αρχικά στο προσκήνιο με τον Russell Ackoff [2],
έναν θεωρητικό των συστημάτων, σύμφωνα με τον οποίο το περιεχόμενο του ανθρώπινου νου μπο-
ρεί να ταξινομηθεί σε πέντε (5) κατηγορίες, για τις οποίες και δίνει κάποιους σύντομους ορισμούς:
–– Δεδομένα: σύμβολα
–– Πληροφορία: δεδομένα επεξεργασμένα ώστε να είναι χρήσιμα. Είναι η απάντηση σε ερωτή-
σεις του τύπου «ποιος», «τι», «πού», «πότε».
–– Γνώση / Κατανόηση: εφαρμογή δεδομένων και πληροφοριών. Είναι η απάντηση σε ερωτή-
σεις του τύπου «πώς» και η εκτίμηση του «γιατί» (appreciation of “why”).
–– Σοφία: αξιολογημένη γνώση / κατανόηση (evaluated understanding). Επιλέγω ή γνωρίζω τη
σωστή επιλογή.
Οι 5 αυτές κατηγορίες συνήθως παριστάνονται με τη μορφή μιας ιεραρχίας ή πυραμίδας, όπως στην
παρακάτω εικόνα:

Σοφία -
Wisdom

Γνώση - Knowledge

Πληροφορία - Information

Δεδοµένα - Data

Σχήμα 1.1. Η ιεραρχία της γνώσης σύμφωνα με το σχήμα DIKW.

Η Jennifer Rowley [3] θεωρεί ότι τα δεδομένα είναι προϊόν παρατηρήσεων και δεν έχουν
καμία αξία ώσπου να υποστούν επεξεργασία και να μετασχηματιστούν σε μια χρήσιμη μορφή, την
πληροφορία. Η πληροφορία περιέχεται στο περιεχόμενο των απαντήσεων σε συγκεκριμένες ερωτή-
σεις. Εν συνεχεία, η γνώση εκλεπτύνει περαιτέρω την πληροφορία, καθώς «καθιστά δυνατό τον μετα-
σχηματισμό της πληροφορίας σε εντολές και, επίσης, τον έλεγχο ενός συστήματος», ώστε να δουλεύει
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~3~

αποδοτικά. Η προοπτική που διατρέχει την ιεραρχία του Achoff είναι περισσότερο διαχειριστική
παρά σχολαστική, οπότε το νόημα που δίνει στην κατανόηση είναι η ικανότητα κάποιου να εκτιμά
και να διορθώνει τα λάθη, ενώ με τον όρο σοφία εννοεί την ικανότητα μακροπρόθεσμης πρόβλεψης
των συνεπειών μιας δράσης και της αιτιολόγησής τους σε σχέση με το ιδανικό του απόλυτου ελέγχου.
Σύμφωνα με τον Ackoff [4], η απόδοση (efficiency) και η αποτελεσματικότητα (effectiveness)
διαχωρίζονται ως εξής: «η επιστήμη, η τεχνολογία και τα οικονομικά εστιάζονται στην απόδοση και
όχι στην αποτελεσματικότητα». Η απόδοση είναι ένα μέτρο του πόσο καλά χρησιμοποιούνται οι πό-
ροι για την επίτευξη στόχων. Η αποτελεσματικότητα είναι η απόδοση μετρημένη με βάρος τις αξίες
των υπό εκπλήρωση στόχων. Συγκεκριμένα: «Η απόδοση αφορά το να κάνεις τα πράγματα σωστά,
ενώ η αποτελεσματικότητα το να κάνεις τα σωστά πράγματα...».
Η διαφορά μεταξύ απόδοσης και αποτελεσματικότητας αντανακλάται και στη διαφορά με-
ταξύ των δυο διαφορετικών παραμέτρων/όψεων της προόδου: (α) την ποσοτική αύξηση (growth)
και (β) την ποιοτική βελτίωση (development). Η ποσοτική αύξηση είναι η αύξηση σε σχέση με το
μέγεθος ή την ποσότητα, ενώ η ποιοτική βελτίωση είναι η αύξηση σε σχέση με την ικανότητα. Για
παράδειγμα, το επίπεδο διαβίωσης αναφέρεται κυρίως στην ποσοτική αύξηση, ενώ αντίστοιχα η
ποιότητα ζωής στον δείκτης της ποιοτικής βελτίωσης. Επισημαίνεται ότι οι δυο αυτές παράμετροι
μπορούν να συμβούν/διαφοροποιηθούν ανεξάρτητα (π.χ. ο όγκος των σκουπιδιών αυξάνει, αλλά δεν
βελτιώνονται, μια εταιρεία μπορεί να βελτιώνεται, χωρίς να αυξάνει σε μέγεθος κ.λπ.).
Ακόμα και οι αξίες, οι οποίες είναι αντικείμενο της ηθικής και της αισθητικής, εμπλέκονται
άμεσα στην μετατροπή της απόδοσης σε αποτελεσματικότητα. Η παραγωγή δεδομένων, πληροφορί-
ας, γνώσης και σοφίας είναι βασικές λειτουργίες της επιστήμης και αποτελούν αναπόσπαστο μέρος
των εσωτερικών διαδικασιών. Η παραγωγή σοφίας, η οποία προϋποθέτει τα τρία (3) προηγούμενα,
είναι βασικά μια λειτουργία της ηθικής και της αισθητικής, καθώς εμπλέκει τη συνειδητή εισαγωγή
αξιών στη λήψη αποφάσεων και την αξιολόγηση των αποτελεσμάτων.
Η αποτελεσματικότητα λοιπόν είναι προϊόν της σοφίας, καθώς εμπλουτίζει το εύρος των συ-
νεπειών που λαμβάνονται υπόψη κατά τη διάρκεια μιας απόφασης, όσο και το χρονικό διάστημα στο
οποίο αναφέρονται / έχουν επίδραση οι πιθανές συνέπειες. Λαμβάνοντας υπόψη τόσο τις μακροπρό-
θεσμες όσο και τις βραχυπρόθεσμες συνέπειες, η σοφία αποτρέπει τη θυσία του μέλλοντος χάριν
του παρόντος. Για παράδειγμα, «η τεχνολογία μας δίνει τη δυνατότητα να κρατάμε ασθενείς στη ζωή
μηχανικά για μεγάλο χρονικό διάστημα, με μεγάλο κόστος. Είναι όμως αυτό μακροπρόθεσμα σωστό;
Είναι σοφό; Μήπως οι ίδιοι πόροι θα μπορούσαν να χρησιμοποιηθούν κάπου καλύτερα;».
Οπότε στην παραπάνω αντιδιαστολή απόδοσης και αποτελεσματικότητας, εφόσον ο Ackoff
συνδέει την αποτελεσματικότητα με τη σοφία, μάλλον υπονοεί ότι η απόδοση είναι προϊόν των τρι-
ών (3) προηγουμένων σταδίων: δεδομένων, πληροφορίας, και γνώσης.
Ο Ben Rockwood [5] ενδιαφέρεται για τη διαφορά μεταξύ του να κάνεις τα πράγματα σω-
στά και του να κάνεις σωστά πράγματα, και ανατρέχει στο έργο του Ackoff, ο οποίος, στα παρακάτω
αποσπάσματα βίντεο, αναφέρει:
~4~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Βίντεο 1.1. Συνέντευξη Russell Ackoff – Μέρος Ι (Βίντεο mp4)

Στο βίντεο, μεταξύ άλλων, διαπιστώνονται τα εξής:


1. «Το να κάνεις το σωστό πράγμα είναι σοφία. Το παράξενο είναι ότι όσο σωστότερα κάνεις
το λανθασμένο πράγμα, τόσο πιο λάθος γίνεται. Αν δηλαδή κάνεις το λάθος πράγμα και στην
περίπτωση ενός σφάλματος το διορθώσεις/βελτιώσεις, τότε αυτό γίνεται ακόμα πιο λάθος.
Οπότε είναι καλύτερο να κάνεις το λάθος πράγμα λανθασμένα παρά να κάνεις το λάθος
πράγμα σωστά...».
2. «Το ζήτημα αυτό αποτελεί σήμερα το σημαντικότερο κοινωνικό πρόβλημα, το να προσπαθού-
με δηλαδή να κάνουμε δηλαδή το λάθος πράγμα σωστότερα...».
3. «Ποτέ δεν μαθαίνεις κάνοντας κάτι σωστά, καθώς ήδη το κάνεις σωστά. Μαθαίνεις μόνο από
τα λάθη σου...».
4. «Υπάρχουν δύο (2) τύποι λαθών: ο πρώτος τύπος αναφέρεται στα λάθη της κατηγορίας του
‘θα έπρεπε να μην το κάνεις’, που είναι το λάθος της διάπραξης και ο δεύτερος τύπος στο ‘δεν
έκανες κάτι που θα έπρεπε να είχες κάνει’, που είναι το λάθος της παράλειψης. Στην καθημε-
ρινότητα βέβαια καταγράφονται μόνο τα λάθη του πρώτου τύπου...».
5. «Η σταθερότητα και η σοφία τελικά επέρχεται μέσα από την έγκαιρη διόρθωση και διαχείριση
των λαθών του πρώτου τύπου».

Πίνακας 1.1. Συνέντευξη Russell Ackoff - Μέρος Ι

Στη συνέχεια, στο Μέρος II, o Ackoff κάνει αναφορά σε διάφορα παραδείγματα, για να κατα-
δείξει ότι η αναλυτική σκέψη (δεδομένα – πληροφορία – γνώση) είναι ανεπαρκής για την αντι-
μετώπιση των σύγχρονων προβλημάτων, τα οποία απαιτούν ένα νέο πρότυπο σκέψης (αυτό της
συνθετικής σκέψης):
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~5~

Βίντεο 1.2. Συνέντευξη Russell Ackoff – Μέρος ΙΙ (Βίντεο mp4)

Στο βίντεο, μεταξύ άλλων, διαπιστώνονται τα εξής:


1. «Οι ερωτήσεις τύπου “γιατί” σχετικά με τα συστήματα, δεν μπορούν να απαντηθούν μέσω
της ανάλυσης». Στη συνέχεια, εξηγεί ότι η διαδικασία της ανάλυσης παράγει γνώση, αλλά όχι
κατανόηση, μας λέει πώς λειτουργεί κάτι, αλλά όχι γιατί λειτουργεί με τον τρόπο που λειτουρ-
γεί. Και συνεχίζει (βλ. σημεία 2-4), παραθέτοντας τα 3 βήματα της συνθετικής σκέψης που
προτείνει, σε αντιδιαστολή με την αναλυτική.
2. «Στο πρώτο βήμα της αναλυτικής σκέψης, οφείλουμε να μελετούμε διακριτά αυτό που επιθυ-
μούμε να κατανοήσουμε. Αντίθετα, στο πρώτο βήμα της σύνθεσης, για το υπό μελέτη αντικεί-
μενο, τίθεται το ερώτημα: ‘τίνος μέρος είναι αυτό;’. Με τον τρόπο αυτόν προσδιορίζεται το
ευρύτερο πλαίσιο του οποίου αποτελεί μέρος. Για παράδειγμα, η κατανόηση του αντικειμένου
αυτοκινήτου, μπορεί να γίνει είτε με τη μελέτη των διακριτών μερών που το αποτελούν ή με
την καταρχήν θεώρηση ότι αποτελεί ένα μέρος του συστήματος μεταφορών/συγκοινωνιών».
3. «Στο δεύτερο βήμα της αναλυτικής σκέψης, η προσπάθεια επικεντρώνεται στον προσδιορισμό
των ιδιοτήτων και της συμπεριφοράς των διακριτών μερών/τμημάτων του πρώτου βήματος.
Αντίθετα, στο δεύτερο βήμα της σύνθεσης η προσπάθεια επικεντρώνεται στο να υπάρξει εξή-
γηση σε ό, τι αφορά τη συμπεριφορά του περιέχοντος πλαισίου, δηλαδή του συστήματος των
μεταφορών/συγκοινωνιών».
4. «Στο τρίτο βήμα της αναλυτικής σκέψης ακολουθεί η άθροιση των μερών με στόχο την κα-
τανόηση του όλου (δηλαδή του αυτοκινήτου). Αντίθετα, στο τρίτο βήμα της σύνθεσης, επι-
χειρείται η αποσαφήνιση περιέχοντος πλαισίου (σύστημα μεταφορών) και η κατανόηση των
επί μέρους συστατικών στοιχείων, προσδιορίζοντας έτσι τον ρόλο ή τη λειτουργία αυτού που
προσπαθούμε να προσδιορίσουμε (δηλαδή του αυτοκινήτου)».

Πίνακας 1.2. Συνέντευξη Russell Ackoff - Μέρος ΙΙ


~6~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Οι Bellinger, Castro και Mills [6] ερμηνεύουν ως εξής τους βασικούς ορισμούς του Ackoff:
–– Τα δεδομένα είναι ακατέργαστα, απλώς υπάρχουν και δεν διαθέτουν καμία σημασία πέ-
ραν της ύπαρξής τους. Υφίστανται σε οποιαδήποτε μορφή, χρηστική ή μη, π.χ. στο πλαί-
σιο των υπολογιστών, τα δεδομένα αντιστοιχούν στο περιεχόμενο ενός φύλλου εργασιών
(spreadsheet).
–– Πληροφορία είναι τα δεδομένα, στα οποία έχει δοθεί νόημα μέσω μιας σχεσιακής σύν-
δεσης. Το “νόημα” μπορεί να είναι χρήσιμο, αλλά δεν είναι απαραίτητο ότι έχει συμβεί.
Στο πλαίσιο των υπολογιστών, η πληροφορία αντιστοιχεί σε μια σχεσιακή βάση δεδομένων
(relational database). Συγκεκριμένα, η βάση δεδομένων μπορεί να παράγει πληροφορία
από τα αποθηκευμένα της δεδομένα και την αξιοποίηση των μεταξύ τους σχέσεων.
–– Γνώση είναι μια συλλογή πληροφοριών, για την οποία υπάρχει πρόθεση να γίνει χρηστική.
Η γνώση είναι ντετερμινιστική διαδικασία (αιτιοκρατική). Όταν κάποιος απομνημονεύει
πληροφορία, την καθιστά γνώση μέσα από τη διανοητική επεξεργασία. Αυτή η γνώση έχει
ένα χρήσιμο νόημα γι’ αυτόν που την κατέχει, αλλά δεν αποτελεί μια ολοκληρωμένη κατά-
σταση, τέτοια ώστε να παράγεται απ’ αυτήν περαιτέρω γνώση. Για παράδειγμα, η απάντηση
σε ό, τι αφορά τον πολλαπλασιασμό 2x2 είναι εύκολη, αλλά η απάντηση στον πολλαπλασι-
ασμό 1320x1261 απαιτεί περαιτέρω γνώση (αλγόριθμος πολλαπλασιασμού). Για να μπορεί
κάποιος να απαντήσει σε μια τέτοια ερώτηση χρειάζεται μια πραγματικά γνωσιακή και ανα-
λυτική ικανότητα, η οποία αναπτύσσεται στο επόμενο στάδιο (κατανόηση).
–– Κατανόηση (understanding) είναι μια γνωσιακή και αναλυτική διαδικασία κατά την οποία
πραγματοποιείται σύνθεση και νέα γνώση από προηγούμενες γνώσεις. Είναι παρεμβλητική
(interpolative), δηλαδή δημιουργεί μια γνώση ως παρεμβολή σε άλλες, και πιθανοκρατική,
δηλαδή εκτιμά την πιθανότητα να ισχύει κάτι με βάση άλλες γνώσεις. Η διαφορά μεταξύ
κατανόησης και γνώσης είναι η διαφορά μεταξύ εκμάθησης και απομνημόνευσης. Οι άν-
θρωποι μέσω της διανοητικής λειτουργίας μπορούν να κατανοούν τις γνώσεις, δηλαδή να
συνθέτουν νέα γνώση ή τουλάχιστον νέα πληροφορία από προηγούμενες πληροφορίες, γνώ-
σεις και κατανοήσεις. Στο πλαίσιο των υπολογιστών, τα συστήματα Τεχνητής Νοημοσύνης
(Artificial Intelligence – AI) διαθέτουν κατανόηση με την έννοια ότι μπορούν να συνθέσουν
νέα γνώση από προηγούμενα αποθηκευμένες πληροφορίες και γνώσεις.
–– Σοφία είναι η ουσία της φιλοσοφικής έρευνας. Επιχειρεί να προσφέρει κατανόηση για ό, τι
προηγουμένως δεν υπήρχε κατανόηση, και με τον τρόπο αυτόν προχωρά πέραν της κατανόη-
σης. Είναι λοιπόν μια επεκτατική (extrapolative) διαδικασία και μάλιστα μη-πιθανοκρατική,
καθώς δεν εκτιμά πιθανότητες με βάση υπάρχουσες γνώσεις, αλλά στηρίζεται κυρίως στην
έμπνευση. Σε αντίθεση με τα προηγούμενα τέσσερα επίπεδα, θέτει ερωτήσεις στις οποίες δεν
υπάρχει εύκολη απάντηση, και ενίοτε, δεν υπάρχει καν απάντηση, μέχρι τώρα. Στη σοφία θα
μπορούσε να ενταχθεί και η ικανότητα διάκρισης μεταξύ ορθού και λάθους, καλού και κακού.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~7~

Συνεκτικότητα Σοφία
Κατανόηση
αρχών
Γνώση
Κατανόηση
μοτίβων
Πληροφορία
Κατανόηση
απλών σχέσεων

Δεδομένα Κατανόηση

Σχήμα 1.2. Δεδομένα, Πληροφορία, Γνώση, Κατανόηση, Σοφία.

Ο David Weinberg [7] εμβαθύνει στην ερμηνεία του μοντέλου DIKW σύμφωνα με τους
Ackoff και Zeleny, ανατρέχοντας στον Θεαίτητο (διάλογος του Πλάτωνα).
Η μετάβαση από την πληροφορία στη γνώση είναι πολύ πιο προβληματική από τη μετάβαση από
τα δεδομένα στην πληροφορία. Αν ρωτήσεις κάποιον εκτός του κύκλου των επιστημόνων της πληροφορί-
ας/πληροφόρησης (information science), τι σημαίνει πληροφορία θα δυσκολευτείς να πάρεις απάντηση.
Πρόκειται λοιπόν για κάποιον όρο που διατίθεται για επανακαθορισμό. Αντίθετα, ο όρος γνώση είναι από
τις σημαντικότερες λέξεις του πολιτισμού μας, εδραιωμένος, με μια μακρά και βαθιά ιστορία.
Τι είναι λοιπόν η γνώση στην πυραμίδα DIKW; Για τον Ackoff, η γνώση «μετατρέπει την
πληροφορία σε εντολές». Ο Milan Zeleny [8] υποστηρίζει ότι η γνώση είναι η συνταγή που σου επι-
τρέπει να φτιάχνεις ψωμί από τα συστατικά όπως (είναι) το αλεύρι, το νερό και η μαγιά (τα οποία
είναι οι πληροφορίες, με τον ρόλο τον δεδομένων να διαδραματίζουν τα μόρια των συστατικών).
Ο οδηγός καλής πρακτικής για τη Διαχείριση Γνώσης [9] της Ευρωπαϊκής Επιτροπής Τυποποίη-
σης αναφέρει σχετικά: «Γνώση είναι ο συνδυασμός δεδομένων και πληροφορίας, στον οποίο προστίθεται
η γνώμη των ειδικών, επιδεξιότητα και εμπειρία, ώστε να επιτευχθεί ένα πολύτιμο αποτέλεσμα που μπορεί
να χρησιμοποιηθεί στην υποβοήθηση λήψης αποφάσεων - The combination of data and information, to
which is added expert opinion, skills and experience, to result in a valuable asset which can be used to
aid decision making. Knowledge may be explicit and/or tacit, individual and/or collective».
Σε όλες αυτές τις περιγραφές η γνώση βοηθά στη δράση και αποτελεί μια εκλέπτυνση της
πληροφορίας. Ήδη πριν από 2500 έτη ο Πλάτων δίνει τον ορισμό της γνώσης στον Θεαίτητo, ως
αληθή δοξασία, και μάλιστα δικαιολογημένα ορθή δοξασία. Πράγματι, πάντοτε η γνώση θεωρείται
κάτι πέραν της απλής συσσώρευσης δοξασιών, ως κάτι που αντανακλά την αληθή φύση του σύμπα-
ντος, ενός όλου που λέγεται «κόσμος» ακριβώς επειδή τα μέρη συνιστούν κάτι αληθές και ωραίο.
~8~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Το πραγματικό πρόβλημα δεν είναι η θέση της γνώσης στην ιεραρχία DIKW αλλά η ερμη-
νεία της ως αποτελέσματος επεξεργασίας της διαθέσιμης πληροφορίας. Γιατί στην πραγματικότητα
δεν αποκτάται από τον άνθρωπο έτσι, όπως δηλαδή συμβαίνει στη μηχανή. Πράγματι, στον υπολο-
γιστή η γνώση προκύπτει μέσω συνδυαστικών ερωτημάτων (queries), σε διάφορους πίνακες βάσεων
δεδομένων που φιλτράρουν (επιλέγουν με διάφορα κριτήρια) τη διαθέσιμη αποθηκευμένη πληροφο-
ρία ή «τρέχοντας» εξελιγμένους αλγόριθμους (ακολουθίες εντολών) σε μεγάλο όγκο πληροφοριών.
Εν τούτοις, στον άνθρωπο η γνώση δεν προκύπτει από τέτοιες διαδικασίες φιλτραρίσματος ή αλγο-
ριθμικών ακολουθιών εντολών αλλά μέσω μιας πολυπλοκότερης διαδικασίας κοινωνικής φύσεως,
καθοδηγούμενης από στόχους (goal-driven) και βασισμένης στα συμφραζόμενα (contextual) και σε
στοιχεία πολιτιστικά (culturally-bound). Φτάνουμε στη γνώση – και ειδικά την αξιοποιήσιμη προς
δράση (actionable) γνώση – επειδή υπάρχουν επιθυμίες και περιέργεια, μέσω σχεδίων και παιγνίων,
μέσω των λανθασμένων παρά των ορθών ενεργειών, μέσω συζητήσεων με άλλους και δημιουργίας
κοινωνικών δεσμών, μέσω εφαρμογής μεθόδων από τις οποίες στη συνέχεια υπαναχωρούμε, μέσω
κοπιαστικών υπολογισμών αλλά ενίοτε και εύνοιας της τύχης, ορθολογικά αλλά και διαισθητικά,
μέσω θεσμικών διαδικασιών και κοινωνικών ρόλων. Το σημαντικό σ’ αυτή τη θεώρηση, όπου οι
αποφάσεις είναι δύσκολες και η διαδικασία παραγωγής γνώσης επίπονη, είναι ότι η γνώση δεν καθο-
ρίζεται από την πληροφορία, καθώς η ίδια η γνωστική διαδικασία αποφασίζει καταρχήν ποια πληρο-
φορία είναι σχετική και πώς πρέπει να χρησιμοποιηθεί.
Η πυραμίδα DIKW είναι υπεραπλουστευτική και αντιστοιχεί στην αντίληψη ότι αρκεί να
φιλτραριστεί ο θόρυβος της πληροφορίας και να προκύψει μια ροή πληροφοριών καθαρή και δι-
αχειρίσιμη. Όμως, η απόκτηση της γνώσης είναι μια διαδικασία πιο δημιουργική, πιο άτακτη και
περισσότερο ασυνεχής.

1.1.2 Έρευνα της βιβλιογραφίας σχετικά με το μοντέλο DIKW από την


Jennifer Rowly
Η Jennifer Rowley, στο άρθρο της “The wisdom hierarchy: representations of the DIKW hierarchy” [3],
κάνει μια ανασκόπηση των μελετών και άρθρων που έχουν συγγραφεί σχετικά με την ιεραρχία DIKW,
εξετάζοντας τυχόν συγκλίσεις και διαφορές των βασικών εννοιών, καθώς και των μεταβάσεων από τη
μια έννοια στην άλλη. Τυπικά, σε όλες τις περιπτώσεις η πληροφορία ορίζεται βάσει των δεδομένων, η
γνώση βάσει της πληροφορίας και η σοφία βάσει της γνώσης, αλλά υπάρχει μικρότερη σύγκλιση από-
ψεων στην περιγραφή των διαδικασιών μετασχηματισμού των χαμηλότερων ιεραρχικά στοιχείων στα
ανώτερά τους. Επίσης, υπάρχει πολύ περιορισμένη, πλέον, αναφορά στην έννοια της σοφίας.
Στη συνέχεια στο άρθρο της, περιγράφει τους διαφορετικούς ορισμούς των στοιχείων αυτών
από τους Ackoff [2] και Zeleny [8], όπως φαίνονται στον παρακάτω πίνακα.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~9~

Συγκρίνοντας τους ορισμούς των δεδομένων, των πληροφοριών,


της γνώσης και της σοφίας των Ackoff και Zeleny
Ackoff Zenely
Δεδομένα Σύμβολα Καμία γνώση
Τα δεδομένα γίνονται αντι-
κείμενο επεξεργασίας ώστε
Γνωρίζουμε την ύπαρξη,
Πληροφορία να καταστούν χρήσιμα. Δίδο-
το τι είναι κάτι.
νται απαντήσεις στο ποιος, τι,
πού και πότε.
Ο συνδυασμός των δεδομέ-
Γνώση νων και των πληροφοριών Γνωρίζουμε το πώς.
μάς δίνει απάντηση στο πώς.
Κατανόηση Κατανοούμε το γιατί.
Σοφία Κατανόηση Κατανοούμε το γιατί.
Απόκτηση της αίσθησης της
αλήθειας, της αίσθησης του
Διαφωτισμός
σωστού και του λάθους, κοινω-
νική αποδοχή και σεβασμός.

Πίνακας 1.3. Σύγκριση του μοντέλου DIKW κατά Ackoff και Zeleny.

Στη συνέχεια, παρατίθενται ενδιαφέροντες ορισμοί και περιγραφές των δεδομένων, της πληροφορί-
ας και της γνώσης από διάφορους συγγραφείς, οι εξής:

Δεδομένα
–– Δεδομένα είναι στοιχεία χωρίς νόημα και αξία, χωρίς πλαίσιο συμφραζομένων και χωρίς ερμηνεία.
–– Δεδομένα είναι διακεκριμένα αντικειμενικά γεγονότα ή παρατηρήσεις, ανοργάνωτα και ανε-
πεξέργαστα, τα οποία δεν μεταφέρουν κάποιο ειδικό νόημα.

Πληροφορία
–– Πληροφορία είναι μορφοποιημένα δεδομένα που αναπαριστούν την πραγματικότητα.
–– Πληροφορία είναι δεδομένα που έχουν μορφοποιηθεί κατά τέτοιον τρόπο ώστε να είναι κατα-
νοητά και χρήσιμα στα ανθρώπινα όντα.
–– Πληροφορία είναι δεδομένα που έχουν οργανωθεί κατά τέτοιον τρόπο ώστε να έχουν νόημα
και αξία για τον παραλήπτη.
–– Πληροφορία είναι δεδομένα που έχουν υποστεί επεξεργασία για κάποιον σκοπό.
–– Πληροφορία είναι δεδομένα στα οποία έχει δοθεί νόημα μέσω των συμφραζομένων.
~ 10 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

–– Πληροφορία είναι συσσώρευση δεδομένων που καθιστά ευκολότερη τη λήψη αποφάσεων.


–– Πληροφορία είναι δεδομένα στα οποία έχει αποδοθεί νόημα, συνάφεια και σκοπός.

Γνώση
–– Γνώση είναι δεδομένα ή/και πληροφορία που έχουν οργανωθεί και υποστεί επεξεργασία
έτσι ώστε να μεταφέρουν κατανόηση, εμπειρία, συσσωρευμένη εκμάθηση και επιδεξιότητα
(expertise) όσον αφορά ένα συγκεκριμένο πρόβλημα ή δραστηριότητα.
–– Η γνώση εδράζεται πάνω στην πληροφορία που εξάγεται από τα δεδομένα, αλλά ενώ τα δε-
δομένα είναι μια ιδιότητα των πραγμάτων, η γνώση είναι ικανότητα του ανθρώπου να τα
χρησιμοποιεί ώστε να δρα με ένα συγκεκριμένο τρόπο.
–– Κατά τους Pearlson and Saunders [10], «η γνώση είναι ένα μείγμα πληροφορίας, αξιών, εμπειρί-
ας και κανόνων και περιλαμβάνει τη σύνθεση πληροφοριών διαφόρων πηγών. Η ανθρώπινη συμ-
βολή αυξάνει στην πορεία από τα δεδομένα στη πληροφορία και από την πληροφορία στη γνώση».
–– Οι Bocij, Greasley και Hickie [11] πραγματοποιούν τη διαφοροποίηση μεταξύ της εμφα-
νούς (explicit) γνώσης και της σιωπηρής (tacit) γνώσης, προτείνοντας ότι εμφανής γνώση
είναι αυτή που μπορεί να καταγραφεί σε Πληροφοριακά Συστήματα, σε αντίθεση με τη
σιωπηρή γνώση που δεν μπορεί να καταγραφεί, καθώς είναι μέρος του ανθρώπινου νου.
Ομοίως, ο Michael Polanyi [12] υποστηρίζει ότι «θα έπρεπε να ξεκινήσουμε από το γεγονός
ότι μπορούμε να μάθουμε περισσότερα από όσα μπορούμε να πούμε». Ονόμασε αυτήν την
προ-λογική φάση της γνώσης ως σιωπηρή (tacit) γνώση. Κατά τους Laudon και Laudon
[13], «σιωπηρή γνώση είναι η προσωπική γνώση που είναι εμφυτευμένη στην ατομική εμπει-
ρία και περιλαμβάνει μη χειροπιαστούς παράγοντες όπως η προσωπική πίστη, η προοπτική
και οι αξίες. Εμφανής γνώση είναι η σιωπηρή γνώση που έχει καταγραφεί». Τέλος, οι Awad
και Ghaziri [14] ερμηνεύουν ως «σιωπηρή γνώση τη γνώση που εμφυτεύεται στον ανθρώπινο
νου μέσω της εμπειρίας και της εργασίας. Εμφανής γνώση είναι η γνώση που έχει κωδικοποι-
ηθεί και αναπαρασταθεί σε βιβλία, τεκμήρια, αναφορές, εκπαιδευτικές σειρές κ.λπ.».
–– Ενδιαφέρον έχει και η διάκριση προτασιακής (propositional) και διαδικασιακής
(procedural) γνώσης. Ο Zeleny θεωρεί τη γνώση ως τεχνογνωσία (know-how), ως διαδι-
κασία, όχι ως περιγραφή διαδικασίας και μάλιστα αρνείται την ύπαρξη εμφανούς γνώσης,
καθώς, κατά την άποψη του, μόλις η γνώση καταγραφεί με σύμβολα καθίσταται πληρο-
φορία. Άλλοι όμως, θεωρητικοί, πιστεύουν ότι μπορεί η γνώση να εκφραστεί προτασιακά
ως δικαιολογημένες δοξασίες (υποκειμενική σιωπηρή γνώση), αλλά και ως σύμβολα που
αναπαριστούν αυτές τις δοξασίες (αντικειμενική εμφανής γνώση).
Τέλος, ολοκληρώνοντας αυτή τη σύντομη βιβλιογραφική αναδρομή, η Rowley επιχειρεί μια αντι-
στοίχιση των στοιχείων της ιεραρχίας DIKW με τους τύπους Πληροφοριακών Συστημάτων, όπως
φαίνεται στο παρακάτω Σχήμα:
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 11 ~

ΣΟΦΙΑ Έµπειρα WISDOM


Συστήµατα
Expert Systems

ΓΝΩΣΗ Συστήµατα Υποστήριξης KNOWLEDGE


Λήψης Αποφάσεων
Decision Support Systems

ΠΛΗΡΟΦΟΡΙΕΣ Πληροφοριακά Συστήµατα Διοίκησης INFORMATION


Management Information Systems

ΔΕΔΟΜΕΝΑ Συστήµατα Επεξεργασίας Συναλλαγών DATA


Transaction Processing Systems

Σχήμα 1.3. Αντιστοίχιση της ιεραρχίας DIKW με τους τύπους των Πληροφοριακών Συστημάτων.

1.2 Πληροφορία και γνώση στη φυσική γλώσσα και στη γλώσσα των Η/Υ
Στη παρούσα παράγραφο ακολουθεί μια περιγραφή της πληροφορίας και της γνώσης στο πλαίσιο
μιας φυσικής γλώσσας.
Ως πληροφορία μπορεί να θεωρηθεί η άμεση σημασία των εννοιών και των προτάσεων.
Αντίθετα, ως γνώση συνήθως ορίζεται η απόδοση μιας τιμής αλήθειας (ισχύει / δεν ισχύει - true or
false) στις προτάσεις εκείνες που είναι άμεσα επαληθεύσιμες από την εμπειρία ή της συνεπαγόμενης
τιμής αλήθειας μιας πρότασης, βάσει της τιμής αλήθειας άλλων, επιμέρους, σχετιζόμενων προτάσε-
ων, μέσω της εφαρμογής λογικών κανόνων.
Η πληροφορία είναι μια έννοια πρωταρχική, για την οποία έχουν προταθεί πολλές περιγραφές
και ορισμοί (βλ. πιο πάνω). Θα μπορούσε να οριστεί ως η αποδιδόμενη σημασία σε ένα παρατηρού-
μενο ή φανταστικό αντικείμενο (πχ. άνθρωπος, γάτα, τραπέζι, γοργόνα, ξωτικό) ή σε μια ιδιότητα (πχ.
πράσινο, μαλακό, ξεπερασμένο), για καθένα από τα οποία έχουμε ορίσει ένα αυθαίρετο όνομα (όρο).
Ο όρος είναι το δεδομένο και η πληροφορία είναι η σημασία του. Συνδυάζοντας όρους δομούμε
προτάσεις που περιγράφουν δραστηριότητες (π.χ. «βρέχει» ή «το τραπέζι είναι πράσινο» ή «ο Νίκος
τρέχει»). Ο ισχυρισμός (νόημα-πληροφορία) που περιέχεται σε μια πρόταση μπορεί να εξεταστεί από
την κρίση ενός υποκειμένου, δηλαδή κατά πόσο ανταποκρίνεται ή όχι στην πραγματικότητα, οπότε
χαρακτηρίζεται ως αληθής ή ψευδής. Οι όροι που δομούν την πρόταση είναι τα δεδομένα, το νόημά
της είναι η πληροφορία και η πληροφορία μαζί με την τιμή αλήθειάς της είναι η γνώση.
Μια άλλη μορφή γνώσης είναι η τοποθέτηση μιας έννοιας (σημασίας-πληροφορίας) σε μια
ιεραρχία ή σε ένα δίκτυο εννοιών βάσει κάποιων σχέσεων, από την απλή ταξινομία μιας προκαθο-
ρισμένης ιεραρχίας σχέσεων ευρύτερο-στενότερο μέχρι την οντολογία, όπου οι έννοιες ορίζονται
ελεύθερα μέσω οποιωνδήποτε σχέσεων.
Σημαντική σημασία διαδραματίζει η ροή της πληροφορίας από μια πηγή σε έναν δέκτη
(είτε άνθρωπο είτε μηχανή). Ειδικότερα, μέσω μιας σειράς δεδομένων (είτε προφορικών ή γραπτών
συμβόλων) επικοινωνούν δυο άνθρωποι μεταξύ τους. Η επικοινωνία όμως είναι δυνατή μόνο αν
~ 12 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

αντιλαμβάνονται με τον ίδιο τρόπο τη σημασία των συμβόλων, έχουν δηλαδή μια κοινή αντίληψη
της πληροφορίας, κατανοούν μια κοινή γλώσσα.
Κατά αναλογία, στον κόσμο των ηλεκτρονικών υπολογιστών, τα δυαδικά ψηφία (bits) και οι
συνδυασμοί τους, στο πλαίσιο της δυαδικής γλώσσας (δυαδικά δεδομένα), είναι κωδικοποιημένα σύμ-
βολα που αναπαριστούν εντολές και δεδομένα. Οι εντολές αυτές καθοδηγούν τον υπολογιστή ώστε να
εκτελέσει συγκεκριμένες διαδικασίες και τα δεδομένα που τις συνοδεύουν είναι ονόματα ή τιμές παρα-
μέτρων αυτών των διαδικασιών. Οι εντολές και τα δεδομένα έχουν προκαθορισμένη και αντικειμενική
σημασία (information) για κάθε συγκεκριμένο τύπο μηχανών – ηλεκτρονικών υπολογιστών. Τα δεδο-
μένα εισόδου του υπολογιστή (input data) υφίστανται επεξεργασία (processing) και οδηγούν στην πα-
ραγωγή νέων δεδομένων, των δεδομένων εξόδου (output data), τα οποία μεταφέρουν νέα πληροφορία.
Από τα παραπάνω φαίνεται ότι η έννοια της πληροφορίας είναι σχετική με τον φορέα αντί-
ληψης. Αυτό που αποτελεί πληροφορία για τον άνθρωπο (φυσική γλώσσα) δεν είναι πληροφορία
για τον υπολογιστή (ο οποίος αντιλαμβάνεται μόνο τη δυαδική γλώσσα μηχανής), και για τον λόγο
αυτό υπάρχει η ανάγκη μεταγλώττισης των ανθρωπίνως εννοούμενων εντολών σε δυαδικές εντολές,
δυαδικής κωδικοποίησης των δεδομένων (αριθμών και ονομάτων) και, στη συνέχεια, η αντίστροφη
διαδικασία αποκωδικοποίησης των αποτελεσμάτων του προγράμματος σε μια μορφή που να είναι
κατανοητή από τον άνθρωπο (φυσικό κείμενο, γραφικά κ.λπ.).
Οι έννοιες έχουν προκύψει μετά από μια διαδικασία κατηγοριοποίησης πολλών παρόμοιων
αντικειμένων. Πρωταρχικά χρησιμοποιούνται οι έννοιες ως αντιπρόσωποι, υποκατάστατα, σύμβο-
λα αντικειμένων, στη συνέχεια αποκτούν αυθυπαρξία και γίνονται πρώτη ύλη για τον σχηματισμό
προτάσεων (απλών ή σύνθετων) και, στη συνέχεια, συλλογισμών (κατηγορικών, υποθετικών ή δι-
αζευκτικών). Πρόταση, κατά τον Αριστοτέλη, είναι «λόγος ἀποφαντικὸς, ἀλλ’ ἐν ᾧ τὸ ἀληθεύειν ἢ
ψεύδεσθαι ὑπάρχει», είναι δηλαδή μια κρίση που τίθεται υπό έλεγχο, και παρά την πεποίθηση του
ομιλούντος περί της αλήθειάς της της, μπορεί να καταδειχθεί εντέλει ψευδής. Συλλογισμός είναι μια
σειρά προτάσεων που οδηγούν μέσω κάποιων λογικών κανόνων σε μια άλλη πρόταση. Η προσφυγή
στην εμπειρία, στην περίπτωση των κατηγορικών προτάσεων, καταδεικνύει την τιμή αλήθειάς τους.
Η εφαρμογή των κανόνων της λογικής διακρίνεται στις εξής περιπτώσεις:
–– 1η περίπτωση: η αλήθεια μιας υποθετικής πρότασης αποδεικνύεται με βάση την αλήθεια της
προηγούμενης πρότασης [π.χ. αρχική πρόταση: «ο Νίκος είναι γιος του Χρήστου (αληθής)», επο-
μένως, η πρόταση προς εξέταση: «Ο Χρήστος είναι πατέρας του Νίκου» είναι και αυτή αληθής].
–– 2η περίπτωση: το ψεύδος μιας υποθετικής πρότασης αποδεικνύεται με βάση το ψεύδος
της επόμενης πρότασης (π.χ. αρχική πρόταση – πρόταση προς εξέταση: «Ο Νίκος είναι
μεγαλύτερος σε ηλικία από τον Χρήστο», άρα η επόμενη πρόταση «ο Χρήστος μπορεί να
είναι γιος του Νίκου», η οποία είναι ψευδής αφού «Ο Χρήστος είναι πατέρας του Νίκου»,
μας αποδεικνύει ότι και η αρχική πρόταση είναι ψευδής).
–– 3η περίπτωση: η εφαρμογή των κανόνων της λογικής σε μια σειρά από απλές προτάσεις
καθορίζει την τιμή αλήθειας μιας πιο σύνθετης πρότασης (π.χ. «η Μαρία είναι κόρη του
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 13 ~

Νίκου», «η Μαρία είναι κόρη της Γεωργίας», επομένως «Η Μαρία, ο Νίκος και η Γεωργία
αποτελούν μια οικογένεια»).
–– 4η περίπτωση: η εφαρμογή πολύπλοκων συλλογιστικών σχημάτων και μεθόδων, βασισμέ-
νων στη λογική, καθορίζει την τιμή της αλήθειας σε σύνθετα νοητικά συμπεράσματα.
Η απόφανση περί της τιμής αλήθειας μιας πρότασης με βάση τις τιμές αλήθειας άλλων προ-
τάσεων και κάποιους λογικούς κανόνες αποτελούν βασικές διεργασίες της διαδικασίας της γνώσης.

1.3 Η πληροφορία από την πλευρά της Φιλοσοφίας της Πληροφορίας


(Philosophy of Information - PI)
Η Φιλοσοφία της Πληροφορίας (Philosophy of Information - PI) είναι ένας σύγχρονος κλάδος της
φιλοσοφίας της επιστήμης, ο οποίος ουσιαστικά καθιερώθηκε από τον Luciano Floridi με ένα βασι-
κό άρθρο, όπου πραγματεύεται δεκαοχτώ (18) ανοικτά ζητήματα της εν λόγω περιοχής [15].
Τα ζητήματα αυτά είναι:
1. Τι είναι «πληροφορία»; (το βασικό πρόβλημα)
Αυτή είναι η κεντρική ερώτηση της Φιλοσοφίας της Πληροφορίας. Η πληροφορία παραμένει μια
πρωταρχική έννοια που είναι πολύ δύσκολο να οριστεί με ακρίβεια. Εν τούτοις, πρέπει να οριστεί με
ποσοτικό τρόπο, έτσι ώστε να είναι αποθηκεύσιμη και μεταδόσιμη. Η Φιλοσοφία της Πληροφορίας,
και ειδικότερα η πληροφορία, μπορεί να ιδωθεί μέσα από τρεις (3) οπτικές γωνίες:
–– πληροφορία ως πραγματικότητα (όπως τα φυσικά σήματα που δεν χαρακτηρίζονται ως αλη-
θή ή ψευδή), η λεγόμενη οικολογική πληροφορία,
–– πληροφορία που περιγράφει την πραγματικότητα, και χαρακτηρίζεται μόνο από την τιμή
αλήθειας, η λεγόμενη σημασιολογική πληροφορία και
–– πληροφορία που στοχεύει στην αναδιαμόρφωση της πραγματικότητας (όπως οι γενετικές
εντολές)
Σχετικά με τα δύο πρώτα είδη πραγματικότητας, έχουν προταθεί διάφορες προσεγγίσεις για την
πληροφορία. Ειδικότερα, διακρίνονται:
–– η προσέγγιση της θεωρίας της επικοινωνίας (communication theory approach), με τεχνι-
κές κωδικοποίησης για την αποτελεσματική και γρήγορη μετάδοση των δεδομένων των
σημάτων, όπου η πληροφορία ορίζεται πιθανοκρατικά [16],
–– η συστημική προσέγγιση (systemic approach) με τη λεγόμενη καταστασιακή λογική (situation
logic), όπου η πληροφορία ορίζεται μέσω του χώρου των καταστάσεων, και πιο συγκεκριμένα,
μέσω των πιθανών μεταβάσεων, εντός του χώρου καταστάσεων ενός συστήματος [17][18],
–– η συμπερασματική προσέγγιση (inferential approach), όπου η πληροφορία ορίζεται μέσω
συμπερασματικών διαδικασιών και εξαρτάται από τους έγκυρους συμπερασμούς σε σχέση
με τη γνωσιακή κατάσταση ενός ατόμου,
~ 14 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

–– η σημασιολογική προσέγγιση (semantic approach), όπου η πληροφορία ορίζεται μέσω του


χώρου των δεδομένων, όπου η σημασιολογική πληροφορία ορίζεται ως ορθά σχηματισμένα
(συνδεδεμένα με σωστή σύνταξη - well formed), με νόημα (να αντιπροσωπεύουν κατανοη-
τά πράγματα - meaningful) και αληθή δεδομένα (να αντιστοιχούν σε πραγματικά γεγονότα
- truthful data) [19].
Έχοντας εξετάσει το βασικό ζήτημα σε ό, τι αφορά τη Φιλοσοφία της Πληροφορίας, παρακάτω ακο-
λουθούν τα υπόλοιπα:
2. Πώς είναι δυνατόν κάτι να μεταφέρει πληροφορία για κάτι άλλο; [πρόβλημα της δυναμικής της
πληροφορίας ή πρόβλημα εισόδου/εξόδου (Ιnput – Output)]
3. Είναι δυνατή μια ενοποιημένη θεωρία της πληροφορίας (UTI – Universal Theory οf Information);
4. Πώς τα δεδομένα αποκτούν σημασία; (DGP - Data Grounding Problem)
5. Πώς τα δεδομένα με σημασία αποκτούν τιμές αλήθειας; (alethization problem)
6. Είναι η πληροφοριακή προσέγγιση κατάλληλη για την κατανόηση της αλήθειας; (informational
truth theory)
7. Είναι η πληροφοριακή προσέγγιση κατάλληλη για την κατανόηση της σημασίας; (informational
semantics)
8. Μπορεί η γνωσιακή αντίληψη (cognition) να αναχθεί πλήρως και ικανοποιητικά στην πληρο-
φορία; (Descartes problem)
9. Μπορεί η φυσική νοημοσύνη (natural intelligene) να αναχθεί πλήρως και ικανοποιητικά στην
επεξεργασία πληροφορίας; (re-engineering problem)
10. Μπορεί η φυσική νοημοσύνη να υλοποιηθεί πλήρως και ικανοποιητικά με μη βιολογικό τρόπο;
11. Μπορεί η πληροφοριακή προσέγγιση να επιλύσει το πρόβλημα mind-body (MIB – Mind
Information Body problem)
12. Μπορεί η πληροφορία να ελεγχθεί με άλλα μέσα εκτός της πληροφορίας; (πρόβλημα του πλη-
ροφοριακού κύκλου)
13. Μπορεί η θεωρία της γνώσης (επιστημολογία) να βασιστεί στη θεωρία της πληροφορίας; (υπό-
θεση του συνεχούς)
14. Μπορεί να αναχθεί η επιστήμη στο πληροφοριακό μοντέλο; (σημασιολογική όψη της επιστήμης)
15. Ποια είναι η οντολογική φύση της πληροφορίας; (Wiener’s problem)
16. Είναι η πληροφορία πάντοτε φυσικά τοποθετημένη κάπου; (πρόβλημα του εντοπισμού)
17. Έχει η πληροφοριακή ηθική (computer ethics) φιλοσοφική θεμελίωση που την καθιστά αυτόνο-
μο κλάδο σε σχέση με τη γενική ηθική;
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 15 ~

1.4 Η αντικειμενοστραφής προσέγγιση της γνώσης – Η διαδικασία της


μάθησης
Για τις ανάγκες του αντικειμενοστραφούς προγραμματισμού (object oriented programming), όλες οι
έννοιες του πραγματικού κόσμου, αντιστοιχίζονται με αντικείμενα (objects) -απλά ή σύνθετα-, τα
οποία είναι γνωστά ως οντότητες (entities). Κάθε αντικείμενο/οντότητα έχει ορισμένα χαρακτηρι-
στικά (attributes), τα οποία αποτελούν τα δεδομένα της εσωτερικής του/της οργάνωσης. Επιπλέ-
ον, τα αντικείμενα δύναται να διαθέτουν μεθόδους για την επικοινωνία με τον εξωτερικό κόσμο ή
με άλλα αντικείμενα (ανταλλαγή μηνυμάτων – messages ή διεπαφές επικοινωνίας – communication
interfaces). Ως κλάση αντικειμένων/οντοτήτων (class) ορίζεται το πρότυπο για τη δημιουργία αντι-
κειμένων/οντοτήτων, ενώ ως στιγμιότυπο (instance) ενός αντικειμένου/μιας οντότητας ορίζεται η
«συγκεκριμενοποίηση» (instantiation) ενός αντικειμένου/μιας οντότητας του πραγματικού κόσμου,
με τη χρήση της κατάλληλης κλάσης. Ένα αντικείμενο (και κατά αναλογία μια κλάση) μπορεί να
αποτελείται/σχηματίζεται από τη συνάθροιση περισσοτέρων αντικειμένων, ενώ τα αντικείμενα μπο-
ρούν να οργανώνονται σε δενδρικές δομές (Ιεραρχία και Κληρονομικότητα).
–– Κλάση – class: Αφηρημένη έννοια - Ιδεατός κόσμος.
–– Στιγμιότυπο – instance αντικειμένου/οντότητας: Πραγματικό αντικείμενο – πραγματικός
κόσμος.
Επιπλέον, ως μια ανώτερη βαθμίδα για την οργάνωση της πληροφορίας ορίζεται η έννοια
(concept) ως μια στοιχειώδης ή σύνθετη μονάδα σκέψης (unit of thought), αναφερόμενη σε μια συ-
γκεκριμένη κατηγορία κλάσεων οντοτήτων, υπαρκτών ή αφηρημένων (αντικειμένων, ιδεών κ.λπ.)
ή γεγονότων του υπαρκτού κόσμου. Κάθε επιμέρους οντότητα ή γεγονός αποτελεί στιγμιότυπο ή
επεισόδιο (instance) της έννοιας. Στην εικόνα που ακολουθεί απεικονίζεται συνολικά ένα στιγμιό-
τυπο της έννοιας «καιρός».
~ 16 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Χαρακτηριστικά:
⁃ θερµοκρασία
⁃ υγρασία
⁃ άνεµοι
⁃ ηλιοφάνεια
Χαρακτηριστικά:
Χαρακτηριστικά: ⁃ κατεύθυνση
⁃ βαθµοί ⁃ ένταση
⁃ ώρα λήψης ⁃ ώρα λήψης
⁃ σταθµός λήψης ⁃ σταθµός λήψης

Έννοια
Κλάση αποτελείται “Καιρός” αποτελείται Κλάση
15 C “ανεµοι”
στιγµιότυπο “Θερµ/σία”
14:00
Station01 αποτελείται στιγµιότυπο
αποτελείται
ΒΔ
5 µποφώρ
Κλάση 14:00
Κλάση “ηλιοφάνεια” Station01
“υγρασία”
στιγµιότυπο
στιγµιότυπο
100 %
80%
14:00
14:00
Station01
Station01
Χαρακτηριστικά:
Χαρακτηριστικά:
⁃ % ποσοστό
⁃ % ποσοστό
⁃ ώρα λήψης
⁃ ώρα λήψης
⁃ σταθµός λήψης
⁃ σταθµός λήψης

Σχήμα 1.4. Απεικόνιση ενός στιγμιότυπου της έννοιας «καιρός».

Συναθροίζοντας επιμέρους «έννοιες», σχηματοποιείται η γνώση (knowledge) ως το σύνολο


των πρώτων (των εννοιών δηλαδή) μέσω ενός οργανωμένου και δομημένου συστήματος με ιεραρχικές
ή άλλες σχέσεις μεταξύ τους, των λογικών προτάσεων που μπορούν σχετικά να διατυπωθούν, καθώς
και των γνωστών στιγμιότυπων αυτών.
Ο συνεχής ορισμός νέων αντικειμένων/οντοτήτων, νέων εννοιών και γνώσης σε προσωπικό
επίπεδο (σε επίπεδο δηλαδή ατόμου – προσωπικός συσσωρευτής γνώσης) αλλά και σε συλλογικό
επίπεδο (σε επίπεδο δηλαδή κοινωνίας ή σε παγκόσμιο επίπεδο – παγκόσμιος συσσωρευτής γνώσης)
στηρίζεται σε μια διαρκή και αμφίδρομη επικοινωνία με τον περιβάλλοντα κόσμο. Τα δεδομένα των
αισθήσεων (sensed data) και οι παρατηρήσεις επ’ αυτών φιλτράρονται από τα «φίλτρα» πρόσληψης
ώστε να παράγουν τα δεδομένα αντίληψης (perceived data) και, μετά από τις κατάλληλες νοητικές
διεργασίες, ενσωματώνονται στο ήδη υπάρχον γνωστικό οικοδόμημα (ατομικό και συλλογικό) ως νέες
έννοιες και οντότητες/στιγμιότυπα αυτών (concepts & instances), ή συνεισφέρουν στην επικαιρο-
ποίηση υφιστάμενων εννοιών ή στην επικαιροποίηση των ταξινομικών-εννοιολογικών δένδρων (της
δομής, εν γένει) ή στη δημιουργία νέων συσχετίσεων μεταξύ εννοιών και οντοτήτων. Οι νοητικές
διαδικασίες που επιτελούνται μετά τη φάση της επεξεργασίας των δεδομένων αντίληψης είναι η ανα-
ζήτηση, η σύγκριση, η ταξινόμηση, η συσχέτιση, η επικαιροποίηση και ο συλλογισμός. Μέρος των
γνώσεων/εννοιών του προσωπικού συσσωρευτής γνώσης μεταφέρονται στον παγκόσμιο συσσωρευτή
γνώσης, αλλά κυρίως πραγματοποιείται η αντίθετη ροή μεταφοράς πληροφοριών, μέσα από τη διαδι-
κασία της μάθησης. Στην εικόνα που ακολουθεί απεικονίζεται συνολικά η αλληλεπίδραση μεταξύ του
προσωπικού και παγκόσμιου συσσωρευτή γνώσης, καθώς και τα βήματα της διαδικασίας μάθησης.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 17 ~

Προσωπικός συσσωρευτής γνώσης Πραγματικός κόσμος

Δεδομένα Δεδομένα
Μαθηματικά Βιολογία αντίληψης αισθήσεων

“φίλτρο”
αντίληψης
νοητική
επεξεργασία
αναζήτηση,
Χημεία σύγκριση,
ταξινόμηση,
συσχέτιση,
επικαιροποίηση
και συλλογισμός

Καταχώρηση
Αναζήτηση Παγκόσμιος συσσωρευτής γνώσης
Πρόσκτηση

Μαθηματικά Χημεία Βιολογία

Σχήμα 1.5. Αλληλεπίδραση μεταξύ του προσωπικού και παγκόσμιου συσσωρευτή γνώσης1.

1.5 Βιβλιοθήκες και Οργανισμοί Πληροφόρησης


Οι βιβλιοθήκες ήταν μέχρι πρότινος οι παραδοσιακοί οργανισμοί συγκέντρωσης και διαφύλαξης της
γνώσης. Στην αρχαιότητα ήταν οι χώροι συγκέντρωσης των κυλινδρικών παπύρων, και συνήθως,
όπως στην περίπτωση της Αλεξάνδρειας, ήταν ενσωματωμένοι σε ένα ευρύτερο πολιτισμικό συγκρό-
τημα. Αλλά και οι σημαντικές σχολές, όπως η Πλατωνική Ακαδημία, είναι βέβαιο ότι είχαν τις βιβλι-
οθήκες τους, με τα βιβλία των μελών και των δασκάλων τους, στα οποία είχαν πρόσβαση οι φοιτητές
για τις μελέτες και τις εργασίες τους. Από τη στιγμή που η καταγεγραμμένη γνώση περιοριζόταν σε
περιορισμένο αριθμό χειρόγραφων αντιτύπων, οι βιβλιοθήκες είχαν κρίσιμο ρόλο στη συγκέντρωση
και διαφύλαξη της γνώσης, στην πρόσβαση σ’ αυτήν, στη διάδοση, προώθηση και αξιοποίησή της.
Κατά τη μακρά περίοδο του Μεσαίωνα, οι βιβλιοθήκες ήταν μέρος των εκκλησιών και των
μοναστηριών, διασφαλίζοντας έτσι τον απόλυτο έλεγχο και τη διαβαθμισμένη πρόσβαση στα κείμενα
που κατείχαν, πολλά από τα οποία θα μπορούσαν να οδηγήσουν σε επικίνδυνες αποκλίσεις από την
επικρατούσα δογματική ορθοδοξία.

1 Ειδικά σε ό,τι αφορά τον παγκόσμιο συσσωρευτή γνώσης, βασικό ρόλο στη συγκρότησή του και στη διατή-
ρησή του διαδραμάτισαν και διαδραματίζουν οι Βιβλιοθήκες και οι Οργανισμοί Πληροφόρησης.
~ 18 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Η μεγάλη επανάσταση στον χώρο της γνώσης γίνεται με την εφεύρεση της τυπογραφίας
κατά τον 15ο αιώνα, οπότε η δυνατότητα παραγωγής πολλαπλών αντιτύπων ενός κειμένου, απε-
λευθερώνει και κοινωνικοποιεί τη γνώση, δίνοντας πλέον στις βιβλιοθήκες έναν άλλον ρόλο, αυ-
τόν της καλύτερης οργάνωσης και ταξινόμησης των βιβλίων, οδηγώντας ταυτόχρονα σε ιδιωτικές
συλλογές και βιβλιοθήκες.
Η επόμενη μεγάλη επανάσταση στον χώρο της γνώσης γίνεται επί των ημερών μας, όπου
πλέον η γνώση, στον μεγαλύτερο όγκο της, αποθηκεύεται και διαδίδεται, σε ηλεκτρονική μορφή. Ο
ρόλος των βιβλιοθηκών έχει αλλάξει ριζικά. Αντί να εξασφαλίζει τη φύλαξη και προστασία των υλι-
κών αντιτύπων, αποκτά την ευθύνη της αξιολόγησης και της θεματικής (σημασιολογικής) οργάνωσης
των διαθέσιμων στο διαδίκτυο πληροφοριακών πόρων. Οι οργανισμοί αυτοί καταχρηστικά διατηρούν
ακόμη το όνομα της βιβλιοθήκης, καθώς ακριβέστερα είναι οργανισμοί διαχείρισης της πληροφορίας
ή, απλούστερα, πληροφοριακοί οργανισμοί.
Οι βασικοί ρόλοι των πληροφοριακών οργανισμών περιγράφονται στις παραγράφους που
ακολουθούν.

1.5.1 Μεσολαβητές (mediators) της πληροφορίας


Οι πληροφοριακοί οργανισμοί (βιβλιοθήκες και λοιποί οργανισμοί διαχείρισης της πληροφορίας),
ως μεσολαβητές (mediators) της πληροφορίας, εξασφαλίζουν ότι η πληροφορία που φτάνει στους
τελικούς χρήστες (end users) είναι αξιόπιστη. Η άμεση συναλλαγή μεταξύ τελικών χρηστών και
δημιουργών περιεχομένου παρουσιάζει μια σειρά από προβλήματα, τα οποία φιλοδοξούν να περιο-
ρίσουν με τη μεσολάβησή τους οι πληροφοριακοί οργανισμοί, όπως:
–– Ο χειρισμός των οικονομικών συναλλαγών του παρόχου περιεχομένου με διάφορες κατηγο-
ρίες χρηστών επιβαρύνει το συνολικό κόστος παροχής πληροφοριών.
–– Οι δημιουργοί περιεχομένου μπορεί να μην διαθέτουν διαδικτυακά συστήματα παρουσία-
σης και παροχής της πληροφορίας στους τελικούς χρήστες (πύλες κ.λπ.), όπως και μηχανι-
σμούς προσωποποιημένης πληροφόρησης.
–– Η διαθέσιμη πληροφορία δεν δομείται συνήθως θεματικά (θεματικοί κλάδοι, συγκεκριμένα
γνωστικά αντικείμενα) αλλά αλφαβητικά (κατά τίτλο, συγγραφέα κ.λπ.).
–– Οι χρήστες επιβαρύνονται με την αναζήτηση πολλαπλών πηγών και διαφόρων τύπων διεπα-
φών, σε αντίθεση με τη φιλική παρουσίαση κάποιων συγκεντρωτικών σημείων πρόσβασης
από τους ιστοτόπους των πληροφοριακών οργανισμών.
–– Οι δημιουργοί περιεχομένου δεν προσφέρουν τις επιπρόσθετες υπηρεσίες των βιβλιοθηκών,
όπως τις θεματικές αναζητήσεις, τις υπηρεσίες τρέχουσας ενημέρωσης, ποιοτικές συλλογές
οργανωμένες από ειδικούς επιστήμονες κ.λπ.
–– Οι πληροφοριακοί οργανισμοί παρουσιάζουν, πέραν της επίλυσης των παραπάνω προβλη-
μάτων, και τα εξής πλεονεκτήματα:
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 19 ~

–– Διαθέτουν ενεργές υπηρεσίες επιλογής υλικού, καταλογογράφησης, ευρετηρίασης, οργανω-


μένης αποθήκευσης, υποστήριξης των χρηστών και δομές που μπορούν να επεκταθούν στο
περιβάλλον του Διαδικτύου.
–– Έχουν μια ισχυρή βάση χρηστών, οι οποίοι τις θεωρούν μια αναγνωρισμένη και οικεία
πηγή γνώσης.
–– Υπάρχει μια μακρά ιστορία συνεργασίας δημιουργών περιεχομένου και βιβλιοθηκών.
Ένας πολύ σημαντικός ρόλος για τους πληροφοριακούς οργανισμούς είναι η εξασφάλιση
ενός αποδεκτού επιπέδου ποιότητας του παρεχόμενου περιεχομένου, καθώς το Διαδίκτυο είναι υπερ-
φορτωμένο από ένα μεγάλο ποσοστό ανεξέλεγκτης μη επιστημονικής πληροφορίας. Χωρίς ένα φίλ-
τρο ποιότητας ο χρήστης είναι καταδικασμένος να φορτώνεται από έναν μεγάλο όγκο άχρηστων
δεδομένων που δεν μπορούν σε καμία περίπτωση να χαρακτηριστούν πληροφορία.
Μια λύση στο πρόβλημα αυτό είναι μια παραδοσιακή πρακτική των βιβλιοθηκών η λεγό-
μενη προ-επιλογή (pre-selection). Υπάρχουν δύο τρόποι με τους οποίους μπορεί να εφαρμοστεί η
προ-επιλογή στους δικτυακούς πόρους :
1. Κατεβάζοντας πόρους υψηλής ποιότητας σε έναν τοπικό διακομιστή (ηλεκτρονική
πρόσκτηση).
2. Διατηρώντας ή παρέχοντας συνδέσεις σε ηλεκτρονικές λίστες πόρων υψηλής ποιότητας,
καθώς και σε διακομιστές, οι οποίοι εφαρμόζουν πρότυπα ποιότητας στα περιεχόμενα
έγγραφα. Οι λίστες αυτές διατίθενται σε ειδικές ιστοσελίδες.
Στις παραπάνω περιπτώσεις η βιβλιοθήκη δρα ως φίλτρο, περιορίζοντας την πρόσβαση μόνο
σε πόρους εγγυημένης ποιότητας. Βέβαια τέτοιου είδους περιορισμοί δεν γίνονται ευχάριστα δε-
κτοί από όλους τους χρήστες, διότι κάποιοι από αυτούς μπορεί να θέλουν να εφαρμόσουν τα δικά
τους κριτήρια ποιότητας και να πάρουν τις δικές τους αποφάσεις ή μπορεί να υποστηρίζουν ότι με
την προ-επιλογή χάνεται ένα μέρος από το σχετικό υλικό, ενώ θα προτιμούσαν να εκμεταλλεύονται
ολόκληρο τον δικτυακό χώρο των διαθέσιμων πόρων, έχοντας βέβαια παράλληλα ενημερωθεί για τα
προβλήματα ποιότητας που εμπεριέχει μια τέτοια διαδικασία.
Η κάθε βιβλιοθήκη εφαρμόζει τις δικές της γραμμές ποιότητας για τους δικτυακούς πόρους,
οι οποίες διαφοροποιούνται ανάλογα με τη θεματική περιοχή, τον τύπο της βιβλιοθήκης, τους χρή-
στες κλπ. Για παράδειγμα, μια ακαδημαϊκή βιβλιοθήκη πρέπει να εστιάζει σε υλικό που έχει αξιο-
λογηθεί (peer reviewed) ή και σε μη αξιολογημένο υλικό γνωστών όμως συγγραφέων. Άλλες βιβλι-
οθήκες εστιάζουν περισσότερο στο έγκαιρο και στην ποιότητα των πηγών (π.χ. πρακτορεία τύπου,
σημαντικές εταιρίες κ.λπ.).
Όσον αφορά την ποιότητα των δικτυακών πόρων, οι βιβλιοθήκες, λόγω της έλλειψης της
γρήγορης επιθεώρησης, πρέπει να βασίζονται κυρίως στην πείρα των ειδικών των συγκεκριμένων
κλάδων αλλά επίσης και στη γνώμη των επίσημων εκδοτών αυτού του υλικού, καθώς επίσης και σε
κάποιες λίστες επιθεωρημένου υλικού που έχουν ήδη οργανωθεί από άλλους και είχαν ως σκοπό τον
προσδιορισμό του υψηλής ποιότητας υλικού.
~ 20 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Τα κριτήρια αξιολόγησης των δικτυακών πόρων είναι:


–– Ακρίβεια (accuracy) – Υπάρχουν τα στοιχεία του διαχειριστή της ιστοσελίδας (webmaster)
ή τουλάχιστον διεύθυνση e-mail για επικοινωνία μαζί του; - Υπάρχουν αντίστοιχα στοιχεία
ή e-mail του συγγραφέα (author) του περιεχομένου της ιστοσελίδας;
–– Ρυθμός ανανέωσης (currency) – Υπάρχει ημερομηνία τελευταίας ανανέωσης; - Αν ναι πόσο
πρόσφατα έχει ανανεωθεί η ιστοσελίδα;

–– Μορφή (format) – Είναι η ιστοσελίδα ισορροπημένη με εικόνες και κείμενα σε μια σωστή
αναλογία; Μήπως δεν έχει καθόλου εικόνες και έτσι δεν εξάπτει το ενδιαφέρον του χρήστη;
Μήπως είναι παραφορτωμένη με εικόνες χωρίς την απαραίτητη παρουσία συνοδευτικού
κειμένου;
–– Λειτουργικότητα (operability) – Είναι η διάταξη (αρχιτεκτονική) της ιστοσελίδας λειτουρ-
γική; Κατευθύνει μέσα από κατανοητή και απλή δομή τον χρήστη στις διάφορες πληροφο-
ρίες που περιέχει; Είναι τα μενού σχεδιασμένα σωστά; Μήπως το πλήθος των ενσωματωμέ-
νων εικόνων καθιστά την ιστοσελίδα αργή, με αποτέλεσμα ο χρήστης να την εγκαταλείπει
πρόωρα; Δίνεται η δυνατότητα επιλογής ανάμεσα σε πολυμεσική και κειμενική εκδοχή της
ιστοσελίδας; Μήπως υπάρχουν «ανενεργοί» σύνδεσμοι (dead links); Μήπως απαιτείται ει-
δικό λογισμικό για την ανάγνωση τμημάτων της ιστοσελίδας και αν ναι, προσφέρεται σύν-
δεσμος για μεταφόρτωσή του (downloading);
–– Αξιοπιστία (credibility) του συγγραφέα – Ο συγγραφέας είναι ένας απλός μελετητής που
ασχολήθηκε με το θέμα και απλώς εκφράζει τις απόψεις του ή κάποιος ειδικός επί του θέ-
ματος, οπότε πρέπει να αναγράφονται οι σπουδές και οι τίτλοι του και ο φορέας στον οποίο
είναι ενταγμένος.
–– Ποιότητα περιεχομένου (content quality) – Το περιεχόμενο είναι τεκμηριωμένο μέσα από
παράθεση έγκυρων βιβλιογραφικών αναφορών ή αποτελεί μια απλή έκθεση των απόψεων
του συγγραφέα; Μήπως το περιεχόμενο λειτουργεί ως δούρειος ίππος κινήσεων ή ατόμων,
διαφήμισης εταιρειών ή προϊόντων, προώθησης ανέλεγκτων σκευασμάτων κ.λπ.;
Δεν πρέπει όμως να υποτιμάται και ο ρόλος των ίδιων των βιβλιοθηκών στη διαμόρφωση λιστών
ποιοτικών δικτυακών πόρων. Η διαδικασία αυτή προωθείται με τα εξής κανάλια:
–– (Απλώς και μόνο με τη) χρήση κάποιων δικτυακών πόρων από τις βιβλιοθήκες, γεγονός που
συνιστά έναν στατιστικό δείκτη ποιότητας,
–– συμμετοχή του προσωπικού της βιβλιοθήκης αλλά και ανάδραση από τους χρήστες για ποιοτική
εκτίμηση των δικτυακών πόρων, διαφόρων ιστοτόπων, διαφόρων εκδοτών του Διαδικτύου κ.λπ.,
–– επικοινωνία των βιβλιοθηκών με τον υπόλοιπο κόσμο για κοινοποίηση της εμπειρίας τους
μέσω λιστών ποιοτικών πόρων, βάσεων δεδομένων με στοιχεία εκτίμησης πόρων κ.λπ.,
–– διεξαγωγή συνεδρίων όπου θα συμμετέχουν βιβλιοθήκες αλλά και τα υπόλοιπα μέρη του κό-
σμου του Διαδικτύου, με σκοπό την ανταλλαγή των εμπειριών και την από κοινού ανάπτυξη
μηχανισμών ελέγχου ποιότητας.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 21 ~

1.6 Βιβλιογραφικές αναφορές Κεφαλαίου 1

[1] Case, P., & Gosling, J. (2011). Where is the Wisdom We Have Lost in Knowledge? A Stoical
Perspective on Personal Knowledge Management. In D. J. Pauleen & G. E. Gorman (Eds.),
Personal Knowledge Management: Individual, Organizational and Social Perspectives (pp.
17–42). Farnham Surrey: Gower Publishing Limited.

[2] Wikipedia. (2015). T. S. Eliot. Wikipedia. Retrieved July 1st, 2016, from http://en.wikipedia.
org/wiki/T._S._Eliot

[3] Ackoff, R. (1989). From data to wisdom: Presidential address to ISGSR, June 1988. Journal
of Applied Systems Analysis, 16(1), 3–9.

[4] Rowley, J. (2007). The wisdom hierarchy: representations of the DIKW hierarchy. Journal of
Information Science, 33(2), 163–180. doi:10.1177/0165551506070706

[5] Ackoff, R. L. (1998). A Systemic View of Transformational Leadership. Systemic Practice and
Action Research, 11(1), 23–36. doi:10.1023/A:1022960804854

[6] Rockwood, B. (2011). Systems Thinking & The Wisdom of Ackoff. Cuddletech Blog. Retrieved
July 1st, 2016, from http://cuddletech.com/?p=534

[7] Bellinger, G., Castro, D., & Mills, A. (2004). Data, Information, Knowledge and Wisdom.
Systems Thinking. Retrieved July 1st, 2016, from http://www.systems-thinking.org/dikw/
dikw.htm

[8] Weinberger, D. (2010). The Problem with the Data-Information-Knowledge-Wisdom


Hierarchy. Harvard Business Review. Retrieved July 1st, 2016, from https://hbr.org/2010/02/
data-is-to-info-as-info-is-not

[9] Zeleny, M. (1987). Management support systems: Towards integrated knowledge management.
Human Systems Management, 7(1), 59–70. doi:10.3233/HSM-1987-7108

[10] European Committee for Standardization. (2004). European Guide to good practice in
Knowledge Management -Part 1: Knowledge Management Framework CWA 14924-1:2004
E. Retrieved July 1st, 2016, from http://research.fraserhealth.ca/media/Euro Guide to good
practice in KM Part 1.pdf

[11] Pearlson, K. E., & Saunders, C. S. (2012). Managing and Using Information Systems: A
Strategic Approach, 5th Edition. doi:10.1017/CBO9781107415324.004

[12] Paul Bocij, Greasley, A., & Hickie, S. (2008). Business information systems : technology,
development and management for the e-business (4th edition). Pearson Education Limited.

[13] Smith, M. K. (2003). Michael Polanyi and tacit knowledge. The encyclopedia of informal
education. Retrieved July 1st, 2016, from http://infed.org/mobi/michael-polanyi-and-tacit-
knowledge/
~ 22 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

[14] Laudon, K. C., & Laudon, J. P. (2014). Management information systems: managing the
digital firm. Prentice Hall.

[15] Awad, E. M., & Ghaziri, H. M. (2003). Knowledge Management. Prentice Hall.

[16] Floridi, L. (2004). Open Problems in the Philosophy of Information. Metaphilosophy, 35(4),
554–582. doi:10.1111/j.1467-9973.2004.00336.x

[17] Shannon, C. E. (1948). A mathematical theory of communication. The Bell System Technical
Journal, 27(July 1928), 379–423. doi:10.1145/584091.584093

[18] Barwise, J., & Perry, J. (1983). Situations and Attitudes. Cambridge: MIT Press.

[19] Israel, D., & Perry, J. (1990). What is information? In P. Hanson (Ed.), Information, language,
and cognition (pp. 1–19). Vancouver: University of British Columbia Press.

[20] Floridi, L. (2005). Is Semantic Information Meaningful Data? Philosophy and


Phenomenological Research, LXX(2). Retrieved July 1st, 2016, from https://www.academia.
edu/3491629/Is_Information_Meaningful_Data

1.7 Βιβλιογραφία Κεφαλαίου 1

[1] Shannon, C. E., & Weaver, W. (1963). The mathematical theory of communication. Urbana:
University of Illinois Press.

[2] Dendrinos, M. (2005). From the Physical Reality to the Virtual Reality in the Library
Environment. Library Philosophy and Practice, 7(2), 1–6. Retrieved from http://unllib.unl.
edu/LPP/dendrinos.htm

[3] Dendrinos, M. N. (2008). Computer Science Professionals and Greek Library Science.
Education for Information, 26(2), 101–111. Retrieved July 1st, 2016, from http://search.
proquest.com/docview/57681957?accountid=47392\nhttp://link.periodicos.capes.gov.br/
sfxlcl41?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&genre=article&si
d=ProQ:ProQ:lisashell&atitle=Computer+Science+Professionals+and+Greek+L

[4] Dendrinos, M. (2013). From Information to Knowledge: From Positive Chatter to Negative
Semantics. The Official Journal of the Pacific Northwest Library Association, 78(1), 11.
Retrieved July 1st, 2016, from http://www.pnla.org/assets/documents/Quarterly/pnlaq78-
1fall2013.pdf
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 23 ~

1.8 Ερωτήσεις – Ασκήσεις αξιολόγησης Κεφαλαίου 1


1.8.1 Ερωτήσεις
1. Αναφέρατε τα επίπεδα της ιεραρχίας DIKW (σε ελληνικά και αγγλικά).
2. Ποια είναι κατά την άποψη του Ackoff η διαφορά μεταξύ πληροφορίας και γνώσης;
3. Ποια είναι η διαφορά μεταξύ εμφανούς και σιωπηρής γνώσης;
4. Περιγράψτε τα στάδια της διαδικασίας της μάθησης.
5. Ποιος είναι ο ρόλος των βιβλιοθηκών στο γενικότερο πλαίσιο των πληροφοριακών οργανισμών.
6. Ποια είναι τα κριτήρια αξιολόγησης ενός δικτυακού πόρου.

1.8.2 Ασκήσεις
1. Αντιστοιχίστε το κατάλληλο επίπεδο ιεραρχίας DIKW με τις παρακάτω εικόνες.
~ 24 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

1.9 Πίνακας ακρωνυμίων και ορολογία Κεφαλαίου 1

Ακρωνύμιο Ανάλυση ακρωνυμίου

AI Artificial Intelligence

DGP Data Grounding Problem

DIKW Data-Information-Knowledge-Wisdom

I/O Input/Output

MIB Mind Information Body problem

PI Philosophy of Information

UTI Universal Theory οf Information

Πίνακας 1.4. Πίνακας ακρωνυμίων Κεφαλαίου 1.

Ξενόγλωσσος όρος Ελληνικός όρος / απόδοση

accuracy ακρίβεια

actionable αξιοποιήσιμη προς δράση

τα δεδομένα με σημασία αποκτούν τιμές αλή-


alethization problem
θειας

appreciation of “why” εκτίμηση του «γιατί»

Artificial Intelligence τεχνητή νοημοσύνη

attributes χαρακτηριστικά

credibility αξιοπιστία

bit δυαδικό ψηφίο

class κλάση

cognition γνωσιακή αντίληψη

προσέγγιση της θεωρίας


communication theory approach
της επικοινωνίας

computer ethics πληροφοριακή ηθική


Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 25 ~

contextual βασισμένη στα συμφραζόμενα

culturally-bound πολιτιστικά (καθ)ορισμένη

currency ρυθμός ανανέωσης

data δεδομένα

dead links «νεκροί» σύνδεσμοι

Συστήματα Υποστήριξης Λήψης


Decision Support Systems
Αποφάσεων

development ποιοτική βελτίωση

Data Grounding Problem

Data-Information-Knowledge-Wisdom Δεδομένο-Πληροφορία-Γνώση-Σοφία

downloading μεταφόρτωση

effectiveness αποτελεσματικότητα

efficiency απόδοση

end user τελικός χρήστης

entities οντότητες

evaluated understanding αξιολογημένη κατανόηση

Expert Systems Έμπειρα Συστήματα

expertise επιδεξιότητα

explicit εμφανής

extrapolative επεκτατική

format μορφή

goal-driven καθοδηγούμενη από στόχους

growth ποσοτική αύξηση

Input/Output Είσοδος/Έξοδος

inferential approach συμπερασματική προσέγγιση

information πληροφορία/-ες

Information Science Επιστήμη της Πληροφόρησης/Πληροφορίας


~ 26 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

πληροφοριακή προσέγγιση κατάλληλη για την


informational semantics
κατανόηση της σημασίας

πληροφοριακή προσέγγιση κατάλληλη για την


informational truth theory
κατανόηση της αλήθειας

input data δεδομένα εισόδου

instance στιγμιότυπο

instantiation συγκεκριμενοποίηση

internet διαδίκτυο

interpolative παρεμβλητική

know-how τεχνογνωσία

knowledge γνώση

Management Information Systems Πληροφοριακά Συστήματα Διοίκησης

meaningful κατανοητός

mediator μεσολαβητής

Mind Information Body problem Πρόβλημα νου-σώματος-πληροφοριών

natural intelligence φυσική νοημοσύνη

operability λειτουργικότητα

output data δεδομένα εξόδου

perceived data δεδομένα αντίληψης

Philosophy of Information Φιλοσοφία της Πληροφορίας

pre-selection προ-επιλογή

processing επεξεργασία

quality of content ποιότητα περιεχομένου

queries συνδυαστικά ερωτήματα

relational database σχεσιακή βάση δεδομένων

sensed data δεδομένα των αισθήσεων

situation logic καταστασιακή λογική


Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 27 ~

source code πηγαίος κώδικας

spreadsheet φύλλο εργασιών

systemic approach συστημική προσέγγιση

tacit σιωπηρή

trade-off ανταγωνισμός, πάρε-δώσε

Transaction Processing Systems Συστήματα Επεξεργασίας Συναλλαγών

δεδομένα που αντιστοιχούν σε πραγματικά


truthful data
γεγονότα

understanding κατανόηση

unit of thought μονάδα σκέψης

Universal Theory οf Information Παγκόσμια θεωρία πληροφοριών

webmaster διαχειριστής της ιστοσελίδας

ορθά σχηματισμένος, με σωστή


well formed
σύνταξη/μορφή

wisdom σοφία

Πίνακας 1.5. Πίνακας επιστημονικής ορολογίας Κεφαλαίου 1.


Κεφάλαιο 2

Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο

Σύνοψη

Στο Κεφάλαιο αυτό παρουσιάζεται το απαραίτητο θεωρητικό υπόβαθρο της αναπαράστασης της πλη-
ροφορίας στο ψηφιακό κόσμο και πιο συγκεκριμένα στο ψηφιακό περιβάλλον στο οποίο κυριαρχεί
η δυαδική κωδικοποίηση (binary coding). Ειδικότερα, παρουσιάζονται η αναπαράσταση των αλφα-
ριθμητικών χαρακτήρων και τα πρότυπα κωδικοποίησής τους (coding character), οι μορφές ανα-
παράστασης κειμένου (text), η αναπαράσταση εικόνας (image), η αναπαράσταση ήχου (audio) και
η αναπαράσταση κινούμενης εικόνας με ήχο, γνωστή ως βίντεο (video). Επιπλέον, παρουσιάζονται
και άλλες σύγχρονες μορφές αναπαράστασης της πληροφορίας, οι οποίες συνδυάζουν περισσότερες
από μία από τις βασικές μορφές αναπαράστασης της πληροφορίας, όπως η τρισδιάστατη απεικόνιση
(3D-animations), έξυπνα γραφήματα (infographics) κ.λπ. Στο ίδιο κεφάλαιο παρατίθενται οι βασικές
διαδικασίες δειγματοληψίας και ψηφιοποίησης αναλογικών ροών πληροφορίας όπως αυτές της εικό-
νας (συμπεριλαμβανομένου του κειμένου σε έντυπη μορφή), του ήχου και του βίντεο. Τέλος, παρουσι-
άζονται οι σύγχρονες τεχνολογίες φωνής (αναγνώριση και σύνθεση φωνής) και η οπτική αναγνώριση
χαρακτήρων, που αποσκοπούν τόσο στην απλοποίηση και βελτίωση της καθημερινότητας, όσο και
στην υποστήριξη των Ατόμων με Ειδικές Ανάγκες (ΑμΕΑ).

Προαπαιτούμενη γνώση

Το κεφάλαιο αυτό δεν απαιτεί την προηγούμενη γνώση άλλων βιβλίων/μαθημάτων ή ύλης άλλων κε-
φαλαίων του παρόντος βιβλίου.

2.1 Μοντέλο ιεραρχίας DIKW


Όπως φάνηκε στο Κεφάλαιο 1, η πληροφορία είναι είτε ένα φυσικό αντικείμενο (συνεχόμενη ακου-
στική εντύπωση, οπτική εικόνα ή ένα γεγονός στο οποίο επικεντρώνεται ένας θεατής) ή μια γλωσ-
σική αναπαράσταση (ένα όνομα που αναπαριστά ένα αισθητό ή νοητό αντικείμενο, αλλά και μια
δήλωση που αναπαριστά ένα πραγματικό συμβάν ή μια φανταστική σύνθεση ή κάτι που επιδιώκει να
συμβεί). Η γλωσσική αναπαράσταση αποτέλεσε τη μεγάλη επανάσταση που ξεχώρισε τον άνθρωπο
από τα υπόλοιπα είδη, καθώς με αυτόν τον τρόπο μπορεί πλέον να επικοινωνεί και να μοιράζεται
με τους άλλους ό, τι θεωρεί χρήσιμο για την υλική του επιβίωση και την πνευματική του έκφραση.
~ 30 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Αλλά και από τα φυσικά αντικείμενα όσα ήθελε να τα κοινοποιήσει ο άνθρωπος προσπάθησε να τα
αναπαραστήσει μέσα από τη μουσική ή την εικαστική σύνθεση και στη συνέχεια μέσα από τη φωτο-
γράφιση, ηχογράφηση ή κινηματογράφηση.
Στην αρχή η αναπαράσταση ήταν συνεχής – αναλογική (analog), μετατρέποντας την
ηχητική ένταση σε ηλεκτρική ένταση και τη φωτεινή εικόνα σε χημική αλλοίωση. Στη συνέχεια,
όμως, στο πλαίσιο της αναπτυσσόμενης τεχνολογίας των ηλεκτρονικών υπολογιστών (Η/Υ),
έγινε διακριτή – ψηφιακή (digital).
Οι Η/Υ εφευρέθηκαν και αναπτύχθηκαν με σκοπό τη γρήγορη και αποτελεσματική εκτέλε-
ση αριθμητικών υπολογισμών, αρχικά, και, στη συνέχεια, την ολοκλήρωσης μιας σειράς διαδικασι-
ών και ελέγχων μέσω ενός τυποποιημένου σετ εντολών.
Τα ηλεκτρονικά στοιχεία (και ειδικότερα τα ψηφιακά κυκλώματα) που χρησιμοποιούνται
στους ηλεκτρονικούς υπολογιστές μπορούν να βρίσκονται σε μία από τις δύο καταστάσεις: Ανοικτό
– κλειστό / Αληθές – ψευδές / Αγωγή ρεύματος - Διακοπή ρεύματος / Υψηλή τάση – Χαμηλή τάση /
«0» ή «1». Για τον λόγο αυτό, όλες οι εντολές εκτέλεσης των προγραμματισμένων διαδικασιών είναι
κωδικοποιημένες σε μια ακολουθία από δύο (2) και μόνο σύμβολα, το «μηδέν» 0 και το «ένα» 1.
Αυτά τα σύμβολα ονομάζονται δυαδικά ψηφία (binary digits ή bits).
Αυτό το χαρακτηριστικό των στοιχειωδών συνιστωσών των Η/Υ αποτέλεσε και τη βασική
ιδέα της τεχνολογικής υλοποίησης της αναπαράστασης και αποθήκευσης της πληροφορίας -προς
μελλοντική χρήση- σε έναν Η/Υ. Αν από ένα συνεχόμενο ήχο (φυσικό ήχο, συζήτηση ή μουσικό
κομμάτι) απομονώσουμε μια σειρά στιγμών πολύ κοντά τη μια στην άλλη, τότε προκύπτει μια ακο-
λουθία αριθμών που ο καθένας από αυτούς αντιπροσωπεύει μια ηχητική ένταση. Αντίστοιχα, αν από
μια συνεχή φωτεινή εικόνα απομονώσουμε μια σειρά σημείων πολύ κοντά το ένα στο άλλο, τότε
προκύπτει μια σειρά αριθμών που ο καθένας αντιπροσωπεύει τον χρωματικό κώδικα κάθε σημείου.
Και στη μια και στην άλλη περίπτωση όλη η πληροφορία είναι μια σειρά αριθμών, η οποία μπορεί να
παρασταθεί σε ένα τέτοιο αριθμητικό σύστημα που να προσαρμόζεται στη δυνατότητα των ηλεκτρο-
νικών στοιχείων να βρίσκονται σε μια από τις δύο καταστάσεις. Όπως θα δούμε στην επόμενη πα-
ράγραφο, υπάρχει ένα τέτοιο σύστημα αριθμητικής αναπαράστασης και είναι το δυαδικό (binary).
Αλλά και όλος ο υπόλοιπος όγκος πληροφορίας, όπως η γλωσσική αναπαράσταση, μπορεί
και αυτός να αποθηκευτεί στον Η/Υ μέσω συστημάτων κωδικοποίησης κάθε γράμματος και σημείου
στίξης της φυσικής γλώσσας με μια σειρά συμβόλων 0 και 1, μετατρέποντας τη γλωσσική αναπαρά-
σταση, δηλαδή το εργαλείο κατανόησης και επικοινωνίας των ανθρώπων, σε ψηφιακή αναπαράστα-
ση, δηλαδή στο εργαλείο κατανόησης και επικοινωνίας των Η/Υ.

2.2 Δυαδικό σύστημα αρίθμησης


Σύστημα αρίθμησης είναι ο τρόπος παράστασης ενός αριθμού βασισμένος σε ένα διαθέσιμο σύνολο
συμβόλων-ψηφίων και στη συσχέτιση της αριθμητικής αξίας του ψηφίου με τη θέση του στην ακολουθία
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 31 ~

ψηφίων που αποτελεί την αναπαράσταση του αριθμού. Το πλήθος των διαφορετικών ψηφίων αναπαρά-
στασης είναι η λεγόμενη βάση (base) του συστήματος αρίθμησης και δίνει και το όνομα στο σύστημα.
Το σύστημα που χρησιμοποιούμε καθημερινά είναι το δεκαδικό σύστημα (decimal system),
το οποίο έχει ως βάση το 10 και ως διαφορετικά σύμβολα-ψηφία (digits) τα 0, 1, 2, 3, 4, 5, 6, 7, 8
και 9. Ο τρόπος αναπαράστασης δηλώνει ότι το δεξιότερο ψηφίο αντιστοιχεί σε αξία ίση με την τιμή
του, ενώ τα υπόλοιπα αντιστοιχούν σε αξίες που προκύπτουν από την τιμή τους πολλαπλασιασμένη
με μια δύναμη του 10 (δηλαδή της βάσης του συστήματος αρίθμησης), το αμέσως αριστερότερο επί
10, το αριστερότερο επί 102=100, το αριστερότερο επί 103=1000 κ.λπ.
Για παράδειγμα, ο αριθμός 153, στο δεκαδικό σύστημα αναλύεται ως εξής:
+ 1 x 10² = 1 x 100 = 100
+ 5 x 10¹ = 5 x 10 = 50
+ 3 x 10º = 3x1 =3
= 153
Ο γενικός τύπος, με βάση τον οποίο αναλύονται οι αριθμοί σε όλα τα συστήματα αρίθμησης,
είναι ο εξής:

R είναι η βάση

dn * Rn-1 + dn-1 * Rn-2 + ... + d2 * R + d1

n είναι ο αριθµός
d είναι το ψηφίο στην
των ψηφίων
iοστή θέση

642 είναι:
63 * 102 + 42 * 101 + 21 * 100

Σχήμα 2.1. Σημειολογία θέσης στα συστήματα αρίθμησης.

Το σύστημα αρίθμησης για την αναπαράσταση των αριθμητικών δεδομένων στους Η/Υ εί-
ναι το δυαδικό σύστημα (binary numerical system). Η επιλογή δεν είναι τυχαία, αφού όπως ειπώ-
θηκε και πιο πριν, τα ηλεκτρονικά κυκλώματα που χρησιμοποιούνται στους Η/Υ μπορούν να βρί-
σκονται σε μία από τις δύο καταστάσεις. Τα ηλεκτρονικά κυκλώματα που μπορούν να βρίσκονται σε
δύο καταστάσεις ονομάζονται ψηφιακά (digital). Η κατάλληλη διασύνδεση ψηφιακών κυκλωμάτων
επιτρέπει την αποθήκευση και επεξεργασία δεδομένων σε ψηφιακή μορφή, τα οποία ονομάζονται
δυαδικά ψηφία (binary digits) ή bits.
~ 32 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Επομένως, στο δυαδικό σύστημα η βάση είναι το R=2 και τα διαθέσιμα σύμβολα – ψηφία
είναι τα 0 και 1.
Στην τεχνολογία των υπολογιστών εκτός του δυαδικού χρησιμοποιούνται και άλλα δύο
συστήματα που έχουν ως βάση δυνάμεις του 2 και, συγκεκριμένα, το οκταδικό (octal numerical
system) και το δεκαεξαδικό (hexadecimal numerical system), με βάση το 8 και το 16 αντίστοιχα.

Δεκαδικό σύστηµα (Βάση: R=10, Σύµβολα: 0,1,2,3,4,5,6,7,8,9)

Δυαδικό σύστηµα (Βάση: R=2, Σύµβολα: 0,1)

Οκταδικό σύστηµα (Βάση: R=8, Σύµβολα: 0,1,2,3,4,5,6,7)

Δεκαεξαδικό σύστηµα (Βάση: R=16, Σύµβολα: 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F)


(Τα τελευταία 6 σύµβολα είναι αυτά που στα δεκαδικό σύστηµα έχουν τις εξής αξίες: A=10,
B=11, C=12, D=13, E=14 και F = 15).

Σχήμα 2.2. Αριθμητικά συστήματα – Βάσεις και σύμβολα.

Η τεχνική (αλγόριθμος) της μετατροπής ενός αριθμού από το δεκαδικό σύστημα στο δυαδικό έχει
ως εξής:
1ο Βήμα: Πραγματοποιούμε διαδοχικές ακέραιες διαιρέσεις του υπό μετατροπή αριθμού και των
παραγόμενων πηλίκων με τον αριθμό 2 (βλέπε παρακάτω σχήμα), έως την τελική διαίρεση 1:2, όπου
το αποτέλεσμα δίνει πηλίκο 0 και υπόλοιπο 1.
2ο Βήμα: Η δυαδική μορφή του υπό μετατροπή αριθμού σχηματίζεται από τα υπόλοιπα των διαιρέ-
σεων, με αριστερότερο ψηφίο του αριθμού το τελευταίο υπόλοιπο και δεξιότερο το πρώτο.
Η μετατροπή, για παράδειγμα, του αριθμού 59 σε δυαδική μορφή γίνεται ως εξής:

59 : 2 δίνει πηλίκο 29 και υπόλοιπο 1.


29 : 2 δίνει πηλίκο 14 και υπόλοιπο 1.
14 : 2 δίνει πηλίκο 7 και υπόλοιπο 0.
7 :2 δίνει πηλίκο 3 και υπόλοιπο 1.
3 :2 δίνει πηλίκο 1 και υπόλοιπο 1.
1 :2 δίνει πηλίκο 0 και υπόλοιπο 1.

Σχήμα 2.3. Μετατροπή από δεκαδικό σε δυαδικό σύστημα.

Ο αριθμός που σχηματίζεται αριστερά προς τα δεξιά από το τελευταίο προς το πρώτο υπό-
λοιπο είναι η ζητούμενη δυαδική μορφή δηλ. (59)10 =(111011)2.
Η αντίστροφη μετατροπή ενός αριθμού από R-ική μορφή σε δεκαδική γίνεται χρησιμοποιώ-
ντας τον γενικό τύπο αναπαράστασης (Εικόνα 2.1), όπου κάθε ψηφίο έχει διαφορετικό βάρος, καθώς
πολλαπλασιάζεται με μια δύναμη του R, δηλαδή:
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 33 ~

–– στην περίπτωση ενός δυαδικού αριθμού τα ψηφία από αριστερά προς τα δεξιά συμβολίζουν
μονάδες, δυάδες, τετράδες κλπ. οπότε πολλαπλασιάζονται με το 1, το 2, το 4, κ.λπ.,
–– στην περίπτωση ενός οκταδικού συμβολίζουν μονάδες, οκτάδες, 64άδες κ.λπ. οπότε πολλα-
πλασιάζονται με το 1, το 8, το 64, κ.λπ.,
–– στην περίπτωση ενός δεκαεξαδικού συμβολίζουν μονάδες, δεκαεξάδες, 256άδες, κλπ. οπότε
πολλαπλασιάζονται με το 1, το 16, το 256, κ.λπ.

Παράδειγµα µετατροπής του δυαδικού (111011) 2 σε δεκαδική µορφή:


(111011)2 = 1 x 2 5 + 1x 2 4 + 1 x 2 3 + 0 x 2 2 + 1 x 2 1 + 1 x 2 0
(σε δεκαδικό) = 32 + 16 + 8 + 0 + 2 + 1
= (59) 10

Σχήμα 2.4. Μετατροπή από δυαδικό σε δεκαδικό.

Παράδειγµα µετατροπής του οκταδικού (576) 8 σε δεκαδική µορφή:


(576) 8 = 7 x 82 + 7 x 81 + 6 x 80
(σε δεκαδικό) = 448 + 56 + 6
= (510)10

Σχήμα 2.5. Μετατροπή από οκταδικό σε δεκαδικό.

Παράδειγµα µετατροπής του δεκαεξαδικού (2FA) 16 σε δεκαδική µορφή:


(2FA) 16 = 2 x 16 2 + 15 x 16 1 + 10 x 16 0
(σε δεκαδικό) = 512 + 240 + 10
= (762) 10

Σχήμα 2.6. Μετατροπή από δεκαεξαδικό σε δεκαδικό.

Για τη μετατροπή δεκαδικών σε οκταδικό ή δεκαεξαδικό σύστημα είναι προτιμότερη η


ενδιάμεση μετατροπή σε δυαδικό και η εφαρμογή, στη συνέχεια, του κανόνα των 3 και 4 bits αντί-
στοιχα, όπως απεικονίζεται στο επόμενο παράδειγμα.
~ 34 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

( 3 6 9 2 ) 10
Εφαρµογή αλγορίθµου µετατροπ ής
από δεκαδικό σε δυαδικό

(111001101100) 2

Κανόνας των «3» bits (7 1 5 4)8

(α) µετατροπ ή από δεκαδικό σε οκταδικό

( 2 6 8 6 ) 10
Εφαρµογή αλγορίθµου µετατροπ ής
από δεκαδικό σε δυαδικό

(1010 0111 1110) 2

(A 7 E)16
Κανόνας των «4» bits

(β) µετατροπ ή από δεκαδικό σε δεκαεξαδικό

Σχήμα 2.7. Μετατροπή από δυαδικό σε (α) οκταδικό και (β) δεκαεξαδικό.

2.3 Μονάδες πληροφορίας


Η ελάχιστη μονάδα δυαδικής πληροφορίας είναι το δυαδικό ψηφίο ή bit (binary digit). Σε ό, τι αφο-
ρά τους Η/Υ, το ελάχιστο μέγεθος της μονάδα αποθήκευσης πληροφορίας με κάποια σημασία είναι
τα 8 bits, τα οποία και ορίζουν την ψηφιολέξη ή byte, η οποία αποτελείται από 8 bits.
O όγκος των πληροφοριών και των δεδομένων μετριέται σε πολλαπλάσια του bit ή του byte.
Ειδικότερα, στο χώρο των ψηφιακών επικοινωνιών χρησιμοποιούνται τα πολλαπλάσια του bit, ενώ
σε ό, τι αφορά τη μέτρηση αποθηκευτικού όγκου αλλά και την εσωτερική λειτουργία των Η/Υ χρη-
σιμοποιούνται συνήθως τα πολλαπλάσια του byte.
Πιο συγκεκριμένα:

1 byte = 2 3 bits = 8 bits


1 KiloByte (KB) = 2 10 Bytes = 1024 Bytes
1 MegaByte (MB)= 2 10 KB= 2 20 Bytes= 1.048.576 Bytes
1 GigaByte (GB)= 2 10 MB= 2 20 KB = 2 30 Bytes = 1.073.741.824 Bytes
1 TeraByte (TB)= 2 10 GB =2 20 MB= 2 30 KB = 2 40 Bytes = 10.99.511.627.776 Bytes

Σχήμα 2.8. Μονάδες αποθήκευσης δυαδικής πληροφορίας με βάση το byte.


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 35 ~

Για λόγους απλοποίησης, κατά τη διάρκεια των μετατροπών ισχύουν οι παρακάτω παραδοχές:

1 KiloByte (KB) ~ 1000 Bytes


1 MegaByte (MB) ~ 1000 KB
1 GigaByte (GB) ~ 1000 MB
1 TeraByte (TB) ~ 1000 GB

Σχήμα 2.9. Παραδοχές μετατροπής για τους υπολογισμούς στην καθημερινότητα.

Αντίστοιχα ορίζονται και τα πολλαπλάσια του bit (ιδιαίτερα χρήσιμα στις επικοινωνίες των Η/Υ).
Συγκεκριμένα:

1 Kilobit (Kb) = 1000 bits


1 Megabit (Mb)= 1000 Kb = 1.000.000 bit
1 Gigabit (Gb)= 1000 Mb =1.000.000 Kb= 1.000.000.000 bit
1 Terabit (Tb)= 1000 Gb =1.000.000 Mb =1.000.000.000 Kb= 1.000.000.000.000 bit

Σχήμα 2.10. Μονάδες αποθήκευσης δυαδικής πληροφορίας με βάση το bit.

Είναι λοιπόν προφανές ότι η αποθήκευση (αλλά και η μετάδοση της πληροφορίας) στον
ψηφιακό κόσμο πραγματοποιείται με τη χρήση του δυαδικού συστήματος αρίθμησης. Κυρίαρχο
ρόλο σε αυτές τις διαδικασίες διαδραματίζει η μετατροπή (κωδικοποίηση ή ψηφιοποίηση) της πλη-
ροφορίας από την «αναλογική» της μορφή στη λεγόμενη «ψηφιακή» μορφή (analog to digital) αλλά
και αντίστροφα (digital to analog). Επομένως, οποιαδήποτε μορφή πληροφορίας, πριν αποθηκευτεί,
επεξεργαστεί ή μεταδοθεί με την χρήση των Η/Υ και των δικτύων επικοινωνίας πρέπει να κωδικο-
ποιηθεί στην κατάλληλη μορφή (βλέπε παρακάτω σχήμα).

1010010101
0101010100
1010100101
Αποκωδικοποίηση

0101010100
Κείµενο Κείµενο
Κωδικοποίηση

1001010101
εικόνα 0110110101 εικόνα
0101010101
ήχος 0101010100 ήχος
βίντεο
1010101001
0101010010
βίντεο
1001010001
010101011

«αναλογικός» κόσµος «ψηφιακός» κόσµος «αναλογικός» κόσµος

Σχήμα 2.11. Κωδικοποίηση δεδομένων για την αποθήκευσή τους σε Ηλεκτρονικό Υπολογιστή.
~ 36 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

2.4 Κώδικες αναπαράστασης αλφαριθμητικών συμβόλων


Για την αναπαράσταση των αλφαριθμητικών συμβόλων κειμένου έχουν σχεδιαστεί και προτυπο-
ποιηθεί μια σειρά από ακολουθίες bit (bit patterns), γνωστοί ως κώδικες (codes), σε καθεμία από
τις οποίες (ακολουθίες) αντιστοιχίζεται και ένα σύμβολο. Μέσω λοιπόν ενός δυαδικού κώδικα κει-
μένου κάθε χαρακτήρας ενός κειμένου (γράμμα, αριθμός, σημείο στίξεως) αντιστοιχίζεται σε μια
μοναδική δυαδική ακολουθία.

Κώδικας είναι μία αμφιμονοσήμαντη αντιστοίχιση συμβόλων ενός αλφαβήτου


σε ακολουθίες από δυαδικά ψηφία.

Ο κώδικας περιλαμβάνει, πέραν των συμβόλων (γραμμάτων ή αριθμών), και κάποιες συ-
γκεκριμένες λειτουργίες ελέγχου ή ειδικούς χαρακτήρες, όπως π.χ. καμπανάκι (BEL – bell), εκτέ-
λεση (CR - carriage return ή enter), αλλαγή γραμμής (LF - line feed), διαγραφή (DEL - delete), μια
- θέση - πίσω (BS - backspace) κ.λπ. Συνήθως, οι χαρακτήρες αυτοί ονομάζονται μη-εκτυπώσιμοι
(nonprintable) χαρακτήρες και αντιστοιχίζονται, όπως και οι υπόλοιποι, σε δυαδικές ακολουθίες.
Γενικά, ένας κώδικας του οποία το μήκος των δυαδικών ακολουθιών του είναι Ν bits ανά
χαρακτήρα (δηλαδή κώδικας μήκους Ν) έχει τη δυνατότητα να αναπαραστήσει 2Ν διαφορετικούς
χαρακτήρες. Επομένως, όσο μεγαλύτερο είναι το μήκος του κώδικα, τόσο περισσότερους χαρακτή-
ρες μπορεί να αναπαραστήσει ο κώδικας αυτός, αλλά και τόσο περισσότερο αυξάνει η πολυπλοκό-
τητα υλοποίησής του.
Για λόγους διαλειτουργικότητας (δηλαδή δυνατότητας ανταλλαγής δεδομένων μεταξύ δια-
φορετικών υπολογιστικών συστημάτων) προτάθηκαν, κατά καιρούς, κοινά αποδεκτές αναπαραστά-
σεις κείμενο-συμβόλων, ώστε κάθε αλφαριθμητικός χαρακτήρας να έχει ως αναπαράσταση την ίδια
αναγνωρίσιμη συγκεκριμένη ακολουθία δυαδικών ψηφίων.
Η αρχή έγινε το 1968, στο ξεκίνημα της εποχής των Η/Υ, από τον αμερικανικό οργανισμό
ANSI (American National Standards Institute, http://www.ansi.org) με την εισαγωγή του αμερι-
κανικού πρότυπου κώδικα για την ανταλλαγή πληροφοριών ASCII (American Standard Code for
Information Interchange – [1], [2]). Ο κώδικας ASCII αντικατέστησε τους κώδικες EBCDIC [3] και
τον ευρωπαϊκό Baudot [4] και επικράτησε ως το βασικό μέσο για την ανταλλαγή πληροφοριών (έως
και πρόσφατα). Ειδικότερα, ο κώδικας EBCDIC (Extended Binary Code for Data Interchange), που
αναπτύχθηκε από την IBM, χρησιμοποιούσε και αυτός 8 bits ανά χαρακτήρα, και, επομένως, μπο-
ρούσε να αναπαραστήσει 28=256 χαρακτήρες.
Στον κώδικα ASCII χρησιμοποιούνται 7 ή 8 δυαδικά ψηφία, ανάλογα με το αν πρόκειται
για τον απλό ή εκτεταμένο κώδικα ASCII. Στον απλό κώδικα ASCII περιλαμβάνονται χαρακτή-
ρες ελέγχου, σημεία στίξης, τελεστές λογικών ή αριθμητικών πράξεων, πεζά και κεφαλαία γράμ-
ματα και αριθμοί. Στην περίπτωση αυτή κωδικοποιούνται 27 = 128 διαφορετικοί χαρακτήρες.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 37 ~

Επειδή το πλήθος αυτό είναι πολύ περιορισμένο και δεν επαρκεί για να περιλάβει και τα γράμ-
ματα μιας επιπλέον γλώσσας (π.χ. ελληνικής ή κάποιας άλλης ευρωπαϊκής), χρησιμοποιείται ένα
ακόμη δυαδικό ψηφίο, οπότε είναι δυνατή η κωδικοποίηση ακόμη 128 χαρακτήρων. Ο κώδικας
ASCII των 8 ψηφίων έχει προτυποποιηθεί για χρήση σε ηλεκτρονικούς υπολογιστές με βάση το
πρότυπο ISO-8859 [5] και είναι γνωστός ως εκτεταμένος κώδικας ASCII (extended ASCII).
Ενδεικτικά αναφέρεται ότι το μέρος 7 προτύπου ISO-8859 (γνωστό ως ISO-8859-7) καλύπτει
την ελληνική γλώσσα. Στους πίνακες που ακολουθούν παρουσιάζεται η κωδικοποίηση ASCII.
~ 38 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Πίνακας 2.1. Η κωδικοποίηση ASCII (Μέρος 1ο).


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 39 ~

Πίνακας 2.2. Η κωδικοποίηση ASCII (Μέρος 2ο). Πηγή (ASCII, https://en.wikipedia.org/wiki/ASCII).

Αλλά στη σημερινή ποικιλία γλωσσών και κειμένων δεν επαρκεί ούτε καν η ταυτόχρονη
συνύπαρξη δύο γλωσσών. Η απαίτηση για την υποστήριξη όλων των γραπτών γλωσσών με έναν ενιαίο
κώδικα οδήγησε σε μια παγκόσμια κωδικοποίηση που θα μπορεί να καλύπτει ένα μεγάλο εύρος τους.
Αυτός είναι ο λεγόμενος κώδικας UNICODE [6], ο οποίος, στην αρχική του έκδοση, χρησιμοποιεί δύο
δυαδικές λέξεις (δηλαδή δύο bytes) ή 16 δυαδικά ψηφία για κάθε χαρακτήρα. Ο κώδικας αυτός έχει
τυποποιηθεί με το πρότυπο ISO-10646 και έχει δύο μέρη, το ISO 10646-1 και το ISO 10646-2, στα
οποία ορίζονται συνολικά περίπου 128.237 χαρακτήρες (9.0 έκδοση, Ιούνιος 2016). Το πρώτο μέρος
καλύπτει όλες τις «ζωντανές» γλώσσες και είναι γνωστό ως Basic Multilingual Plane (ενδεικτικά
αναφέρεται ότι το πρώτο μέρος του προτύπου έχει μέγεθος 1.000 σελίδες και καλύπτει 49.000 χαρα-
κτήρες). Τα επόμενα δεκαέξι (16) μέρη καλύπτουν διάφορες ανάγκες αναπαράστασης ειδικών χαρα-
κτήρων, ιερογλυφικών κ.λπ. Η δομή του προτύπου UNICODE εμφανίζεται στον παρακάτω πίνακα.

Πίνακας 2.3. Δομή προτύπου UNICODE.


~ 40 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Παραδείγματα/πληροφορίες αναπαράστασης χαρακτήρων σε μορφή UNICODE:


–– Αγγλικό γράμμα G: U+0047 (δεκαεξαδικός)
–– Αντιστοίχιση χαρακτήρων ASCII σε UNICODE: U+0000 ως και U+007F (0 ως και 128,
basic latin character set)
–– Συνδυασμός χαρακτήρων (combining characters), π.χ. διαλυτικά: ο συνδυασμός U+0075
(u) και U+0038 (¨) θα παράγει τον χαρακτήρα (ü). Σε αρκετές περιπτώσεις υπάρχει πιθανό-
τητα η αναπαράσταση σύνθετων χαρακτήρων (composite characters) να επιτυγχάνεται με
ένα μόνο κωδικό UNICODE.
Το άνω όριο του προτύπου UNICODE σε ό, τι αφορά το μέγεθος της συμβολοσειράς κάθε
χαρακτήρα είναι τα 32 bits (4 X 8 bits ή 4 bytes), επιτρέποντας έτσι την αναπαράσταση 232 =
4.294.967.296 διαφορετικών γραμμάτων, συμβόλων, ιδεογραφημάτων κ.λπ. Για την κωδικοποίηση
του UNICODE σε συμβατή μορφή για ηλεκτρονικούς υπολογιστές καθορίστηκαν δύο πρότυπα και
συγκεκριμένα το Unicode Transformation Format (UTF – [7]) και το Universal Coded Character Set
(UCS – [8], [9]).
Βασική επιδίωξη των κωδικοποιήσεων αυτών είναι η διατήρηση της προς τα πίσω συμβα-
τότητας (backward compatibility) με τους υπάρχοντες κώδικες (π.χ. ASCII) αλλά και η συμβατότη-
τα με την αρχιτεκτονική των διαφόρων υπολογιστικών συστημάτων (π.χ. υπολογιστές που μπορούν
να υποστηρίξουν μήκος λέξης 8 bit ή 16 bit ή 32 bit ή 64 bit), καθώς και της ανταλλαγής πληροφορι-
ών μέσω του Διαδικτύου. Για την κάλυψη όλων των περιπτώσεων έχουν οριστεί ο UTF-8 (ο οποίος
απαιτεί από 1-4 bytes για την αναπαράσταση οποιαδήποτε χαρακτήρα του προτύπου UNICODE,
ο UTF-16 (ο οποίος απαιτεί από 2 ή 4 bytes για την αναπαράσταση οποιαδήποτε χαρακτήρα του
προτύπου UNICODE και αποτελεί την πιο διαδεδομένη κωδικοποίηση των πληροφοριών στο Δια-
δίκτυο) και ο UTF-16 (ο οποίος απαιτεί από 4 bytes για την αναπαράσταση οποιαδήποτε χαρακτήρα
του προτύπου UNICODE).
Παρακάτω ακολουθούν ορισμένα παραδείγματα κωδικοποίησης με τη χρήση UTF (Πίνα-
κας 2.4), καθώς και η αντιστοιχία/συμβατότητα μεταξύ των διαφόρων κωδικοποιήσεων που κατά
καιρούς έχουν χρησιμοποιηθεί (Πίνακας 2.5), με στόχο πάντα τη διατήρηση της προς τα πίσω συμ-
βατότητας.

Πίνακας 2.4. Κωδικοποίηση λέξης «Greece».


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 41 ~

Πίνακας 2.5. Αντιστοιχία/συμβατότητα ή άλλη επιλογή μεταξύ των διαφόρων κωδικοποιήσεων.

Στο διάγραμμα που ακολουθεί απεικονίζεται το ποσοστό των διαθέσιμων ιστοσελίδων ανά-
λογα με το επιλεγμένο σχήμα κωδικοποίησης του περιεχομένου τους (δηλαδή UTF, ASCII ή ISO-
8859). Είναι προφανής η σταδιακή επικράτηση της κωδικοποίησης UTF. Σήμερα (Αύγουστος 2016)
το ποσοστό για την κωδικοποίηση UTF, ξεπερνά το 87,5% - Πηγή: Usage of character encodings
for websites https://w3techs.com/technologies/overview/character_encoding/all).

Σχήμα 2.12. Ποσοστό ιστοσελίδων στο Διαδίκτυο ανά ακολουθούμενο πρότυπο κωδικοποίησης
χαρακτήρων. (Πηγή: Wikimedia, https://commons.wikimedia.org/wiki/File:UnicodeGrow2b.png)

Τέλος, στον πίνακα που ακολουθεί παρατίθενται συνοπτικά μερικά στοιχεία για τις πιο σημαντικές
κωδικοποιήσεις γραμμάτων, αριθμών και συμβόλων στην ιστορία των ηλεκτρονικών υπολογιστών.
~ 42 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Πίνακας 2.6. Συνοπτική παρουσίαση κωδίκων αναπαράστασης κειμένου.

2.5 Αναπαράσταση αριθμητικών δεδομένων


Πέραν του κειμένου, υπάρχουν και τα αριθμητικά δεδομένα, για τα οποία υπάρχει ανάγκη αποθή-
κευσής τους στη μνήμη του υπολογιστή.
Μια σειρά αριθμών μπορεί να αποτελούν δεδομένα εισόδου ενός προγράμματος (πχ. τα
ύψη των αθλητών μιας αθλητικής διοργάνωσης) ή να είναι δεδομένα που προκύπτουν από την εκτέ-
λεση μιας εφαρμογής ή να είναι δυαδικοί αριθμοί που έχουν προκύψει από τη μετατροπή σήματος
από αναλογικό σε ψηφιακό (analog to digital) και την ψηφιακή κωδικοποίηση των τιμών ενός φυ-
σικού σήματος, όπως των εντάσεων ενός ήχου ή των χρωματικών εντάσεων των εικονο-στοιχείων
μιας εικόνας (βλέπε παράγραφο 2.6).
Στην περίπτωση ενός δεκαδικού αριθμού, διατίθενται δύο τρόποι ψηφιακής αναπαράστα-
σης, είτε η κωδικοποίηση κατά ASCII ψηφίο προς ψηφίο (βλέπε παράγραφο 2.4) είτε η δυαδική του
αναπαράσταση (βλέπε παράγραφο 2.2).
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 43 ~

Για να γίνει σύγκριση της οικονομικότερης από την άποψη αποθηκευτικού χώρου λύσης,
πρέπει να καθοριστεί η συγκεκριμένη κωδικοποίηση κατά ASCII, η οποία πλέον είναι η UNICODE.
Συνεπώς, κάθε αριθμός Ν ψηφίων κωδικοποιείται κατά ASCII μέσω 2Ν bytes. Αντίθετα η δυαδική
αναπαράσταση ενός αριθμού από 0-8 απαιτεί 1 byte (κατά ACSII 2 bytes), μεταξύ 9 και 65.535
(216-1) 2 bytes (κατά ASCII 2-10 bytes), μεταξύ 65.536 και 16.717.215 (224-1) 3 bytes (κατά ASCII
10-16 bytes) και μεταξύ 16.717.216 και 4.294.967.295 (232-1) 4 bytes (κατά ASCII 16-20 bytes). Η
υπεροχή στη χρήση της δυαδικής αναπαράστασης ως κωδικοποίησης σε σχέση με την κωδικοποίη-
ση κατά ASCII είναι καταφανής. Αλλά και στην περίπτωση των δυαδικών αριθμών, η δυαδική του
μορφή, που είναι ήδη η δυαδική του αναπαράσταση, υπερέχει κατά πολύ της κωδικοποίησης κατά
ASCII, καθώς κάθε byte της δυαδικής αναπαράστασης κωδικοποιείται με 2x8=16 bytes κατά ASCII,
οπότε η σχέση είναι 1 προς 16.

2.6 Αναπαράσταση εικόνων


Μια εικόνα (έγχρωμη ή ασπρόμαυρη ή σε τόνους γκρι) μπορεί να αναπαρασταθεί μέσω μιας από
τις παρακάτω δύο τεχνικές: την ψηφιογραφική (bitmap ή raster graphics) και τη διανυσματική
(vector graphics).
Με την ψηφιογραφική μέθοδο κάθε εικόνα διαιρείται σε μια διάταξη από pixels (picture
elements – εικονοστοιχεία ή στοιχεία εικόνας). Ο αριθμός των pixels, και συνεπώς το μέγεθός τους,
για συγκεκριμένες διαστάσεις της εικόνας, καθορίζουν την ποιότητα της απεικόνισης και συνδέο-
νται άμεσα με την ανάλυση (resolution), η οποία εκφράζει τον αριθμό pixels στη μονάδα μήκους.
Μια ανάλυση, για παράδειγμα 300 dpi (dots per inch), σημαίνει ότι μία ίντσα της εικόνας κόβεται
σε τριακόσια (300) μέρη (ίσης επιφάνειας), καθένα από τα οποία θα πρέπει να αναπαρασταθεί με
κάποιον τρόπο αριθμητικά ως προς το χρώμα του.
Στη διανυσματική αναπαράσταση των εικόνων επικρατεί η χρήση μαθηματικών εξισώσεων
για την περιγραφή των στοιχείων που τη συνθέτουν.
Αναλυτική περιγραφή για τις δύο μεθόδους ακολουθεί στις επόμενες παραγράφους.

2.6.1 Ψηφιογραφική μέθοδος


Η ψηφιογραφική (bitmap ή raster) μέθοδος απεικόνισης στηρίζεται στη χρήση οπτικών συσκευών,
όπως κάμερες, φωτογραφικές μηχανές, ψηφιοποιητές (scanners) κ.λπ. Βασική αρχή αποτελεί η χρή-
ση ενός δισδιάστατου πίνακα (dot matrix structure), συνήθως ορθογώνιου, σε κάθε κελί του οποίου
(σημείο ή pixel) αποθηκεύονται οι κατάλληλες αριθμητικές τιμές για την απόδοση του χρώματος. Οι
διαστάσεις του πίνακα καθορίζουν και την ανάλυση που θα έχει η εικόνα (π.χ. 1000Χ1000 σημεία ή
pixels καθορίζουν ως ανάλυση της εικόνας το 1.000.000 pixels ή το 1 Mpixel) και εξαρτώνται από
τον εξοπλισμό ψηφιοποίησης και τις δυνατότητές του. Ακόμα ένα μέτρο για την αξιολόγηση της «ποι-
ότητας» μιας εικόνας είναι η πυκνότητα των pixels (και συνδέεται άμεσα με τις διαστάσεις τους), η
οποία καθορίζεται με βάση τον αριθμό τους σε μια περιοχή με ακμή μια (1) ίντσα ή αλλιώς ppi (pixels
~ 44 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

per inch). Οι οθόνες υπολογιστών ή άλλων συσκευών, συνήθως διαθέτουν μια ικανότητα απεικόνι-
σης που κυμαίνεται από 72 ppi μέχρι 300 ppi (σε εξαιρετικές περιπτώσεις οθονών υψηλής ανάλυσης
κινητών τηλεφώνων). Σε ό, τι αφορά όμως τις εκτυπώσεις, ορίζεται το αντίστοιχο μέγεθος που καθο-
ρίζει τη λεπτομέρεια εκτύπωσης μιας εικόνας και είναι ο αριθμός των κουκίδων ανά ίντσα ή αλλιώς
dpi (dots per inch). Η λεπτομέρεια εκτύπωσης ενός εκτυπωτή μπορεί να φτάσει έως και τα 2400 dpi.
Τόσο η ανάλυση μιας εικόνας, όσο και η πυκνότητα, ως μεγέθη αξιολόγησης βρίσκουν εφαρ-
μογή, όπως θα δούμε και σε επόμενες παραγράφους, τόσο στις οθόνες των ηλεκτρονικών υπολογι-
στών, όσο και στους εκτυπωτές αλλά και τις συσκευές ψηφιοποίησης. Για την καλύτερη κατανόηση
των βασικών αρχών της ψηφιογραφικής μεθόδου ακολουθούν ορισμένα παραδείγματα.
Παράδειγμα 1. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 45 pixels (9Χ5),
καθένα από τα οποία είναι σε μια από τις καταστάσεις άσπρο ή μαύρο.

Σχήμα 2.13. (α) Διαμερισμός σε άσπρα ή μαύρα pixels ασπρόμαυρης εικόνας 5x9 – (β) αναπαράστα-
ση με την ψηφιογραφική μέθοδο – μέγεθος 45 bits.

Με δεδομένο ότι για τη συγκεκριμένη εικόνα έχουμε μόνο δύο χρωματικούς τόνους, για την
κωδικοποίησή τους χρειαζόμαστε μόνο ένα bit. Συγκεκριμένα, το μηδέν (0) αντιστοιχεί στο άσπρο
χρώμα και το ένα (1) στο μαύρο. Επομένως, για κάθε pixel της εικόνας απαιτείται 1 ψηφίο (bit) για
την αποθήκευση του χρωματικού τόνου, άρα το μέγεθος του ψηφιακού αρχείου θα είναι 45 pixels *
1 bit ανά pixel = 45 bits ή 6 bytes (3 bits θα παραμείνουν χωρίς χρήση).
Παράδειγμα 2. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 99 pixels (9Χ11)
και σε κάθε pixel αντιστοιχεί μια χρωματική αναπαράσταση από τις διαθέσιμες, όπως άσπρο, ανοι-
κτό γκρι, σκούρο γκρι και μαύρο.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 45 ~

Σχήμα 2.14. (α) Διαμερισμός pixels σε τέσσερις χρωματικούς τόνους εικόνας 9x11 – (β) αναπαρά-
σταση με την ψηφιογραφική μέθοδο – μέγεθος 198 bits.

Με δεδομένο ότι για τη συγκεκριμένη εικόνα έχουμε τέσσερις (4) χρωματικούς τόνους, για
την κωδικοποίησή τους χρειαζόμαστε δύο (2) bits. Συγκεκριμένα ορίζουμε την εξής κωδικοποίηση:
00=άσπρο, 01=ανοικτό γκρι, 10=σκούρο γκρι και 11=μαύρο. Επομένως, για κάθε pixel της εικόνας
απαιτούνται δύο ψηφία (bits) για την αποθήκευση του χρωματικού τόνου, άρα το μέγεθος του ψηφιακού
αρχείου θα είναι 99 pixels * 2 bits ανά pixel = 198 bits ή 25 bytes (2 bits θα παραμείνουν χωρίς χρήση).
Παράδειγμα 3. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 99 pixels (9Χ11)
και σε κάθε pixel αντιστοιχεί μια χρωματική αναπαράσταση, κάνοντας χρήση του χρωματικού κώ-
δικα RGB (Red Green Blue) [10]. Ειδικότερα, το μοντέλο χρωματικής αναπαράστασης RGB προϋ-
ποθέτει ότι κάθε χρώμα μπορεί να αναπαρασταθεί με τον συνδυασμό των τριών βασικών χρωμάτων,
δηλαδή του κόκκινου (red), του πράσινου (green) και του μπλε (blue).

Σχήμα 2.15. Μοντέλο αναπαράστασης χρωματικών τόνων RGB.


(Πηγή: Wikimedia, https://commons.wikimedia.org/wiki/File:AdditiveColor.svg).
~ 46 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Επομένως, για την αναπαράσταση κάθε χρώματος απαιτούνται οι τιμές με τις οποίες κάθε
βασικό χρώμα συμμετέχει στη δημιουργία του. Συγκεκριμένα, η τριάδα αυτή μπορεί να εκφραστεί
με τους τρόπους που απεικονίζονται στον παρακάτω πίνακα.

Πίνακας 2.7. Αντιστοιχία/συμβατότητα ή άλλη επιλογή μεταξύ των διαφόρων κωδικοποιήσεων.

Με βάση τον πιο πάνω πίνακα προκύπτει ότι για την αποθήκευση του χρωματικού τόνου
για κάθε pixel απαιτούνται 24 bits (8bits ανά χρώμα Χ 3 χρώματα). Η χρωματική αναπαράσταση
RGB με τη χρήση 8 bits για την κωδικοποίηση ανά χρώμα είναι γνωστή ως true color και μπορεί να
αναπαραστήσει 224 ή 16.777.216 διαφορετικούς χρωματικούς συνδυασμούς, ξεπερνώντας τη δια-
κριτική ικανότητα του ανθρώπινου ματιού (περίπου 10.000.000 χρωματικοί τόνοι). Οι συνδυασμοί
χρωμάτων που μπορεί να υποστηρίξει μια απεικονιστική συσκευή ή μια συσκευή ψηφιοποίησης, σε
σχέση με τον αριθμό των bits που απαιτούνται για την κωδικοποίησή τους, προσδιορίζουν το βάθος
χρώματος – color depth. Ένας άλλος τρόπος αναπαράστασης των χρωματικών τόνων είναι η αφαιρε-
τική προσέγγιση του μορφότυπου CMYK [11] (Cyan - Magenta - Yellow - Black). Με βάση αυτό το
μορφότυπο, ακολουθείται η μέθοδος αναπαράστασης των χρωμάτων όπως συμβαίνει στη φύση και
κατά τη διάρκεια της εκτύπωσης στο χαρτί, όπου το φόντο είναι το λευκό (μηδενική απορρόφηση
χρώματος), από το οποίο μειώνεται στη συνέχεια η φωτεινή λαμπρότητα, αφαιρώντας χρωματικές
συνιστώσες του κυανού, του ματζέντα και του κίτρινου, ενώ για την καλύτερη τελική χρωματική
απόδοση προστίθεται και μια συνιστώσα του μαύρου. Για τη χρωματική αναπαράσταση με βάση το
πρότυπο CMYK, απαιτούνται 4 bytes ανά pixel.
Επανερχόμενοι στην εικόνα του παραδείγματος, το μέγεθος του ψηφιακού αρχείου αποθή-
κευσης θα έχει μέγεθος 99 pixels * 24 bits ανά pixel = 2.376 bits ή 297 bytes.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 47 ~

Σχήμα 2.16. (α) Διαμερισμός pixels με βάση το χρωματικό μοντέλο RGB εικόνας 9x11 – (β) αναπα-
ράσταση με την ψηφιογραφική μέθοδο – μέγεθος 2376 bits.

2.6.2 Διανυσματική μέθοδος


Η διανυσματική τεχνική περιγράφει τα σχήματα με γεωμετρικό τρόπο, μέσω γραμμών, ορθογώνι-
ων, ελλείψεων ή τόξων. Βασικά στοιχεία για τη διανυσματική τεχνική είναι τα εξής: (α) τα σημεία
(nodes), τα οποία για τις δισδιάστατες απεικονίσεις ορίζονται μέσω των γεωμετρικών συντεταγμέ-
νων (x,y) και (β) οι ακμές ή μονοπάτια (paths) μεταξύ δύο σημείων, με χαρακτηριστικά όπως το
χρώμα, η μορφή, η καμπυλότητα, το πάχος κ.λπ.

Σχήμα 2.17. Χρήση σημείων και ακμών για τη δημιουργία διανυσματικών εικόνων.
(Πηγή: W3C, https://www.w3.org/TR/SVG/paths.html).
~ 48 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Όπως είναι αναμενόμενο, η διαδικασία δημιουργίας εικόνων με τη διανυσματική μέθοδος εί-


ναι αρκετά πολύπλοκη και δεν ανταποκρίνεται στις απαιτήσεις της απεικόνισης ρεαλιστικών σκηνών.
Τα τελευταία χρόνια, με την εξέλιξη των υπολογιστών και την αύξηση της υπολογιστικής ισχύος τους,
έχει σημειωθεί αξιοσημείωτη πρόοδος σε ό, τι αφορά την τρισδιάστατη απεικόνιση τόσο φανταστικών
όσο και ρεαλιστικών σκηνών, καθώς και στην εφαρμογή τεχνικών τρισδιάστατης ψηφιοποίησης (3d
scanning). Επιπλέον, λόγω ακριβώς της μαθηματικής περιγραφής των στοιχείων της εικόνας που έχει
δημιουργηθεί με τη χρήση διανυσμάτων, είναι πολύ εύκολη η αλλαγή μεγέθους χωρίς αλλοίωση της
πληροφορίας, αλλά και ο μικρότερος όγκος δεδομένων που απαιτείται για την αποθήκευσή τους.
Αντίθετα, στις αναπαραστάσεις με την ψηφιογραφική μέθοδο, αφενός η επαναφορά μιας
εικόνας σε ασυμπίεστη μορφή οδηγεί συνήθως σε απώλεια πληροφορίας, και αφετέρου, η μεγέθυν-
ση της εικόνας οδηγεί σε μείωση της ποιότητας (πιξέλιασμα - pixelation), εφόσον δεν προστίθενται
επιπλέον pixels αλλά απλώς επεκτείνεται σε διάσταση η έκταση του κάθε υπάρχοντος pixel.

Μεγένθυνση Χ 7

Διανυσµατική µέθοδος

Ψηφιογραφική µέθοδος

Σχήμα 2.18. Φαινόμενο pixilation μεταξύ ψηφιογραφικής και διανυσματικής μεθόδου αναπαράστασης
εικόνων. (Πηγή: Wikimedia, https://commons.wikimedia.org/wiki/File:VectorBitmapExample.svg).

2.6.3 Συμπίεση αρχείων εικόνων


Το μέγεθος του όγκου ενός ψηφιακού αρχείου για την αποθήκευση μιας εικόνας που έχει δημιουργη-
θεί με την ψηφιογραφική μέθοδο εξαρτάται από την ανάλυσή της, τους χρωματικούς τόνους (color
depth) και το αν εφαρμόζεται ή όχι κάποιος αλγόριθμος συμπίεσης (compression algorithm). Για
παράδειγμα, αν ένας ψηφιοποιητής (scanner) έχει διακριτική ικανότητα 300 dpi και βάθος χρώμα-
τος true color (δηλαδή 24 bit ανά pixel), τότε, για να ψηφιοποιηθεί μια σελίδα Α4, δηλαδή επιφάνεια
με μέγεθος 21 Χ 29 εκατοστά ή 8 Χ 11 ίντσες (περίπου), θα απαιτηθούν [8 Χ 300 dpi] X [11 X
300dpi] X 24 bits = 2.400 pixels X 3.300 pixels X 24 bits = 190.080.000 bits ή ~ 190 Mbits ή ~ 23,76
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 49 ~

Mbytes. Αντίστοιχα υψηλά μεγέθη προκύπτουν και για την περίπτωση λήψης μιας φωτογραφίας από
μια σύγχρονη κάμερα ή ένα κινητό τηλέφωνο. Συγκεκριμένα, αν η ανάλυση της κάμερας ή του κι-
νητού ανέρχεται στα 16 Mpixels, τότε για τη λήψη μόνο μιας φωτογραφίας με βάθος χρώματος true
color θα απαιτούνταν 16 Mpixels X 24 bit = 384 Mbits ή 48 Μ bytes.
Είναι προφανές, ότι τα μεγέθη τόσο για τη ψηφιοποιημένη σελίδα όσο και για τη λήψη της
φωτογραφίας, όπως προκύπτουν από τους προηγούμενους υπολογισμούς, είναι «απαγορευτικά» σε
σχέση με τις συνηθισμένες αποθηκευτικές ικανότητες των υπολογιστικών συστημάτων. Η λύση δό-
θηκε με την εφαρμογή αλγορίθμων συμπίεσης αρχείων αλλά και πιο εξειδικευμένων αλγορίθμων,
προσαρμοσμένων για την αποθήκευση εικόνων.
Οι εν λόγω αλγόριθμοι κατατάσσονται σε δύο μεγάλες κατηγορίες: τους μη απωλεστι-
κούς αλγορίθμους (lossless compression algorithms) και τους απωλεστικούς αλγορίθμους (lossy
compression algorithms). Αναλυτικότερα:
–– Μη απωλεστικοί αλγόριθμοι: Πρόκειται για αλγορίθμους τα πρωτογενή δεδομένα (raw
data) των οποίων διατηρούνται στο ακέραιο μετά τη διαδικασία της συμπίεσης και είναι
δυνατόν να ανακτηθούν πλήρως μέσω της αντίστροφης διαδικασίας. Με άλλα λόγια, δεν
πραγματοποιείται καμία απώλεια δεδομένων σε σχέση με τα δεδομένα της ψηφιοποίησης.
Οι πιο γνωστοί «γενικού σκοπού» μη απωλεστικοί αλγόριθμοι συμπίεσης είναι η κωδικο-
ποίηση Huffman ή Huffman Codding [12], [13], ο LZW [14] (αλγόριθμος των Lempel–
Ziv–Welch) και ο DEFLATE (μια παραλλαγή του LZW), στους οποίους στηρίζονται και τα
μορφότυπα αρχείων εικόνων PNG, GIF και TIFF.
–– Απωλεστικοί αλγόριθμοι: Πρόκειται για αλγορίθμους μέρος από τα πρωτογενή δεδομένα των
οποίων «χάνεται», με στόχο τη μείωση του μεγέθους του ψηφιακού αρχείου στο οποίο αυτά
τελικά αποθηκεύονται. Η «απώλεια» δεδομένων ως μέθοδος συμπίεσης μπορεί να εφαρμοστεί
σε περιπτώσεις που δεν επηρεάζει το τελικό αποτέλεσμα, όπως π.χ. λεπτομέρειες σε εικόνες ή
ήχο που η ανθρώπινη όραση ή ακοή δε μπορεί να διακρίνει έτσι και αλλιώς. Δεν μπορεί όμως
να ισχύσει στις περιπτώσεις που έστω και η παραμικρή αλλοίωση των δεδομένων (π.χ. αρχεία
κειμένου) θα οδηγούσε σε ολική αδυναμία ανάκτησης του συνόλου της πληροφορίας. Επιπλέ-
ον, ειδικά σε ό, τι αφορά την αποθήκευση (ή και μετάδοση) εικόνας ή ήχου, η «απώλεια» δε-
δομένων, με την εφαρμογή έξυπνων αλγορίθμων, μπορεί να αφορά το μέρος της πληροφορίας
που αντιστοιχεί στον «θόρυβο - noise» ή σε τυχόν άλλες αλλοιώσεις. Με τον τρόπο αυτό όχι
μόνο τελικά μειώνεται ο όγκος του τελικού ψηφιακά παραγόμενου αρχείου, αλλά βελτιώνεται
και η ποιότητα. Οι πιο γνωστοί απωλεστικοί αλγόριθμοι συμπίεσης για εικόνες είναι o JPG
(Joint Photographic Experts Group) [15] [καθώς και ο TIFF (Tagged Image File Format)].
Στις επόμενες παραγράφους παρουσιάζεται ένα παράδειγμα συμπίεσης μέσω Huffman coding,
καθώς και πληροφορίες σχετικά με τα πιο δημοφιλή μορφότυπα αποθήκευσης και συμπίεσης
δεδομένων εικόνας.
~ 50 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

2.6.4 Παράδειγμα αλγορίθμου Huffman Coding


Ας υποθέσουμε ότι θέλουμε να κωδικοποιήσουμε, σε ψηφιακή μορφή, την έκφραση «ΚΑΛΗΜΕ-
ΡΑ ΕΛΛΑΔΑ». Κάνοντας χρήση της κωδικοποίησης ISO-8859-7 (εκτεταμένος κώδικας ASCII που
συμπεριλαμβάνει και την ελληνική γλώσσα), θα χρειαζόμασταν για κάθε γράμμα και σύμβολο 8
bits για την αναπαράστασή τους σε δυαδική μορφή. Συγκεκριμένα, η παραπάνω έκφραση έχει 15
χαρακτήρες (14 κεφαλαία γράμματα και το κενό («_») μεταξύ των δύο λέξεων, άρα θα απαιτούσε
15 Χ 8 bits = 120 bits συνολικά.

Πίνακας 2.8. Κωδικοποίηση έκφρασης με τη χρήση του προτύπου ISO-8859-7.

Βασική αρχή στην οποία στηρίζεται η κωδικοποίηση Huffman είναι η εκμετάλλευση της συ-
χνότητας εμφάνισης ενός συμβόλου (για το παρόν παράδειγμα ενός χαρακτήρα, για μια εικόνα ενός
χρώματος, για ένα ηχητικό κλιπ ένα επίπεδο έντασης κ.λπ.). Συγκεκριμένα, ο αλγόριθμος σκοπεύει
να δημιουργήσει μια νέα κωδικοποίηση με στόχο την αναπαράσταση των πιο συχνά εμφανιζόμενων
συμβόλων με όσο το δυνατόν μικρότερο αριθμό bits. Στο παράδειγμά μας, ο αλγόριθμος θα ακολου-
θούσε τα εξής βήματα/στάδια.
1ο Βήμα – Εύρεση συχνοτήτων εμφάνισης ανά σύμβολο.
Υπολογίζουμε τον αριθμό εμφανίσεων κάθε χαρακτήρα στην υπό εξέταση έκφραση (βλέπε παρα-
κάτω πίνακα).

Πίνακας 2.9. Αριθμός εμφανίσεων ανά χαρακτήρα.


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 51 ~

Βήμα 2ο – Δημιουργία δένδρου Huffman


Πριν προχωρήσουμε στην επίδειξη του τρόπου δημιουργίας του δένδρου Huffman παρουσιάζουμε
τις βασικές έννοιες ενός δένδρου ή της δενδρικής αναπαράστασης της πληροφορίας (tree graph).

1 R Κόµβος Ρίζα – Root Node


N

2 3
N N Κόµβος - Node

3 4 5
N N N
L L L
Κόµβος Φύλλο – Leaf Node

Σχήμα 2.19. Βασική δενδρική μορφή.

Η δενδρική μορφή αναπαράστασης της πληροφορίας αποτελεί μια υποκατηγορία της Θεωρίας
των Γραφημάτων ή Γράφων [16]. Όπως φαίνεται και από το παραπάνω σχήμα, σε έναν γράφο (graph)
υπάρχουν οι κορυφές ή κόμβοι (vertices/nodes) και οι ακμές (edges). Κάθε κόμβος μπορεί να συνδέε-
ται με έναν άλλον με μια ακμή, απλή ή κατευθυνόμενη. Στη δεύτερη περίπτωση ο γράφος αποκαλείται
«κατευθυνόμενος γράφος» ή “directed graph”. Για την περίπτωση του δένδρου ισχύουν τα εξής:
–– Κάθε κόμβος ενώνεται με έναν άλλον κόμβο μόνο μέσω ενός μονοπατιού (path) αποτελού-
μενου από ακμές (συνεκτικότητα – μη κυκλικός γράφος).
–– Στην περίπτωση που το δένδρο έχει μοναδικά αριθμημένους κόμβους ή είναι κατευθυνόμε-
νος μπορούν να οριστούν οι εξής κατηγορίες κόμβων:
• Κόμβος πατέρας (parent node): πρόκειται για τον κόμβο στο αρχικό σημείο μιας ακμής
σε έναν κατευθυνόμενο γράφο.
• Κόμβος παιδί (child node): πρόκειται για τον κόμβο στο τελικό σημείο μιας ακμής σε
ένα κατευθυνόμενο γράφο.
• Κόμβος ρίζα (root node): πρόκειται για τον κόμβο στον οποίο δεν υπάρχουν εισερχόμε-
νες ακμές παρά μόνο εξερχόμενες (π.χ. κόμβος 1 στο παραπάνω σχήμα) – Κόμβος χωρίς
γονέα.
• Κόμβος φύλλο (leaf node): πρόκειται για τον κόμβο στον οποίο δεν υπάρχουν εξερχόμε-
νες ακμές παρά μόνο εισερχόμενες (π.χ. κόμβοι 3,4 και 5 στο παραπάνω σχήμα) – Κόμ-
βος χωρίς παιδιά.
• Ενδιάμεσος κόμβος (node): πρόκειται για τον κόμβο στον οποίο υπάρχουν εξερχόμενες
και εισερχόμενες ακμές (π.χ. κόμβοι 2 και 3 στο παραπάνω σχήμα).
Με βάση τα παραπάνω, για τους γράφους και τον αριθμό εμφανίσεων ανά χαρακτήρα, μπο-
ρούμε να προχωρήσουμε στη δημιουργία του δένδρου Huffman, ως εξής:
~ 52 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

–– Καταγράφουμε όλους τους χαρακτήρες και τον αριθμό των εμφανίσεών τους στην έκφραση
κατά φθίνουσα σειρά. Τα ζευγάρια χαρακτήρας – αριθμός εμφανίσεων αποτελούν τα φύλλα/
leaves του δένδρου (κόμβοι χωρίς παιδιά).

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.20. Χαρακτήρες κατά φθίνουσα σειρά με βάση τη συχνότητα εμφάνισής τους.

–– Στη συνέχεια, δημιουργούμε νέους κόμβους (nodes) στο δένδρο, ενώνοντας τα φύλλα με τις
μικρότερες συχνότητες (προσθήκη κόμβου γονέα), έως ότου να δημιουργηθεί ο κόμβος ρίζα
(root node – κόμβος χωρίς πατέρα). Σε κάθε ένωση, ο κόμβος πατέρας (parent node) που
προκύπτει έχει ως αριθμό εμφανίσεων το άθροισμα των εμφανίσεων των κόμβων παιδιών
του (child nodes). Στο παραπάνω παράδειγμα, στο πρώτο «πέρασμα» του αλγορίθμου, ενώ-
νονται διαδοχικά οι κόμβοι «_» (κενό) και «Δ» (προκύπτει ο «_Δ» με αριθμό εμφανίσεων
2), «Μ» και «Ρ» (προκύπτει ο «ΜΡ» με αριθμό εμφανίσεων 2) και ο «Κ» με το «Η» (προ-
κύπτει ο «ΚΗ» με αριθμό εμφανίσεων 2).

ΚΗ 2 ΜΡ 2 _Δ 2

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.21. 1ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.

–– Στο δεύτερο «πέρασμα» του αλγορίθμου, ενώνονται διαδοχικά οι κόμβοι «Ε» και «ΚΗ»
(προκύπτει ο «ΕΚΗ» με αριθμό εμφανίσεων 4) και ο «ΜΡ» με το «_Δ» (προκύπτει ο
«ΜΡ_Δ» με αριθμό εμφανίσεων 4).

ΕΚΗ 4 ΜΡ_Δ 4

ΚΗ 2 ΜΡ 2 _Δ 2

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.22. 2ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.

–– Στο τρίτο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «Α» και «Ε» (προκύπτει ο «ΑΕ»
με αριθμό εμφανίσεων 7).
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 53 ~

ΕΚΗ 4 ΜΡ_Δ 4

ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.23. 3ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.

–– Στο τέταρτο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «ΕΚΗ» και «ΜΡ_Δ» (προκύ-
πτει ο «ΕΚΗΜΡ_Δ» με αριθμό εμφανίσεων 8).

ΕΚΗΜΡ_Δ 8

ΕΚΗ 4 ΜΡ_Δ 4

ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.24. 4ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.

–– Στο πέμπτο και τελευταίο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «ΑΛ» και
«ΕΚΗΜΡ_Δ» (προκύπτει ο «ΑΛΕΚΗΜΡ_Δ» - «κόμβος root» με αριθμό εμφανίσεων 15 –
όσες και το άθροισμα των χαρακτήρων).

ΑΛΕΚΗΜΡ_Δ 15

ΕΚΗΜΡ_Δ 8

ΕΚΗ 4 ΜΡ_Δ 4

ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.25. 5ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
~ 54 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Βήμα 3ο – Προσδιορισμός νέας κωδικοποίησης.


Έχοντας δημιουργήσει το δένδρο Huffman, μπορούμε να προχωρήσουμε στον προσδιορισμό της νέας
κωδικοποίησης. Συγκεκριμένα, για κάθε αριστερή ακμή (edge) μεταξύ πατέρα και παιδιού ορίζεται
ως δείκτης το «0» και για κάθε δεξιά ακμή το «1». Ακολουθώντας το μονοπάτι (path) από την κορυφή
του δένδρου, προς κάθε φύλλο – χαρακτήρα και σημειώνοντας τους δείκτες των ακμών, προκύπτει η
νέα κωδικοποίηση, π.χ. για το χαρακτήρα «Α» είναι το «00» (βλέπε σχήμα και πίνακα που ακολουθεί).

ΑΛΕΚΗΜΡ_Δ 15

0 1

ΕΚΗΜΡ_Δ 8
Μονοπάτι για χαρακτήρα «Α»
0 1

ΕΚΗ 4 ΜΡ_Δ 4

0 1 0 1

ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2

0 1 0 1 0 1 0 1

Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1

Σχήμα 2.26. Προσδιορισμός νέας κωδικοποίησης μέσω δένδρου Huffman.

Πίνακας 2.10. Αριθμός εμφανίσεων ανά χαρακτήρα

Από τον πιο πάνω πίνακα προκύπτει ότι τα πιο συχνά εμφανιζόμενα σύμβολα «Α» και «Λ»,
στη νέα κωδικοποίηση αναπαραστάθηκαν με 2 μόνο bits (μικρότερο μήκος). Επιπλέον, η συνολική
απαίτηση για την αποθήκευση της πληροφορίας από τα 120 bits, με τη χρήση του εκτεταμένου κώ-
δικα ASCII, μετά την εφαρμογή του αλγορίθμου συμπίεσης Huffman ανήλθε σε μόλις 44 bits.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 55 ~

2.6.5 Μορφότυπα GIF και PNG


Το μορφότυπο GIF (Graphics Interchange Format) ήταν από τα πρώτα που δημιουργήθηκαν για την
απόθηκευση και ανταλλαγή ψηφιακών αρχείων εικόνων. Το βάθος χρώματος είναι 8 bits ανά pixel
και, συνεπώς, το πλήθος των διαφορετικών επιπέδων χρωματικής έντασης ανά pixel είναι 256 (28).
Το μορφότυπο PNG (Portable Network Graphics) χρησιμοποιείται για την αναπαράσταση
εικόνων, κυρίως στο Διαδίκτυο, για τις οποίες είναι απαραίτητη η συμπίεση χωρίς όμως απώλεια
δεδομένων. Χρησιμοποιούνται τόσο η αναπαράσταση σε επίπεδα του γκρίζου (gray scale tones) όσο
και η αναπαράσταση true color. Ειδικότερα, για την αναπαράσταση gray scale χρησιμοποιούνται έως
και 16 bits (2 bytes) ανά pixel, ενώ για την full-color πληροφορία έως και 48 bits (4 bytes) ανά pixel.
Το GIF σε σχέση με το PNG οδηγεί σε μικρότερα συμπιεσμένα αρχεία από το PNG, ειδικά
για τις εικόνες μικρού μεγέθους, αλλά έχει τα μειονεκτήματα της χονδροειδέστερης αναπαράστασης
8-bit σε σχέση με την αναπαράσταση 24-bit ή 48-bit true color του PNG, καθώς και της εμφάνισης
απότομης μετάβασης μεταξύ των χρωματικών τόνων (posterisation) κατά τη μετατροπή από PNG
σε GIF. Τέλος, το πρότυπο GIF υποστηρίζει κινούμενες εικόνες, ενώ το PNG όχι.

2.6.6 Μορφότυπα JPG και TIFF


Το μορφότυπο JPEG (Joint Photographic Experts Group) είναι το πιο διαδεδομένο μορφότυπο περι-
γραφής των εικόνων, ιδίως αυτών που αποθηκεύονται και διακινούνται στο Διαδίκτυο, λόγω των τε-
χνικών ισχυρής συμπίεσης, οι οποίες έχουν ως αποτέλεσμα πολύ μεγάλη μείωση του αποθηκευτικού
χώρου με ταυτόχρονη μικρή απώλεια της πληροφορίας. Διατίθενται βέβαια και εκδοχές συμπίεσης
χωρίς απώλειες. Ο αλγόριθμος συμπίεσης JPEG είναι βασισμένος στον μαθηματικό μετασχηματι-
σμό DCT (Discrete Cosine Transform).
Το JPEG σε σχέση με το PNG οδηγεί σε μικρότερα συμπιεσμένα αρχεία, ειδικά για εικόνες
με μεταβάσεις χαμηλής αντίθεσης, όπου το PNG οδηγεί σε μεγαλύτερα συμπιεσμένα αρχεία αλλά με
αμελητέα διαφορά ποιότητας. Αντίθετα, σε εικόνες μεγάλων αντιθέσεων, όπως εικόνες με κείμενο,
γραφικά ή line art, το PNG οδηγεί σε πιο συμφέρουσα συμπίεση και μάλιστα χωρίς απώλειες, σε σχέση
με το JPEG, το οποίο, λόγω των απωλειών κατά τη συμπίεση, παρουσιάζει παραμορφώσεις στις πε-
ριοχές έντονων χρωματικών μεταπτώσεων. Επίσης, το JPEG πρέπει να αποφεύγεται στις περιπτώσεις
διαδοχικών επεξεργασιών και αποθηκεύσεων λόγω της αλλεπάλληλης απώλειας πληροφορίας κατά τη
συμπίεση και την αποκατάσταση, ενώ αντίθετα το PNG παραμένει στην αρχική του μορφή επειδή οι
διαδοχικές συμπιέσεις και αποκαταστάσεις δεν συνεπάγονται κάποια απώλεια πληροφορίας.
Το μορφότυπο TIFF (Tagged Image File Format) χρησιμοποιείται για την ακριβή περιγρα-
φή μιας εικόνας γραμμή προς γραμμή, pixel προς pixel. Συνήθως χρησιμοποιείται για την πρωτογενή
αποθήκευση της εικόνας. Το μορφότυπο αυτό δίνει δυνατότητα και για συμπίεση χωρίς απώλεια ή
και για ισχυρότερη αλλά με απώλεια της πληροφορίας.
~ 56 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Το TIFF, αν και κλασικό πρότυπο για την ανταλλαγή εικόνων μεταξύ διαφόρων προγραμμά-
των επεξεργασίας, αποφεύγεται για τη χρήση στο Διαδίκτυο λόγω του μεγάλου όγκου των αρχείων
του. Επίσης, πρόβλημα δημιουργείται και λόγω της χρησιμοποίησης παραλλαγών TIFF περιορισμέ-
νων χαρακτηριστικών, οι οποίες όμως παρουσιάζουν προβλήματα συμβατότητας κατά την ανταλλα-
γή τους ανάμεσα στα διάφορα περιβάλλοντα.

Πίνακας 2.11. Βασικά χαρακτηριστικά ανά μορφότυπο εικόνας.

2.6.7 Μορφότυπο SVG


Το μορφότυπο SVG (Scalable Vector Graphics) αποτελεί σήμερα το πιο σημαντικό, ανοικτό πρό-
τυπο για την αναπαράσταση εικόνων με την διανυσματική μέθοδο, με ευρεία χρήση στο Διαδίκτυο.
Δυνατά του σημεία αποτελούν η χρήση της γλώσσας επισημειώσεων κειμένου XML (eXtensible
Markup Language), η στενή του σχέση με την HTML (HyperText Markup Language) καθώς και της
CSS (Cascade Style Sheets), δύο τεχνολογίες ευρέως χρησιμοποιούμενες για την αναπαράσταση των
σελίδων στο Διαδίκτυο. Επιπλέον, μπορεί να υποστηρίξει την αναπαράσταση βίντεο, ήχο αλλά και
πολύπλοκων μορφών διάδρασης. Στο σχήμα που ακολουθεί αποτυπώνεται ο κώδικας σε μορφή SVG
και η αντίστοιχη αναπαράσταση (rendering) της πληροφορίας.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 57 ~

Σχήμα 2.27. Παραδείγματα εικόνων SVG (a) κύκλος (β) πολύγωνο.


(Πηγή: W3Schools.com, http://www.w3schools.com/svg).

Μέσω της γλώσσας SVG μπορούν να προστεθούν σχήματα όπως κύκλος, ορθογώνιο, έλ-
λειψη, γραμμή, πολύγωνο κ.λπ., κείμενο, χρωματικά φίλτρα, κίνηση, εικόνες ήχοι, βίντεο κ.λπ. Στα
παραπάνω παραδείγματα απεικονίζονται: (α) ένας κύκλος (circle) με καθορισμό του κέντρου του
(συντεταγμένες cx=50, cy=50), της ακτίνας (r=40), του χρώματος (black) και του πάχους της περι-
φέρειάς του (stroke-width), καθώς και του χρώματος του γεμίσματος (fill-red) και (β) ένα πολύγωνο
(polygon) με καθορισμό των κορυφών του (polygon points = 220,10 300,210 170,250 123,234), του
χρώματος της περιφέρειάς του (stroke: purple), καθώς και του χρώματος του γεμίσματος (fill: lime).

2.7 Οπτική Αναγνώριση Χαρακτήρων


Η οπτική αναγνώριση χαρακτήρων, γνωστή ως OCR (Optical Character Recognition) είναι η δια-
δικασία μετατροπής ψηφιοποιημένων σελίδων που περιέχουν κείμενο, εικόνες και άλλα στοιχεία
σε ψηφιακά αναγνωρίσιμο περιεχόμενο. Βασική επιδίωξη της διαδικασίας OCR είναι αφενός το
περιεχόμενο να καταστεί αναζητήσιμο (searchable) και σε κάποιες περιπτώσεις και επεξεργάσιμο
(editable). Για την επίτευξη αυτού του στόχου, αξιοποιούνται ειδικά προγράμματα επεξεργασίας και
αναγνώρισης εικόνας, τα οποία σαρώνουν την κάθε σελίδα και αναγνωρίζουν τη δομή της. Συγκε-
κριμένα, αναγνωρίζουν το κείμενο, τις εικόνες, τα σχήματα, τους πίνακες κ.λπ., και μετατρέπουν τις
εικόνες σε ψηφιακά επεξεργάσιμη ή αναζητήσιμη μορφή [π.χ. αρχεία Microsoft Word ή αναζητήσι-
μα αρχεία PDF (Portable Document Format)].
~ 58 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Έγγραφο για Ψηφιοποιηµένο Ψηφιοποιηµένο


OCR αρχείο αρχείο µε OCR

Χαρακτήρες κειµένου Χαρακτήρες κειµένου


µε µορφή pixels µε κωδικοποίηση βάσει
προτύπου

Σχήμα 2.28. Διαδικασία ψηφιοποίησης και αναγνώρισης χαρακτήρων.

Η διαδικασία αυτή δεν είναι τετριμμένη, όπως τυχόν φαίνεται, αλλά επηρεάζεται από
πολλούς παράγοντες όπως:
–– Ανάλυση της υπό αναγνώρισης εικόνας – Προτείνεται από 300 dpi και άνω, ενώ, αν το μέγε-
θος των γραμμάτων είναι σχετικά μικρό, συστήνεται από 400 έως 600 dpi.
–– Πολυπλοκότητα δομής κειμένου – Αν πρόκειται για εικόνες κειμένου με πολύπλοκη δομή,
όπως δηλαδή πίνακες, εξισώσεις, λεζάντες, πλαίσια κειμένου κ.λπ., ενδέχεται να μην υπάρ-
ξει το βέλτιστο αποτέλεσμα και να χρειαστεί ανθρώπινη παρέμβαση.
–– «Θόρυβος» στο περιεχόμενο - πιο δύσκολες είναι οι περιπτώσεις θορυβωδών σελίδων, δη-
λαδή με πολλές μουτζούρες ανακατεμένες με τα γράμματα, καθώς και στις περιπτώσεις
ενωμένων χαρακτήρων, οπότε πρέπει να χρησιμοποιηθούν ειδικοί αλγόριθμοι διαχωρισμού,
καθώς κολλημένοι χαρακτήρες συνεχόμενων γραμμών αλλά και μεγάλες κλίσεις οδηγούν
συχνά σε εσφαλμένη ταυτοποίηση των γραμμών.
–– Γλώσσα κειμένου – Τόσο η γλώσσα κειμένου όσο και η πιθανότητα ύπαρξης στο κείμενο
πολλαπλών γλωσσών (π.χ. ελληνικά και αγγλικά), δυσκολεύει πολύ τη διαδικασία αναγνώ-
ρισης του κειμένου. Το πρόβλημα αυτό είναι εντονότερο για τις γλώσσες με πολλούς τό-
νους, όπως στα ελληνικά πολυτονικά κείμενα, όπου οι τόνοι είναι πολύ συχνά αδιαχώριστοι
από τα κάτω γράμματα.
–– Χειρόγραφο κείμενο – Πρόκειται για την πιο δύσκολη περίπτωση αναγνώρισης κειμένου
όπου διεξάγεται μεγάλη έρευνα. Στην περίπτωση αναγνώρισης χειρογράφων, όπου κάθε
γράμμα δεν έχει σε κάθε εμφάνισή του την ίδια, επαναλαμβανόμενη τυπωμένη εκδοχή του,
αλλά εμφανίζεται σε διάφορες παραλλαγές, ο πλούτος των οποίων εξαρτάται από τον γρα-
φικό χαρακτήρα του γραφέα, χρειάζεται να εφαρμοστούν ειδικοί αλγόριθμοι εκμάθησης για
την επίτευξη του βέλτιστου αποτελέσματος.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 59 ~

Στο σχήμα που ακολουθεί απεικονίζεται η πρακτική χρήσης ειδικού λογισμικού για την
υλοποίηση της διαδικασίας αναγνώρισης εικόνας.

Σχήμα 2.29. Αναγνώριση OCR με το λογισμικό ABBYY Finereader.

Η διαδικασία ψηφιοποίησης υλικού, μέρος της οποίας αποτελεί και η οπτική αναγνώριση
κειμένου είναι μια από τις βασικές δραστηριότητες κάθε βιβλιοθήκης και, γενικότερα, κάθε Οργανι-
σμού Πληροφόρησης. Στο κεφάλαιο ΧΧ παρουσιάζονται αναλυτικά όλες οι απαραίτητες πληροφο-
ρίες που πρέπει να γνωρίζει ένας επιστήμονας Πληροφόρησης ώστε να διαχειριστεί με επιτυχία ένα
έργο (project) ψηφιοποίησης.

2.8 Ήχος
Η ψηφιοποίηση/αποθήκευση του ήχου αποτελεί το κύριο αντικείμενο της παρούσας παραγράφου.
Είναι βασική ανάγκη η μεταφορά της πληροφορίας του ήχου από τον αναλογικό κόσμο στον ψηφι-
ακό, με σκοπό αφενός την αποθήκευσή του, και αφετέρου, κυρίως στις μέρες μας, τη μετάδοσή του.
~ 60 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Βασικές πηγές ηχητικών σημάτων είναι η ανθρώπινη φωνή, τα μουσικά όργανα, το φυσικό περιβάλ-
λον κ.λπ. Η μετατροπή του ήχου από την αναλογική του μορφή σε ψηφιακή μπορεί να λάβει χώρα
είτε κατ’ ευθείαν, με ηχογράφηση εν τη γενέσει του, είτε από ένα μέσο αναλογικής καταγραφής (π.χ.
δίσκο βινυλίου, μαγνητική ταινία κ.λπ.). Στο σχήμα που ακολουθεί απεικονίζονται τα απαραίτητα
βήματα για την ψηφιοποίηση του ήχου.

Αναλογικό σήµα Ψηφιακό σήµα

Δυαδική Συµπίεση –
Δειγµατοληψία Κβάντιση
κωδικοποίηση Αποθήκευση

Σχήμα 2.30. Ψηφιοποίηση ήχου βήμα προς βήμα.

Τα στάδια για την ψηφιοποίηση του ήχου είναι τα εξής:


Στάδιο 1ο – Δειγματοληψία: Μέσω ειδικών συσκευών (αναλογικός-ψηφιακός μετατροπέας –
analog-digital converter) λαμβάνονται δείγματα (sampling) της έντασης του αναλογικού σήματος
του ήχου προς ψηφιοποίηση. Όσο περισσότερα δείγματα επιλέγονται ανά μονάδα χρόνου (συχνότη-
τα δειγματοληψίας), τόσο πιστότερη είναι η αναπαράσταση του αρχικού αναλογικού σήματος, αλλά
και τόσες περισσότερες τιμές θα πρέπει να αποθηκευτούν, αυξάνοντας το μέγεθος του τελικού ψηφι-
ακού αρχείου. Για παράδειγμα, στο τηλεφωνικό δίκτυο (σταθερής ή κινητής τηλεφωνίας) ο αριθμός
δειγμάτων που λαμβάνονται ανά δευτερόλεπτο ανέρχεται στα 16.000 δείγματα ανά δευτερόλεπτο
(συχνότητα δειγματοληψίας 16 KHz), ενώ στα μουσικά CD o ρυθμός δειγματοληψίας ανεβαίνει
στα 44.100 δείγματα ανά δευτερόλεπτο (συχνότητα δειγματοληψίας 44,1 KHz). Είναι προφανές ότι
απαιτείται ένας συμβιβασμός μεταξύ της ποιότητας, του κόστους του εξοπλισμού για την επίτευξη
μεγάλων ρυθμών δειγματοληψίας, του απαιτούμενου αποθηκευτικού χώρου ή τις δυνατότητες του
δικτύου, αν πρόκειται για ήχο που πρέπει να μεταδοθεί. Επιπλέον, πρέπει να ληφθεί υπόψη το θε-
ώρημα των Nyquist – Shannon [17], σύμφωνα με το οποίο η συχνότητα δειγματοληψίας πρέπει να
είναι τουλάχιστον διπλάσια της μεγαλύτερης χαρακτηριστικής συχνότητας του σήματος.
Στάδιο 2ο – Κβάντωση: Κβάντωση (quantization) ονομάζεται η διαδικασία κατά την οποία κάθε
δείγμα αντιστοιχίζεται σε μια τιμή από ένα συγκεκριμένο σύνολο. Όσο περισσότερες είναι οι τιμές
του συνόλου της κβάντισης, τόσο μεγαλύτερη είναι η ακρίβεια αντιστοίχισης των δειγμάτων με τις
πραγματικές τιμές του αρχικού αναλογικού σήματος, άρα και μικρότερο το αναγκαστικό σφάλμα
κατά το πέρασμα από την πραγματική αναλογική τιμή σε μια αριθμητική της αναπαράσταση. Για
παράδειγμα, αν σε ένα σύνολο δειγμάτων ενός σήματος, η μικρότερη τιμή είναι το 0 και η μεγαλύ-
τερη 50, το σύνολο των τιμών κβάντωσης θα μπορούσε να οριστεί π.χ. με βήμα αύξησης το 1 ή το
0,1. Στην πρώτη περίπτωση, το σύνολο τιμών κβάντισης έχει πλήθος 51 στοιχεία και ορίζεται ως
[0,1,2,3,4, … 48, 49, 50], και στη δεύτερη περίπτωση έχει πλήθος 510 και ορίζεται ως [0.1, 0.2, 0.3,
0.4 … 49.8, 49.9, 50.0]. Αν μια τιμή ενός δείγματος του υπό ψηφιοποίηση σήματος είναι π.χ. 17.66,
τότε, στην πρώτη περίπτωση κβάντισης θα αντιστοιχιστεί με το 18, οδηγώντας σε απόκλιση από
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 61 ~

την πραγματική τιμή σε ποσοστό περίπου 1,9 %, ενώ στη δεύτερη περίπτωση κβάντισης, θα αντι-
στοιχιστεί με το 17.7, οδηγώντας σε απόκλιση από την πραγματική τιμή σε ποσοστό περίπου 0,2 %
(σχεδόν 10 φορές μικρότερο).
Στάδιο 3ο – Ψηφιοποίηση - Κωδικοποίηση / Συμπίεση: Ανάλογα με τον αριθμό των τιμών κβά-
ντισης και των τιμών των δειγμάτων, ορίζεται η δυαδική κωδικοποίηση, αλλά και εφαρμόζεται ο
κατάλληλος αλγόριθμος συμπίεσης των δεδομένων. Είναι προφανές ότι και πάλι, όσο μεγαλύτερος
είναι ο αριθμός των τιμών κβάντισης, τόσο μεγαλύτερο μήκος θα πρέπει να έχει η συμβολοσειρά
που θα χρησιμοποιηθεί για την κωδικοποίηση των τιμών. Στο προηγούμενο παράδειγμα τιμών κβά-
ντισης, για την πρώτη περίπτωση, όπου υπάρχουν 51 διακριτές τιμές, απαιτούνται 6 bits για την
κωδικοποίησή τους, ενώ στη δεύτερη, με 510 διαφορετικές τιμές, απαιτούνται 9 bits. Επομένως,
και σ’ αυτήν την περίπτωση θα απαιτηθεί ένας συμβιβασμός κόστους-ποιότητας, καθώς κάθε χρήση
περισσότερων bits ανά δείγμα σημαίνει ανάγκη μεγαλύτερου διαθέσιμου χώρου αποθήκευσης και
εξασφάλιση υψηλότερων ρυθμών μετάδοσης. Σπουδαία σημασία για τη μείωση του μεγέθους του
τελικού ψηφιακού αρχείου διαδραματίζει η εφαρμογή αλγορίθμων συμπίεσης. Πιο γνωστός αλγό-
ριθμος συμπίεσης (κατηγορία lossy) για την περίπτωση του ήχου είναι ο MP3 [18], [19].
Στις επόμενες παραγράφους παρατίθενται δύο παραδείγματα στα οποία: (α) περιγράφονται
τα στάδια για τη δυαδική αποθήκευση του ήχου, δηλαδή της δειγματοληψίας, της κβάντωσης και
της κωδικοποίησης και (β) υπολογίζεται η απαιτούμενη χωρητικότητα για την ψηφιοποίηση ενός
ηχητικού σήματος με δεδομένα τον ρυθμό δειγματοληψίας και το είδος της κωδικοποίησης.

2.8.1 Παράδειγμα ψηφιοποίησης ήχου


Στο παρόν παράδειγμα θα παρουσιαστούν όλα τα βήματα για την ψηφιοποίηση ενός αναλογικού
σήματος (βλέπε παρακάτω σχήμα).

Σχήμα 2.31. Αναλογικό σήμα προς ψηφιοποίηση.

Αρχικά, πρέπει να αποφασιστεί η περίοδος δειγματοληψίας (T), δηλαδή το σταθερό χρονι-


κό διάστημα μεταξύ δύο λήψεων δειγμάτων από το αναλογικό σήμα, η οποία και θα καθορίσει και
τη συχνότητα δειγματοληψίας (ν, με ν = 1/Τ). Τα δείγματα που λαμβάνονται ανά χρονικό διάστημα
T ανήκουν στο σύνολο S(t), με t = 1T, 2T, 3T κ.λπ. (για λόγους απλότητας θα συμβολίζονται ως Si,
όπου i = 1, 2, 3, 4 … 13) κ.λπ.), και αντιπροσωπεύουν μια τιμή έντασης του αναλογικού σήματος
τη δεδομένη χρονική στιγμή.
~ 62 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Σχήμα 2.32. Δειγματοληψία αναλογικού σήματος με περίοδο Τ, 13 δείγματα.

Με δεδομένες τις τιμές των δειγμάτων (βλέπε παρακάτω σχήμα) ξεκινά η διαδικασία κβά-
ντωσης. Συγκεκριμένα, ορίζεται ως ελάχιστη τιμή – 4 και ως μέγιστη το 4, με βήμα το 1. Επομένως,
το σύνολο των τιμών κβάντωσης είναι το εξής: -4, -3, -2, -1, 0, 1, 2, 3, 4 (9 διακριτές τιμές).

Σχήμα 2.33. Τιμές δειγμάτων σήματος προς ψηφιοποίηση.

Έχοντας ορίσει τα επίπεδα κβάντωσης, στη συνέχεια γίνεται η αντιστοίχιση των δειγμάτων
(βλέπε παρακάτω σχήμα και πίνακα).

Σχήμα 2.34. Διαδικασία κβάντωσης. Πίνακας 2.12. Τελικές τιμές κβάντωσης.


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 63 ~

Στο επόμενο βήμα οι κβαντωμένες τιμές μετατρέπονται σε δυαδικούς αριθμούς. Οι αριθμοί


αυτοί αποθηκεύονται στη μνήμη του υπολογιστή και μπορούν, στη συνέχεια, να χρησιμοποιηθούν
για την ανασύνθεση του αρχικού αναλογικού ηχητικού σήματος μέσω της αντίστροφης διαδικασίας
μετατροπής σήματος από ψηφιακό σε αναλογικό. Για την αναπαράσταση 9 διακριτών τιμών κβά-
ντωσης απαιτούνται 4 bits (24 = 16 διαφορετικές τιμές). Οι τιμές των επιπέδων κβάντωσης μετα-
τρέπονται σε δυαδική μορφή πραγματοποιώντας την εξής παραδοχή: το πρώτο bit υποδηλώνει το
πρόσημο (1 για αρνητικούς αριθμούς, 0 για θετικούς αριθμούς) και τα επόμενα 3 bits την τιμή. Άρα,
στους πίνακες που ακολουθούν απεικονίζονται οι δυαδικές τιμές των επιπέδων κβάντισης, καθώς και
η δυαδική μορφή (ψηφιακή μορφή) του αναλογικού σήματος.

Πίνακας 2.13. Δυαδική αναπαράσταση επιπέδων κβάντωσης.

Πίνακας 2.14. Δυαδική αναπαράσταση ψηφιοποιημένου σήματος (σύνολο bits: 52).

2.8.2 Παράδειγμα υπολογισμού αποθηκευτικού χώρου ψηφιοποίησης ηχητικού


σήματος
Δεδομένα: η τιμή συχνότητας δειγματοληψίας του ηχητικού σήματος είναι 44,1 KHz και το μήκος
της συμβολοσειράς των επιπέδων κβάντωσης είναι 16 bits. Σημειώνεται ότι ο εξοπλισμός δειγματο-
ληψίας έχει τη δυνατότητα στερεοφωνικής λήψης. Τα παραπάνω δεδομένα ψηφιοποίησης αντιστοι-
χούν σε επίπεδο ποιότητας CD (Compact Disc).
~ 64 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Ζητούμενο: ο υπολογισμός του αποθηκευτικού χώρου που πρέπει να διαθέτουμε για την αποθήκευ-
ση ενός ηχητικού σήματος διάρκειας 30 λεπτών.
Λύση
Υπολογίζουμε την απαιτούμενη χωρητικότητα για την αποθήκευση ενός δευτερολέπτου από το ηχη-
τικό σήμα ως εξής:
–– Εξαιτίας της στερεοφωνικής δυνατότητας, η δειγματοληψία λαμβάνει ταυτόχρονα δείγματα
από 2 διαφορετικά κανάλια ήχου.
–– Με δεδομένη τη συχνότητα δειγματοληψίας (44,1KHz), προκύπτει ότι σε κάθε δευτερόλε-
πτο λαμβάνονται 44.100 δείγματα ανά κανάλι δειγματοληψίας, δηλαδή 88.200 συνολικά.
–– Για την κωδικοποίηση ενός δείγματος απαιτούνται 16 bits, επομένως, για τα 88.200 απαιτούνται
16 Χ 88.200 bits = 1.411.200 bits ή ~ 1.411,2 Kbps ή 176.400 bytes ή ~ 176,400 Kbytes.
–– Στη συνέχεια, υπολογίζουμε ότι για την αποθήκευση των 30 λεπτών του ηχητικού σήματος
θα απαιτηθούν 30 λεπτά Χ 60 δευτερόλεπτα ανά λεπτό Χ 176,500 Kbytes ανά δευτερόλεπτο
= 317.520 Kbytes ή ~ 317,52 Mbytes.
Σημειώνεται ότι η απαιτούμενη χωρητικότητα που υπολογίστηκε δεν λαμβάνει υπόψη τυχόν
διαδικασία συμπίεσης δεδομένων που μπορεί να εφαρμοστεί. Τέλος, η χρήση 16 bits για το μήκος της
συμβολοσειράς των επιπέδων κβάντωσης επιτρέπει τον ορισμό 65.536 (216) διαφορετικών τιμών.

2.8.3 Μορφότυπα ήχου


Όπως αναφέρθηκε σε προηγούμενη παράγραφο, ο συνηθέστερος τύπος ψηφιακού αρχείου, είναι το
MP3 (lossy). Το ΜΡ3 [18] προτυποποιήθηκε το 1993 από τον οργανισμό ISO και παρέχει τη δυνατό-
τητα συμπίεσης ηχητικών σημάτων, κυρίως μέσω της «απόρριψης» τμημάτων του φάσματος τα οποία
δεν είναι αντιληπτά από τον άνθρωπο. Η κωδικοποίηση της πληροφορίας ακολουθεί τη μέθοδο LPCM
/ Linear Pulse Code Modulation (γραμμική παλμοκωδική διαμόρφωση), δεσμεύοντας λιγότερο χώρο,
συλλαμβάνοντας τα δείγματα και, αντιστοιχίζοντάς τα, στη συνέχεια, σε τιμές ηχητικής έντασης σε μια
σειρά από ισαπέχουσες επιλεγμένες τιμές που διαμερίζουν ένα δοσμένο εύρος διαστήματος. Ο ρυθμός
ροής πληροφορίας στο πρότυπο MP3 κυμαίνεται από 128 Kbps έως και 320 Kbps. Με βάση αυτές τις
τιμές και με δεδομένο (βλέπε προηγούμενη παράγραφο) ότι ο ρυθμός ροής δεδομένων για ήχο σε CD
αγγίζει περίπου τα 1.411,2 Kbps, διαπιστώνεται ότι το πρότυπο MP3 παρέχει έναν λόγο συμπίεσης που
κυμαίνεται από 1/11 ως και 1/4, με ταυτόχρονη διατήρηση ενός καλού ακουστικού επιπέδου.
Ένας άλλος τύπος ψηφιακού ήχου είναι το WAV (Wave Audio File Format), το οποίο ανήκει
στην κατηγορία των μη απωλεστικών αλγορίθμων συμπίεσης. Στην περίπτωση των WAV αρχείων
τα ηχητικά αναλογικά σήματα ψηφιοποιούνται μετά την αναγκαία δειγματοληψία και κβάντωση
και αποθηκεύονται. Σε κάθε αρχείο WAV, αποθηκεύονται, πέρα από τα δεδομένα, η επιλεγμένη
συχνότητα δειγματοληψίας, το δυαδικό βάθος / bit depth (δηλαδή ο αριθμός δυαδικών ψηφίων για
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 65 ~

την αναπαράσταση κάθε δείγματος) και το πλήθος δειγμάτων. Όπως και στην περίπτωση του MP3,
γίνεται χρήση της μεθόδου LPCM. Η πιο διαδεδομένη συχνότητα δειγματοληψίας για τα ηχητικά
κλιπ σε WAV είναι 44100 δείγματα ανά δευτερόλεπτο, με 16 bits ανά δείγμα.

2.9 Τεχνολογίες φωνής


Ο τομέας Ψηφιακής Επεξεργασίας Σημάτων (Digital Signal Processing - DSP) ασχολείται με ανά-
λυση, επεξεργασία και διαχείριση σημάτων παραγομένων είτε από φυσικά φαινόμενα (π.χ. σεισμικά
σήματα, ένταση ηλιακής ακτινοβολίας, θερμοκρασία κ.λπ.) είτε από τη λειτουργία του ανθρώπινου
οργανισμού (π.χ. ηλεκτροκαρδιογράφημα, ηλεκτροεγκεφαλογράφημα, φωνή κ.λπ.).
Η επεξεργασία της ανθρώπινης φωνής -με τη χρήση ηλεκτρονικού υπολογιστή- αποτελεί
έναν ολόκληρο τομέα της ψηφιακής επεξεργασίας σημάτων και προϋποθέτει τη μετατροπή σήματος
από αναλογικό σε ψηφιακό, την κβάντωση και την ψηφιοποίηση. Η επεξεργασία της φωνής μπορεί
να αξιοποιηθεί σε τρεις πολύ σημαντικούς τομείς, όπως την αναγνώριση φωνής, τη σύνθεση φωνής
και την αποθορυβοποίηση φωνής.

2.9.1 Αναγνώριση φωνής


Η φασματική μελέτη των κομματιών της φωνής σε επίπεδο φθόγγου ή συλλαβής οδηγεί σε μια αντι-
στοίχιση των κομματιών αυτών σε κάποια διανύσματα συγκεκριμένων τιμών, τα οποία, στη συνέχεια,
μπορούν να χρησιμοποιηθούν για την αναγνώριση των κομματιών αυτών μέσω αλγορίθμων ανα-
γνώρισης προτύπων. Η έρευνα στην αναγνώριση της φωνής προχώρησε στην αντιμετώπιση όλο και
πιο απαιτητικών περιπτώσεων, όπως η ύπαρξη πολλαπλών ομιλητών (cocktail party) και η ομιλία σε
συνθήκες υψηλού θορύβου. Το ποσοστό επιτυχίας της αναγνώρισης φωνής είναι πλέον πολύ μεγάλο,
ιδίως στις περιπτώσεις περιορισμένου λεξιλογίου, όπως στις αυτόματες υπηρεσίες, όπου καλείται
ο πελάτης να εκφωνήσει κάποια λέξη από ένα συγκεκριμένο σύνολο λέξεων, και χρησιμοποιείται
πλέον ευρύτατα. Έχει αρχίσει μάλιστα να χρησιμοποιείται και σε περιπτώσεις ελεύθερης εκφώνησης,
όπου βέβαια η απόδοση είναι αντιστρόφως ανάλογη του ύψους του περιβάλλοντος θορύβου.
Τέλος, πολύ χρήσιμες είναι οι εφαρμογές εισαγωγής εκφωνούμενου κειμένου, όπου το εκ-
φωνούμενο κείμενο μπροστά σε μικρόφωνο συνδεδεμένο με τον υπολογιστή μετατρέπεται αυτόμα-
τα σε ηλεκτρονικό κείμενο που αποθηκεύεται στη μνήμη του υπολογιστή.
Προφανώς η διαδικασία αυτή είναι αποτελεσματικότερη όταν περιορίζεται σε μια συγκεκρι-
μένη φυσική γλώσσα, καθώς λαμβάνεται υπόψη και η πληροφορία των συμφραζομένων (context),
οπότε ο χώρος των πιθανών επιλογών είναι μικρότερος. Εν τούτοις, πολλές στατιστικές τεχνικές
αυτόματης εκμάθησης λειτουργούν ανεξάρτητα της γλώσσας και μάλιστα με μεγάλη επιτυχία.
~ 66 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

2.9.2 Σύνθεση φωνής


Η σύνθεση φωνής είναι η αντίστροφη προς την προηγούμενη διαδικασία, όπου κάποιο ηλεκτρονικό
κείμενο μετατρέπεται σε προφορικό λόγο. Κάθε μονάδα γραπτού κειμένου αντιστοιχίζεται σε ένα
σήμα φωνής πολύ μικρής χρονικής διάρκειας και η διαδοχική συνένωση αυτών των σημάτων οδηγεί
σε έναν συνεχή προφορικό λόγο.
Η μεγάλη δυσκολία σ’ αυτήν τη διαδικασία είναι η τεχνική συνένωσης (merging) των ηχη-
τικών κομματιών και η επιλογή του κατάλληλου ύψους και της σωστής διάρκειας του καθενός απ’
αυτά (άπλωμα στον χρόνο), έτσι ώστε το αποτέλεσμα να έχει φυσική προσωδία, να ακούγεται δηλα-
δή σαν φυσική ανθρώπινη φωνή και όχι σαν μηχανική κουραστική εκφώνηση.
Μέσω της σύνθεσης φωνής μπορεί κάποιος να ακούει ιστοσελίδες του Διαδικτύου ηλεκτρονι-
κά κείμενα, όντας ταυτόχρονα σε μια παράλληλη δραστηριότητα ή για λόγους προβλημάτων όρασης.

2.9.3 Αποθορυβοποίηση φωνής


Η αφαίρεση από ένα αποθηκευμένο ψηφιοποιημένο σήμα φωνής του θορύβου που έχει εγγραφεί πα-
ράλληλα μ’ αυτό πραγματοποιείται με διάφορες φασματικές τεχνικές, μέσω των οποίων μετατρέπε-
ται το σήμα σε μια σειρά από διανύσματα τιμών, κάποια από τα οποία αντιστοιχούν στην επιθυμητή
φωνητική συνιστώσα και κάποια στη θορυβώδη.
Ένα κρίσιμο ερευνητικό ζήτημα είναι η επιλογή εκείνου ακριβώς του αριθμού των δια-
νυσμάτων φωνητικού περιεχομένου, ώστε η διαγραφή των υπόλοιπων διανυσμάτων που αντιπρο-
σωπεύουν τον θόρυβο να οδηγήσει στο καλύτερο δυνατό ηχητικό αποτέλεσμα. Γιατί η διατήρηση
περισσότερων διανυσμάτων έχει ως αποτέλεσμα την παραμονή ενοχλητικού θορύβου, ενώ η διατή-
ρηση λιγότερων οδηγεί σε σήματα παραμορφωμένα, καθώς έχει εσφαλμένα αφαιρεθεί και μέρος του
πραγματικού σήματος φωνής.
Η διαδικασία της αποθορυβοποίησης χρησιμοποιείται στον καθαρισμό παλαιών ηχητικών
εγγραφών αλλά κυρίως ως πρώτο στάδιο της διαδικασίας αναγνώρισης, ώστε να απομακρυνθεί αρ-
κετός θόρυβος, ο οποίος καθιστά δυσκολότερη τη σωστή αναγνώριση.

2.9.4 Χρήση τεχνικών αναγνώρισης και σύνθεσης φωνής για ΑμεΑ


Οι παραπάνω τεχνικές αναγνώρισης και σύνθεσης φωνής είναι χρησιμότατες για τα άτομα με ανα-
πηρίες (ΑμεΑ – Άτομα με ειδικές Ανάγκες) στο πεδίο της ακοής και της όρασης.
Βαρήκοοι μπορούν μέσω συσκευών να μετατρέπουν το ηχητικό σήμα σε κάποιο άλλο με
παραλλαγμένες φασματικές συνιστώσες, οι οποίες το καθιστούν πιο αναγνωρίσιμο, ή και να το
μετατρέπουν σε αναγνώσιμο κείμενο. Μάλιστα, η τελευταία λύση μπορεί να βοηθήσει τους ολικά
κωφάλαλους, ιδίως στη συνεννόηση με κανονικά ακούοντες, οι οποίοι συνήθως δεν γνωρίζουν να
χειρίζονται τη νοηματική γλώσσα.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 67 ~

Αντίστοιχα η εκφώνηση γραπτών κειμένων μέσω συνθετικής φωνής είναι μια αποτελεσμα-
τικότατη λύση για την «ανάγνωση» ηλεκτρονικών κειμένων από τους ολικά τυφλούς αλλά και γε-
νικότερα από άτομα με προβλήματα οπτικής οξύτητας. Είναι πολύ διαδεδομένη στην εποχή μας η
ενσωμάτωση σε ιστοτόπους, κυρίως δημόσιων ή διεθνών οργανισμών, της δυνατότητας πρόσβασης
ατόμων με προβλήματα όρασης, είτε μέσω διαδικασιών υπερβολικών μεγεθύνσεων είτε με εκφώ-
νηση όλης της γραπτής πληροφορίας (μενού, σύνδεσμοι πλοήγησης, κομμάτια κειμένου, μεταδεδο-
μένα πολυμεσικού υλικού κ.λπ.). Μάλιστα σε πολλές περιπτώσεις τα ενσωματωμένα αυτά εργαλεία
δεν είναι απλώς καλοδεχούμενα αλλά και υποχρεωτικά, μέσω ειδικών Κανόνων Πρόσβασης Διαδι-
κτυακού Περιεχομένου / Web Content Accessibility Guides (WCAG) [20].

2.10 Βίντεο
Με την έννοια βίντεο περιγράφεται η συνεχής εναλλαγή εικόνων (καρέ/frames), με συγκεκριμένο
ρυθμό (frame rate per second / fps), διαδικασία μέσω της οποίας δίνεται η αίσθηση της κινούμενης
εικόνας. Σημειώνεται ότι όταν ο ρυθμός εναλλαγής των εικόνων είναι μεγαλύτερος από 24 καρέ ανά
δευτερόλεπτο, στα φιλμ δίνεται η αίσθηση της ομαλής κίνησης (smooth motion), ενώ, για να δίνεται
η αίσθηση της σταθερότητας στον χρήστη στις οθόνες των ηλεκτρονικών υπολογιστών, απαιτείται
ρυθμός ανανέωσης (refresh rate) γύρω στα 50 με 60 Hz. Παράλληλα με τη ροή των εικόνων υπάρχει
και ηχητική πληροφορία που συμπληρώνει το βίντεο (audio stream). Το βίντεο (όπως και ο ήχος)
μπορεί να είναι εξ αρχής σε ψηφιακή (digital) μορφή ή αφού καταγραφεί με αναλογικό τρόπο (π.χ.
σε φιλμ) να μετατρέπεται σε ψηφιακή μορφή στη συνέχεια. Τα κύρια χαρακτηριστικά ενός βίντεο
είναι τα εξής:
–– Ρυθμός καρέ ή frame rate: Πρόκειται για τον αριθμό των εικόνων ανά δευτερόλεπτο. Οι
σύγχρονες βιντεοκάμερες έχουν την ικανότητα λήψης έως και 120 καρέ ανά δευτερόλεπτο,
ενώ στα συστήματα εκπομπής τηλεοπτικού σήματος ο ρυθμός κυμαίνεται μεταξύ 25 (PAL/
SECAM [21], [22]) και 30 (NTSC [23]).
–– Λόγος διαστάσεων – aspect ratio: Πρόκειται για την αναλογία πλάτους/ύψους των καρέ.
Σε ό, τι αφορά την τηλεόραση, τις οθόνες των ηλεκτρονικών υπολογιστών και τον κινημα-
τογράφο, οι πιο διαδεδομένες αναλογίες 4:3 και 16:9.
–– Ανάλυση και βάθος χρώματος – resolution και color depth: Πρόκειται για τον αριθμό
των pixels σε συγκεκριμένες διαστάσεις των συνεχόμενων καρέ, καθώς και τον αριθμό των
χρωμάτων που μπορούν να αναπαρασταθούν (άρα και τα απαιτούμενα bit ανά pixel για την
κωδικοποίησή τους).
~ 68 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Πίνακας 2.15. Λόγος διαστάσεων και αριθμός pixels ανά πρότυπο.

–– Συμπίεση βίντεο (για ψηφιακή μορφή): Πρόκειται για το είδος της συμπίεσης, και, κατά
συνέπεια, των μορφότυπων αποθήκευσης των βίντεο που βρίσκονται σε ψηφιακή μορφή.
Στις επόμενες παραγράφους παρατίθενται: (α) ένα παράδειγμα όπου υπολογίζεται η απαιτούμενη
χωρητικότητα για την ψηφιοποίηση ενός βίντεο με συγκεκριμένα χαρακτηριστικά και (β) τα μορφό-
τυπα αποθήκευσης που συνήθως χρησιμοποιούνται.

2.10.1 Παράδειγμα υπολογισμού απαιτούμενης χωρητικότητας για την


ψηφιοποίηση βίντεο
Το μέγεθος της απαιτούμενης χωρητικότητας για την αποθήκευση ενός βίντεο εξαρτάται από τη
συχνότητα εναλλαγής των καρέ (fps), την ανάλυση και το βάθος χρώματος. Στο παράδειγμά μας
υπολογίζουμε την απαιτούμενη χωρητικότητα για την αποθήκευση 30 λεπτών βίντεο, το οποίο ακο-
λουθεί τη μορφή PAL, δηλαδή ρυθμό εναλλαγής ίσο με 25 εικόνες/καρέ ανά δευτερόλεπτο, ανάλυση
ανά καρέ 768Χ576 και βάθος χρώματος true color ή 24 bit ανά pixel.
Υπολογίζουμε την απαιτούμενη χωρητικότητα για την αποθήκευση ενός δευτερολέπτου βίντεο ως εξής:
–– Για την αποθήκευση μιας εικόνας / καρέ απαιτούνται 768 Χ 576 Χ 24 bit ή 10.616.832 bits
ή 1.327.104 byte ή περίπου 1,3 Mbytes.
–– Με δεδομένο τον ρυθμό εναλλαγής καρέ (25 fps), προκύπτει ότι για ένα δευτερόλεπτο πρέ-
πει να αποθηκευτούν 25 εικόνες, οπότε απαιτούνται 25 Χ 1,3 Μbytes ή 32,5 Mbytes (ανά
δευτερόλεπτο βίντεο).
–– Στη συνέχεια, υπολογίζουμε ότι για την αποθήκευση των 30 λεπτών βίντεο θα απαιτηθούν
30 λεπτά Χ 60 δευτερόλεπτα ανά λεπτό Χ 32,5 Mbytes ανά δευτερόλεπτο = 58.500 Mbytes
ή 58,5 Gbytes.
Σημειώνεται ότι η απαιτούμενη χωρητικότητα που υπολογίστηκε δεν λαμβάνει υπόψη τυχόν
διαδικασία συμπίεσης δεδομένων που μπορεί να εφαρμοστεί. Η πρακτική που ακολουθείται είναι ότι
το ψηφιακό βίντεο υφίσταται μια συμπίεση, κάτω από συγκεκριμένες προδιαγραφές, με σκοπό τη
μείωση της απαιτούμενης χωρητικότητας για την αποθήκευσή του.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 69 ~

2.10.2 Κωδικοποίηση βίντεο και μορφότυπα


Ένα ψηφιακό βίντεο αποθηκεύεται ως μια ακολουθία εικόνων (video stream), με έναν προκαθορι-
σμένο ρυθμό καρέ, η οποία συνοδεύεται και από ένα ηχητικό σήμα (audio stream), με τη βοήθεια
ενός μορφότυπου κωδικοποίησης (encoding) που περιέχει συνήθως και μια τεχνική συμπίεσης. Ένα
ψηφιακό αρχείο βίντεο έχει τη μορφή ενός περιέχοντος πλαισίου (container), όπου περιλαμβάνονται
η επικεφαλίδα του (πληροφορίες συγχρονισμού του μέρους βίντεο με το μέρος audio, τυχόν υπότιτ-
λος και μεταδεδομένα όπως το τίτλος κ.ά.), τα δεδομένα του βίντεο (video stream) και τα δεδομένα
του ήχου (audio stream). Όλα τα προηγούμενα επίπεδα πληροφορίας μέσω της διαδικασίας της πο-
λυπλεξίας (multimpexing) μετατρέπονται σε ένα ψηφιακό αρχείο. Για την εκτέλεση του ψηφιακού
βίντεο απαιτείται η διάθεση κατάλληλου προγράμματος αναπαραγωγής (media player), των σχετι-
κών βιβλιοθηκών αποκωδικοποίησης (decoding) τόσο της ροής βίντεο όσο και της ροής ήχου. Το πιο
διαδεδομένο πρόγραμμα ανοικτού κώδικα εκτέλεσης βίντεο, στο οποίο βρίσκονται ενσωματωμένοι
όλοι οι διαδεδομένοι αποκωδικοποιητές (codecs) είναι το VLC (http://www.videolan.org/vlc/).

Σχήμα 2.35. Κωδικοποίηση βίντεο.

Για την κωδικοποίηση της ροής βίντεο χρησιμοποιούνται συνήθως τα εξής πρότυπα: MPEG-
1, MPEG -2, MPEG -4, Η.262 κ.λπ. Για την κωδικοποίηση ροής ήχου χρησιμοποιούνται συνήθως τα
μορφότυπα MP3 και AAC (Advance audio coding). Στο μορφότυπο MP3 γίνεται συμπίεση του ήχου
με απώλειες, αλλά αφαιρώντας εκείνες τις φασματικές συνιστώσες που δεν είναι σχεδόν καθόλου
αντιληπτές από το μέσο αυτί. Το μορφότυπο ACC πετυχαίνει καλύτερη ποιότητα ήχου από το MP3
για τον ίδιο ρυθμό bits.
Η επέκταση του αρχείου ενός βίντεο δείχνει και την τεχνική κωδικοποίησης, καθορίζοντας
έτσι και τον σχετικό απαιτούμενο αποκωδικοποιητή (decoder).
Στον πίνακα που ακολουθεί αναγράφονται τα διαδεδομένα μορφότυπα και οι τεχνικές κω-
δικοποίησης που χρησιμοποιούν.
~ 70 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

Πίνακας 2.16. Μορφότυπα βίντεο – Τεχνικές κωδικοποίηση βίντεο και ήχου.

2.11 Βιβλιογραφικές αναφορές Κεφαλαίου 2

[1] Wikipedia. (2016). ASCII. Wikipedia. Retrieved July 1st, 2016, from https://en.wikipedia.org/
wiki/ASCII

[2] Gorn, S., Bemer, R. W., & Green, J. (1963). American standard code for information
interchange. Communications of the ACM, 6(8), 422–426. doi:10.1145/366707.367524

[3] Wikipedia. (2016). EBCDIC. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/EBCDIC

[4] Wikipedia. (2016). Baudot code. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/Baudot_code

[5] Wikipedia. (2016). ISO/IEC 8859. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/ISO/IEC_8859

[6] Wikipedia. (2016). UNICODE. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/Unicode

[7] Wikipedia. (2016). UTF-8. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/UTF-8

[8] Wikipedia. (2016). Universal Coded Character Set. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου
2016 από https://en.wikipedia.org/wiki/Universal_Coded_Character_Set

[9] ISO/IEC 10646:2003 -- Information technology -- Universal Coded Character Set (UCS).
(2003). International Organization for Standardization. Ανάκτηση 1η Σεπτεμβρίου 2016 από
http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?csnumber=63182

[10] Wikipedia. (2016). RGB. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/RGB_color_model
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 71 ~

[11] Wikipedia. (2016). CMYK Color Model. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από
https://en.wikipedia.org/wiki/CMYK_color_model

[12] Wikipedia. (2016). Huffman coding. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από
https://en.wikipedia.org/wiki/Huffman_coding

[13] Huffman, D. A. (1952). A Method for the Construction of Minimum-Redundancy Codes.


Proceedings of the IRE, 40(9), 1098–1101. doi:10.1109/JRPROC.1952.273898

[14] Wikipedia. (2016). Lempel–Ziv–Welch. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από


https://en.wikipedia.org/wiki/Lempel–Ziv–Welch

[15] Wikipedia. (2016). JPEG. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/JPEG

[16] Νικολόπουλος, Σ., Γεωργιάδης, Λ., & Παληός, Λ. (2015). Αλγοριθμική θεωρία γραφημάτων.
Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών. Ανάκτηση 1η Σεπτεμβρίου 2016
από https://repository.kallipos.gr/handle/11419/2067

[17] Wikipedia. (2016). Nyquist–Shannon sampling theorem. Wikipedia. Ανάκτηση 1η Σεπτεμβρί-


ου 2016 από https://en.wikipedia.org/wiki/Nyquist–Shannon_sampling_theorem

[18] Wikipedia. (2016). MP3. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/MP3

[19] ISO/IEC 11172-3:1993 - Information technology -- Coding of moving pictures and associated
audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio. (1993). ISO. Ανάκτη-
ση 1η Σεπτεμβρίου 2016 από http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_
detail.htm?csnumber=22412

[20] W3C. (2008). Web Content Accessibility Guidelines (WCAG) 2.0. W3C. Ανάκτηση 1η Σε-
πτεμβρίου 2016 από, from https://www.w3.org/TR/WCAG20/

[21] Wikipedia. (2016). PAL. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/PAL

[22] Wikipedia. (2016). SECAM. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/SECAM

[23] Wikipedia. (2016). NTSC. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/NTSC
~ 72 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

2.12 Βιβλιογραφία Κεφαλαίου 2

[1] Κουής, Δ., & Δενδρινός, Μ. (2010). Εισαγωγή στην Τεχνολογία Πληροφοριών (1st ed.). Αθή-
να: Εκδόσεις Νέων Τεχνολογιών.

[2] Butterfield, A. (Andrew), Ngondi, G. E., & Kerr, A. (n.d.). A dictionary of computer science.

[3] Forouzan, B. A., Στεφανίδης, Γ., & Χατζηγεωργίου, Α. (2003). Εισαγωγή στην επιστήμη των
υπολογιστών: θεμελιώδεις έννοιες - από το χειρισμό δεδομένων μέχρι τη θεωρία των υπολογι-
σμών. Αθήνα: Κλειδάριθμος.

[4] Witten, I. H., Bainbridge, D., & Nichols, D. M. (2010). How to build a digital library. Morgan
Kaufmann Publishers.

[5] Dendrinos, M., Bakamidis, S., & Carayannis, G. (1991). Speech enhancement from
noise: A regenerative approach. Speech Communication, 10(1), 45–57. doi: http://dx.doi.
org/10.1016/0167-6393(91)90027-Q

[6] Dendrinos, M. (2002). A Speaking Electronic Librarian. Ariadne, (33). Retrieved from
http://www.ariadne.ac.uk/issue33/dendrinos/

[7] Dendrinos, M., & Bakamidis, S. (2002). A Resource Description Device Used for More Efficient
Library Services. (Communications). Information Technology and Libraries, 21(4), 186.

[8] Δενδρινός, Μ. (2003). Ειδικές διεπαφές με ηλεκτρονικά συστήματα βιβλιοθηκών για άτο-
μα με προβλήματα όρασης. Στο 12ο Πανελλήνιο Συνέδριo Ακαδημαϊκών Βιβλιοθηκών (pp.
375–384). ΤΕΙ Σερρών.

2.13 Ερωτήσεις – Ασκήσεις αξιολόγησης Κεφαλαίου 2


2.13.1 Ερωτήσεις
1. Να αναφέρετε τέσσερα συστήματα αρίθμησης. Ποια είναι η βάση και ποια τα σύμβολα για το
καθένα από αυτά.
2. Πώς γίνεται η μετατροπή ενός δεκαδικού αριθμού στο δυαδικό και αντίστροφα.
3. Πώς γίνεται η μετατροπή ενός δυαδικού αριθμού στο οκταδικό και στο δεκαεξαδικό σύστημα
αρίθμησης.
4. Τι είναι το bit και το byte; Ποια είναι τα πολλαπλάσια του byte;
5. Τι είναι κώδικας στην Επιστήμη των Υπολογιστών;
6. Να αναφέρετε τρεις κώδικες για την ανταλλαγή πληροφοριών μεταξύ των ηλεκτρονικών
υπολογιστών.
7. Να αναφέρετε δύο κώδικες που υποστηρίζουν την ελληνική γλώσσα.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 73 ~

8. Πώς σχετίζεται το μήκος ενός σχήματος bit με το πλήθος των συμβόλων τα οποία μπορούν να
αναπαρασταθούν από το συγκεκριμένο σχήμα;
9. Γιατί δεν είναι δυνατή η αποθήκευση του δεκαδικού αριθμού 256 σε μια θέση μνήμης με 8 bit;
10. Με ποιον τρόπο αναπαριστά η ψηφιογραφική μέθοδος μια εικόνα ως σχήμα bit;
11. Ποιες είναι οι βασικές ιδιότητες μιας ψηφιακής εικόνας;
12. Να αναφέρετε δύο βασικά μοντέλα αναπαράστασης χρωμάτων στους ηλεκτρονικούς υπολογιστές.
13. Με ποιον τρόπο αναπαρίσταται μια εικόνα με τη χρήση της διανυσματικής μεθόδου;
14. Ποιο είναι το βασικό πλεονέκτημα της διανυσματικής μεθόδου αναπαράστασης μιας εικόνας σε
σχέση με την ψηφιογραφική;
15. Να αναφέρετε τις δύο βασικές κατηγορίες αλγορίθμων συμπίεσης δεδομένων.
16. Σε ποια αρχή στηρίζεται ο αλγόριθμος συμπίεσης δεδομένων του Huffman;
17. Να αναφέρετε τα βασικά μορφότυπα αποθήκευσης εικόνων.
18. Τι εννοούμε με τον όρο οπτική αναγνώριση χαρακτήρων;
19. Ποια είναι τα βήματα που απαιτούνται για την ψηφιοποίηση του ήχου;
20. Να αναφέρετε δύο βασικά μορφότυπα για την ψηφιακή αποθήκευση του ήχου. Ποια κατηγορία
αλγορίθμων συμπίεσης δεδομένων χρησιμοποιεί το καθένα από αυτά;
21. Να αναφέρετε τους τρεις βασικούς τομείς με τους οποίους ασχολείται η επεξεργασία της
ανθρώπινης φωνής.
22. Ποιες είναι οι βασικές ιδιότητες ενός βίντεο;
23. Ποια είναι τα πιο σημαντικά μορφότυπα αποθήκευσης βίντεο;

2.13.2 Ασκήσεις
1. Μετατρέψτε τον αριθμό 924 σε δυαδική, οκταδική και δεκαεξαδική μορφή.
2. Η Κεντρική Βιβλιοθήκη αποφασίζει να εμπλουτίσει την ψηφιακή της βιβλιοθήκη. Σε αυτή την
προσπάθεια θα προχωρήσει στην ψηφιοποίηση ενός μεγάλου αριθμού τεκμηρίων. Συγκεκριμέ-
να, θα ψηφιοποιήσει 150 διπλωματικές εργασίες (με μέσο όρο 100 σελίδες), 100 διδακτορικές
διατριβές (με μέσο όρο 200 σελίδες) και 100 βιβλία (με μέσο όρο 250 σελίδες). Πόση είναι η
απαιτούμενη χωρητικότητα σε αποθηκευτικό χώρο που θα απαιτηθεί (σε GBytes), αν ο εξοπλι-
σμός ψηφιοποίησης αποτελείται από ένα scanner με ανάλυση σάρωσης 5 Mpixels και βάθος
χρώματος 24 bit (ανά σελίδα).
3. Μια φωτογραφική μηχανή διαθέτει φακό με δυνατότητα ανάλυσης 5 Mpixels και βάθος χρώμα-
τος 24 bit. Μηχάνημα ψηφιοποίησης διαθέτει μια τέτοια μηχανή για την ψηφιοποίηση ιστορικών
βιβλίων, η οποία σε κάθε λήψη ψηφιοποιεί μια σελίδα του βιβλίου. Πόση είναι η απαιτούμενη
χωρητικότητα (σε GBytes) για την αποθήκευση ενός βιβλίου 500 σελίδων;
~ 74 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

4. Μια φωτογραφική μηχανή διαθέτει φακό με δυνατότητα ανάλυσης 2000Χ5000 pixels με βάθος
χρώματος true color. Πόση είναι η απαιτούμενη χωρητικότητα (σε GBytes) που πρέπει να διαθέ-
τει η συγκεκριμένη μηχανή για την αποθήκευση 100 φωτογραφιών;
5. Το μουσικό τμήμα μιας βιβλιοθήκης αποφασίζει να ψηφιοποιήσει και να διαθέσει μέσω του Δι-
αδικτύου μια συλλογή με σπάνιες ηχογραφήσεις. Συνολικά θα ψηφιοποιηθούν 5 ηχογραφήσεις
διάρκειας μίας (1) ώρας η καθεμιά. Ο εξοπλισμός ψηφιοποίησης έχει την ικανότητα να λαμβά-
νει 100.000 δείγματα το δευτερόλεπτο, σε δύο κανάλια ήχου (στερεοφωνική ψηφιοποίηση), με
την κωδικοποίηση του κάθε δείγματος να απαιτεί 4 bytes (4.294.967.296 επίπεδα κβαντισμού).
Πόση είναι η απαιτούμενη χωρητικότητα σε αποθηκευτικό χώρο που θα απαιτηθεί (σε GBytes)
για να αποθηκευτούν τα ψηφιακά αρχεία των παραστάσεων;
6. Κατασκευάστε το δένδρο Huffman για τη φράση “GOOD MORNING GREECE”.

2.14 Πίνακας ακρωνυμίων και ορολογία Κεφαλαίου 2

Ακρωνύμιο – Ανάλυση Ελληνικός όρος / μετάφραση

AAC Advance Audio Coding

Analog Αναλογικός

ANSI American National Standards Institute

American Standard Code for Information


ASCII Interchange - Αμερικανικός Πρότυπος Κώδι-
κας για την ανταλλαγή πληροφοριών

Binary digits - bits Δυαδικά ψηφία

Binary numerical system Δυαδικό σύστημα

Bitmap Ψηφιογραφικός

BS – Backspace Σβήσιμο χαρακτήρα

Byte Ψηφιολέξη

CD Compact Disc

CMYK Cyan - Magenta - Yellow - Black

Compression algorithm Αλγόριθμος συμπίεσης

CR-Carriage return ή enter Αλλαγή γραμμής


Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 75 ~

CSS Cascade Style Sheets

DCT Discrete Cosine Transform

Decimal numerical system Δεκαδικό σύστημα

Digital Ψηφιακός

Directed graph Κατευθυνόμενος γράφος

dpi dots per inch

DSP Digital Signal Processing

EBCDIC Extended Binary Code for Data Interchange

FHD Full High Definition

FLV Flash Video

FPS Frame rate Per Second

GIF Graphics Interchange Format

H/Y Ηλεκτρονικός υπολογιστής

HD High Definition

Hexadecimal numerical system Δεκαεξαδικό σύστημα

HTML HyperText Markup Language

IBM International Business Machines

JPG Joint Photographic Experts Group

Lossless compression algorithms Μη απωλεστικοί αλγόριθμοι

Lossy compression algorithms Απωλεστικοί αλγόριθμοι

LPCM Linear Pulse Code Modulation

LZW Lempel–Ziv–Welch

Multimpexing Πολυπλεξία

NTSC National Television System Committee

OCR Optical Character Recognition

Octal numerical system Οκταδικό σύστημα


~ 76 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης

PAL Phase Alternate Line

PDF Portable Document Format αρχεία

Pixel – Picture element Εικονοστοιχείο

PNG Portable Network Graphics

ppi pixels per inch

resolution ανάλυση

RGB Red Green Blue

SECAM Sequential Color with Memory

SVG Scalable Vector Graphics

TIFF Tagged Image File Format

UCS Universal Coded Character Set

UHD Ultra High Definition

UTF Unicode Transformation Format

WAV Wave Audio File Format)

WCAG Web Content Accessibility Guides

WMV Windows Media Video

XML eXtensible Markup Language

ΑμΕΑ Άτομα με Ειδικές Ανάγκες

Κβάντωση Quantization

Πίνακας 1.17. Πίνακας ακρωνυμίων και ορολογίας Κεφαλαίου 2.

You might also like