Professional Documents
Culture Documents
«Βασικές Αρχές Και Τεχνολογίες Στην Επιστήμη Της Πληροφόρησης»
«Βασικές Αρχές Και Τεχνολογίες Στην Επιστήμη Της Πληροφόρησης»
και Τεχνολογίες
στην Επιστήμη
της Πληροφόρησης
Μάρκος Δενδρινός
Δημήτρης Κουής
G Y
L O
N O
C H
T E
I O N
A T
R M
F O
IN
ΜΑΡΚΟΣ ΔΕΝΔΡΙΝΟΣ
Καθηγητής
ΔΗΜΗΤΡΗΣ ΚΟΥΗΣ
Καθηγητής
Συγγραφή
Μάρκος Δενδρινός
Δημήτρης Κουής
Κριτικός αναγνώστης
Χρήστος Σκουρλάς
ISBN: 978-960-603-519-7
Το παρόν έργο αδειοδοτείται υπό τους όρους της άδειας Creative Commons Αναφορά Δημιουργού -
Μη Εμπορική Χρήση - Όχι Παράγωγα Έργα 3.0.Για να δείτε ένα αντίγραφο της άδειας αυτής επισκεφτείτε
τον ιστότοπο https://creativecommons.org/licenses/by-nc-nd/3.0/gr/
1.2 Πληροφορία και γνώση στη φυσική γλώσσα και στη γλώσσα των Η/Υ ................................... 11
Σύνοψη
Στο πρώτο μέρος του παρόντος κεφαλαίου πραγματοποιείται η παρουσίαση της ιεραρχίας DIKW
(Data-Information-Knowledge-Wisdom), με βάση τις απόψεις και τις θεωρήσεις σημαντικών φιλο-
σόφων που ασχολήθηκαν με την έννοια της Πληροφορίας, όπως ο Russell Ackoff, ο Milan Zeleny, η
Jennifer Rowley αλλά και άλλοι. Επίσης, παρουσιάζονται η Πληροφορία και η Γνώση στο πλαίσιο της
φυσικής γλώσσας αλλά και από την πλευρά του νέου και αναπτυσσόμενου κλάδου της Φιλοσοφίας της
Πληροφορίας. Επιπλέον, στο δεύτερο μέρος του κεφαλαίου παρουσιάζονται η διαδικασία της μάθησης,
καθώς και μια πρώτη προσέγγιση αναφορικά με τον ρόλο και τα χαρακτηριστικά των Βιβλιοθηκών και
των Οργανισμών Πληροφόρησης.
Προαπαιτούμενη γνώση
Ίσως, άθελά του, πραγματοποιεί μια ουσιαστική παρατήρηση, ότι δηλαδή η ολοένα αυξανόμενη
παραγωγή πληροφοριών -αποτέλεσμα της τεχνολογικής προόδου κυρίως- δεν συμβαδίζει με την
απόκτηση, εκ μέρους της ανθρωπότητας, ενός καλύτερου επιπέδου γνώσης ή, ακόμα περισσότερο,
του σημαντικότερου στόχου, που δεν είναι άλλος από την κατάκτηση της σοφίας [1].
Η παραπάνω διαπίστωση του Έλιοτ έρχεται, πολύ αργότερα, να τεκμηριωθεί και να μοντε-
λοποιηθεί από μια σειρά από σύγχρονους στοχαστές, με κυριότερο τον Russell Ackoff, μέσω του μο-
ντέλου ιεραρχίας DIKW (Data-Information-Knowledge-Wisdom) που εκείνος πρώτος εισήγαγε [2].
~2~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Σοφία -
Wisdom
Γνώση - Knowledge
Πληροφορία - Information
Δεδοµένα - Data
Η Jennifer Rowley [3] θεωρεί ότι τα δεδομένα είναι προϊόν παρατηρήσεων και δεν έχουν
καμία αξία ώσπου να υποστούν επεξεργασία και να μετασχηματιστούν σε μια χρήσιμη μορφή, την
πληροφορία. Η πληροφορία περιέχεται στο περιεχόμενο των απαντήσεων σε συγκεκριμένες ερωτή-
σεις. Εν συνεχεία, η γνώση εκλεπτύνει περαιτέρω την πληροφορία, καθώς «καθιστά δυνατό τον μετα-
σχηματισμό της πληροφορίας σε εντολές και, επίσης, τον έλεγχο ενός συστήματος», ώστε να δουλεύει
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~3~
αποδοτικά. Η προοπτική που διατρέχει την ιεραρχία του Achoff είναι περισσότερο διαχειριστική
παρά σχολαστική, οπότε το νόημα που δίνει στην κατανόηση είναι η ικανότητα κάποιου να εκτιμά
και να διορθώνει τα λάθη, ενώ με τον όρο σοφία εννοεί την ικανότητα μακροπρόθεσμης πρόβλεψης
των συνεπειών μιας δράσης και της αιτιολόγησής τους σε σχέση με το ιδανικό του απόλυτου ελέγχου.
Σύμφωνα με τον Ackoff [4], η απόδοση (efficiency) και η αποτελεσματικότητα (effectiveness)
διαχωρίζονται ως εξής: «η επιστήμη, η τεχνολογία και τα οικονομικά εστιάζονται στην απόδοση και
όχι στην αποτελεσματικότητα». Η απόδοση είναι ένα μέτρο του πόσο καλά χρησιμοποιούνται οι πό-
ροι για την επίτευξη στόχων. Η αποτελεσματικότητα είναι η απόδοση μετρημένη με βάρος τις αξίες
των υπό εκπλήρωση στόχων. Συγκεκριμένα: «Η απόδοση αφορά το να κάνεις τα πράγματα σωστά,
ενώ η αποτελεσματικότητα το να κάνεις τα σωστά πράγματα...».
Η διαφορά μεταξύ απόδοσης και αποτελεσματικότητας αντανακλάται και στη διαφορά με-
ταξύ των δυο διαφορετικών παραμέτρων/όψεων της προόδου: (α) την ποσοτική αύξηση (growth)
και (β) την ποιοτική βελτίωση (development). Η ποσοτική αύξηση είναι η αύξηση σε σχέση με το
μέγεθος ή την ποσότητα, ενώ η ποιοτική βελτίωση είναι η αύξηση σε σχέση με την ικανότητα. Για
παράδειγμα, το επίπεδο διαβίωσης αναφέρεται κυρίως στην ποσοτική αύξηση, ενώ αντίστοιχα η
ποιότητα ζωής στον δείκτης της ποιοτικής βελτίωσης. Επισημαίνεται ότι οι δυο αυτές παράμετροι
μπορούν να συμβούν/διαφοροποιηθούν ανεξάρτητα (π.χ. ο όγκος των σκουπιδιών αυξάνει, αλλά δεν
βελτιώνονται, μια εταιρεία μπορεί να βελτιώνεται, χωρίς να αυξάνει σε μέγεθος κ.λπ.).
Ακόμα και οι αξίες, οι οποίες είναι αντικείμενο της ηθικής και της αισθητικής, εμπλέκονται
άμεσα στην μετατροπή της απόδοσης σε αποτελεσματικότητα. Η παραγωγή δεδομένων, πληροφορί-
ας, γνώσης και σοφίας είναι βασικές λειτουργίες της επιστήμης και αποτελούν αναπόσπαστο μέρος
των εσωτερικών διαδικασιών. Η παραγωγή σοφίας, η οποία προϋποθέτει τα τρία (3) προηγούμενα,
είναι βασικά μια λειτουργία της ηθικής και της αισθητικής, καθώς εμπλέκει τη συνειδητή εισαγωγή
αξιών στη λήψη αποφάσεων και την αξιολόγηση των αποτελεσμάτων.
Η αποτελεσματικότητα λοιπόν είναι προϊόν της σοφίας, καθώς εμπλουτίζει το εύρος των συ-
νεπειών που λαμβάνονται υπόψη κατά τη διάρκεια μιας απόφασης, όσο και το χρονικό διάστημα στο
οποίο αναφέρονται / έχουν επίδραση οι πιθανές συνέπειες. Λαμβάνοντας υπόψη τόσο τις μακροπρό-
θεσμες όσο και τις βραχυπρόθεσμες συνέπειες, η σοφία αποτρέπει τη θυσία του μέλλοντος χάριν
του παρόντος. Για παράδειγμα, «η τεχνολογία μας δίνει τη δυνατότητα να κρατάμε ασθενείς στη ζωή
μηχανικά για μεγάλο χρονικό διάστημα, με μεγάλο κόστος. Είναι όμως αυτό μακροπρόθεσμα σωστό;
Είναι σοφό; Μήπως οι ίδιοι πόροι θα μπορούσαν να χρησιμοποιηθούν κάπου καλύτερα;».
Οπότε στην παραπάνω αντιδιαστολή απόδοσης και αποτελεσματικότητας, εφόσον ο Ackoff
συνδέει την αποτελεσματικότητα με τη σοφία, μάλλον υπονοεί ότι η απόδοση είναι προϊόν των τρι-
ών (3) προηγουμένων σταδίων: δεδομένων, πληροφορίας, και γνώσης.
Ο Ben Rockwood [5] ενδιαφέρεται για τη διαφορά μεταξύ του να κάνεις τα πράγματα σω-
στά και του να κάνεις σωστά πράγματα, και ανατρέχει στο έργο του Ackoff, ο οποίος, στα παρακάτω
αποσπάσματα βίντεο, αναφέρει:
~4~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Στη συνέχεια, στο Μέρος II, o Ackoff κάνει αναφορά σε διάφορα παραδείγματα, για να κατα-
δείξει ότι η αναλυτική σκέψη (δεδομένα – πληροφορία – γνώση) είναι ανεπαρκής για την αντι-
μετώπιση των σύγχρονων προβλημάτων, τα οποία απαιτούν ένα νέο πρότυπο σκέψης (αυτό της
συνθετικής σκέψης):
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~5~
Οι Bellinger, Castro και Mills [6] ερμηνεύουν ως εξής τους βασικούς ορισμούς του Ackoff:
–– Τα δεδομένα είναι ακατέργαστα, απλώς υπάρχουν και δεν διαθέτουν καμία σημασία πέ-
ραν της ύπαρξής τους. Υφίστανται σε οποιαδήποτε μορφή, χρηστική ή μη, π.χ. στο πλαί-
σιο των υπολογιστών, τα δεδομένα αντιστοιχούν στο περιεχόμενο ενός φύλλου εργασιών
(spreadsheet).
–– Πληροφορία είναι τα δεδομένα, στα οποία έχει δοθεί νόημα μέσω μιας σχεσιακής σύν-
δεσης. Το “νόημα” μπορεί να είναι χρήσιμο, αλλά δεν είναι απαραίτητο ότι έχει συμβεί.
Στο πλαίσιο των υπολογιστών, η πληροφορία αντιστοιχεί σε μια σχεσιακή βάση δεδομένων
(relational database). Συγκεκριμένα, η βάση δεδομένων μπορεί να παράγει πληροφορία
από τα αποθηκευμένα της δεδομένα και την αξιοποίηση των μεταξύ τους σχέσεων.
–– Γνώση είναι μια συλλογή πληροφοριών, για την οποία υπάρχει πρόθεση να γίνει χρηστική.
Η γνώση είναι ντετερμινιστική διαδικασία (αιτιοκρατική). Όταν κάποιος απομνημονεύει
πληροφορία, την καθιστά γνώση μέσα από τη διανοητική επεξεργασία. Αυτή η γνώση έχει
ένα χρήσιμο νόημα γι’ αυτόν που την κατέχει, αλλά δεν αποτελεί μια ολοκληρωμένη κατά-
σταση, τέτοια ώστε να παράγεται απ’ αυτήν περαιτέρω γνώση. Για παράδειγμα, η απάντηση
σε ό, τι αφορά τον πολλαπλασιασμό 2x2 είναι εύκολη, αλλά η απάντηση στον πολλαπλασι-
ασμό 1320x1261 απαιτεί περαιτέρω γνώση (αλγόριθμος πολλαπλασιασμού). Για να μπορεί
κάποιος να απαντήσει σε μια τέτοια ερώτηση χρειάζεται μια πραγματικά γνωσιακή και ανα-
λυτική ικανότητα, η οποία αναπτύσσεται στο επόμενο στάδιο (κατανόηση).
–– Κατανόηση (understanding) είναι μια γνωσιακή και αναλυτική διαδικασία κατά την οποία
πραγματοποιείται σύνθεση και νέα γνώση από προηγούμενες γνώσεις. Είναι παρεμβλητική
(interpolative), δηλαδή δημιουργεί μια γνώση ως παρεμβολή σε άλλες, και πιθανοκρατική,
δηλαδή εκτιμά την πιθανότητα να ισχύει κάτι με βάση άλλες γνώσεις. Η διαφορά μεταξύ
κατανόησης και γνώσης είναι η διαφορά μεταξύ εκμάθησης και απομνημόνευσης. Οι άν-
θρωποι μέσω της διανοητικής λειτουργίας μπορούν να κατανοούν τις γνώσεις, δηλαδή να
συνθέτουν νέα γνώση ή τουλάχιστον νέα πληροφορία από προηγούμενες πληροφορίες, γνώ-
σεις και κατανοήσεις. Στο πλαίσιο των υπολογιστών, τα συστήματα Τεχνητής Νοημοσύνης
(Artificial Intelligence – AI) διαθέτουν κατανόηση με την έννοια ότι μπορούν να συνθέσουν
νέα γνώση από προηγούμενα αποθηκευμένες πληροφορίες και γνώσεις.
–– Σοφία είναι η ουσία της φιλοσοφικής έρευνας. Επιχειρεί να προσφέρει κατανόηση για ό, τι
προηγουμένως δεν υπήρχε κατανόηση, και με τον τρόπο αυτόν προχωρά πέραν της κατανόη-
σης. Είναι λοιπόν μια επεκτατική (extrapolative) διαδικασία και μάλιστα μη-πιθανοκρατική,
καθώς δεν εκτιμά πιθανότητες με βάση υπάρχουσες γνώσεις, αλλά στηρίζεται κυρίως στην
έμπνευση. Σε αντίθεση με τα προηγούμενα τέσσερα επίπεδα, θέτει ερωτήσεις στις οποίες δεν
υπάρχει εύκολη απάντηση, και ενίοτε, δεν υπάρχει καν απάντηση, μέχρι τώρα. Στη σοφία θα
μπορούσε να ενταχθεί και η ικανότητα διάκρισης μεταξύ ορθού και λάθους, καλού και κακού.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~7~
Συνεκτικότητα Σοφία
Κατανόηση
αρχών
Γνώση
Κατανόηση
μοτίβων
Πληροφορία
Κατανόηση
απλών σχέσεων
Δεδομένα Κατανόηση
Ο David Weinberg [7] εμβαθύνει στην ερμηνεία του μοντέλου DIKW σύμφωνα με τους
Ackoff και Zeleny, ανατρέχοντας στον Θεαίτητο (διάλογος του Πλάτωνα).
Η μετάβαση από την πληροφορία στη γνώση είναι πολύ πιο προβληματική από τη μετάβαση από
τα δεδομένα στην πληροφορία. Αν ρωτήσεις κάποιον εκτός του κύκλου των επιστημόνων της πληροφορί-
ας/πληροφόρησης (information science), τι σημαίνει πληροφορία θα δυσκολευτείς να πάρεις απάντηση.
Πρόκειται λοιπόν για κάποιον όρο που διατίθεται για επανακαθορισμό. Αντίθετα, ο όρος γνώση είναι από
τις σημαντικότερες λέξεις του πολιτισμού μας, εδραιωμένος, με μια μακρά και βαθιά ιστορία.
Τι είναι λοιπόν η γνώση στην πυραμίδα DIKW; Για τον Ackoff, η γνώση «μετατρέπει την
πληροφορία σε εντολές». Ο Milan Zeleny [8] υποστηρίζει ότι η γνώση είναι η συνταγή που σου επι-
τρέπει να φτιάχνεις ψωμί από τα συστατικά όπως (είναι) το αλεύρι, το νερό και η μαγιά (τα οποία
είναι οι πληροφορίες, με τον ρόλο τον δεδομένων να διαδραματίζουν τα μόρια των συστατικών).
Ο οδηγός καλής πρακτικής για τη Διαχείριση Γνώσης [9] της Ευρωπαϊκής Επιτροπής Τυποποίη-
σης αναφέρει σχετικά: «Γνώση είναι ο συνδυασμός δεδομένων και πληροφορίας, στον οποίο προστίθεται
η γνώμη των ειδικών, επιδεξιότητα και εμπειρία, ώστε να επιτευχθεί ένα πολύτιμο αποτέλεσμα που μπορεί
να χρησιμοποιηθεί στην υποβοήθηση λήψης αποφάσεων - The combination of data and information, to
which is added expert opinion, skills and experience, to result in a valuable asset which can be used to
aid decision making. Knowledge may be explicit and/or tacit, individual and/or collective».
Σε όλες αυτές τις περιγραφές η γνώση βοηθά στη δράση και αποτελεί μια εκλέπτυνση της
πληροφορίας. Ήδη πριν από 2500 έτη ο Πλάτων δίνει τον ορισμό της γνώσης στον Θεαίτητo, ως
αληθή δοξασία, και μάλιστα δικαιολογημένα ορθή δοξασία. Πράγματι, πάντοτε η γνώση θεωρείται
κάτι πέραν της απλής συσσώρευσης δοξασιών, ως κάτι που αντανακλά την αληθή φύση του σύμπα-
ντος, ενός όλου που λέγεται «κόσμος» ακριβώς επειδή τα μέρη συνιστούν κάτι αληθές και ωραίο.
~8~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Το πραγματικό πρόβλημα δεν είναι η θέση της γνώσης στην ιεραρχία DIKW αλλά η ερμη-
νεία της ως αποτελέσματος επεξεργασίας της διαθέσιμης πληροφορίας. Γιατί στην πραγματικότητα
δεν αποκτάται από τον άνθρωπο έτσι, όπως δηλαδή συμβαίνει στη μηχανή. Πράγματι, στον υπολο-
γιστή η γνώση προκύπτει μέσω συνδυαστικών ερωτημάτων (queries), σε διάφορους πίνακες βάσεων
δεδομένων που φιλτράρουν (επιλέγουν με διάφορα κριτήρια) τη διαθέσιμη αποθηκευμένη πληροφο-
ρία ή «τρέχοντας» εξελιγμένους αλγόριθμους (ακολουθίες εντολών) σε μεγάλο όγκο πληροφοριών.
Εν τούτοις, στον άνθρωπο η γνώση δεν προκύπτει από τέτοιες διαδικασίες φιλτραρίσματος ή αλγο-
ριθμικών ακολουθιών εντολών αλλά μέσω μιας πολυπλοκότερης διαδικασίας κοινωνικής φύσεως,
καθοδηγούμενης από στόχους (goal-driven) και βασισμένης στα συμφραζόμενα (contextual) και σε
στοιχεία πολιτιστικά (culturally-bound). Φτάνουμε στη γνώση – και ειδικά την αξιοποιήσιμη προς
δράση (actionable) γνώση – επειδή υπάρχουν επιθυμίες και περιέργεια, μέσω σχεδίων και παιγνίων,
μέσω των λανθασμένων παρά των ορθών ενεργειών, μέσω συζητήσεων με άλλους και δημιουργίας
κοινωνικών δεσμών, μέσω εφαρμογής μεθόδων από τις οποίες στη συνέχεια υπαναχωρούμε, μέσω
κοπιαστικών υπολογισμών αλλά ενίοτε και εύνοιας της τύχης, ορθολογικά αλλά και διαισθητικά,
μέσω θεσμικών διαδικασιών και κοινωνικών ρόλων. Το σημαντικό σ’ αυτή τη θεώρηση, όπου οι
αποφάσεις είναι δύσκολες και η διαδικασία παραγωγής γνώσης επίπονη, είναι ότι η γνώση δεν καθο-
ρίζεται από την πληροφορία, καθώς η ίδια η γνωστική διαδικασία αποφασίζει καταρχήν ποια πληρο-
φορία είναι σχετική και πώς πρέπει να χρησιμοποιηθεί.
Η πυραμίδα DIKW είναι υπεραπλουστευτική και αντιστοιχεί στην αντίληψη ότι αρκεί να
φιλτραριστεί ο θόρυβος της πληροφορίας και να προκύψει μια ροή πληροφοριών καθαρή και δι-
αχειρίσιμη. Όμως, η απόκτηση της γνώσης είναι μια διαδικασία πιο δημιουργική, πιο άτακτη και
περισσότερο ασυνεχής.
Πίνακας 1.3. Σύγκριση του μοντέλου DIKW κατά Ackoff και Zeleny.
Στη συνέχεια, παρατίθενται ενδιαφέροντες ορισμοί και περιγραφές των δεδομένων, της πληροφορί-
ας και της γνώσης από διάφορους συγγραφείς, οι εξής:
Δεδομένα
–– Δεδομένα είναι στοιχεία χωρίς νόημα και αξία, χωρίς πλαίσιο συμφραζομένων και χωρίς ερμηνεία.
–– Δεδομένα είναι διακεκριμένα αντικειμενικά γεγονότα ή παρατηρήσεις, ανοργάνωτα και ανε-
πεξέργαστα, τα οποία δεν μεταφέρουν κάποιο ειδικό νόημα.
Πληροφορία
–– Πληροφορία είναι μορφοποιημένα δεδομένα που αναπαριστούν την πραγματικότητα.
–– Πληροφορία είναι δεδομένα που έχουν μορφοποιηθεί κατά τέτοιον τρόπο ώστε να είναι κατα-
νοητά και χρήσιμα στα ανθρώπινα όντα.
–– Πληροφορία είναι δεδομένα που έχουν οργανωθεί κατά τέτοιον τρόπο ώστε να έχουν νόημα
και αξία για τον παραλήπτη.
–– Πληροφορία είναι δεδομένα που έχουν υποστεί επεξεργασία για κάποιον σκοπό.
–– Πληροφορία είναι δεδομένα στα οποία έχει δοθεί νόημα μέσω των συμφραζομένων.
~ 10 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Γνώση
–– Γνώση είναι δεδομένα ή/και πληροφορία που έχουν οργανωθεί και υποστεί επεξεργασία
έτσι ώστε να μεταφέρουν κατανόηση, εμπειρία, συσσωρευμένη εκμάθηση και επιδεξιότητα
(expertise) όσον αφορά ένα συγκεκριμένο πρόβλημα ή δραστηριότητα.
–– Η γνώση εδράζεται πάνω στην πληροφορία που εξάγεται από τα δεδομένα, αλλά ενώ τα δε-
δομένα είναι μια ιδιότητα των πραγμάτων, η γνώση είναι ικανότητα του ανθρώπου να τα
χρησιμοποιεί ώστε να δρα με ένα συγκεκριμένο τρόπο.
–– Κατά τους Pearlson and Saunders [10], «η γνώση είναι ένα μείγμα πληροφορίας, αξιών, εμπειρί-
ας και κανόνων και περιλαμβάνει τη σύνθεση πληροφοριών διαφόρων πηγών. Η ανθρώπινη συμ-
βολή αυξάνει στην πορεία από τα δεδομένα στη πληροφορία και από την πληροφορία στη γνώση».
–– Οι Bocij, Greasley και Hickie [11] πραγματοποιούν τη διαφοροποίηση μεταξύ της εμφα-
νούς (explicit) γνώσης και της σιωπηρής (tacit) γνώσης, προτείνοντας ότι εμφανής γνώση
είναι αυτή που μπορεί να καταγραφεί σε Πληροφοριακά Συστήματα, σε αντίθεση με τη
σιωπηρή γνώση που δεν μπορεί να καταγραφεί, καθώς είναι μέρος του ανθρώπινου νου.
Ομοίως, ο Michael Polanyi [12] υποστηρίζει ότι «θα έπρεπε να ξεκινήσουμε από το γεγονός
ότι μπορούμε να μάθουμε περισσότερα από όσα μπορούμε να πούμε». Ονόμασε αυτήν την
προ-λογική φάση της γνώσης ως σιωπηρή (tacit) γνώση. Κατά τους Laudon και Laudon
[13], «σιωπηρή γνώση είναι η προσωπική γνώση που είναι εμφυτευμένη στην ατομική εμπει-
ρία και περιλαμβάνει μη χειροπιαστούς παράγοντες όπως η προσωπική πίστη, η προοπτική
και οι αξίες. Εμφανής γνώση είναι η σιωπηρή γνώση που έχει καταγραφεί». Τέλος, οι Awad
και Ghaziri [14] ερμηνεύουν ως «σιωπηρή γνώση τη γνώση που εμφυτεύεται στον ανθρώπινο
νου μέσω της εμπειρίας και της εργασίας. Εμφανής γνώση είναι η γνώση που έχει κωδικοποι-
ηθεί και αναπαρασταθεί σε βιβλία, τεκμήρια, αναφορές, εκπαιδευτικές σειρές κ.λπ.».
–– Ενδιαφέρον έχει και η διάκριση προτασιακής (propositional) και διαδικασιακής
(procedural) γνώσης. Ο Zeleny θεωρεί τη γνώση ως τεχνογνωσία (know-how), ως διαδι-
κασία, όχι ως περιγραφή διαδικασίας και μάλιστα αρνείται την ύπαρξη εμφανούς γνώσης,
καθώς, κατά την άποψη του, μόλις η γνώση καταγραφεί με σύμβολα καθίσταται πληρο-
φορία. Άλλοι όμως, θεωρητικοί, πιστεύουν ότι μπορεί η γνώση να εκφραστεί προτασιακά
ως δικαιολογημένες δοξασίες (υποκειμενική σιωπηρή γνώση), αλλά και ως σύμβολα που
αναπαριστούν αυτές τις δοξασίες (αντικειμενική εμφανής γνώση).
Τέλος, ολοκληρώνοντας αυτή τη σύντομη βιβλιογραφική αναδρομή, η Rowley επιχειρεί μια αντι-
στοίχιση των στοιχείων της ιεραρχίας DIKW με τους τύπους Πληροφοριακών Συστημάτων, όπως
φαίνεται στο παρακάτω Σχήμα:
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 11 ~
Σχήμα 1.3. Αντιστοίχιση της ιεραρχίας DIKW με τους τύπους των Πληροφοριακών Συστημάτων.
1.2 Πληροφορία και γνώση στη φυσική γλώσσα και στη γλώσσα των Η/Υ
Στη παρούσα παράγραφο ακολουθεί μια περιγραφή της πληροφορίας και της γνώσης στο πλαίσιο
μιας φυσικής γλώσσας.
Ως πληροφορία μπορεί να θεωρηθεί η άμεση σημασία των εννοιών και των προτάσεων.
Αντίθετα, ως γνώση συνήθως ορίζεται η απόδοση μιας τιμής αλήθειας (ισχύει / δεν ισχύει - true or
false) στις προτάσεις εκείνες που είναι άμεσα επαληθεύσιμες από την εμπειρία ή της συνεπαγόμενης
τιμής αλήθειας μιας πρότασης, βάσει της τιμής αλήθειας άλλων, επιμέρους, σχετιζόμενων προτάσε-
ων, μέσω της εφαρμογής λογικών κανόνων.
Η πληροφορία είναι μια έννοια πρωταρχική, για την οποία έχουν προταθεί πολλές περιγραφές
και ορισμοί (βλ. πιο πάνω). Θα μπορούσε να οριστεί ως η αποδιδόμενη σημασία σε ένα παρατηρού-
μενο ή φανταστικό αντικείμενο (πχ. άνθρωπος, γάτα, τραπέζι, γοργόνα, ξωτικό) ή σε μια ιδιότητα (πχ.
πράσινο, μαλακό, ξεπερασμένο), για καθένα από τα οποία έχουμε ορίσει ένα αυθαίρετο όνομα (όρο).
Ο όρος είναι το δεδομένο και η πληροφορία είναι η σημασία του. Συνδυάζοντας όρους δομούμε
προτάσεις που περιγράφουν δραστηριότητες (π.χ. «βρέχει» ή «το τραπέζι είναι πράσινο» ή «ο Νίκος
τρέχει»). Ο ισχυρισμός (νόημα-πληροφορία) που περιέχεται σε μια πρόταση μπορεί να εξεταστεί από
την κρίση ενός υποκειμένου, δηλαδή κατά πόσο ανταποκρίνεται ή όχι στην πραγματικότητα, οπότε
χαρακτηρίζεται ως αληθής ή ψευδής. Οι όροι που δομούν την πρόταση είναι τα δεδομένα, το νόημά
της είναι η πληροφορία και η πληροφορία μαζί με την τιμή αλήθειάς της είναι η γνώση.
Μια άλλη μορφή γνώσης είναι η τοποθέτηση μιας έννοιας (σημασίας-πληροφορίας) σε μια
ιεραρχία ή σε ένα δίκτυο εννοιών βάσει κάποιων σχέσεων, από την απλή ταξινομία μιας προκαθο-
ρισμένης ιεραρχίας σχέσεων ευρύτερο-στενότερο μέχρι την οντολογία, όπου οι έννοιες ορίζονται
ελεύθερα μέσω οποιωνδήποτε σχέσεων.
Σημαντική σημασία διαδραματίζει η ροή της πληροφορίας από μια πηγή σε έναν δέκτη
(είτε άνθρωπο είτε μηχανή). Ειδικότερα, μέσω μιας σειράς δεδομένων (είτε προφορικών ή γραπτών
συμβόλων) επικοινωνούν δυο άνθρωποι μεταξύ τους. Η επικοινωνία όμως είναι δυνατή μόνο αν
~ 12 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
αντιλαμβάνονται με τον ίδιο τρόπο τη σημασία των συμβόλων, έχουν δηλαδή μια κοινή αντίληψη
της πληροφορίας, κατανοούν μια κοινή γλώσσα.
Κατά αναλογία, στον κόσμο των ηλεκτρονικών υπολογιστών, τα δυαδικά ψηφία (bits) και οι
συνδυασμοί τους, στο πλαίσιο της δυαδικής γλώσσας (δυαδικά δεδομένα), είναι κωδικοποιημένα σύμ-
βολα που αναπαριστούν εντολές και δεδομένα. Οι εντολές αυτές καθοδηγούν τον υπολογιστή ώστε να
εκτελέσει συγκεκριμένες διαδικασίες και τα δεδομένα που τις συνοδεύουν είναι ονόματα ή τιμές παρα-
μέτρων αυτών των διαδικασιών. Οι εντολές και τα δεδομένα έχουν προκαθορισμένη και αντικειμενική
σημασία (information) για κάθε συγκεκριμένο τύπο μηχανών – ηλεκτρονικών υπολογιστών. Τα δεδο-
μένα εισόδου του υπολογιστή (input data) υφίστανται επεξεργασία (processing) και οδηγούν στην πα-
ραγωγή νέων δεδομένων, των δεδομένων εξόδου (output data), τα οποία μεταφέρουν νέα πληροφορία.
Από τα παραπάνω φαίνεται ότι η έννοια της πληροφορίας είναι σχετική με τον φορέα αντί-
ληψης. Αυτό που αποτελεί πληροφορία για τον άνθρωπο (φυσική γλώσσα) δεν είναι πληροφορία
για τον υπολογιστή (ο οποίος αντιλαμβάνεται μόνο τη δυαδική γλώσσα μηχανής), και για τον λόγο
αυτό υπάρχει η ανάγκη μεταγλώττισης των ανθρωπίνως εννοούμενων εντολών σε δυαδικές εντολές,
δυαδικής κωδικοποίησης των δεδομένων (αριθμών και ονομάτων) και, στη συνέχεια, η αντίστροφη
διαδικασία αποκωδικοποίησης των αποτελεσμάτων του προγράμματος σε μια μορφή που να είναι
κατανοητή από τον άνθρωπο (φυσικό κείμενο, γραφικά κ.λπ.).
Οι έννοιες έχουν προκύψει μετά από μια διαδικασία κατηγοριοποίησης πολλών παρόμοιων
αντικειμένων. Πρωταρχικά χρησιμοποιούνται οι έννοιες ως αντιπρόσωποι, υποκατάστατα, σύμβο-
λα αντικειμένων, στη συνέχεια αποκτούν αυθυπαρξία και γίνονται πρώτη ύλη για τον σχηματισμό
προτάσεων (απλών ή σύνθετων) και, στη συνέχεια, συλλογισμών (κατηγορικών, υποθετικών ή δι-
αζευκτικών). Πρόταση, κατά τον Αριστοτέλη, είναι «λόγος ἀποφαντικὸς, ἀλλ’ ἐν ᾧ τὸ ἀληθεύειν ἢ
ψεύδεσθαι ὑπάρχει», είναι δηλαδή μια κρίση που τίθεται υπό έλεγχο, και παρά την πεποίθηση του
ομιλούντος περί της αλήθειάς της της, μπορεί να καταδειχθεί εντέλει ψευδής. Συλλογισμός είναι μια
σειρά προτάσεων που οδηγούν μέσω κάποιων λογικών κανόνων σε μια άλλη πρόταση. Η προσφυγή
στην εμπειρία, στην περίπτωση των κατηγορικών προτάσεων, καταδεικνύει την τιμή αλήθειάς τους.
Η εφαρμογή των κανόνων της λογικής διακρίνεται στις εξής περιπτώσεις:
–– 1η περίπτωση: η αλήθεια μιας υποθετικής πρότασης αποδεικνύεται με βάση την αλήθεια της
προηγούμενης πρότασης [π.χ. αρχική πρόταση: «ο Νίκος είναι γιος του Χρήστου (αληθής)», επο-
μένως, η πρόταση προς εξέταση: «Ο Χρήστος είναι πατέρας του Νίκου» είναι και αυτή αληθής].
–– 2η περίπτωση: το ψεύδος μιας υποθετικής πρότασης αποδεικνύεται με βάση το ψεύδος
της επόμενης πρότασης (π.χ. αρχική πρόταση – πρόταση προς εξέταση: «Ο Νίκος είναι
μεγαλύτερος σε ηλικία από τον Χρήστο», άρα η επόμενη πρόταση «ο Χρήστος μπορεί να
είναι γιος του Νίκου», η οποία είναι ψευδής αφού «Ο Χρήστος είναι πατέρας του Νίκου»,
μας αποδεικνύει ότι και η αρχική πρόταση είναι ψευδής).
–– 3η περίπτωση: η εφαρμογή των κανόνων της λογικής σε μια σειρά από απλές προτάσεις
καθορίζει την τιμή αλήθειας μιας πιο σύνθετης πρότασης (π.χ. «η Μαρία είναι κόρη του
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 13 ~
Νίκου», «η Μαρία είναι κόρη της Γεωργίας», επομένως «Η Μαρία, ο Νίκος και η Γεωργία
αποτελούν μια οικογένεια»).
–– 4η περίπτωση: η εφαρμογή πολύπλοκων συλλογιστικών σχημάτων και μεθόδων, βασισμέ-
νων στη λογική, καθορίζει την τιμή της αλήθειας σε σύνθετα νοητικά συμπεράσματα.
Η απόφανση περί της τιμής αλήθειας μιας πρότασης με βάση τις τιμές αλήθειας άλλων προ-
τάσεων και κάποιους λογικούς κανόνες αποτελούν βασικές διεργασίες της διαδικασίας της γνώσης.
Χαρακτηριστικά:
⁃ θερµοκρασία
⁃ υγρασία
⁃ άνεµοι
⁃ ηλιοφάνεια
Χαρακτηριστικά:
Χαρακτηριστικά: ⁃ κατεύθυνση
⁃ βαθµοί ⁃ ένταση
⁃ ώρα λήψης ⁃ ώρα λήψης
⁃ σταθµός λήψης ⁃ σταθµός λήψης
Έννοια
Κλάση αποτελείται “Καιρός” αποτελείται Κλάση
15 C “ανεµοι”
στιγµιότυπο “Θερµ/σία”
14:00
Station01 αποτελείται στιγµιότυπο
αποτελείται
ΒΔ
5 µποφώρ
Κλάση 14:00
Κλάση “ηλιοφάνεια” Station01
“υγρασία”
στιγµιότυπο
στιγµιότυπο
100 %
80%
14:00
14:00
Station01
Station01
Χαρακτηριστικά:
Χαρακτηριστικά:
⁃ % ποσοστό
⁃ % ποσοστό
⁃ ώρα λήψης
⁃ ώρα λήψης
⁃ σταθµός λήψης
⁃ σταθµός λήψης
Δεδομένα Δεδομένα
Μαθηματικά Βιολογία αντίληψης αισθήσεων
“φίλτρο”
αντίληψης
νοητική
επεξεργασία
αναζήτηση,
Χημεία σύγκριση,
ταξινόμηση,
συσχέτιση,
επικαιροποίηση
και συλλογισμός
Καταχώρηση
Αναζήτηση Παγκόσμιος συσσωρευτής γνώσης
Πρόσκτηση
Σχήμα 1.5. Αλληλεπίδραση μεταξύ του προσωπικού και παγκόσμιου συσσωρευτή γνώσης1.
1 Ειδικά σε ό,τι αφορά τον παγκόσμιο συσσωρευτή γνώσης, βασικό ρόλο στη συγκρότησή του και στη διατή-
ρησή του διαδραμάτισαν και διαδραματίζουν οι Βιβλιοθήκες και οι Οργανισμοί Πληροφόρησης.
~ 18 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Η μεγάλη επανάσταση στον χώρο της γνώσης γίνεται με την εφεύρεση της τυπογραφίας
κατά τον 15ο αιώνα, οπότε η δυνατότητα παραγωγής πολλαπλών αντιτύπων ενός κειμένου, απε-
λευθερώνει και κοινωνικοποιεί τη γνώση, δίνοντας πλέον στις βιβλιοθήκες έναν άλλον ρόλο, αυ-
τόν της καλύτερης οργάνωσης και ταξινόμησης των βιβλίων, οδηγώντας ταυτόχρονα σε ιδιωτικές
συλλογές και βιβλιοθήκες.
Η επόμενη μεγάλη επανάσταση στον χώρο της γνώσης γίνεται επί των ημερών μας, όπου
πλέον η γνώση, στον μεγαλύτερο όγκο της, αποθηκεύεται και διαδίδεται, σε ηλεκτρονική μορφή. Ο
ρόλος των βιβλιοθηκών έχει αλλάξει ριζικά. Αντί να εξασφαλίζει τη φύλαξη και προστασία των υλι-
κών αντιτύπων, αποκτά την ευθύνη της αξιολόγησης και της θεματικής (σημασιολογικής) οργάνωσης
των διαθέσιμων στο διαδίκτυο πληροφοριακών πόρων. Οι οργανισμοί αυτοί καταχρηστικά διατηρούν
ακόμη το όνομα της βιβλιοθήκης, καθώς ακριβέστερα είναι οργανισμοί διαχείρισης της πληροφορίας
ή, απλούστερα, πληροφοριακοί οργανισμοί.
Οι βασικοί ρόλοι των πληροφοριακών οργανισμών περιγράφονται στις παραγράφους που
ακολουθούν.
–– Μορφή (format) – Είναι η ιστοσελίδα ισορροπημένη με εικόνες και κείμενα σε μια σωστή
αναλογία; Μήπως δεν έχει καθόλου εικόνες και έτσι δεν εξάπτει το ενδιαφέρον του χρήστη;
Μήπως είναι παραφορτωμένη με εικόνες χωρίς την απαραίτητη παρουσία συνοδευτικού
κειμένου;
–– Λειτουργικότητα (operability) – Είναι η διάταξη (αρχιτεκτονική) της ιστοσελίδας λειτουρ-
γική; Κατευθύνει μέσα από κατανοητή και απλή δομή τον χρήστη στις διάφορες πληροφο-
ρίες που περιέχει; Είναι τα μενού σχεδιασμένα σωστά; Μήπως το πλήθος των ενσωματωμέ-
νων εικόνων καθιστά την ιστοσελίδα αργή, με αποτέλεσμα ο χρήστης να την εγκαταλείπει
πρόωρα; Δίνεται η δυνατότητα επιλογής ανάμεσα σε πολυμεσική και κειμενική εκδοχή της
ιστοσελίδας; Μήπως υπάρχουν «ανενεργοί» σύνδεσμοι (dead links); Μήπως απαιτείται ει-
δικό λογισμικό για την ανάγνωση τμημάτων της ιστοσελίδας και αν ναι, προσφέρεται σύν-
δεσμος για μεταφόρτωσή του (downloading);
–– Αξιοπιστία (credibility) του συγγραφέα – Ο συγγραφέας είναι ένας απλός μελετητής που
ασχολήθηκε με το θέμα και απλώς εκφράζει τις απόψεις του ή κάποιος ειδικός επί του θέ-
ματος, οπότε πρέπει να αναγράφονται οι σπουδές και οι τίτλοι του και ο φορέας στον οποίο
είναι ενταγμένος.
–– Ποιότητα περιεχομένου (content quality) – Το περιεχόμενο είναι τεκμηριωμένο μέσα από
παράθεση έγκυρων βιβλιογραφικών αναφορών ή αποτελεί μια απλή έκθεση των απόψεων
του συγγραφέα; Μήπως το περιεχόμενο λειτουργεί ως δούρειος ίππος κινήσεων ή ατόμων,
διαφήμισης εταιρειών ή προϊόντων, προώθησης ανέλεγκτων σκευασμάτων κ.λπ.;
Δεν πρέπει όμως να υποτιμάται και ο ρόλος των ίδιων των βιβλιοθηκών στη διαμόρφωση λιστών
ποιοτικών δικτυακών πόρων. Η διαδικασία αυτή προωθείται με τα εξής κανάλια:
–– (Απλώς και μόνο με τη) χρήση κάποιων δικτυακών πόρων από τις βιβλιοθήκες, γεγονός που
συνιστά έναν στατιστικό δείκτη ποιότητας,
–– συμμετοχή του προσωπικού της βιβλιοθήκης αλλά και ανάδραση από τους χρήστες για ποιοτική
εκτίμηση των δικτυακών πόρων, διαφόρων ιστοτόπων, διαφόρων εκδοτών του Διαδικτύου κ.λπ.,
–– επικοινωνία των βιβλιοθηκών με τον υπόλοιπο κόσμο για κοινοποίηση της εμπειρίας τους
μέσω λιστών ποιοτικών πόρων, βάσεων δεδομένων με στοιχεία εκτίμησης πόρων κ.λπ.,
–– διεξαγωγή συνεδρίων όπου θα συμμετέχουν βιβλιοθήκες αλλά και τα υπόλοιπα μέρη του κό-
σμου του Διαδικτύου, με σκοπό την ανταλλαγή των εμπειριών και την από κοινού ανάπτυξη
μηχανισμών ελέγχου ποιότητας.
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 21 ~
[1] Case, P., & Gosling, J. (2011). Where is the Wisdom We Have Lost in Knowledge? A Stoical
Perspective on Personal Knowledge Management. In D. J. Pauleen & G. E. Gorman (Eds.),
Personal Knowledge Management: Individual, Organizational and Social Perspectives (pp.
17–42). Farnham Surrey: Gower Publishing Limited.
[2] Wikipedia. (2015). T. S. Eliot. Wikipedia. Retrieved July 1st, 2016, from http://en.wikipedia.
org/wiki/T._S._Eliot
[3] Ackoff, R. (1989). From data to wisdom: Presidential address to ISGSR, June 1988. Journal
of Applied Systems Analysis, 16(1), 3–9.
[4] Rowley, J. (2007). The wisdom hierarchy: representations of the DIKW hierarchy. Journal of
Information Science, 33(2), 163–180. doi:10.1177/0165551506070706
[5] Ackoff, R. L. (1998). A Systemic View of Transformational Leadership. Systemic Practice and
Action Research, 11(1), 23–36. doi:10.1023/A:1022960804854
[6] Rockwood, B. (2011). Systems Thinking & The Wisdom of Ackoff. Cuddletech Blog. Retrieved
July 1st, 2016, from http://cuddletech.com/?p=534
[7] Bellinger, G., Castro, D., & Mills, A. (2004). Data, Information, Knowledge and Wisdom.
Systems Thinking. Retrieved July 1st, 2016, from http://www.systems-thinking.org/dikw/
dikw.htm
[9] Zeleny, M. (1987). Management support systems: Towards integrated knowledge management.
Human Systems Management, 7(1), 59–70. doi:10.3233/HSM-1987-7108
[10] European Committee for Standardization. (2004). European Guide to good practice in
Knowledge Management -Part 1: Knowledge Management Framework CWA 14924-1:2004
E. Retrieved July 1st, 2016, from http://research.fraserhealth.ca/media/Euro Guide to good
practice in KM Part 1.pdf
[11] Pearlson, K. E., & Saunders, C. S. (2012). Managing and Using Information Systems: A
Strategic Approach, 5th Edition. doi:10.1017/CBO9781107415324.004
[12] Paul Bocij, Greasley, A., & Hickie, S. (2008). Business information systems : technology,
development and management for the e-business (4th edition). Pearson Education Limited.
[13] Smith, M. K. (2003). Michael Polanyi and tacit knowledge. The encyclopedia of informal
education. Retrieved July 1st, 2016, from http://infed.org/mobi/michael-polanyi-and-tacit-
knowledge/
~ 22 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
[14] Laudon, K. C., & Laudon, J. P. (2014). Management information systems: managing the
digital firm. Prentice Hall.
[15] Awad, E. M., & Ghaziri, H. M. (2003). Knowledge Management. Prentice Hall.
[16] Floridi, L. (2004). Open Problems in the Philosophy of Information. Metaphilosophy, 35(4),
554–582. doi:10.1111/j.1467-9973.2004.00336.x
[17] Shannon, C. E. (1948). A mathematical theory of communication. The Bell System Technical
Journal, 27(July 1928), 379–423. doi:10.1145/584091.584093
[18] Barwise, J., & Perry, J. (1983). Situations and Attitudes. Cambridge: MIT Press.
[19] Israel, D., & Perry, J. (1990). What is information? In P. Hanson (Ed.), Information, language,
and cognition (pp. 1–19). Vancouver: University of British Columbia Press.
[1] Shannon, C. E., & Weaver, W. (1963). The mathematical theory of communication. Urbana:
University of Illinois Press.
[2] Dendrinos, M. (2005). From the Physical Reality to the Virtual Reality in the Library
Environment. Library Philosophy and Practice, 7(2), 1–6. Retrieved from http://unllib.unl.
edu/LPP/dendrinos.htm
[3] Dendrinos, M. N. (2008). Computer Science Professionals and Greek Library Science.
Education for Information, 26(2), 101–111. Retrieved July 1st, 2016, from http://search.
proquest.com/docview/57681957?accountid=47392\nhttp://link.periodicos.capes.gov.br/
sfxlcl41?url_ver=Z39.88-2004&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&genre=article&si
d=ProQ:ProQ:lisashell&atitle=Computer+Science+Professionals+and+Greek+L
[4] Dendrinos, M. (2013). From Information to Knowledge: From Positive Chatter to Negative
Semantics. The Official Journal of the Pacific Northwest Library Association, 78(1), 11.
Retrieved July 1st, 2016, from http://www.pnla.org/assets/documents/Quarterly/pnlaq78-
1fall2013.pdf
Κεφάλαιο 1 - Πληροφορία και Πληροφοριακοί Οργανισμοί ~ 23 ~
1.8.2 Ασκήσεις
1. Αντιστοιχίστε το κατάλληλο επίπεδο ιεραρχίας DIKW με τις παρακάτω εικόνες.
~ 24 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
AI Artificial Intelligence
DIKW Data-Information-Knowledge-Wisdom
I/O Input/Output
PI Philosophy of Information
accuracy ακρίβεια
attributes χαρακτηριστικά
credibility αξιοπιστία
class κλάση
data δεδομένα
Data-Information-Knowledge-Wisdom Δεδομένο-Πληροφορία-Γνώση-Σοφία
downloading μεταφόρτωση
effectiveness αποτελεσματικότητα
efficiency απόδοση
entities οντότητες
expertise επιδεξιότητα
explicit εμφανής
extrapolative επεκτατική
format μορφή
Input/Output Είσοδος/Έξοδος
information πληροφορία/-ες
instance στιγμιότυπο
instantiation συγκεκριμενοποίηση
internet διαδίκτυο
interpolative παρεμβλητική
know-how τεχνογνωσία
knowledge γνώση
meaningful κατανοητός
mediator μεσολαβητής
operability λειτουργικότητα
pre-selection προ-επιλογή
processing επεξεργασία
tacit σιωπηρή
understanding κατανόηση
wisdom σοφία
Σύνοψη
Στο Κεφάλαιο αυτό παρουσιάζεται το απαραίτητο θεωρητικό υπόβαθρο της αναπαράστασης της πλη-
ροφορίας στο ψηφιακό κόσμο και πιο συγκεκριμένα στο ψηφιακό περιβάλλον στο οποίο κυριαρχεί
η δυαδική κωδικοποίηση (binary coding). Ειδικότερα, παρουσιάζονται η αναπαράσταση των αλφα-
ριθμητικών χαρακτήρων και τα πρότυπα κωδικοποίησής τους (coding character), οι μορφές ανα-
παράστασης κειμένου (text), η αναπαράσταση εικόνας (image), η αναπαράσταση ήχου (audio) και
η αναπαράσταση κινούμενης εικόνας με ήχο, γνωστή ως βίντεο (video). Επιπλέον, παρουσιάζονται
και άλλες σύγχρονες μορφές αναπαράστασης της πληροφορίας, οι οποίες συνδυάζουν περισσότερες
από μία από τις βασικές μορφές αναπαράστασης της πληροφορίας, όπως η τρισδιάστατη απεικόνιση
(3D-animations), έξυπνα γραφήματα (infographics) κ.λπ. Στο ίδιο κεφάλαιο παρατίθενται οι βασικές
διαδικασίες δειγματοληψίας και ψηφιοποίησης αναλογικών ροών πληροφορίας όπως αυτές της εικό-
νας (συμπεριλαμβανομένου του κειμένου σε έντυπη μορφή), του ήχου και του βίντεο. Τέλος, παρουσι-
άζονται οι σύγχρονες τεχνολογίες φωνής (αναγνώριση και σύνθεση φωνής) και η οπτική αναγνώριση
χαρακτήρων, που αποσκοπούν τόσο στην απλοποίηση και βελτίωση της καθημερινότητας, όσο και
στην υποστήριξη των Ατόμων με Ειδικές Ανάγκες (ΑμΕΑ).
Προαπαιτούμενη γνώση
Το κεφάλαιο αυτό δεν απαιτεί την προηγούμενη γνώση άλλων βιβλίων/μαθημάτων ή ύλης άλλων κε-
φαλαίων του παρόντος βιβλίου.
Αλλά και από τα φυσικά αντικείμενα όσα ήθελε να τα κοινοποιήσει ο άνθρωπος προσπάθησε να τα
αναπαραστήσει μέσα από τη μουσική ή την εικαστική σύνθεση και στη συνέχεια μέσα από τη φωτο-
γράφιση, ηχογράφηση ή κινηματογράφηση.
Στην αρχή η αναπαράσταση ήταν συνεχής – αναλογική (analog), μετατρέποντας την
ηχητική ένταση σε ηλεκτρική ένταση και τη φωτεινή εικόνα σε χημική αλλοίωση. Στη συνέχεια,
όμως, στο πλαίσιο της αναπτυσσόμενης τεχνολογίας των ηλεκτρονικών υπολογιστών (Η/Υ),
έγινε διακριτή – ψηφιακή (digital).
Οι Η/Υ εφευρέθηκαν και αναπτύχθηκαν με σκοπό τη γρήγορη και αποτελεσματική εκτέλε-
ση αριθμητικών υπολογισμών, αρχικά, και, στη συνέχεια, την ολοκλήρωσης μιας σειράς διαδικασι-
ών και ελέγχων μέσω ενός τυποποιημένου σετ εντολών.
Τα ηλεκτρονικά στοιχεία (και ειδικότερα τα ψηφιακά κυκλώματα) που χρησιμοποιούνται
στους ηλεκτρονικούς υπολογιστές μπορούν να βρίσκονται σε μία από τις δύο καταστάσεις: Ανοικτό
– κλειστό / Αληθές – ψευδές / Αγωγή ρεύματος - Διακοπή ρεύματος / Υψηλή τάση – Χαμηλή τάση /
«0» ή «1». Για τον λόγο αυτό, όλες οι εντολές εκτέλεσης των προγραμματισμένων διαδικασιών είναι
κωδικοποιημένες σε μια ακολουθία από δύο (2) και μόνο σύμβολα, το «μηδέν» 0 και το «ένα» 1.
Αυτά τα σύμβολα ονομάζονται δυαδικά ψηφία (binary digits ή bits).
Αυτό το χαρακτηριστικό των στοιχειωδών συνιστωσών των Η/Υ αποτέλεσε και τη βασική
ιδέα της τεχνολογικής υλοποίησης της αναπαράστασης και αποθήκευσης της πληροφορίας -προς
μελλοντική χρήση- σε έναν Η/Υ. Αν από ένα συνεχόμενο ήχο (φυσικό ήχο, συζήτηση ή μουσικό
κομμάτι) απομονώσουμε μια σειρά στιγμών πολύ κοντά τη μια στην άλλη, τότε προκύπτει μια ακο-
λουθία αριθμών που ο καθένας από αυτούς αντιπροσωπεύει μια ηχητική ένταση. Αντίστοιχα, αν από
μια συνεχή φωτεινή εικόνα απομονώσουμε μια σειρά σημείων πολύ κοντά το ένα στο άλλο, τότε
προκύπτει μια σειρά αριθμών που ο καθένας αντιπροσωπεύει τον χρωματικό κώδικα κάθε σημείου.
Και στη μια και στην άλλη περίπτωση όλη η πληροφορία είναι μια σειρά αριθμών, η οποία μπορεί να
παρασταθεί σε ένα τέτοιο αριθμητικό σύστημα που να προσαρμόζεται στη δυνατότητα των ηλεκτρο-
νικών στοιχείων να βρίσκονται σε μια από τις δύο καταστάσεις. Όπως θα δούμε στην επόμενη πα-
ράγραφο, υπάρχει ένα τέτοιο σύστημα αριθμητικής αναπαράστασης και είναι το δυαδικό (binary).
Αλλά και όλος ο υπόλοιπος όγκος πληροφορίας, όπως η γλωσσική αναπαράσταση, μπορεί
και αυτός να αποθηκευτεί στον Η/Υ μέσω συστημάτων κωδικοποίησης κάθε γράμματος και σημείου
στίξης της φυσικής γλώσσας με μια σειρά συμβόλων 0 και 1, μετατρέποντας τη γλωσσική αναπαρά-
σταση, δηλαδή το εργαλείο κατανόησης και επικοινωνίας των ανθρώπων, σε ψηφιακή αναπαράστα-
ση, δηλαδή στο εργαλείο κατανόησης και επικοινωνίας των Η/Υ.
ψηφίων που αποτελεί την αναπαράσταση του αριθμού. Το πλήθος των διαφορετικών ψηφίων αναπαρά-
στασης είναι η λεγόμενη βάση (base) του συστήματος αρίθμησης και δίνει και το όνομα στο σύστημα.
Το σύστημα που χρησιμοποιούμε καθημερινά είναι το δεκαδικό σύστημα (decimal system),
το οποίο έχει ως βάση το 10 και ως διαφορετικά σύμβολα-ψηφία (digits) τα 0, 1, 2, 3, 4, 5, 6, 7, 8
και 9. Ο τρόπος αναπαράστασης δηλώνει ότι το δεξιότερο ψηφίο αντιστοιχεί σε αξία ίση με την τιμή
του, ενώ τα υπόλοιπα αντιστοιχούν σε αξίες που προκύπτουν από την τιμή τους πολλαπλασιασμένη
με μια δύναμη του 10 (δηλαδή της βάσης του συστήματος αρίθμησης), το αμέσως αριστερότερο επί
10, το αριστερότερο επί 102=100, το αριστερότερο επί 103=1000 κ.λπ.
Για παράδειγμα, ο αριθμός 153, στο δεκαδικό σύστημα αναλύεται ως εξής:
+ 1 x 10² = 1 x 100 = 100
+ 5 x 10¹ = 5 x 10 = 50
+ 3 x 10º = 3x1 =3
= 153
Ο γενικός τύπος, με βάση τον οποίο αναλύονται οι αριθμοί σε όλα τα συστήματα αρίθμησης,
είναι ο εξής:
R είναι η βάση
n είναι ο αριθµός
d είναι το ψηφίο στην
των ψηφίων
iοστή θέση
642 είναι:
63 * 102 + 42 * 101 + 21 * 100
Το σύστημα αρίθμησης για την αναπαράσταση των αριθμητικών δεδομένων στους Η/Υ εί-
ναι το δυαδικό σύστημα (binary numerical system). Η επιλογή δεν είναι τυχαία, αφού όπως ειπώ-
θηκε και πιο πριν, τα ηλεκτρονικά κυκλώματα που χρησιμοποιούνται στους Η/Υ μπορούν να βρί-
σκονται σε μία από τις δύο καταστάσεις. Τα ηλεκτρονικά κυκλώματα που μπορούν να βρίσκονται σε
δύο καταστάσεις ονομάζονται ψηφιακά (digital). Η κατάλληλη διασύνδεση ψηφιακών κυκλωμάτων
επιτρέπει την αποθήκευση και επεξεργασία δεδομένων σε ψηφιακή μορφή, τα οποία ονομάζονται
δυαδικά ψηφία (binary digits) ή bits.
~ 32 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Επομένως, στο δυαδικό σύστημα η βάση είναι το R=2 και τα διαθέσιμα σύμβολα – ψηφία
είναι τα 0 και 1.
Στην τεχνολογία των υπολογιστών εκτός του δυαδικού χρησιμοποιούνται και άλλα δύο
συστήματα που έχουν ως βάση δυνάμεις του 2 και, συγκεκριμένα, το οκταδικό (octal numerical
system) και το δεκαεξαδικό (hexadecimal numerical system), με βάση το 8 και το 16 αντίστοιχα.
Η τεχνική (αλγόριθμος) της μετατροπής ενός αριθμού από το δεκαδικό σύστημα στο δυαδικό έχει
ως εξής:
1ο Βήμα: Πραγματοποιούμε διαδοχικές ακέραιες διαιρέσεις του υπό μετατροπή αριθμού και των
παραγόμενων πηλίκων με τον αριθμό 2 (βλέπε παρακάτω σχήμα), έως την τελική διαίρεση 1:2, όπου
το αποτέλεσμα δίνει πηλίκο 0 και υπόλοιπο 1.
2ο Βήμα: Η δυαδική μορφή του υπό μετατροπή αριθμού σχηματίζεται από τα υπόλοιπα των διαιρέ-
σεων, με αριστερότερο ψηφίο του αριθμού το τελευταίο υπόλοιπο και δεξιότερο το πρώτο.
Η μετατροπή, για παράδειγμα, του αριθμού 59 σε δυαδική μορφή γίνεται ως εξής:
Ο αριθμός που σχηματίζεται αριστερά προς τα δεξιά από το τελευταίο προς το πρώτο υπό-
λοιπο είναι η ζητούμενη δυαδική μορφή δηλ. (59)10 =(111011)2.
Η αντίστροφη μετατροπή ενός αριθμού από R-ική μορφή σε δεκαδική γίνεται χρησιμοποιώ-
ντας τον γενικό τύπο αναπαράστασης (Εικόνα 2.1), όπου κάθε ψηφίο έχει διαφορετικό βάρος, καθώς
πολλαπλασιάζεται με μια δύναμη του R, δηλαδή:
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 33 ~
–– στην περίπτωση ενός δυαδικού αριθμού τα ψηφία από αριστερά προς τα δεξιά συμβολίζουν
μονάδες, δυάδες, τετράδες κλπ. οπότε πολλαπλασιάζονται με το 1, το 2, το 4, κ.λπ.,
–– στην περίπτωση ενός οκταδικού συμβολίζουν μονάδες, οκτάδες, 64άδες κ.λπ. οπότε πολλα-
πλασιάζονται με το 1, το 8, το 64, κ.λπ.,
–– στην περίπτωση ενός δεκαεξαδικού συμβολίζουν μονάδες, δεκαεξάδες, 256άδες, κλπ. οπότε
πολλαπλασιάζονται με το 1, το 16, το 256, κ.λπ.
( 3 6 9 2 ) 10
Εφαρµογή αλγορίθµου µετατροπ ής
από δεκαδικό σε δυαδικό
(111001101100) 2
( 2 6 8 6 ) 10
Εφαρµογή αλγορίθµου µετατροπ ής
από δεκαδικό σε δυαδικό
(A 7 E)16
Κανόνας των «4» bits
Σχήμα 2.7. Μετατροπή από δυαδικό σε (α) οκταδικό και (β) δεκαεξαδικό.
Για λόγους απλοποίησης, κατά τη διάρκεια των μετατροπών ισχύουν οι παρακάτω παραδοχές:
Αντίστοιχα ορίζονται και τα πολλαπλάσια του bit (ιδιαίτερα χρήσιμα στις επικοινωνίες των Η/Υ).
Συγκεκριμένα:
Είναι λοιπόν προφανές ότι η αποθήκευση (αλλά και η μετάδοση της πληροφορίας) στον
ψηφιακό κόσμο πραγματοποιείται με τη χρήση του δυαδικού συστήματος αρίθμησης. Κυρίαρχο
ρόλο σε αυτές τις διαδικασίες διαδραματίζει η μετατροπή (κωδικοποίηση ή ψηφιοποίηση) της πλη-
ροφορίας από την «αναλογική» της μορφή στη λεγόμενη «ψηφιακή» μορφή (analog to digital) αλλά
και αντίστροφα (digital to analog). Επομένως, οποιαδήποτε μορφή πληροφορίας, πριν αποθηκευτεί,
επεξεργαστεί ή μεταδοθεί με την χρήση των Η/Υ και των δικτύων επικοινωνίας πρέπει να κωδικο-
ποιηθεί στην κατάλληλη μορφή (βλέπε παρακάτω σχήμα).
1010010101
0101010100
1010100101
Αποκωδικοποίηση
0101010100
Κείµενο Κείµενο
Κωδικοποίηση
1001010101
εικόνα 0110110101 εικόνα
0101010101
ήχος 0101010100 ήχος
βίντεο
1010101001
0101010010
βίντεο
1001010001
010101011
Σχήμα 2.11. Κωδικοποίηση δεδομένων για την αποθήκευσή τους σε Ηλεκτρονικό Υπολογιστή.
~ 36 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Ο κώδικας περιλαμβάνει, πέραν των συμβόλων (γραμμάτων ή αριθμών), και κάποιες συ-
γκεκριμένες λειτουργίες ελέγχου ή ειδικούς χαρακτήρες, όπως π.χ. καμπανάκι (BEL – bell), εκτέ-
λεση (CR - carriage return ή enter), αλλαγή γραμμής (LF - line feed), διαγραφή (DEL - delete), μια
- θέση - πίσω (BS - backspace) κ.λπ. Συνήθως, οι χαρακτήρες αυτοί ονομάζονται μη-εκτυπώσιμοι
(nonprintable) χαρακτήρες και αντιστοιχίζονται, όπως και οι υπόλοιποι, σε δυαδικές ακολουθίες.
Γενικά, ένας κώδικας του οποία το μήκος των δυαδικών ακολουθιών του είναι Ν bits ανά
χαρακτήρα (δηλαδή κώδικας μήκους Ν) έχει τη δυνατότητα να αναπαραστήσει 2Ν διαφορετικούς
χαρακτήρες. Επομένως, όσο μεγαλύτερο είναι το μήκος του κώδικα, τόσο περισσότερους χαρακτή-
ρες μπορεί να αναπαραστήσει ο κώδικας αυτός, αλλά και τόσο περισσότερο αυξάνει η πολυπλοκό-
τητα υλοποίησής του.
Για λόγους διαλειτουργικότητας (δηλαδή δυνατότητας ανταλλαγής δεδομένων μεταξύ δια-
φορετικών υπολογιστικών συστημάτων) προτάθηκαν, κατά καιρούς, κοινά αποδεκτές αναπαραστά-
σεις κείμενο-συμβόλων, ώστε κάθε αλφαριθμητικός χαρακτήρας να έχει ως αναπαράσταση την ίδια
αναγνωρίσιμη συγκεκριμένη ακολουθία δυαδικών ψηφίων.
Η αρχή έγινε το 1968, στο ξεκίνημα της εποχής των Η/Υ, από τον αμερικανικό οργανισμό
ANSI (American National Standards Institute, http://www.ansi.org) με την εισαγωγή του αμερι-
κανικού πρότυπου κώδικα για την ανταλλαγή πληροφοριών ASCII (American Standard Code for
Information Interchange – [1], [2]). Ο κώδικας ASCII αντικατέστησε τους κώδικες EBCDIC [3] και
τον ευρωπαϊκό Baudot [4] και επικράτησε ως το βασικό μέσο για την ανταλλαγή πληροφοριών (έως
και πρόσφατα). Ειδικότερα, ο κώδικας EBCDIC (Extended Binary Code for Data Interchange), που
αναπτύχθηκε από την IBM, χρησιμοποιούσε και αυτός 8 bits ανά χαρακτήρα, και, επομένως, μπο-
ρούσε να αναπαραστήσει 28=256 χαρακτήρες.
Στον κώδικα ASCII χρησιμοποιούνται 7 ή 8 δυαδικά ψηφία, ανάλογα με το αν πρόκειται
για τον απλό ή εκτεταμένο κώδικα ASCII. Στον απλό κώδικα ASCII περιλαμβάνονται χαρακτή-
ρες ελέγχου, σημεία στίξης, τελεστές λογικών ή αριθμητικών πράξεων, πεζά και κεφαλαία γράμ-
ματα και αριθμοί. Στην περίπτωση αυτή κωδικοποιούνται 27 = 128 διαφορετικοί χαρακτήρες.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 37 ~
Επειδή το πλήθος αυτό είναι πολύ περιορισμένο και δεν επαρκεί για να περιλάβει και τα γράμ-
ματα μιας επιπλέον γλώσσας (π.χ. ελληνικής ή κάποιας άλλης ευρωπαϊκής), χρησιμοποιείται ένα
ακόμη δυαδικό ψηφίο, οπότε είναι δυνατή η κωδικοποίηση ακόμη 128 χαρακτήρων. Ο κώδικας
ASCII των 8 ψηφίων έχει προτυποποιηθεί για χρήση σε ηλεκτρονικούς υπολογιστές με βάση το
πρότυπο ISO-8859 [5] και είναι γνωστός ως εκτεταμένος κώδικας ASCII (extended ASCII).
Ενδεικτικά αναφέρεται ότι το μέρος 7 προτύπου ISO-8859 (γνωστό ως ISO-8859-7) καλύπτει
την ελληνική γλώσσα. Στους πίνακες που ακολουθούν παρουσιάζεται η κωδικοποίηση ASCII.
~ 38 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Αλλά στη σημερινή ποικιλία γλωσσών και κειμένων δεν επαρκεί ούτε καν η ταυτόχρονη
συνύπαρξη δύο γλωσσών. Η απαίτηση για την υποστήριξη όλων των γραπτών γλωσσών με έναν ενιαίο
κώδικα οδήγησε σε μια παγκόσμια κωδικοποίηση που θα μπορεί να καλύπτει ένα μεγάλο εύρος τους.
Αυτός είναι ο λεγόμενος κώδικας UNICODE [6], ο οποίος, στην αρχική του έκδοση, χρησιμοποιεί δύο
δυαδικές λέξεις (δηλαδή δύο bytes) ή 16 δυαδικά ψηφία για κάθε χαρακτήρα. Ο κώδικας αυτός έχει
τυποποιηθεί με το πρότυπο ISO-10646 και έχει δύο μέρη, το ISO 10646-1 και το ISO 10646-2, στα
οποία ορίζονται συνολικά περίπου 128.237 χαρακτήρες (9.0 έκδοση, Ιούνιος 2016). Το πρώτο μέρος
καλύπτει όλες τις «ζωντανές» γλώσσες και είναι γνωστό ως Basic Multilingual Plane (ενδεικτικά
αναφέρεται ότι το πρώτο μέρος του προτύπου έχει μέγεθος 1.000 σελίδες και καλύπτει 49.000 χαρα-
κτήρες). Τα επόμενα δεκαέξι (16) μέρη καλύπτουν διάφορες ανάγκες αναπαράστασης ειδικών χαρα-
κτήρων, ιερογλυφικών κ.λπ. Η δομή του προτύπου UNICODE εμφανίζεται στον παρακάτω πίνακα.
Στο διάγραμμα που ακολουθεί απεικονίζεται το ποσοστό των διαθέσιμων ιστοσελίδων ανά-
λογα με το επιλεγμένο σχήμα κωδικοποίησης του περιεχομένου τους (δηλαδή UTF, ASCII ή ISO-
8859). Είναι προφανής η σταδιακή επικράτηση της κωδικοποίησης UTF. Σήμερα (Αύγουστος 2016)
το ποσοστό για την κωδικοποίηση UTF, ξεπερνά το 87,5% - Πηγή: Usage of character encodings
for websites https://w3techs.com/technologies/overview/character_encoding/all).
Σχήμα 2.12. Ποσοστό ιστοσελίδων στο Διαδίκτυο ανά ακολουθούμενο πρότυπο κωδικοποίησης
χαρακτήρων. (Πηγή: Wikimedia, https://commons.wikimedia.org/wiki/File:UnicodeGrow2b.png)
Τέλος, στον πίνακα που ακολουθεί παρατίθενται συνοπτικά μερικά στοιχεία για τις πιο σημαντικές
κωδικοποιήσεις γραμμάτων, αριθμών και συμβόλων στην ιστορία των ηλεκτρονικών υπολογιστών.
~ 42 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Για να γίνει σύγκριση της οικονομικότερης από την άποψη αποθηκευτικού χώρου λύσης,
πρέπει να καθοριστεί η συγκεκριμένη κωδικοποίηση κατά ASCII, η οποία πλέον είναι η UNICODE.
Συνεπώς, κάθε αριθμός Ν ψηφίων κωδικοποιείται κατά ASCII μέσω 2Ν bytes. Αντίθετα η δυαδική
αναπαράσταση ενός αριθμού από 0-8 απαιτεί 1 byte (κατά ACSII 2 bytes), μεταξύ 9 και 65.535
(216-1) 2 bytes (κατά ASCII 2-10 bytes), μεταξύ 65.536 και 16.717.215 (224-1) 3 bytes (κατά ASCII
10-16 bytes) και μεταξύ 16.717.216 και 4.294.967.295 (232-1) 4 bytes (κατά ASCII 16-20 bytes). Η
υπεροχή στη χρήση της δυαδικής αναπαράστασης ως κωδικοποίησης σε σχέση με την κωδικοποίη-
ση κατά ASCII είναι καταφανής. Αλλά και στην περίπτωση των δυαδικών αριθμών, η δυαδική του
μορφή, που είναι ήδη η δυαδική του αναπαράσταση, υπερέχει κατά πολύ της κωδικοποίησης κατά
ASCII, καθώς κάθε byte της δυαδικής αναπαράστασης κωδικοποιείται με 2x8=16 bytes κατά ASCII,
οπότε η σχέση είναι 1 προς 16.
per inch). Οι οθόνες υπολογιστών ή άλλων συσκευών, συνήθως διαθέτουν μια ικανότητα απεικόνι-
σης που κυμαίνεται από 72 ppi μέχρι 300 ppi (σε εξαιρετικές περιπτώσεις οθονών υψηλής ανάλυσης
κινητών τηλεφώνων). Σε ό, τι αφορά όμως τις εκτυπώσεις, ορίζεται το αντίστοιχο μέγεθος που καθο-
ρίζει τη λεπτομέρεια εκτύπωσης μιας εικόνας και είναι ο αριθμός των κουκίδων ανά ίντσα ή αλλιώς
dpi (dots per inch). Η λεπτομέρεια εκτύπωσης ενός εκτυπωτή μπορεί να φτάσει έως και τα 2400 dpi.
Τόσο η ανάλυση μιας εικόνας, όσο και η πυκνότητα, ως μεγέθη αξιολόγησης βρίσκουν εφαρ-
μογή, όπως θα δούμε και σε επόμενες παραγράφους, τόσο στις οθόνες των ηλεκτρονικών υπολογι-
στών, όσο και στους εκτυπωτές αλλά και τις συσκευές ψηφιοποίησης. Για την καλύτερη κατανόηση
των βασικών αρχών της ψηφιογραφικής μεθόδου ακολουθούν ορισμένα παραδείγματα.
Παράδειγμα 1. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 45 pixels (9Χ5),
καθένα από τα οποία είναι σε μια από τις καταστάσεις άσπρο ή μαύρο.
Σχήμα 2.13. (α) Διαμερισμός σε άσπρα ή μαύρα pixels ασπρόμαυρης εικόνας 5x9 – (β) αναπαράστα-
ση με την ψηφιογραφική μέθοδο – μέγεθος 45 bits.
Με δεδομένο ότι για τη συγκεκριμένη εικόνα έχουμε μόνο δύο χρωματικούς τόνους, για την
κωδικοποίησή τους χρειαζόμαστε μόνο ένα bit. Συγκεκριμένα, το μηδέν (0) αντιστοιχεί στο άσπρο
χρώμα και το ένα (1) στο μαύρο. Επομένως, για κάθε pixel της εικόνας απαιτείται 1 ψηφίο (bit) για
την αποθήκευση του χρωματικού τόνου, άρα το μέγεθος του ψηφιακού αρχείου θα είναι 45 pixels *
1 bit ανά pixel = 45 bits ή 6 bytes (3 bits θα παραμείνουν χωρίς χρήση).
Παράδειγμα 2. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 99 pixels (9Χ11)
και σε κάθε pixel αντιστοιχεί μια χρωματική αναπαράσταση από τις διαθέσιμες, όπως άσπρο, ανοι-
κτό γκρι, σκούρο γκρι και μαύρο.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 45 ~
Σχήμα 2.14. (α) Διαμερισμός pixels σε τέσσερις χρωματικούς τόνους εικόνας 9x11 – (β) αναπαρά-
σταση με την ψηφιογραφική μέθοδο – μέγεθος 198 bits.
Με δεδομένο ότι για τη συγκεκριμένη εικόνα έχουμε τέσσερις (4) χρωματικούς τόνους, για
την κωδικοποίησή τους χρειαζόμαστε δύο (2) bits. Συγκεκριμένα ορίζουμε την εξής κωδικοποίηση:
00=άσπρο, 01=ανοικτό γκρι, 10=σκούρο γκρι και 11=μαύρο. Επομένως, για κάθε pixel της εικόνας
απαιτούνται δύο ψηφία (bits) για την αποθήκευση του χρωματικού τόνου, άρα το μέγεθος του ψηφιακού
αρχείου θα είναι 99 pixels * 2 bits ανά pixel = 198 bits ή 25 bytes (2 bits θα παραμείνουν χωρίς χρήση).
Παράδειγμα 3. Έστω η εικόνα του παρακάτω σχήματος, η οποία αποτελείται από 99 pixels (9Χ11)
και σε κάθε pixel αντιστοιχεί μια χρωματική αναπαράσταση, κάνοντας χρήση του χρωματικού κώ-
δικα RGB (Red Green Blue) [10]. Ειδικότερα, το μοντέλο χρωματικής αναπαράστασης RGB προϋ-
ποθέτει ότι κάθε χρώμα μπορεί να αναπαρασταθεί με τον συνδυασμό των τριών βασικών χρωμάτων,
δηλαδή του κόκκινου (red), του πράσινου (green) και του μπλε (blue).
Επομένως, για την αναπαράσταση κάθε χρώματος απαιτούνται οι τιμές με τις οποίες κάθε
βασικό χρώμα συμμετέχει στη δημιουργία του. Συγκεκριμένα, η τριάδα αυτή μπορεί να εκφραστεί
με τους τρόπους που απεικονίζονται στον παρακάτω πίνακα.
Με βάση τον πιο πάνω πίνακα προκύπτει ότι για την αποθήκευση του χρωματικού τόνου
για κάθε pixel απαιτούνται 24 bits (8bits ανά χρώμα Χ 3 χρώματα). Η χρωματική αναπαράσταση
RGB με τη χρήση 8 bits για την κωδικοποίηση ανά χρώμα είναι γνωστή ως true color και μπορεί να
αναπαραστήσει 224 ή 16.777.216 διαφορετικούς χρωματικούς συνδυασμούς, ξεπερνώντας τη δια-
κριτική ικανότητα του ανθρώπινου ματιού (περίπου 10.000.000 χρωματικοί τόνοι). Οι συνδυασμοί
χρωμάτων που μπορεί να υποστηρίξει μια απεικονιστική συσκευή ή μια συσκευή ψηφιοποίησης, σε
σχέση με τον αριθμό των bits που απαιτούνται για την κωδικοποίησή τους, προσδιορίζουν το βάθος
χρώματος – color depth. Ένας άλλος τρόπος αναπαράστασης των χρωματικών τόνων είναι η αφαιρε-
τική προσέγγιση του μορφότυπου CMYK [11] (Cyan - Magenta - Yellow - Black). Με βάση αυτό το
μορφότυπο, ακολουθείται η μέθοδος αναπαράστασης των χρωμάτων όπως συμβαίνει στη φύση και
κατά τη διάρκεια της εκτύπωσης στο χαρτί, όπου το φόντο είναι το λευκό (μηδενική απορρόφηση
χρώματος), από το οποίο μειώνεται στη συνέχεια η φωτεινή λαμπρότητα, αφαιρώντας χρωματικές
συνιστώσες του κυανού, του ματζέντα και του κίτρινου, ενώ για την καλύτερη τελική χρωματική
απόδοση προστίθεται και μια συνιστώσα του μαύρου. Για τη χρωματική αναπαράσταση με βάση το
πρότυπο CMYK, απαιτούνται 4 bytes ανά pixel.
Επανερχόμενοι στην εικόνα του παραδείγματος, το μέγεθος του ψηφιακού αρχείου αποθή-
κευσης θα έχει μέγεθος 99 pixels * 24 bits ανά pixel = 2.376 bits ή 297 bytes.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 47 ~
Σχήμα 2.16. (α) Διαμερισμός pixels με βάση το χρωματικό μοντέλο RGB εικόνας 9x11 – (β) αναπα-
ράσταση με την ψηφιογραφική μέθοδο – μέγεθος 2376 bits.
Σχήμα 2.17. Χρήση σημείων και ακμών για τη δημιουργία διανυσματικών εικόνων.
(Πηγή: W3C, https://www.w3.org/TR/SVG/paths.html).
~ 48 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Μεγένθυνση Χ 7
Διανυσµατική µέθοδος
Ψηφιογραφική µέθοδος
Σχήμα 2.18. Φαινόμενο pixilation μεταξύ ψηφιογραφικής και διανυσματικής μεθόδου αναπαράστασης
εικόνων. (Πηγή: Wikimedia, https://commons.wikimedia.org/wiki/File:VectorBitmapExample.svg).
Mbytes. Αντίστοιχα υψηλά μεγέθη προκύπτουν και για την περίπτωση λήψης μιας φωτογραφίας από
μια σύγχρονη κάμερα ή ένα κινητό τηλέφωνο. Συγκεκριμένα, αν η ανάλυση της κάμερας ή του κι-
νητού ανέρχεται στα 16 Mpixels, τότε για τη λήψη μόνο μιας φωτογραφίας με βάθος χρώματος true
color θα απαιτούνταν 16 Mpixels X 24 bit = 384 Mbits ή 48 Μ bytes.
Είναι προφανές, ότι τα μεγέθη τόσο για τη ψηφιοποιημένη σελίδα όσο και για τη λήψη της
φωτογραφίας, όπως προκύπτουν από τους προηγούμενους υπολογισμούς, είναι «απαγορευτικά» σε
σχέση με τις συνηθισμένες αποθηκευτικές ικανότητες των υπολογιστικών συστημάτων. Η λύση δό-
θηκε με την εφαρμογή αλγορίθμων συμπίεσης αρχείων αλλά και πιο εξειδικευμένων αλγορίθμων,
προσαρμοσμένων για την αποθήκευση εικόνων.
Οι εν λόγω αλγόριθμοι κατατάσσονται σε δύο μεγάλες κατηγορίες: τους μη απωλεστι-
κούς αλγορίθμους (lossless compression algorithms) και τους απωλεστικούς αλγορίθμους (lossy
compression algorithms). Αναλυτικότερα:
–– Μη απωλεστικοί αλγόριθμοι: Πρόκειται για αλγορίθμους τα πρωτογενή δεδομένα (raw
data) των οποίων διατηρούνται στο ακέραιο μετά τη διαδικασία της συμπίεσης και είναι
δυνατόν να ανακτηθούν πλήρως μέσω της αντίστροφης διαδικασίας. Με άλλα λόγια, δεν
πραγματοποιείται καμία απώλεια δεδομένων σε σχέση με τα δεδομένα της ψηφιοποίησης.
Οι πιο γνωστοί «γενικού σκοπού» μη απωλεστικοί αλγόριθμοι συμπίεσης είναι η κωδικο-
ποίηση Huffman ή Huffman Codding [12], [13], ο LZW [14] (αλγόριθμος των Lempel–
Ziv–Welch) και ο DEFLATE (μια παραλλαγή του LZW), στους οποίους στηρίζονται και τα
μορφότυπα αρχείων εικόνων PNG, GIF και TIFF.
–– Απωλεστικοί αλγόριθμοι: Πρόκειται για αλγορίθμους μέρος από τα πρωτογενή δεδομένα των
οποίων «χάνεται», με στόχο τη μείωση του μεγέθους του ψηφιακού αρχείου στο οποίο αυτά
τελικά αποθηκεύονται. Η «απώλεια» δεδομένων ως μέθοδος συμπίεσης μπορεί να εφαρμοστεί
σε περιπτώσεις που δεν επηρεάζει το τελικό αποτέλεσμα, όπως π.χ. λεπτομέρειες σε εικόνες ή
ήχο που η ανθρώπινη όραση ή ακοή δε μπορεί να διακρίνει έτσι και αλλιώς. Δεν μπορεί όμως
να ισχύσει στις περιπτώσεις που έστω και η παραμικρή αλλοίωση των δεδομένων (π.χ. αρχεία
κειμένου) θα οδηγούσε σε ολική αδυναμία ανάκτησης του συνόλου της πληροφορίας. Επιπλέ-
ον, ειδικά σε ό, τι αφορά την αποθήκευση (ή και μετάδοση) εικόνας ή ήχου, η «απώλεια» δε-
δομένων, με την εφαρμογή έξυπνων αλγορίθμων, μπορεί να αφορά το μέρος της πληροφορίας
που αντιστοιχεί στον «θόρυβο - noise» ή σε τυχόν άλλες αλλοιώσεις. Με τον τρόπο αυτό όχι
μόνο τελικά μειώνεται ο όγκος του τελικού ψηφιακά παραγόμενου αρχείου, αλλά βελτιώνεται
και η ποιότητα. Οι πιο γνωστοί απωλεστικοί αλγόριθμοι συμπίεσης για εικόνες είναι o JPG
(Joint Photographic Experts Group) [15] [καθώς και ο TIFF (Tagged Image File Format)].
Στις επόμενες παραγράφους παρουσιάζεται ένα παράδειγμα συμπίεσης μέσω Huffman coding,
καθώς και πληροφορίες σχετικά με τα πιο δημοφιλή μορφότυπα αποθήκευσης και συμπίεσης
δεδομένων εικόνας.
~ 50 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Βασική αρχή στην οποία στηρίζεται η κωδικοποίηση Huffman είναι η εκμετάλλευση της συ-
χνότητας εμφάνισης ενός συμβόλου (για το παρόν παράδειγμα ενός χαρακτήρα, για μια εικόνα ενός
χρώματος, για ένα ηχητικό κλιπ ένα επίπεδο έντασης κ.λπ.). Συγκεκριμένα, ο αλγόριθμος σκοπεύει
να δημιουργήσει μια νέα κωδικοποίηση με στόχο την αναπαράσταση των πιο συχνά εμφανιζόμενων
συμβόλων με όσο το δυνατόν μικρότερο αριθμό bits. Στο παράδειγμά μας, ο αλγόριθμος θα ακολου-
θούσε τα εξής βήματα/στάδια.
1ο Βήμα – Εύρεση συχνοτήτων εμφάνισης ανά σύμβολο.
Υπολογίζουμε τον αριθμό εμφανίσεων κάθε χαρακτήρα στην υπό εξέταση έκφραση (βλέπε παρα-
κάτω πίνακα).
2 3
N N Κόµβος - Node
3 4 5
N N N
L L L
Κόµβος Φύλλο – Leaf Node
Η δενδρική μορφή αναπαράστασης της πληροφορίας αποτελεί μια υποκατηγορία της Θεωρίας
των Γραφημάτων ή Γράφων [16]. Όπως φαίνεται και από το παραπάνω σχήμα, σε έναν γράφο (graph)
υπάρχουν οι κορυφές ή κόμβοι (vertices/nodes) και οι ακμές (edges). Κάθε κόμβος μπορεί να συνδέε-
ται με έναν άλλον με μια ακμή, απλή ή κατευθυνόμενη. Στη δεύτερη περίπτωση ο γράφος αποκαλείται
«κατευθυνόμενος γράφος» ή “directed graph”. Για την περίπτωση του δένδρου ισχύουν τα εξής:
–– Κάθε κόμβος ενώνεται με έναν άλλον κόμβο μόνο μέσω ενός μονοπατιού (path) αποτελού-
μενου από ακμές (συνεκτικότητα – μη κυκλικός γράφος).
–– Στην περίπτωση που το δένδρο έχει μοναδικά αριθμημένους κόμβους ή είναι κατευθυνόμε-
νος μπορούν να οριστούν οι εξής κατηγορίες κόμβων:
• Κόμβος πατέρας (parent node): πρόκειται για τον κόμβο στο αρχικό σημείο μιας ακμής
σε έναν κατευθυνόμενο γράφο.
• Κόμβος παιδί (child node): πρόκειται για τον κόμβο στο τελικό σημείο μιας ακμής σε
ένα κατευθυνόμενο γράφο.
• Κόμβος ρίζα (root node): πρόκειται για τον κόμβο στον οποίο δεν υπάρχουν εισερχόμε-
νες ακμές παρά μόνο εξερχόμενες (π.χ. κόμβος 1 στο παραπάνω σχήμα) – Κόμβος χωρίς
γονέα.
• Κόμβος φύλλο (leaf node): πρόκειται για τον κόμβο στον οποίο δεν υπάρχουν εξερχόμε-
νες ακμές παρά μόνο εισερχόμενες (π.χ. κόμβοι 3,4 και 5 στο παραπάνω σχήμα) – Κόμ-
βος χωρίς παιδιά.
• Ενδιάμεσος κόμβος (node): πρόκειται για τον κόμβο στον οποίο υπάρχουν εξερχόμενες
και εισερχόμενες ακμές (π.χ. κόμβοι 2 και 3 στο παραπάνω σχήμα).
Με βάση τα παραπάνω, για τους γράφους και τον αριθμό εμφανίσεων ανά χαρακτήρα, μπο-
ρούμε να προχωρήσουμε στη δημιουργία του δένδρου Huffman, ως εξής:
~ 52 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
–– Καταγράφουμε όλους τους χαρακτήρες και τον αριθμό των εμφανίσεών τους στην έκφραση
κατά φθίνουσα σειρά. Τα ζευγάρια χαρακτήρας – αριθμός εμφανίσεων αποτελούν τα φύλλα/
leaves του δένδρου (κόμβοι χωρίς παιδιά).
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.20. Χαρακτήρες κατά φθίνουσα σειρά με βάση τη συχνότητα εμφάνισής τους.
–– Στη συνέχεια, δημιουργούμε νέους κόμβους (nodes) στο δένδρο, ενώνοντας τα φύλλα με τις
μικρότερες συχνότητες (προσθήκη κόμβου γονέα), έως ότου να δημιουργηθεί ο κόμβος ρίζα
(root node – κόμβος χωρίς πατέρα). Σε κάθε ένωση, ο κόμβος πατέρας (parent node) που
προκύπτει έχει ως αριθμό εμφανίσεων το άθροισμα των εμφανίσεων των κόμβων παιδιών
του (child nodes). Στο παραπάνω παράδειγμα, στο πρώτο «πέρασμα» του αλγορίθμου, ενώ-
νονται διαδοχικά οι κόμβοι «_» (κενό) και «Δ» (προκύπτει ο «_Δ» με αριθμό εμφανίσεων
2), «Μ» και «Ρ» (προκύπτει ο «ΜΡ» με αριθμό εμφανίσεων 2) και ο «Κ» με το «Η» (προ-
κύπτει ο «ΚΗ» με αριθμό εμφανίσεων 2).
ΚΗ 2 ΜΡ 2 _Δ 2
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.21. 1ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
–– Στο δεύτερο «πέρασμα» του αλγορίθμου, ενώνονται διαδοχικά οι κόμβοι «Ε» και «ΚΗ»
(προκύπτει ο «ΕΚΗ» με αριθμό εμφανίσεων 4) και ο «ΜΡ» με το «_Δ» (προκύπτει ο
«ΜΡ_Δ» με αριθμό εμφανίσεων 4).
ΕΚΗ 4 ΜΡ_Δ 4
ΚΗ 2 ΜΡ 2 _Δ 2
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.22. 2ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
–– Στο τρίτο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «Α» και «Ε» (προκύπτει ο «ΑΕ»
με αριθμό εμφανίσεων 7).
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 53 ~
ΕΚΗ 4 ΜΡ_Δ 4
ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.23. 3ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
–– Στο τέταρτο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «ΕΚΗ» και «ΜΡ_Δ» (προκύ-
πτει ο «ΕΚΗΜΡ_Δ» με αριθμό εμφανίσεων 8).
ΕΚΗΜΡ_Δ 8
ΕΚΗ 4 ΜΡ_Δ 4
ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.24. 4ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
–– Στο πέμπτο και τελευταίο «πέρασμα» του αλγορίθμου, ενώνονται οι κόμβοι «ΑΛ» και
«ΕΚΗΜΡ_Δ» (προκύπτει ο «ΑΛΕΚΗΜΡ_Δ» - «κόμβος root» με αριθμό εμφανίσεων 15 –
όσες και το άθροισμα των χαρακτήρων).
ΑΛΕΚΗΜΡ_Δ 15
ΕΚΗΜΡ_Δ 8
ΕΚΗ 4 ΜΡ_Δ 4
ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Σχήμα 2.25. 5ο «πέρασμα» του αλγορίθμου για τη δημιουργία του δένδρου Huffman.
~ 54 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
ΑΛΕΚΗΜΡ_Δ 15
0 1
ΕΚΗΜΡ_Δ 8
Μονοπάτι για χαρακτήρα «Α»
0 1
ΕΚΗ 4 ΜΡ_Δ 4
0 1 0 1
ΑΛ 7 ΚΗ 2 ΜΡ 2 _Δ 2
0 1 0 1 0 1 0 1
Α 4 Λ 3 Ε 2 Κ 1 Η 1 Μ 1 Ρ 1 _ 1 Δ 1
Από τον πιο πάνω πίνακα προκύπτει ότι τα πιο συχνά εμφανιζόμενα σύμβολα «Α» και «Λ»,
στη νέα κωδικοποίηση αναπαραστάθηκαν με 2 μόνο bits (μικρότερο μήκος). Επιπλέον, η συνολική
απαίτηση για την αποθήκευση της πληροφορίας από τα 120 bits, με τη χρήση του εκτεταμένου κώ-
δικα ASCII, μετά την εφαρμογή του αλγορίθμου συμπίεσης Huffman ανήλθε σε μόλις 44 bits.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 55 ~
Το TIFF, αν και κλασικό πρότυπο για την ανταλλαγή εικόνων μεταξύ διαφόρων προγραμμά-
των επεξεργασίας, αποφεύγεται για τη χρήση στο Διαδίκτυο λόγω του μεγάλου όγκου των αρχείων
του. Επίσης, πρόβλημα δημιουργείται και λόγω της χρησιμοποίησης παραλλαγών TIFF περιορισμέ-
νων χαρακτηριστικών, οι οποίες όμως παρουσιάζουν προβλήματα συμβατότητας κατά την ανταλλα-
γή τους ανάμεσα στα διάφορα περιβάλλοντα.
Μέσω της γλώσσας SVG μπορούν να προστεθούν σχήματα όπως κύκλος, ορθογώνιο, έλ-
λειψη, γραμμή, πολύγωνο κ.λπ., κείμενο, χρωματικά φίλτρα, κίνηση, εικόνες ήχοι, βίντεο κ.λπ. Στα
παραπάνω παραδείγματα απεικονίζονται: (α) ένας κύκλος (circle) με καθορισμό του κέντρου του
(συντεταγμένες cx=50, cy=50), της ακτίνας (r=40), του χρώματος (black) και του πάχους της περι-
φέρειάς του (stroke-width), καθώς και του χρώματος του γεμίσματος (fill-red) και (β) ένα πολύγωνο
(polygon) με καθορισμό των κορυφών του (polygon points = 220,10 300,210 170,250 123,234), του
χρώματος της περιφέρειάς του (stroke: purple), καθώς και του χρώματος του γεμίσματος (fill: lime).
Η διαδικασία αυτή δεν είναι τετριμμένη, όπως τυχόν φαίνεται, αλλά επηρεάζεται από
πολλούς παράγοντες όπως:
–– Ανάλυση της υπό αναγνώρισης εικόνας – Προτείνεται από 300 dpi και άνω, ενώ, αν το μέγε-
θος των γραμμάτων είναι σχετικά μικρό, συστήνεται από 400 έως 600 dpi.
–– Πολυπλοκότητα δομής κειμένου – Αν πρόκειται για εικόνες κειμένου με πολύπλοκη δομή,
όπως δηλαδή πίνακες, εξισώσεις, λεζάντες, πλαίσια κειμένου κ.λπ., ενδέχεται να μην υπάρ-
ξει το βέλτιστο αποτέλεσμα και να χρειαστεί ανθρώπινη παρέμβαση.
–– «Θόρυβος» στο περιεχόμενο - πιο δύσκολες είναι οι περιπτώσεις θορυβωδών σελίδων, δη-
λαδή με πολλές μουτζούρες ανακατεμένες με τα γράμματα, καθώς και στις περιπτώσεις
ενωμένων χαρακτήρων, οπότε πρέπει να χρησιμοποιηθούν ειδικοί αλγόριθμοι διαχωρισμού,
καθώς κολλημένοι χαρακτήρες συνεχόμενων γραμμών αλλά και μεγάλες κλίσεις οδηγούν
συχνά σε εσφαλμένη ταυτοποίηση των γραμμών.
–– Γλώσσα κειμένου – Τόσο η γλώσσα κειμένου όσο και η πιθανότητα ύπαρξης στο κείμενο
πολλαπλών γλωσσών (π.χ. ελληνικά και αγγλικά), δυσκολεύει πολύ τη διαδικασία αναγνώ-
ρισης του κειμένου. Το πρόβλημα αυτό είναι εντονότερο για τις γλώσσες με πολλούς τό-
νους, όπως στα ελληνικά πολυτονικά κείμενα, όπου οι τόνοι είναι πολύ συχνά αδιαχώριστοι
από τα κάτω γράμματα.
–– Χειρόγραφο κείμενο – Πρόκειται για την πιο δύσκολη περίπτωση αναγνώρισης κειμένου
όπου διεξάγεται μεγάλη έρευνα. Στην περίπτωση αναγνώρισης χειρογράφων, όπου κάθε
γράμμα δεν έχει σε κάθε εμφάνισή του την ίδια, επαναλαμβανόμενη τυπωμένη εκδοχή του,
αλλά εμφανίζεται σε διάφορες παραλλαγές, ο πλούτος των οποίων εξαρτάται από τον γρα-
φικό χαρακτήρα του γραφέα, χρειάζεται να εφαρμοστούν ειδικοί αλγόριθμοι εκμάθησης για
την επίτευξη του βέλτιστου αποτελέσματος.
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 59 ~
Στο σχήμα που ακολουθεί απεικονίζεται η πρακτική χρήσης ειδικού λογισμικού για την
υλοποίηση της διαδικασίας αναγνώρισης εικόνας.
Η διαδικασία ψηφιοποίησης υλικού, μέρος της οποίας αποτελεί και η οπτική αναγνώριση
κειμένου είναι μια από τις βασικές δραστηριότητες κάθε βιβλιοθήκης και, γενικότερα, κάθε Οργανι-
σμού Πληροφόρησης. Στο κεφάλαιο ΧΧ παρουσιάζονται αναλυτικά όλες οι απαραίτητες πληροφο-
ρίες που πρέπει να γνωρίζει ένας επιστήμονας Πληροφόρησης ώστε να διαχειριστεί με επιτυχία ένα
έργο (project) ψηφιοποίησης.
2.8 Ήχος
Η ψηφιοποίηση/αποθήκευση του ήχου αποτελεί το κύριο αντικείμενο της παρούσας παραγράφου.
Είναι βασική ανάγκη η μεταφορά της πληροφορίας του ήχου από τον αναλογικό κόσμο στον ψηφι-
ακό, με σκοπό αφενός την αποθήκευσή του, και αφετέρου, κυρίως στις μέρες μας, τη μετάδοσή του.
~ 60 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
Βασικές πηγές ηχητικών σημάτων είναι η ανθρώπινη φωνή, τα μουσικά όργανα, το φυσικό περιβάλ-
λον κ.λπ. Η μετατροπή του ήχου από την αναλογική του μορφή σε ψηφιακή μπορεί να λάβει χώρα
είτε κατ’ ευθείαν, με ηχογράφηση εν τη γενέσει του, είτε από ένα μέσο αναλογικής καταγραφής (π.χ.
δίσκο βινυλίου, μαγνητική ταινία κ.λπ.). Στο σχήμα που ακολουθεί απεικονίζονται τα απαραίτητα
βήματα για την ψηφιοποίηση του ήχου.
Δυαδική Συµπίεση –
Δειγµατοληψία Κβάντιση
κωδικοποίηση Αποθήκευση
την πραγματική τιμή σε ποσοστό περίπου 1,9 %, ενώ στη δεύτερη περίπτωση κβάντισης, θα αντι-
στοιχιστεί με το 17.7, οδηγώντας σε απόκλιση από την πραγματική τιμή σε ποσοστό περίπου 0,2 %
(σχεδόν 10 φορές μικρότερο).
Στάδιο 3ο – Ψηφιοποίηση - Κωδικοποίηση / Συμπίεση: Ανάλογα με τον αριθμό των τιμών κβά-
ντισης και των τιμών των δειγμάτων, ορίζεται η δυαδική κωδικοποίηση, αλλά και εφαρμόζεται ο
κατάλληλος αλγόριθμος συμπίεσης των δεδομένων. Είναι προφανές ότι και πάλι, όσο μεγαλύτερος
είναι ο αριθμός των τιμών κβάντισης, τόσο μεγαλύτερο μήκος θα πρέπει να έχει η συμβολοσειρά
που θα χρησιμοποιηθεί για την κωδικοποίηση των τιμών. Στο προηγούμενο παράδειγμα τιμών κβά-
ντισης, για την πρώτη περίπτωση, όπου υπάρχουν 51 διακριτές τιμές, απαιτούνται 6 bits για την
κωδικοποίησή τους, ενώ στη δεύτερη, με 510 διαφορετικές τιμές, απαιτούνται 9 bits. Επομένως,
και σ’ αυτήν την περίπτωση θα απαιτηθεί ένας συμβιβασμός κόστους-ποιότητας, καθώς κάθε χρήση
περισσότερων bits ανά δείγμα σημαίνει ανάγκη μεγαλύτερου διαθέσιμου χώρου αποθήκευσης και
εξασφάλιση υψηλότερων ρυθμών μετάδοσης. Σπουδαία σημασία για τη μείωση του μεγέθους του
τελικού ψηφιακού αρχείου διαδραματίζει η εφαρμογή αλγορίθμων συμπίεσης. Πιο γνωστός αλγό-
ριθμος συμπίεσης (κατηγορία lossy) για την περίπτωση του ήχου είναι ο MP3 [18], [19].
Στις επόμενες παραγράφους παρατίθενται δύο παραδείγματα στα οποία: (α) περιγράφονται
τα στάδια για τη δυαδική αποθήκευση του ήχου, δηλαδή της δειγματοληψίας, της κβάντωσης και
της κωδικοποίησης και (β) υπολογίζεται η απαιτούμενη χωρητικότητα για την ψηφιοποίηση ενός
ηχητικού σήματος με δεδομένα τον ρυθμό δειγματοληψίας και το είδος της κωδικοποίησης.
Με δεδομένες τις τιμές των δειγμάτων (βλέπε παρακάτω σχήμα) ξεκινά η διαδικασία κβά-
ντωσης. Συγκεκριμένα, ορίζεται ως ελάχιστη τιμή – 4 και ως μέγιστη το 4, με βήμα το 1. Επομένως,
το σύνολο των τιμών κβάντωσης είναι το εξής: -4, -3, -2, -1, 0, 1, 2, 3, 4 (9 διακριτές τιμές).
Έχοντας ορίσει τα επίπεδα κβάντωσης, στη συνέχεια γίνεται η αντιστοίχιση των δειγμάτων
(βλέπε παρακάτω σχήμα και πίνακα).
Ζητούμενο: ο υπολογισμός του αποθηκευτικού χώρου που πρέπει να διαθέτουμε για την αποθήκευ-
ση ενός ηχητικού σήματος διάρκειας 30 λεπτών.
Λύση
Υπολογίζουμε την απαιτούμενη χωρητικότητα για την αποθήκευση ενός δευτερολέπτου από το ηχη-
τικό σήμα ως εξής:
–– Εξαιτίας της στερεοφωνικής δυνατότητας, η δειγματοληψία λαμβάνει ταυτόχρονα δείγματα
από 2 διαφορετικά κανάλια ήχου.
–– Με δεδομένη τη συχνότητα δειγματοληψίας (44,1KHz), προκύπτει ότι σε κάθε δευτερόλε-
πτο λαμβάνονται 44.100 δείγματα ανά κανάλι δειγματοληψίας, δηλαδή 88.200 συνολικά.
–– Για την κωδικοποίηση ενός δείγματος απαιτούνται 16 bits, επομένως, για τα 88.200 απαιτούνται
16 Χ 88.200 bits = 1.411.200 bits ή ~ 1.411,2 Kbps ή 176.400 bytes ή ~ 176,400 Kbytes.
–– Στη συνέχεια, υπολογίζουμε ότι για την αποθήκευση των 30 λεπτών του ηχητικού σήματος
θα απαιτηθούν 30 λεπτά Χ 60 δευτερόλεπτα ανά λεπτό Χ 176,500 Kbytes ανά δευτερόλεπτο
= 317.520 Kbytes ή ~ 317,52 Mbytes.
Σημειώνεται ότι η απαιτούμενη χωρητικότητα που υπολογίστηκε δεν λαμβάνει υπόψη τυχόν
διαδικασία συμπίεσης δεδομένων που μπορεί να εφαρμοστεί. Τέλος, η χρήση 16 bits για το μήκος της
συμβολοσειράς των επιπέδων κβάντωσης επιτρέπει τον ορισμό 65.536 (216) διαφορετικών τιμών.
την αναπαράσταση κάθε δείγματος) και το πλήθος δειγμάτων. Όπως και στην περίπτωση του MP3,
γίνεται χρήση της μεθόδου LPCM. Η πιο διαδεδομένη συχνότητα δειγματοληψίας για τα ηχητικά
κλιπ σε WAV είναι 44100 δείγματα ανά δευτερόλεπτο, με 16 bits ανά δείγμα.
Αντίστοιχα η εκφώνηση γραπτών κειμένων μέσω συνθετικής φωνής είναι μια αποτελεσμα-
τικότατη λύση για την «ανάγνωση» ηλεκτρονικών κειμένων από τους ολικά τυφλούς αλλά και γε-
νικότερα από άτομα με προβλήματα οπτικής οξύτητας. Είναι πολύ διαδεδομένη στην εποχή μας η
ενσωμάτωση σε ιστοτόπους, κυρίως δημόσιων ή διεθνών οργανισμών, της δυνατότητας πρόσβασης
ατόμων με προβλήματα όρασης, είτε μέσω διαδικασιών υπερβολικών μεγεθύνσεων είτε με εκφώ-
νηση όλης της γραπτής πληροφορίας (μενού, σύνδεσμοι πλοήγησης, κομμάτια κειμένου, μεταδεδο-
μένα πολυμεσικού υλικού κ.λπ.). Μάλιστα σε πολλές περιπτώσεις τα ενσωματωμένα αυτά εργαλεία
δεν είναι απλώς καλοδεχούμενα αλλά και υποχρεωτικά, μέσω ειδικών Κανόνων Πρόσβασης Διαδι-
κτυακού Περιεχομένου / Web Content Accessibility Guides (WCAG) [20].
2.10 Βίντεο
Με την έννοια βίντεο περιγράφεται η συνεχής εναλλαγή εικόνων (καρέ/frames), με συγκεκριμένο
ρυθμό (frame rate per second / fps), διαδικασία μέσω της οποίας δίνεται η αίσθηση της κινούμενης
εικόνας. Σημειώνεται ότι όταν ο ρυθμός εναλλαγής των εικόνων είναι μεγαλύτερος από 24 καρέ ανά
δευτερόλεπτο, στα φιλμ δίνεται η αίσθηση της ομαλής κίνησης (smooth motion), ενώ, για να δίνεται
η αίσθηση της σταθερότητας στον χρήστη στις οθόνες των ηλεκτρονικών υπολογιστών, απαιτείται
ρυθμός ανανέωσης (refresh rate) γύρω στα 50 με 60 Hz. Παράλληλα με τη ροή των εικόνων υπάρχει
και ηχητική πληροφορία που συμπληρώνει το βίντεο (audio stream). Το βίντεο (όπως και ο ήχος)
μπορεί να είναι εξ αρχής σε ψηφιακή (digital) μορφή ή αφού καταγραφεί με αναλογικό τρόπο (π.χ.
σε φιλμ) να μετατρέπεται σε ψηφιακή μορφή στη συνέχεια. Τα κύρια χαρακτηριστικά ενός βίντεο
είναι τα εξής:
–– Ρυθμός καρέ ή frame rate: Πρόκειται για τον αριθμό των εικόνων ανά δευτερόλεπτο. Οι
σύγχρονες βιντεοκάμερες έχουν την ικανότητα λήψης έως και 120 καρέ ανά δευτερόλεπτο,
ενώ στα συστήματα εκπομπής τηλεοπτικού σήματος ο ρυθμός κυμαίνεται μεταξύ 25 (PAL/
SECAM [21], [22]) και 30 (NTSC [23]).
–– Λόγος διαστάσεων – aspect ratio: Πρόκειται για την αναλογία πλάτους/ύψους των καρέ.
Σε ό, τι αφορά την τηλεόραση, τις οθόνες των ηλεκτρονικών υπολογιστών και τον κινημα-
τογράφο, οι πιο διαδεδομένες αναλογίες 4:3 και 16:9.
–– Ανάλυση και βάθος χρώματος – resolution και color depth: Πρόκειται για τον αριθμό
των pixels σε συγκεκριμένες διαστάσεις των συνεχόμενων καρέ, καθώς και τον αριθμό των
χρωμάτων που μπορούν να αναπαρασταθούν (άρα και τα απαιτούμενα bit ανά pixel για την
κωδικοποίησή τους).
~ 68 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
–– Συμπίεση βίντεο (για ψηφιακή μορφή): Πρόκειται για το είδος της συμπίεσης, και, κατά
συνέπεια, των μορφότυπων αποθήκευσης των βίντεο που βρίσκονται σε ψηφιακή μορφή.
Στις επόμενες παραγράφους παρατίθενται: (α) ένα παράδειγμα όπου υπολογίζεται η απαιτούμενη
χωρητικότητα για την ψηφιοποίηση ενός βίντεο με συγκεκριμένα χαρακτηριστικά και (β) τα μορφό-
τυπα αποθήκευσης που συνήθως χρησιμοποιούνται.
Για την κωδικοποίηση της ροής βίντεο χρησιμοποιούνται συνήθως τα εξής πρότυπα: MPEG-
1, MPEG -2, MPEG -4, Η.262 κ.λπ. Για την κωδικοποίηση ροής ήχου χρησιμοποιούνται συνήθως τα
μορφότυπα MP3 και AAC (Advance audio coding). Στο μορφότυπο MP3 γίνεται συμπίεση του ήχου
με απώλειες, αλλά αφαιρώντας εκείνες τις φασματικές συνιστώσες που δεν είναι σχεδόν καθόλου
αντιληπτές από το μέσο αυτί. Το μορφότυπο ACC πετυχαίνει καλύτερη ποιότητα ήχου από το MP3
για τον ίδιο ρυθμό bits.
Η επέκταση του αρχείου ενός βίντεο δείχνει και την τεχνική κωδικοποίησης, καθορίζοντας
έτσι και τον σχετικό απαιτούμενο αποκωδικοποιητή (decoder).
Στον πίνακα που ακολουθεί αναγράφονται τα διαδεδομένα μορφότυπα και οι τεχνικές κω-
δικοποίησης που χρησιμοποιούν.
~ 70 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
[1] Wikipedia. (2016). ASCII. Wikipedia. Retrieved July 1st, 2016, from https://en.wikipedia.org/
wiki/ASCII
[2] Gorn, S., Bemer, R. W., & Green, J. (1963). American standard code for information
interchange. Communications of the ACM, 6(8), 422–426. doi:10.1145/366707.367524
[3] Wikipedia. (2016). EBCDIC. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/EBCDIC
[4] Wikipedia. (2016). Baudot code. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/Baudot_code
[5] Wikipedia. (2016). ISO/IEC 8859. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/ISO/IEC_8859
[6] Wikipedia. (2016). UNICODE. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/Unicode
[7] Wikipedia. (2016). UTF-8. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/UTF-8
[8] Wikipedia. (2016). Universal Coded Character Set. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου
2016 από https://en.wikipedia.org/wiki/Universal_Coded_Character_Set
[9] ISO/IEC 10646:2003 -- Information technology -- Universal Coded Character Set (UCS).
(2003). International Organization for Standardization. Ανάκτηση 1η Σεπτεμβρίου 2016 από
http://www.iso.org/iso/home/store/catalogue_ics/catalogue_detail_ics.htm?csnumber=63182
[10] Wikipedia. (2016). RGB. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/RGB_color_model
Κεφάλαιο 2 - Αναπαράσταση της πληροφορίας στον ψηφιακό κόσμο ~ 71 ~
[11] Wikipedia. (2016). CMYK Color Model. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από
https://en.wikipedia.org/wiki/CMYK_color_model
[12] Wikipedia. (2016). Huffman coding. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από
https://en.wikipedia.org/wiki/Huffman_coding
[15] Wikipedia. (2016). JPEG. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/JPEG
[16] Νικολόπουλος, Σ., Γεωργιάδης, Λ., & Παληός, Λ. (2015). Αλγοριθμική θεωρία γραφημάτων.
Αθήνα: Σύνδεσμος Ελληνικών Ακαδημαϊκών Βιβλιοθηκών. Ανάκτηση 1η Σεπτεμβρίου 2016
από https://repository.kallipos.gr/handle/11419/2067
[18] Wikipedia. (2016). MP3. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/MP3
[19] ISO/IEC 11172-3:1993 - Information technology -- Coding of moving pictures and associated
audio for digital storage media at up to about 1,5 Mbit/s -- Part 3: Audio. (1993). ISO. Ανάκτη-
ση 1η Σεπτεμβρίου 2016 από http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_
detail.htm?csnumber=22412
[20] W3C. (2008). Web Content Accessibility Guidelines (WCAG) 2.0. W3C. Ανάκτηση 1η Σε-
πτεμβρίου 2016 από, from https://www.w3.org/TR/WCAG20/
[21] Wikipedia. (2016). PAL. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/PAL
[22] Wikipedia. (2016). SECAM. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://
en.wikipedia.org/wiki/SECAM
[23] Wikipedia. (2016). NTSC. Wikipedia. Ανάκτηση 1η Σεπτεμβρίου 2016 από https://en.wikipedia.
org/wiki/NTSC
~ 72 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
[1] Κουής, Δ., & Δενδρινός, Μ. (2010). Εισαγωγή στην Τεχνολογία Πληροφοριών (1st ed.). Αθή-
να: Εκδόσεις Νέων Τεχνολογιών.
[2] Butterfield, A. (Andrew), Ngondi, G. E., & Kerr, A. (n.d.). A dictionary of computer science.
[3] Forouzan, B. A., Στεφανίδης, Γ., & Χατζηγεωργίου, Α. (2003). Εισαγωγή στην επιστήμη των
υπολογιστών: θεμελιώδεις έννοιες - από το χειρισμό δεδομένων μέχρι τη θεωρία των υπολογι-
σμών. Αθήνα: Κλειδάριθμος.
[4] Witten, I. H., Bainbridge, D., & Nichols, D. M. (2010). How to build a digital library. Morgan
Kaufmann Publishers.
[5] Dendrinos, M., Bakamidis, S., & Carayannis, G. (1991). Speech enhancement from
noise: A regenerative approach. Speech Communication, 10(1), 45–57. doi: http://dx.doi.
org/10.1016/0167-6393(91)90027-Q
[6] Dendrinos, M. (2002). A Speaking Electronic Librarian. Ariadne, (33). Retrieved from
http://www.ariadne.ac.uk/issue33/dendrinos/
[7] Dendrinos, M., & Bakamidis, S. (2002). A Resource Description Device Used for More Efficient
Library Services. (Communications). Information Technology and Libraries, 21(4), 186.
[8] Δενδρινός, Μ. (2003). Ειδικές διεπαφές με ηλεκτρονικά συστήματα βιβλιοθηκών για άτο-
μα με προβλήματα όρασης. Στο 12ο Πανελλήνιο Συνέδριo Ακαδημαϊκών Βιβλιοθηκών (pp.
375–384). ΤΕΙ Σερρών.
8. Πώς σχετίζεται το μήκος ενός σχήματος bit με το πλήθος των συμβόλων τα οποία μπορούν να
αναπαρασταθούν από το συγκεκριμένο σχήμα;
9. Γιατί δεν είναι δυνατή η αποθήκευση του δεκαδικού αριθμού 256 σε μια θέση μνήμης με 8 bit;
10. Με ποιον τρόπο αναπαριστά η ψηφιογραφική μέθοδος μια εικόνα ως σχήμα bit;
11. Ποιες είναι οι βασικές ιδιότητες μιας ψηφιακής εικόνας;
12. Να αναφέρετε δύο βασικά μοντέλα αναπαράστασης χρωμάτων στους ηλεκτρονικούς υπολογιστές.
13. Με ποιον τρόπο αναπαρίσταται μια εικόνα με τη χρήση της διανυσματικής μεθόδου;
14. Ποιο είναι το βασικό πλεονέκτημα της διανυσματικής μεθόδου αναπαράστασης μιας εικόνας σε
σχέση με την ψηφιογραφική;
15. Να αναφέρετε τις δύο βασικές κατηγορίες αλγορίθμων συμπίεσης δεδομένων.
16. Σε ποια αρχή στηρίζεται ο αλγόριθμος συμπίεσης δεδομένων του Huffman;
17. Να αναφέρετε τα βασικά μορφότυπα αποθήκευσης εικόνων.
18. Τι εννοούμε με τον όρο οπτική αναγνώριση χαρακτήρων;
19. Ποια είναι τα βήματα που απαιτούνται για την ψηφιοποίηση του ήχου;
20. Να αναφέρετε δύο βασικά μορφότυπα για την ψηφιακή αποθήκευση του ήχου. Ποια κατηγορία
αλγορίθμων συμπίεσης δεδομένων χρησιμοποιεί το καθένα από αυτά;
21. Να αναφέρετε τους τρεις βασικούς τομείς με τους οποίους ασχολείται η επεξεργασία της
ανθρώπινης φωνής.
22. Ποιες είναι οι βασικές ιδιότητες ενός βίντεο;
23. Ποια είναι τα πιο σημαντικά μορφότυπα αποθήκευσης βίντεο;
2.13.2 Ασκήσεις
1. Μετατρέψτε τον αριθμό 924 σε δυαδική, οκταδική και δεκαεξαδική μορφή.
2. Η Κεντρική Βιβλιοθήκη αποφασίζει να εμπλουτίσει την ψηφιακή της βιβλιοθήκη. Σε αυτή την
προσπάθεια θα προχωρήσει στην ψηφιοποίηση ενός μεγάλου αριθμού τεκμηρίων. Συγκεκριμέ-
να, θα ψηφιοποιήσει 150 διπλωματικές εργασίες (με μέσο όρο 100 σελίδες), 100 διδακτορικές
διατριβές (με μέσο όρο 200 σελίδες) και 100 βιβλία (με μέσο όρο 250 σελίδες). Πόση είναι η
απαιτούμενη χωρητικότητα σε αποθηκευτικό χώρο που θα απαιτηθεί (σε GBytes), αν ο εξοπλι-
σμός ψηφιοποίησης αποτελείται από ένα scanner με ανάλυση σάρωσης 5 Mpixels και βάθος
χρώματος 24 bit (ανά σελίδα).
3. Μια φωτογραφική μηχανή διαθέτει φακό με δυνατότητα ανάλυσης 5 Mpixels και βάθος χρώμα-
τος 24 bit. Μηχάνημα ψηφιοποίησης διαθέτει μια τέτοια μηχανή για την ψηφιοποίηση ιστορικών
βιβλίων, η οποία σε κάθε λήψη ψηφιοποιεί μια σελίδα του βιβλίου. Πόση είναι η απαιτούμενη
χωρητικότητα (σε GBytes) για την αποθήκευση ενός βιβλίου 500 σελίδων;
~ 74 ~ Βασικές Αρχές και Τεχνολογίες στην Επιστήμη της Πληροφόρησης
4. Μια φωτογραφική μηχανή διαθέτει φακό με δυνατότητα ανάλυσης 2000Χ5000 pixels με βάθος
χρώματος true color. Πόση είναι η απαιτούμενη χωρητικότητα (σε GBytes) που πρέπει να διαθέ-
τει η συγκεκριμένη μηχανή για την αποθήκευση 100 φωτογραφιών;
5. Το μουσικό τμήμα μιας βιβλιοθήκης αποφασίζει να ψηφιοποιήσει και να διαθέσει μέσω του Δι-
αδικτύου μια συλλογή με σπάνιες ηχογραφήσεις. Συνολικά θα ψηφιοποιηθούν 5 ηχογραφήσεις
διάρκειας μίας (1) ώρας η καθεμιά. Ο εξοπλισμός ψηφιοποίησης έχει την ικανότητα να λαμβά-
νει 100.000 δείγματα το δευτερόλεπτο, σε δύο κανάλια ήχου (στερεοφωνική ψηφιοποίηση), με
την κωδικοποίηση του κάθε δείγματος να απαιτεί 4 bytes (4.294.967.296 επίπεδα κβαντισμού).
Πόση είναι η απαιτούμενη χωρητικότητα σε αποθηκευτικό χώρο που θα απαιτηθεί (σε GBytes)
για να αποθηκευτούν τα ψηφιακά αρχεία των παραστάσεων;
6. Κατασκευάστε το δένδρο Huffman για τη φράση “GOOD MORNING GREECE”.
Analog Αναλογικός
Bitmap Ψηφιογραφικός
Byte Ψηφιολέξη
CD Compact Disc
Digital Ψηφιακός
HD High Definition
LZW Lempel–Ziv–Welch
Multimpexing Πολυπλεξία
resolution ανάλυση
Κβάντωση Quantization