Download as pdf or txt
Download as pdf or txt
You are on page 1of 328

ΘΕΟΔΩΡΟΣ ΛΩΤΗΣ

Τμήμα Μουσικών Σπουδών,


Σχολή Μουσικής & Οπτικοακουστικών Τεχνών, Ιόνιο Πανεπιστήμιο

ΤΑΞΙΑΡΧΗΣ ΔΙΑΜΑΝΤΟΠΟΥΛΟΣ
Διδάσκων ΑΣΚΤ

Μουσική Πληροφορική &


Μουσική με Υπολογιστές
Μουσική Πληροφορική & Μουσική με Υπολογιστές

Συγγραφή
Θεόδωρος Λώτης
Ταξιάρχης Διαμαντόπουλος

Κριτικός αναγνώστης
Ιωάννης Δεληγιάννης

Συντελεστές έκδοσης
Τεχνική Επεξεργασία: Άγγελος Φλώρος

ISBN: 978-960-603-408-4

Copyright © ΣΕΑΒ, 2015

Το παρόν έργο αδειοδοτείται υπό τους όρους της άδειας Creative Commons Αναφορά Δημιουργού - Μη Εμπορική
Χρήση - Όχι Παράγωγα Έργα 3.0. Για να δείτε ένα αντίγραφο της άδειας αυτής επισκεφτείτε τον ιστότοπο
https://creativecommons.org/licenses/by-nc-nd/3.0/gr/

ΣΥΝΔΕΣΜΟΣ ΕΛΛΗΝΙΚΩΝ ΑΚΑΔΗΜΑΪΚΩΝ ΒΙΒΛΙΟΘΗΚΩΝ


Εθνικό Μετσόβιο Πολυτεχνείο
Ηρώων Πολυτεχνείου 9, 15780 Ζωγράφου
www.kallipos.gr
Όλα τα τρέχοντα συστήµατα δεν µπορούν λογικά να θεωρηθούν παρά µόνο σαν σύνεργα πάνω στον πάγκο ενός
ξυλουργού. Ο ξυλουργός αυτός είσαι συ. Μόνο αν έχεις περιέλθει σε µανιακή τρέλα, θα επιχειρήσεις να αδιαφορήσεις
για όλα αυτά τα σύνεργα εκτός ίσως από ένα και να υποστηρίζεις, ας πούµε, την πλάνη µέχρι του σηµείου να βγάζεις
λαθεµένη τη χρήση του τρυπανιού.

André Breton, Προλεγόµενα σε Ένα Τρίτο Μανιφέστο του Σουρρεαλισµού ή Όχι.

.Σ.

Εικόνα εξώφυλλου: Αλέξανδρος Αγγελάκης, J_dith, 2015.

iv
Πίνακας Περιεχοµένων

Πίνακας Συντοµεύσεων – Ακρωνύµια


Πρόλογος
Εισαγωγή

Κεφάλαιο 1 Εισαγωγή. Μουσική µε Υπολογιστές.


1. Ιστορική Ανασκόπηση.
1.1. Οι Πρώτες Ιστορικές Αναφορές. Οι Πρωτοπόροι της Συγκεκριµένης Μουσικής στο Παρίσι, της
Ηλεκτρονικής Μουσικής στην Κολωνία και οι Εξελίξεις στις ΗΠΑ.
1.1.1. Το Παρίσι.
1.1.2. Η Κολωνία.
1.1.3. ΗΠΑ.
1.2. Ιστορία των Γλωσσών Μουσικού Προγραµµατισµού. Από τη MUSIC στα Σηµερινά
Περιβάλλοντα Μουσικού Προγραµµατισµού.
1.2.1. Οι Πρώτοι Υπολογιστές.
1.2.2. Τι Είναι το Πρόγραµµα;
1.2.3. Γλώσσες Προγραµµατισµού.
1.2.4. Assembly (Γλώσσες Χαµηλού Επιπέδου).
1.2.5. Γλώσσες Υψηλού Επιπέδου.
1.2.6. Μεταγλωττιστής.
1.2.7. Διερµηνευτής.
Βιβλιογραφία

Κεφάλαιο 2 Βασικά Χαρακτηριστικά του Ήχου.


2.1. Ταλαντώσεις Ήχου.
2.1.1. Ο Ήχος ως Κύµα.
2.1.2. Βασικά Χαρακτηριστικά Ταλάντωσης.
2.2. Φασµατική Πληροφορία.
2.2.1. Ανάλυση Fourier.
2.2.2. Φασµατική Αναπαράσταση.
2.2.3. Σύνθεση Κυµατοµορφών.
2.2.4. FFT-IFFT.
2.3. Ψηφιακός Ήχος.
2.3.1. Δείγµατα Ήχου.
2.3.2. Δειγµατοληψία.
2.3.2.1. Ψευδώνυµες Συχνότητες (Alias Frequencies).
2.3.2.2. Συχνότητα Nyquist. Θόρυβος Επικάλυψης (Aliasing). Αναδίπλωση (Foldover).
2.3.3. PCM Κωδικοποίηση.
2.3.4. Δυναµικό Εύρος (Dynamic Range).
2.3.5. Από τον Αναλογικό στον Ψηφιακό Ήχο: Μια Αποτίµηση.
2.4. Ψυχοακουστικά Φαινόµενα.
2.4.1. Η Αίσθηση του Τονικού Ύψους.
2.4.2. Η Αντίληψη της Έντασης: η Κλίµακα dB SPL. Υποκειµενική Ένταση (Loudness).
2.4.3. Μελέτες για τη Χροιά.
Βιβλιογραφία

v
Κεφάλαιο 3 Σύνθεση µε Ηλεκτρονικό Υπολογιστή.
3.1. Η Τέχνη των Υπολογιστών.
3.1.1. Μουσική Πληροφορική.
3.1.2. Συγχρονικότητα.
3.1.3. Η Έννοια του Μουσικού Έργου.
3.1.4. Φαινόµενα Οµογενοποίησης και Αφαίρεσης.
3.1.5. Αφαιρετικός Ρεαλισµός.
3.1.6. Θετική και Αρνητική Στάση Απέναντι στην Ψηφιακή Τεχνολογία.
3.2. Αισθητικές και Τεχνικές Αποφάσεις του Συνθέτη και του Υπολογιστή στη Διαδικασία της
Σύνθεσης.
3.2.1. Δοµικά Πρότυπα.
3.2.2. Εξαγωγή Γνωρισµάτων και Δοµικές Διαδικασίες.
3.2.3. Μέθοδοι Βάσης-Κορυφής και Κορυφής-Βάσης.
3.3. Οπτικές Αναπαραστάσεις του Ήχου.
3.3.1. Παλµογράφος (Oscilloscope).
3.3.2. Αναλυτής Φάσµατος (Spectrum Analyzer).
3.3.3. Φασµατογράφος. Φασµατογράφηµα (Spectrogram). 
Βιβλιογραφία

Κεφάλαιο 4 Σύνθεση Ήχου.


4.1. Αλγόριθµοι Σύνθεσης Ήχου.
4.2. Φασµατικές, Γραµµικές Τεχνικές: Αθροιστική Σύνθεση, Αφαιρετική Σύνθεση.
4.2.1. Αθροιστική Σύνθεση (Additive Synthesis).
4.2.1.1. Βασικές Αρχές. Άθροιση Ταλαντωτών.
4.2.1.2. Πίνακες Σύνθετων Κυµατοµορφών.
4.2.2. Αφαιρετική Σύνθεση (Subtractive Synthesis).
4.2.2.1. Ο Θόρυβος ως Σήµα.
4.2.2.2. Γεννήτριες Θορύβου.
4.2.2.3. Γεννήτριες Στενών Χρονικά Παλµών.
4.2.2.4. Φίλτρα. Γενικά Στοιχεία.
4.2.2.5. Γεννήτριες Φίλτρων Χαµηλής/Υψηλής Διέλευσης.
4.2.2.6. Γεννήτριες Φίλτρων Διέλευσης/Αποκοπής Ζώνης.
4.2.2.7. Τεχνικές Φασµατικής Ανασύνθεσης: FOF Synthesis, Resonators.
4.3. Φασµατικές, Μη-Γραµµικές Τεχνικές: Διαµόρφωση Πλάτους (AM), Ring Modulation,
Διαµόρφωση Συχνότητας (FM).
4.3.1. Διαµόρφωση Πλάτους (Amplitude Modulation).
4.3.2. Πολλαπλασιασµός Σηµάτων (Ring Modulation).
4.3.3. Διαµόρφωση Συχνότητας (Frequency Modulation).
4.4. Χρονικές, Γραµµικές Τεχνικές: Σύνθεση Πινάκων Κυµατοµορφής, Σειρές Καθυστέρησης.
4.4.1. Σύνθεση Πινάκων Κυµατοµορφής (Wavetable Synthesis).
4.4.2. Σειρές Καθυστέρησης (Delay Lines).
4.4.2.1. Απλές Σειρές Καθυστέρησης: FIR Φίλτρα.
4.4.2.2. Κυκλική Προσωρινή Μνήµη (Circular Buffer).
4.4.2.3. Φίλτρα Κτένας (Comb Filter).
4.4.2.4. Φαινόµενα Καθυστέρησης (Delay).
4.4.2.5. Αναδροµικά Κυκλώµατα.
4.4.2.6. Φίλτρα Ολικής Διέλευσης (Allpass Filters).
4.5. Χρονικές, Μη-Γραµµικές Τεχνικές: Μικροδοµική Σύνθεση (Granular Synthesis).
4.5.1. Γενικά Στοιχεία.

vi
4.5.2. Η Βασική Δοµή: Κόκκοι Ήχου (Sonic Grains).
4.5.3. Αλγόριθµοι Μικροδοµικής Σύνθεσης.
4.5.4. Υλοποιήσεις.
Βιβλιογραφία

Κεφάλαιο 5 Ολοκληρωµένα Ψηφιακά Περιβάλλοντα Ηχητικού Σχεδιασµού και


Ηχητικής Επεξεργασίας.
5.1. Το Στούντιο.
5.2. Το Μικρόφωνο.
5.2.1. Καµπύλη Απόκρισης Συχνοτήτων (Frequency Response Curve).
5.2.2. Δυναµικά Μικρόφωνα (Dynamic Microphones).
5.2.3. Πυκνωτικά Μικρόφωνα (Condenser Microphones).
5.2.4. Κατευθυντικότητα και Πολικά Διαγράµµατα.
5.2.4.1. Είδη Μικροφώνων σε Σχέση µε την Κατευθυντικότητά τους.
5.2.5. Η Τοποθέτηση του Μικροφώνου.
5.3. Η Κονσόλα Ήχου.
5.4. Ψηφιακά Συστήµατα Ηχητικής Επεξεργασίας (DAW-Digital Audio Workstation).
5.4.1. Tracks.
5.4.2. Ηχογράφηση Ήχου σε Audio Track του DAW.
5.4.3. Αλλαγή της Συχνότητας Δειγµατοληψίας.
5.4.4. Μέγεθος Προσωρινής Μνήµης (Buffer Size).
5.4.5. Μορφότυπα Ηχητικών Αρχείων (Audio File Formats).
5.5. Βασικές Επεξεργασίες Ηχητικών Αρχείων (Editing).
5.5.1. Ενίσχυση (Trim) και Μη Καταστροφική Επεξεργασία (Non Destructive Editing).
5.6. Μίξη.
5.6.1. Περιβάλλουσα ADSR. Αυτοµατισµοί Περιβάλλουσας, Έντασης και Πανοραµικού.
5.6.2. Διασταυρούµενη Κίνηση (Crossfade).
5.7. Μονάδες Επεξεργασίες Ήχου.
5.7.1. Ψηφιακή Επεξεργασία Σήµατος (Digital Signal Processing-DSP).
5.7.2. Επεξεργασίες Δυναµικού Εύρους (Dynamics Processing).
5.7.2.1. Συµπιεστής (Compressor).
5.7.2.2. Πύλη Θορύβου (Noise Gate).
5.7.2.3. Αναστολέας (Limiter).
5.7.2.4. Πολυζωνικοί Συµπιεστές-Αναστολείς (Multiband Compressors-Limiters).
5.7.2.5. Διαστολέας (Expander).
5.7.2.6. De-esser.
5.7.2.7. Λίγες Σκέψεις για τους Επεξεργαστές Δυναµικού Εύρους.
5.7.3. Επεξεργασίες Καθυστέρησης (Delays).
5.7.3.1. Αντήχηση (Reverb).
5.7.3.2. Αντήχηση Συνέλιξης (Convolution Reverb).
5.7.3.3. Αντήχηση Μεταλλικής Επιφάνειας (Plate Reverb).
5.7.3.4. Αντήχηση Ελατηρίου (Spring Reverb).
5.7.3.5. Presets.
Βιβλιογραφία

Κεφάλαιο 6 Τα Πρωτόκολλα Μουσικής Επικοινωνίας MIDI και Open Sound


Control (OSC).
6.1. Tο Πρωτόκολλο Musical Instrument Digital Interface (MIDI).

vii
6.1.1. Πώς µια Μηχανή Αποθηκεύει Έναν Αριθµό;
6.1.2. Λίγα Λόγια για την Κατανόηση του Δυαδικού Συστήµατος.
6.1.3. Παράλληλος και Σειραϊκός Τρόπος Μετάδοσης (Parallel-Serial Transmition).
6.1.3.1. Παράλληλη Μεταφορά Δεδοµένων.
6.1.3.2. Σειραϊκή Μεταφορά Δεδοµένων.
6.1.4. Πώς Μεταφέρονται τα Δεδοµένα MIDI;
6.1.5. MIDI Θύρες: In-Out-Thru.
6.1.5.1. MIDI Out.
6.1.5.2. MIDI In.
6.1.5.3. MIDI Thru.
6.1.6. Διακίνηση Μέσω MIDI.
6.1.7. Ελεγκτές Συνεχούς Ροής (Continuous Controllers).
6.1.8. Bits και Bytes.
6.1.9. Status Bytes και Data Bytes.
6.1.10. Κανάλια MIDI (MIDI Channels).
6.1.11. Δεκαεξαδικό Σύστηµα.
6.1.12. MIDI Μηνύµατα.
6.1.12.1. Channel Voice Messages.
6.1.12.1.1. Note On.
6.1.12.1.2. Note Off.
6.1.12.1.3. Polyphonic Key Pressure (Aftertouch).
6.1.12.1.4. Control Change.
6.1.12.1.5. Program και Program Change.
6.1.12.1.6. Channel Pressure (Aftertouch).
6.1.12.1.7. Pitch Bend.
6.1.12.2. Channel Mode Messages.
6.1.12.2.1. All Sound Off (cc# 120).
6.1.12.2.2. Reset All Controllers (cc# 121).
6.1.12.2.3. Local Control (cc# 122).
6.1.12.2.4. All Notes Off (cc# 123).
6.1.12.2.5. Omni Off (cc# 124).
6.1.12.2.6. Omni On (cc# 125).
6.1.12.2.7. Mono On (cc# 126).
6.1.12.2.8. Poly On (cc# 127).
6.1.12.3. System Messages.
6.1.12.4. System Real Time Messages.
6.1.12.5. System Common Messages.
6.1.12.6. System Exclusive Messages (SysEx).
6.1.13. General MIDI (GM).
6.1.14. Ψηφιακά Όργανα και Συνθετητές.
6.1.15. Κβαντισµός MIDI Δεδοµένων (Quantization).
6.1.16. Sequencers.
6.1.16.1. Step Sequencing.
6.2. Το Πρωτόκολλο Open Sound Control.
6.2.1 Το Μοντέλο Client-Server.
6.2.2. Πακέτα OSC.
6.2.3. Δοµή Μηνύµατος OSC (OSC Message).
6.2.3.1. Δοµή OSC Διεύθυνσης-OSC Address Pattern.
6.2.3.2. Τύποι Δεδοµένων-OSC Type Tag String.
6.2.4. Δοµή Δέσµης OSC (OSC Bundle).

viii
6.2.5. Χρονισµοί Εκτέλεσης OSC Μηνυµάτων.
6.2.6. Παραδείγµατα Εκτέλεσης OSC Κώδικα: Το περιβάλλον του SuperCollider.
6.2.6.1 Η Αρχιτεκτονική του SC: το Μοντέλο Client-Server.
6.2.6.2. Το SC ως Εφαρµογή Client.
6.2.6.3. Το SC ως Εφαρµογή Server.
Βιβλιογραφία

Κεφάλαιο 7 Έλεγχος και Ελεγκτές.


7.1. Μουσικός Έλεγχος.
7.2. Συσκευές Εισόδου.
7.3. Ελεγκτές On-Off και Ελεγκτές Συνεχούς Ροής.
7.4. Παραµετρικός Έλεγχος.
7.5. Συστήµατα Ελεγκτών DIY.
7.6. Ελεγκτές Χειρονοµιακού Ελέγχου (Gestural Controllers).
7.6.1. Ανάλυση Χειρονοµίας.
7.7. Απτικές Διεπαφές Χρήστη (Tangible User Interface-TUI).
7.8. Εντοπισµός Τονικού Ύψους (Pitch Tracking).
7.9. Αναγνώριση Ηχητικών Συµβάντων Μέσω του Εντοπισµού Πλάτους (Amplitude Following,
Amplitude Thresholding).
7.10. Μικροδοµικός και Μακροδοµικός Έλεγχος. Ένα Παράδειγµα.
7.11. Βιο-αισθητήρες.
7.12. Έλεγχος Χωροθέτησης και Διάχυσης του Ήχου.
7.13. Λίγες Σκέψεις Περί της Φύσης του Ελέγχου.
Βιβλιογραφία

Κεφάλαιο 8 Αλγοριθµική Σύνθεση.


8.1. Αλγοριθµική Σύνθεση: Γενικά Στοιχεία.
8.2. Σειραϊσµός: Προς µια Αλγοριθµική Οργάνωση της Μουσικής.
8.3. Η Θεωρία των Συνόλων στη Μουσική - Musical Set Theory.
8.3.1. Σύνολα Τονικών Κλάσεων (Pitch Class Set Theory): Βασικές Έννοιες.
8.3.2. Βασικές Πράξεις των Συνόλων.
8.3.3. Κανονική - Πρωταρχική Μορφή (Normal - Prime Form).
8.3.4. Ιδιότητες Συνόλων: Συµπληρωµατικότητα (Complementation) - Συνδυαστικότητα
(Combinatoriality).
8.3.5. Σειρές Τιµών Διάρκειας (Duration Series) - Σύνολα Χρονικών Στιγµών (Time Point Sets).
8.3.6. Θεωρία Συνόλων και Σειραϊσµός.
8.4. Δωδεκαφθογγισµός και Πρώτος Σειραϊσµός.
8.4.1. Βασικές Αρχές.
8.4.2. Μετασχηµατισµοί στο Δωδεκαφθογγικό Σύστηµα.
8.5. Σηµειακή Οργάνωση (Punctualism).
8.5.1. Βασικές Αρχές.
8.5.2. Olivier Messiaen: «Τέσσερις Ρυθµικές Σπουδές» («Quatre Études de Rythme»), 1949-50.
8.6. Καθολικός Σειραϊσµός (Integral/Total Serialism).
8.6.1. Βασικές Αρχές.
8.6.2. Pierre Boulez: «Le Marteau Sans Maître» (1953-54, 1957).
8.6.3. Karlheinz Stockhausen: Έργα για Πιάνο («Klavierstücke»).
8.6.3.1. Group Composition: Οργάνωση Υλικού σε Οµάδες.
8.6.3.2. Variable Form: Μεταβλητής Φόρµας.

ix
8.7. Στοχαστικά Μοντέλα: η Πιθανοκρατία στη Μουσική (Stochastic Music).
8.7.1. Μοντέλα Τυχαιότητας (Aleatorism).
8.7.1.1. Μοντέλα Τυχαιότητας Καθορισµένης ή Σταθερής Δοµής.
8.7.1.2. Μοντέλα Τυχαιότητας Κινητής Δοµής.
8.7.1.3. Μοντέλα Τυχαιότητας Σηµειογραφικής Απροσδιοριστίας.
8.7.2. Πιθανοκρατικές Διαδικασίες.
8.8. Άλλες Μορφές Αλγοριθµικής Σύνθεσης.
Βιβλιογραφία

Κεφάλαιο 9 Περιβάλλοντα Αλληλεπίδρασης.


9.1. Εισαγωγή.
9.2. Από την Επίδραση στην Αλληλεπίδραση.
9.3. Αλληλεπίδραση και Κινησιολογία.
9.4. Παραδείγµατα Χρήσης Ελεγκτών και Διεπαφών σε Δύο Εγκαταστάσεις.
9.4.1. Παράδειγµα 1. Η Εγκατάσταση «Ασκός: το Δοχείο των Ανέµων».
9.4.2. Παράδειγµα 2. Η Εγκατάσταση «Tribal Cities».
9.4.2.1. Κίνητρα και Αλληλεπίδραση.
9.4.2.2. Τοπικές Δοµές.
9.4.2.3. Μακροδοµή.
Βιβλιογραφία

Κεφάλαιο 10 Codetta. Συµπεράσµατα.


10.1. Νέες Τάσεις και ο Ρόλος της Μουσικής Πληροφορικής στη Διαµόρφωση του Μελλοντικού
Μουσικού. Μια Υπόθεση.
10.1.1. Ο Ψηφιακός Τενόρος.
10.1.2. Συµπεράσµατα.
Βιβλιογραφία

Παράρτηµα. Ευρετήριο Αντιστοίχισης Ελληνικών και Ξενόγλωσσων Όρων.


Αναφορές

x
Πίνακας Συντοµεύσεων-Ακρωνύµια

ADC Analog to Digital Converter


ADSR Attack-Decay-Sustain-Release
AM Amplitude Modulation
ar audio rate
AU Audio Units (Apple)
CDP Composers’ Desktop Project
CLM Common Lisp Music
DAC Digital to Analog Converter
DAW Digital Audio Workstation
dB Decibel
DSP Digital Signal Processing
ER Early Reflections
FFT Fast Fourier Transform
FM Frequency Modulation
FPS Frames Per Second
GM General MIDI
GUI Graphical User Interface
HCI Human Computer Interaction
IFFT Inverse Fast Fourier Transform
IRCAM Institut de Recherche et Coordination Acoustique Musique
ITD Interaural Time Difference
kr control rate
LFO Low Frequency Oscillator
LSB Least Significant Byte
MIDI Musical Instrument Digital Interface
MSB Most Significant Byte
MTC MIDI Time Code
OSC Open Sound Control
PSGS Pitch-Synchronous Granular Synthesis
RT Reverb Time
RTAS Real Time Audio Suite (Avid Technology)
SC SuperCollider
SGS, QSGS Synchronous and Quasi-Synchronous Granular Synthesis
SMPTE Society of Motion Picture and Television Engineers
STFT Short-Time Fourier Transform
TUI Tangible User Interface
UG Ugens Unit Generators
UPIC Unité Polyagogique Informatique CEMAMu
VCA Voltage Controlled Amplifier
VCF Voltage Controlled Filter
VCO Voltage Controlled Oscillator
VST Virtual Studio Technology

xi
Πρόλογος

Η Μουσική Πληροφορική είναι ένας κόµβος στον οποίο εµπλέκονται δύο, τουλάχιστον, τέχνες: η µουσική και
η πληροφορική. Η πληροφορική προσφέρει στη µουσική εργαλεία, ανεξερεύνητες διαδροµές, µεθοδολογίες
και αιτιολογήσεις. Η µουσική τροφοδοτεί την πληροφορική µε αφορµές για αναζήτηση διευρύνοντας τις
ερευνητικές της κατευθύνσεις. Ο κόµβος παραµένει ανοικτός, δυναµικός και φιλόξενος. Σε αυτόν,
συναντιούνται όλο και περισσότερα ερευνητικά αντικείµενα: οι γνωσιακές επιστήµες, η τεχνητή νοηµοσύνη,
η φιλοσοφία του νου, η µηχανική, ο προγραµµατισµός, η ακουστική, η παιδαγωγική, όλες οι µορφές των
τεχνών και των επιστηµονικών αντικειµένων. Μπορεί κανείς να δηµιουργήσει µουσική αναζητώντας
µεθοδολογίες από κάθε τέχνη και επιστήµη. Η πληροφορική προσφέρει τους τρόπους για να µετατραπούν
αυτές οι µεθοδολογίες σε µεθοδολογίες µουσικής έκφρασης. Φιλοδοξία αυτού του βιβλίου είναι να
περιγράψει ορισµένες από αυτές τις συναντήσεις και να εντοπίσει τους καρπούς που δηµιουργούν.
Ευχαριστώ θερµά: όσα µέλη του Συνδέσµου Συνθετών Ηλεκτροακουστικής Μουσικής κατέθεσαν
προτάσεις για τη µετάφραση πολύσηµων και συχνά δυσνόητων και διφορούµενων όρων. Τους συναδέλφους
Δηµήτρη Αδάµ και Νίκο Μασσαρά για τις πολύτιµες επισηµάνσεις τους. Τους/τις Τάνια Τσιρίδου, Πάνο
Πανδή, Φίλιππο Θεοχαρίδη, Πάνο Αµελίδη, Sergio Luque, Peter Batchelor, Ake Parmerud, Todor Todoroff
και Caroline Traube για τις γραµµές κώδικα και τις προσωπικές δηµιουργικές στιγµές που µοιράστηκαν. Τον
Αλέξανδρο Αγγελάκη για όλες τις µετατροπές και την εικόνα του εξώφυλλου. Την Ελευθερία Ράδου για τη
συνδροµή της στην ανάγνωση του κειµένου. Την Ιωάννα Αλεξοπούλου-Δουκουµέ για τη διεισδυτική µατιά
και την επιµονή στην παρακολούθηση του κειµένου. Τέλος, τον συνοδοιπόρο συν-συγγραφέα Ταξιάρχη
Διαµαντόπουλο, χωρίς τον οποίο ακόµη θα έγραφα.

Θεόδωρος Λώτης
Κέρκυρα, Δεκέµβριος 2015

xii
Εισαγωγή

Το περιεχόµενο του βιβλίου Μουσική Πληροφορική & Μουσική µε Υπολογιστές αποτελεί ένα πλήρες
εξαµηνιαίο εισαγωγικό µάθηµα µε αντικείµενο τη Μουσική Πληροφορική. Εξετάζει τη χρήση των
ηλεκτρονικών υπολογιστών και της επιστήµης της πληροφορικής στην τέχνη της µουσικής σύνθεσης.
Επιπλέον, απευθύνεται σε µουσικούς εκτελεστές και αυτοσχεδιαστές που επιθυµούν να εντάξουν τεχνολογικά
εργαλεία και µεθοδολογίες της Μουσικής Πληροφορικής στη µουσική τους εξερεύνηση.
Στο Κεφάλαιο 1 ο αναγνώστης θα γνωρίσει τις ιστορικές πρωτοποριακές τάσεις της Συγκεκριµένης
Μουσικής στη Γαλλία, της Ηλεκτρονικής Μουσικής στη Γερµανία και της υποβοηθούµενης από υπολογιστή
µουσικής στις ΗΠΑ. Θα αναγνώσει µια σύντοµη ιστορία των πρώτων γλωσσών µουσικού προγραµµατισµού.
Επίσης, θα γνωρίσει τις βασικές αρχές και λειτουργίες ενός προγράµµατος για υπολογιστή.
Το Κεφάλαιο 2 αναλύει τα βασικά χαρακτηριστικά του ήχου και τα φαινόµενα των ηχητικών
ταλαντώσεων. Αναφέρεται στην Ανάλυση Fourier, στις τεχνικές FFT και IFFT, στη φασµατική
αναπαράσταση και στη σύνθεση κυµατοµορφών. Περιγράφει τα χαρακτηριστικά του ψηφιακού ήχου, τις
µεθόδους δειγµατοληψίας και κωδικοποίησης, και τις τεχνικές µετατροπής του αναλογικού σήµατος σε
ψηφιακό. Αναλύει την έννοια του δυναµικού εύρους και τα ψυχοακουστικά φαινόµενα, εστιάζοντας στην
αντίληψη της έντασης, της χροιάς και του τονικού ύψους.
Στο Κεφάλαιο 3 αναπτύσσονται θεωρητικές απόψεις σχετικά µε τη χρήση των υπολογιστών στη
µουσική τέχνη και οι διαµορφούµενες αισθητικές τάσεις που προκύπτουν από αυτήν. Δίνεται ένα παράδειγµα
και αναλύονται οι νέες προσεγγίσεις και οι συνέπειες που επιφέρει η ψηφιακή τεχνολογία στη µουσική
δηµιουργία. Ακόµη, αναφέρονται τα βασικά δοµικά πρότυπα στη σύνθεση µε υπολογιστή και εξετάζονται οι
δοµικές διαδικασίες και µέθοδοι (κορυφής-βάσης και βάσης-κορυφής). Τέλος, παρατίθενται τρεις
διαφορετικοί τρόποι οπτικής αναπαράστασης του ήχου.
Στο Κεφάλαιο 4 ο αναγνώστης θα εξοικειωθεί µε τους αλγόριθµους σύνθεσης ήχου, τις φασµατικές,
γραµµικές τεχνικές (Αθροιστική και Αφαιρετική Σύνθεση, πίνακες σύνθετων κυµατοµορφών, γεννήτριες
θορύβου και γεννήτριες στενών χρονικά παλµών, φίλτρα και γεννήτριες φίλτρων, τεχνικές φασµατικής
ανασύνθεσης), τις φασµατικές, µη-γραµµικές τεχνικές (Διαµόρφωση Πλάτους-AM, Ring Modulation,
Διαµόρφωση Συχνότητας-FM), τις χρονικές, γραµµικές τεχνικές (Σύνθεση Πινάκων Κυµατοµορφής, Σειρές
Καθυστέρησης) και τις χρονικές, µη-γραµµικές τεχνικές (Μικροδοµική Σύνθεση-Granular Synthesis).
Στο Κεφάλαιο 5 ο αναγνώστης θα ξεναγηθεί σε ένα σύγχρονο στούντιο ήχου και θα γνωρίσει τα είδη
και τα χαρακτηριστικά των µικροφώνων και τη λειτουργία της κονσόλας ήχου. Θα εξοικειωθεί µε τυπικά
δείγµατα ψηφιακών συστηµάτων ηχητικού σχεδιασµού και ηχητικής επεξεργασίας και µε τις τεχνικές και τα
εργαλεία ελέγχου αυτών των συστηµάτων. Θα µελετήσει τις βασικές επεξεργασίες των ηχητικών αρχείων,
την έννοια της περιβάλλουσας και του αυτοµατισµού της, και τις λειτουργίες των µονάδων επεξεργασίας
ήχου (συµπιεστής, πύλη θορύβου, αναστολέας, de-esser, delay, αντήχηση).
Το Κεφάλαιο 6 αναπτύσσει διεξοδικά τα Πρωτόκολλα Μουσικής Επικοινωνίας Musical Instrument
Digital Interface (MIDI) και Open Sound Control (OSC) µε παραδείγµατα εκτέλεσης OSC κώδικα σε
περιβάλλον SuperCollider. Παραθέτει τα είδη και την αρχιτεκτονική των µηνυµάτων MIDI και OSC, τους
τρόπους διακίνησής τους και αναλυτικούς πίνακες κατηγοριοποίησής τους. Εξετάζει επίσης την τεχνική
sequencing και step sequencing µε παραδείγµατα σε περιβάλλον Max.
Το Κεφάλαιο 7 διερευνά την έννοια του µουσικού ελέγχου και τους τρόπους πραγµάτωσής του µέσω
υλικού εξοπλισµού και λογισµικών (χειρονοµιακοί και απτικοί ελεγκτές, συστήµατα αισθητήρων, βιο-
αισθητήρες, ελεγκτές χωροθέτησης και διάχυσης του ήχου). Παραβάλλει διαφορετικές συσκευές εισόδου και
ελεγκτές, και εξετάζει τους τρόπους ανάλυσης της χειρονοµίας ελέγχου. Περιγράφει τον εντοπισµό τονικού
ύψους (Pitch Tracking) και την αναγνώριση ηχητικών συµβάντων µέσω του εντοπισµού πλάτους (Amplitude
Following, Amplitude Thresholding). Δίνονται παραδείγµατα ελέγχου σε ένα έργο για φλάουτο,
µαγνητοταινία και ζωντανή ηχητική επεξεργασία.
Στο Κεφάλαιο 8 εξετάζονται η ιστορία και η αισθητική της αλγοριθµικής σύνθεσης και αναλύονται οι
στρατηγικές της. Ο αναγνώστης γνωρίζει τον δωδεκαφθογγισµό, τον σειραϊσµό και τον καθολικό σειραϊσµό,
τη θεωρία των συνόλων στη µουσική, τη σηµειακή οργάνωση (Punctualism), τα στοχαστικά µοντέλα και την
πιθανοκρατία στη µουσική, και άλλες µορφές αλγοριθµικής σύνθεσης. Δίνονται παραδείγµατα µουσικών
έργων για τις παραπάνω περιπτώσεις.

xiii
Το Κεφάλαιο 9 ερευνά την έννοια της αλληλεπίδρασης παραθέτοντας παραδείγµατα χρήσης
ελεγκτών και διεπαφών σε δύο οπτικο-ακουστικές εγκαταστάσεις. Εξετάζει τα κίνητρα, τις µορφές και τους
τρόπους δόµησης της αλληλεπίδρασης.
Στο τελευταίο Κεφάλαιο διερευνώνται ορισµένες νέες τάσεις, καθώς και ο ρόλος της µουσικής
πληροφορικής στη διαµόρφωση του µελλοντικού µουσικού µέσα από µια υποθετική νοήµονα µουσική
µηχανή.

xiv
Κεφάλαιο 1
Εισαγωγή. Μουσική µε Υπολογιστές.
Σύνοψη
Το Πρώτο Κεφάλαιο παραθέτει ιστορικά στοιχεία τα οποία θεωρούνται απαραίτητα για την ολοκληρωµένη
κατανόηση του αντικειµένου της Μουσικής Πληροφορικής. Εξετάζει την ανάπτυξη των γλωσσών µουσικού
προγραµµατισµού, µέσα στο πλαίσιο των αρχικών εξελίξεων της υπολογιστικής τεχνολογίας και των
υπολογιστών. Πρέπει φυσικά να επισηµανθεί ότι η παράθεση των ιστορικών στοιχείων περιορίζεται στην
αναφορά γεγονότων και εξελίξεων που επηρέασαν την τέχνη της µουσικής δηµιουργίας. Τέλος, το κεφάλαιο
ολοκληρώνεται µε τις βασικές αρχές και τα χαρακτηριστικά που διέπουν ένα τυπικό πρόγραµµα ψηφιακού
ηλεκτρονικού υπολογιστή.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

1. Ιστορική Ανασκόπηση.
Η µουσική των υπολογιστών γνώρισε µεγάλη άνθιση τις πρώτες δεκαετίες µετά το τέλος του Δεύτερου
Παγκοσµίου Πολέµου. Πριν από αυτήν την ιστορική καµπή, είχαν προηγηθεί πολλές προσπάθειες, εκ των
οποίων κάποιες υπήρξαν άξιες λόγου ενώ άλλες καταδικασµένες από την αρχή να αποτύχουν. Στο παρόν
κεφάλαιο θα αναφερθούµε σε εκείνες τις εξελίξεις στους τοµείς της µουσικής τεχνολογίας και πληροφορικής,
οι οποίες οδήγησαν στη σηµερινή άνθιση και εξάπλωση των υπολογιστών στη µουσική τέχνη.

1.1. Οι Πρώτες Ιστορικές Αναφορές. Οι Πρωτοπόροι της Συγκεκριµένης Μουσικής στο


Παρίσι, της Ηλεκτρονικής Μουσικής στην Κολωνία και οι Εξελίξεις στις ΗΠΑ.
Από τη δεκαετία του 1870 µέχρι και τον Δεύτερο Παγκόσµιο Πόλεµο οι ανατροπές στις τέχνες διαδέχονταν η
µία την άλλη. Από τους ιµπρεσιονιστές στους εξπρεσιονιστές και τους φοβιστές, από τους κυβιστές στους
φουτουριστές, από τους ντανταϊστές στους σουρεαλιστές και από τους ατονιστές στους δωδεκαφθογγιστές,
όλοι οι -ισµοί στις τέχνες επιχείρησαν την ανανέωση, αν όχι την απόλυτη ρήξη, µε τις προηγούµενες
κυρίαρχες τεχνοτροπίες. Η αλµατώδης βιοµηχανική επανάσταση, η κυριαρχία της επιστήµης και της
τεχνολογίας και η επίδρασή τους στο βιοτικό επίπεδο, η σύνδεση της βόρειας και κεντρικής Ευρώπης µέσω
της εξάπλωσης του σιδηρόδροµου, η µακρόχρονη ειρήνη που διατηρήθηκε στην ήπειρο µέχρι το τέλος της
Belle Epoque και η γνωριµία των Ευρωπαίων καλλιτεχνών µε το έργο των εξωτικών συναδέλφων τους από
τις αποικίες (Ασία, Αφρική και Αµερική), αποτέλεσαν κάποιες από τις βασικές αιτίες αυτών των ανατροπών.
Καινούργια γνώση προστίθετο συνεχώς στην, συχνά περιορισµένη ή ανεπαρκή, προηγούµενη. Η αισιοδοξία
που πήγαζε από την ασφάλεια και την οικονοµική ανάπτυξη διαµόρφωνε τη διάθεση της ρήξης, πάντα στα
πλαίσια δηµιουργίας ενός νέου και καλύτερου µέλλοντος. Οι βεβαιότητες που προσέφερε η επιστήµη και η
τεχνολογία σηµατοδοτούσαν τη συνειδητοποίηση νέων αρχών και αξιών και, εξ ορισµού, η συνειδητοποίηση
σηµαίνει πάντα το τέλος µιας κατάστασης και την έναρξη µιας νέας διαδροµής. Οι νεωτερισµοί που
εκδηλώθηκαν στη διάρκεια εκείνης της εποχής ήταν πολλοί. Κάποιοι από αυτούς πέρασαν σύντοµα στη λήθη.
Άλλοι, συνέβαλαν τα µέγιστα στη διαµόρφωση των αισθητικών τάσεων και των καλλιτεχνικών ρευµάτων
όλου του 20ού αιώνα.
Κατά τις δεκαετίες 1940 και 1950, οι εξελίξεις που κατέδειξαν την απόλυτη σύνδεση της
πρωτοποριακής µουσικής µε την τεχνολογία και που αργότερα συσχετίστηκαν µε την ηλεκτρονική µουσική
και τη µουσική µε υπολογιστές συνέβησαν, σχεδόν ταυτόχρονα, σε τρία διαφορετικά κέντρα. Στο Παρίσι, το
οποίο βρισκόταν στο λυκόφως της επίδρασής του ως το κυρίαρχο ευρωπαϊκό κέντρο των τεχνών, στην
Κολωνία µιας εξαθλιωµένης από την πολεµική ήττα Γερµανίας και στην Αµερική των αφηρηµένων
εξπρεσιονιστών ζωγράφων, η οποία έπαυσε από τη δεκαετία του 1950 να είναι µόνο ένας επαρχιακός και
απόµακρος µεταναστευτικός προορισµός των Ευρωπαίων και διεκδικούσε µε αξιώσεις τον ξεχωριστό δικό
της ρόλο στις κοινωνικές, οικονοµικές, επιστηµονικές και πολιτιστικές εξελίξεις.

1
Η διαφορετικότητα των τριών αυτών κέντρων και των συνθετών που εργάστηκαν σε αυτά δεν ήταν
µόνο γεωγραφική. Ήταν κυρίως πολιτισµική, φιλοσοφική και τεχνοτροπική. Σε κάποιες περιπτώσεις, όπως σε
αυτήν της Κολωνίας και του κύριου εκπροσώπου της Karlheinz Stockhausen, η αναγκαιότητα της
αναγέννησης µέσα από τα ερείπια του πολέµου ήταν τόσο µεγάλη και αδιαπραγµάτευτη που η
διαφορετικότητα µετατράπηκε σε αντιπαράθεση µε τα άλλα κέντρα των εξελίξεων. Σε όλες τις µορφές τους
όµως και µε όλες τις διαφορετικότητες και αντιπαραθέσεις τους, εκείνα τα κέντρα µε εκείνους τους
ανθρώπους σε εκείνη την εποχή διαµόρφωσαν, το καθένα ξεχωριστά και όλα µαζί, όλες τις αισθητικές και
τεχνικές της ηλεκτρονικής µουσικής στα χρόνια που ακολούθησαν.
Οι σχολές της Musique Concrète (συγκεκριµένη µουσική) και της Elektronische Musik (ηλεκτρονική
µουσική), στο Παρίσι και στην Κολωνία αντίστοιχα, αλλά και η σύνταξη των πρώτων γλωσσών µουσικού
προγραµµατισµού και η µουσική µε υπολογιστές (computer-assisted και computer-aided composition) στις
ΗΠΑ, αντιπροσωπεύουν τους προδρόµους όλων των τάσεων της σηµερινής ηλεκτροακουστικής µουσικής.
Αυτές οι σχολές γεννήθηκαν στο τέλος µιας µακράς περιόδου ρήξης µε τη δυτική παράδοση η οποία ξεκίνησε
από συνθέτες του τέλους του 19ου αιώνα (Debussy, Satie κ.ά.) και συνεχίστηκε σε όλο το πρώτο µισό του 20ού
(Messiaen, Varèse κ.ά.). Επρόκειτο για εποχές ιδεαλισµού, µε τις καταστροφικές συνέπειες του δεύτερου
παγκοσµίου πολέµου να έχουν τον αρνητικότερο αντίκτυπο στη δυτική µουσική παράδοση. Οι πρωτοπόροι
συνθέτες αυτής της εποχής αποδέχτηκαν την ιστορική αναγκαιότητα να δηµιουργήσουν µουσική µε τη χρήση
των νέων µέσων. Αυτό περιελάµβανε την απόρριψη όλων των παραδοσιακών µουσικών αξιών και την
προσέγγιση περισσότερο πειραµατικών και avant-garde προσεγγίσεων της συνθετικής διαδικασίας.

1.1.1. Το Παρίσι.

Στις 5 Οκτωβρίου 1948, η Γαλλική Ραδιοφωνία (Radiodiffusion Francaise) εξέπεµψε το πρώτο έργο
συγκεκριµένης µουσικής1, τις «Πέντε Σπουδές Θορύβων» (Cinq Έtudes de Bruits) του Pierre Schaeffer. Το
έργο είχε τη µορφή σουίτας σε πέντε µέρη: 1. Étude aux Chemins de Fer 2. Étude aux Tourniquets 3. Étude
Violette 4. Étude Noire 5. Étude Pathétique. Για πρώτη φορά µετά το 1914 και τους φουτουριστές2 ο Pierre
Schaeffer παρουσίασε µια συναυλία µη αναµενόµενη, µη συµβατικής µουσικής, µια συναυλία ήχων και
θορύβων η οποία µεταδόθηκε από έναν σταθµό µε µεγάλη ακροαµατικότητα στη Γαλλία. Οι ακροατές είχαν
µια εµπειρία αν όχι µοναδική – το Παρίσι ήταν συνηθισµένο σε ρηξικέλευθες µουσικές εκδηλώσεις –
τουλάχιστον πρωτάκουστη και αβέβαιη για τη µελλοντική της εξέλιξη.
O Pierre Schaeffer, µηχανικός, συνθέτης, συγγραφέας, εκφωνητής στο ραδιόφωνο, αλλά πάνω από
όλα ερευνητής του ηχητικού φαινοµένου, ξεκίνησε τους ηχητικούς πειραµατισµούς του ήδη από το 1942
ιδρύοντας για αυτόν τον σκοπό ένα πειραµατικό εργαστήριο στη Γαλλική Ραδιοφωνία µε την ονοµασία
«Studio d’Essai» και από το 1946 «Club d’Essai». Η στοιχειώδης τεχνολογία των πρώιµων πειραµατισµών
υπέδειξε τη µουσική πρακτική και µεθοδολογία µε πολλούς τρόπους. Η συγκεκριµένη µουσική του Schaeffer
διαµορφώθηκε αρχικά από τη διαχείριση ηχογραφηµένων ηχητικών πηγών σε δίσκο από κερί. Η χρήση της
µαγνητοταινίας λίγο αργότερα, διεύρυνε τις δυνατότητες, προσέφερε µεγαλύτερη ευχρηστία και οδήγησε σε
µια περισσότερο περίπλοκη συνθετική µεθοδολογία.
Η ονοµασία συγκεκριµένη µουσική (musique concrète) δόθηκε από τον Pierre Schaeffer για να
περιγράψει τη µουσική η οποία συντίθεται από το χειρισµό µικροφωνικών ηχογραφήσεων φυσικού (µη
ηλεκτρονικού) ήχου. Ο Schaeffer µε αυτήν την ονοµασία περιέγραψε όχι µόνο την ηχογράφηση του ήχου
αλλά και τη µέθοδο της σύνθεσης. Η συγκεκριµένη µουσική εγκαινίασε µε ολοκληρωτικό και επίµονο τρόπο
την αποµάκρυνση της συνθετικής τεχνικής από την παραδοσιακή πρακτική που περιελάµβανε τη χρήση των
οργάνων και την κωδικοποίηση των ήχων σε νότες µιας παρτιτούρας. Ο συνθέτης τώρα άρχιζε µε το
συγκεκριµένο (ηχογραφηµένος ήχος) και προχωρούσε στο αφηρηµένο (µουσικές δοµές) σε αντίθεση µε την
παραδοσιακή οργανική µουσική η οποία ξεκινούσε από το αφηρηµένο (παρτιτούρα) για να οδηγηθεί στο
συγκεκριµένο (ηχητική εµπειρία του µουσικού έργου). Η ηχοχρωµατική παλέτα άνοιξε απεριόριστα και
οποιοσδήποτε ηχογραφηµένος ήχος µπορούσε να χρησιµοποιηθεί στη σύνθεση. Ο Schaeffer όρισε τον
ηχογραφηµένο ήχο ως «objet sonore» (ηχητικό αντικείµενο). Η προσέγγιση του ήχου ως αντικειµένου πηγάζει
από την αποτύπωσή του σε ένα κοµµάτι µαγνητοταινίας και, κατά συνέπεια, από τη µετατροπή του, από µια
στιγµιαία και µοναδική µη επαναλαµβανόµενη βιωµατική εµπειρία, σε ένα αντικείµενο εγκλωβισµένο στην

2
υλική υπόσταση της µαγνητοταινίας. Το κοµµάτι της µαγνητοταινίας που περιείχε τον ήχο µπορούσε να
υποστεί επεξεργασίες µε ανάλογο τρόπο µε τον οποίο ένα κοµµάτι µάρµαρο µπορούσε να υποστεί
µορφοποίηση στα χέρια ενός γλύπτη. Για την κατανόηση των ηχητικών αντικειµένων, ο Schaeffer πρότεινε
νέες διαδικασίες ακρόασης, κορωνίδα των οποίων ήταν η «écoute réduite» (ελαχιστοποιηµένη ή αφηρηµένη
ακρόαση)3, κατά την οποία ο ακροατής εστιάζει στην εσωτερική δοµή των ήχων αποχωρίζοντάς τους από την
πηγή και την αιτία που τους παρήγαγε και από το κοινωνιολογικό και σηµασιολογικό τους περιεχόµενο. Αυτή
η διαδικασία απαιτεί από τον ακροατή να αποσπάσει το ηχητικό αντικείµενο από τις υποδηλώσεις του και να
το ακροασθεί µε έναν αφαιρετικό τρόπο αναζητώντας τα ποιοτικά χαρακτηριστικά της υφής του, της µάζας
του και του αρµονικού του περιεχόµενου.
Το βράδυ της 5ης Οκτωβρίου 1948, ο Schaeffer χάραξε νέους και ανεξερεύνητους δρόµους για µια
τέχνη των ήχων βασισµένη στην εµπειρία, στον πειραµατισµό, στην ελευθερία έκφρασης µέσω των ήχων και
στην εγγενή µουσικότητα όλων των αντικειµένων που µπορούν να παράξουν ήχο. Με ένα κοµµάτι ξύλο, µε
την ηχογράφηση θορύβων της αµαξοστοιχίας του τραίνου, και των ήχων του πιάνου και των κρουστών,
δηµιούργησε ένα νέο µουσικό είδος που ήρθε να διευρύνει τις δυνατότητες του συνθέτη αλλά και τη
φαντασία του ακροατή. Ο Pierre Schaeffer εισήγαγε – και αυτό είναι µια µεγάλη εξέλιξη της µουσικής του
20ου αιώνα – µια τέχνη των ήχων, άµεσα συνδεδεµένη µε την πρακτική της ηχοληψίας και την χρήση της στο
στούντιο. Μετά από πολυετή έρευνα δηµοσίευσε τη θεωρία αυτού του νέου µουσικού είδους στην περίφηµη
«Πραγµατεία Περί Μουσικών Αντικειµένων» (Traité des Objets Musicaux)4 το 1966, στην οποία ανέπτυξε
όλη τη θεωρία του σχετικά µε τα χαρακτηριστικά και τις τυποµορφολογίες των ηχητικών αντικειµένων, τους
τρόπους µε τους οποίους αυτά γίνονται αντιληπτά από τον άνθρωπο και τις διαδικασίες και µεθοδολογίες µε
τις οποίες µπορούµε να αναλύσουµε και να συνθέσουµε µε αυτά.
Παρότι η ραδιοφωνική αναµετάδοση των Πέντε Σπουδών Θορύβου θα µπορούσε να προκαλέσει
αντιδράσεις, αυτό δε συνέβη. Αντίθετα, ο συνθέτης έλαβε σηµαντική υποστήριξη από τη Γαλλική
Ραδιοφωνία για να συνεχίσει την εργασία του, πράγµα που έκανε, δηµιουργώντας µια ολόκληρη σχολή
µουσικής έρευνας στην οποία µαθήτευσαν και την οποία στη συνέχεια διεύρυναν, τόσο τεχνικά όσο και
αισθητικά, πολλές γενιές συνθετών. Αυτή η υποστήριξη οδήγησε στην ίδρυση ενός εργαστηρίου
προσανατολισµένου στη σύνθεση συγκεκριµένης µουσικής και στο σχηµατισµό της οµάδας «Groupe de
Recherche de Musique Concrète», η οποία περιελάµβανε εκτός από τον Pierre Schaeffer, τον συνθέτη Pierre
Henry και τον µηχανικό ήχου Jacques Poullin. Το εργαστήριο άνοιξε τις πύλες του σε συνθέτες όπως ο
Messiaen και οι µαθητές του, Pierre Boulez, Karlheinz Stockhausen και Jean Barraqué, Iannis Xenakis, και
Edgar Varèse.
Η προσήλωση που έδειξε η οµάδα του Παρισιού στο φυσικό ήχο, η αρχική της έντονη αποστροφή
στον ηλεκτρονικά παραγόµενο ήχο και στις τεχνικές που αυτός απαιτούσε, και η αυστηρότητα µε την οποία ο
Schaeffer διηύθυνε το εργαστήριο στη Γαλλική Ραδιοφωνία αλλά και τα µαθήµατά του αργότερα στο Ωδείο
του Παρισιού5, είχαν ως αποτέλεσµα να αναπτυχθεί µια συµπαγής και οµοιόµορφη αισθητική σχολή η οποία
οδήγησε στη δεκαετία του 1970 στην ακουσµατική µουσική6. Η σχολή αυτή, εξαιτίας των παραπάνω,
αποστασιοποιήθηκε από τις ταυτόχρονες εξελίξεις στη Γερµανία και στις ΗΠΑ, παρότι προσέφερε σε αυτές
ερεθίσµατα και τις επηρέασε ως ένα βαθµό.

1.1.2. Η Κολωνία.

Το 1948, χρονιά παρουσίασης των Πέντε Σπουδών Θορύβου από τον Schaeffer, ξεκίνησαν οι πρώτες
προσπάθειες για την ίδρυση ενός εργαστηρίου ηλεκτρονικής µουσικής (elektronische musik)7 στη
Ραδιοφωνία της Δυτικής Γερµανίας (NWDR-Nord West Deutscher Rundfunk) στην Κολωνία. Πρωτεργάτες
σε αυτό το εγχείρηµα υπήρξαν οι Werner Meyer-Eppler, διευθυντής εκείνη την εποχή στο Ινστιτούτο
Φωνητικής του Πανεπιστηµίου της Βόννης, Robert Beyer, της NWDR και Herbert Eimert, συνθέτης και
πρώτος διευθυντής του εργαστηρίου. Οι ζυµώσεις ανάµεσα στους τρεις για τη δηµιουργία ενός στούντιο µε
στόχο της σύνθεση µουσικής µε ήχους παραγόµενους από ηλεκτρονικά µέσα και ηχογραφηµένης σε
µαγνητοταινία διήρκησε ως το 1952, έτος κατά το οποίο ολοκληρώθηκε το εργαστήριο. Σύντοµα προσέλκυσε

3
πολλούς από τους µοντερνιστές νέους συνθέτες της εποχής ανάµεσα στους οποίους οι Karlheinz Stockhausen,
Pierre Boulez, Gottfried Michael Koenig, Mauricio Kagel, Henri Pousseur και Karel Goeyvaerts8.
Αν και η Γερµανική Ραδιοφωνία στην Κολωνία στέγασε και προµήθευσε µε υλικοτεχνική υποδοµή
τις πρώτες απόπειρες των µοντερνιστών συνθετών στην ηλεκτρονική µουσική, οι µεταξύ τους ζυµώσεις και οι
ανταλλαγές ιδεών και οραµάτων λάµβαναν χώρα στα θερινά µαθήµατα σύνθεσης του Darmstadt. Εκεί
άλλωστε συναντήθηκαν για πρώτη φορά οι Beyer, Meyer-Eppler και Eimert. Οι διαλέξεις τους στο Darmstadt
σχετίζονταν µε θέµατα µουσικής τεχνολογίας και ηλεκτρονικού ήχου. Στη συνάντηση του 1951, ο Meyer-
Eppler παρουσίασε τους πρώτους συνθετικούς του ήχους δηµιουργηµένους σε ένα Melochord9 και
ηχογραφηµένους σε ένα µαγνητόφωνο της εταιρίας AEG.
Η έµφαση στη χρήση ηλεκτρονικών µέσων και γεννητριών για την παραγωγή ήχου, σε αντίθεση µε
την επιλογή φυσικών ηχητικών πηγών που προτιµήθηκε από τους συνθέτες στο Παρίσι, υπήρξε σαφής και
κατηγορηµατική. Ο Werner Meyer-Eppler στη δηµοσιευµένη το 1949 θέση του «Elektronische
Klangerzeugung: Elektronische Musik und Synthetische Sprache» αποστασιοποιήθηκε από την πρακτική του
Παρισιού προτείνοντας τη δηµιουργία του ηχητικού υλικού εκ του µηδενός µε τη χρήση γεννητριών που
παρήγαγαν ηµιτονοειδείς συχνότητες. Η στάση αυτή είναι απόλυτα κατανοητή αν σκεφτούµε ότι στην
κατεστραµµένη από τον πόλεµο Γερµανία η κυρίαρχη στάση οδηγούσε στο ότι τα πάντα θα έπρεπε να
χτιστούν από την αρχή πάνω σε νέες βάσεις. Με τον ίδιο τρόπο, σύµφωνα µε τον Meyer-Eppler και τους
συνθέτες της Elektronische Musik, η νέα µουσική της Γερµανίας θα έπρεπε να χρησιµοποιήσει σαν
πρωταρχικό υλικό τα νέα πρωτάκουστα ηχοχρώµατα των ηλεκτρονικών γεννητριών µένοντας µακριά από
κάθε ηχητικό υλικό ή µουσική ιδέα του παρελθόντος. Παρότι η Elektronische Musik των πρώιµων
τουλάχιστον έργων κατηγορήθηκε για την προσήλωσή της σε κωδωνοειδείς ήχους, εξ αιτίας της χρήσης
φτωχών σε αρµονικούς κυµατοµορφών, οι συνθέτες του στούντιο της Κολωνίας υπήρξαν αφοσιωµένοι και
επίµονοι ριζοσπάστες που επηρέασαν σηµαντικά όλες τις επόµενες γενιές συνθετών ηλεκτρονικής µουσικής.
Η τεχνολογική πρόοδος, ως αποτέλεσµα του πολέµου, προσέδωσε ώθηση στις αλλαγές αυτές στην
αισθητική. Η ευκολία στη δηµιουργία και στην αναπαραγωγή ήχου µε ηλεκτρικά και ηλεκτρονικά µέσα
προσέφερε τη δυνατότητα να παρακαµφθεί η παραδοσιακή µουσική πρακτική. Έτσι, η Musique Concrète και
η Elektronische Musik αντιπροσώπευαν το ιδανικό µέσο για την επίτευξη της ρήξης µε το παρελθόν.
Στην Κολωνία, η χρήση µιας γεννήτριας ηµιτονοειδών κυµατοµορφών όχι µόνο πρότεινε, αλλά
απαιτούσε µια διαφορετική συνθετική πρακτική. Αυτή η τεχνολογία ήταν ιδανική για την επέκταση της
σειραϊκής τεχνικής στο χώρο του ηχοχρώµατος: όπως ακριβώς οι 12 χρωµατικοί φθόγγοι µπορούσαν να
οργανωθούν σε σειρές, τώρα, µε ηλεκτρονικά µέσα, θα µπορούσαν να δηµιουργηθούν νέα ηχοχρώµατα και
να ελεγχθούν µε την προσθαφαίρεση ηµιτονοειδών κυµατοµορφών οι οποίες αποτελούν το βασικότερο
φυσικό συστατικό του ήχου.
Η τεχνολογία και η αισθητική της Elektronische Musik χαρακτηρίστηκε από έντονες αντιθέσεις σε
σύγκριση µε αυτές της Musique Concrète. Η µουσική στο στούντιο της Κολωνίας δηµιουργήθηκε από την εκ
βάθρων σύλληψη του ήχου. Αυτό αρχικά επετεύχθη µε τη χρήση γεννητριών ηµιτονοειδών κυµατοµορφών.
Οι συνθέτες της Κολωνίας, όπως ο Karlheinz Stockhausen και ο Herbert Eimert, υποστήριξαν την άποψη ότι
ο καθολικός ηλεκτρονικός σειραϊσµός θα οδηγούσε σε µια νέα µουσική που δε θα µπορούσε µε κανένα τρόπο
να συσχετιστεί µε τη µουσική και τα ηχοχρώµατα του παρελθόντος. Ο Eimert, ειδικά, δεν έβλεπε καµία
λογική στη δηµιουργία ηχοχρωµάτων που θα µιµούνταν φυσικούς ήχους, ή ήχους οργάνων. Αντίθετα,
επιχείρησε την αποτελεσµατικότητα µιας µουσικής σύνταξης βασισµένης σε απολύτως νέα ηχοχρώµατα. Σε
αυτό το νέο ηλεκτρονικό µέσο οι ηχοχρωµατικές και χωρικές διαστάσεις της σύνθεσης θα ελέγχονταν από
σειραϊκές διαδικασίες σε ασυνήθιστα µεγάλο βαθµό. Τα πρώιµα ηλεκτρονικά έργα του Stockhausen, «Studie
1» και «Studie 2», χρησιµοποιούν σειραϊκές διαδικασίες για να ελέγξουν το ηχόχρωµα και τις ηχοχρωµατικές
µετεξελίξεις. Στο έργο «Studie 2», ο Stockhausen υιοθέτησε σειραϊκές τεχνικές για να ελέγξει τη διευθέτηση
του ηχοχρώµατος στο χώρο. Η αντήχηση χρησιµοποιήθηκε σαν εγγενές δοµικό στοιχείο του ηχοχρώµατος
ώστε να τεθεί υπό σειραϊκό έλεγχο παρόµοιο µε αυτόν που εφαρµόζονταν σε οποιαδήποτε άλλη ηχητική
παράµετρο. Εντούτοις, η προσπάθεια για τη δηµιουργία εντελώς νέων ηχοχρωµάτων δεν υπήρξε απόλυτα
επιτυχηµένη. Ο ηχητικός κόσµος των πρώτων ηλεκτρονικών Σπουδών του Stockhausen συσχετίστηκε σε
µεγάλο βαθµό µε κωδωνοειδή και φτωχά σε φασµατικό περιεχόµενο ηχοχρώµατα.
Η µέθοδος της συγκεκριµένης µουσικής αντιτάχθηκε στην καθιερωµένη πρακτική του συνθέτη που
ξεκινά από το αφηρηµένο (ιδέα, νότες), το οποίο κωδικοποιείται σε παρτιτούρα και ύστερα πραγµατώνεται

4
στην εκτέλεση από τους µουσικούς. Από πολλές απόψεις, η µουσική της Κολωνίας θα µπορούσε να
ερµηνευθεί ως µια επέκταση αυτής της µουσικής παράδοσης, καθώς βασιζόταν σε µεγάλο βαθµό σε σειραϊκές
µεθόδους. Για τους υποστηρικτές της συγκεκριµένης µουσικής, των οποίων η µέθοδος έφερνε το συνθέτη σε
άµεση επαφή µε το µουσικό υλικό, η πρακτική της Κολωνίας δε θα µπορούσε να ήταν αποδεκτή. Ο Schaeffer
συνηγορούσε υπέρ µιας προσέγγισης της σύνθεσης που θα βασιζόταν στην εν δυνάµει εξέλιξη του αυτιού και
ταυτόχρονα των ορίων του, καθώς όλη η νέα αντίληψη για τη µουσική θα πήγαζε από τους πόρους του
αυτιού. Ανέπτυξε αυτήν την ιδέα εκφράζοντας µια προτίµηση για τις φυσικές ακουστικές πηγές αντί των
ηλεκτρονικά παραγόµενων ήχων. Η αιτιολόγησή του βασίστηκε στο πραγµατικό γεγονός ότι τα αυτιά µας
έχουν συνηθίσει, από τις εµπειρίες µας, να αντιδρούν στους φυσικούς ήχους.

1.1.3. ΗΠΑ.

Σε αντίθεση µε τη γηραιά ήπειρο η οποία µετρούσε τις πληγές της µετά τον Δεύτερο Παγκόσµιο Πόλεµο, η
Αµερική αναδύθηκε από τις στάχτες της Ευρώπης ως µια νέα δύναµη µε ανανεωµένη αισιοδοξία. Στη
βιογραφία του αφηρηµένου εξπρεσιονιστή ζωγράφου Willem de Kooning, οι συγγραφείς Mark Stevens και
Annalyn Swan περιέγραψαν αυτήν την εξαίσια ιστορική συνειδητοποίηση των Αµερικανών καλλιτεχνών:

Συναισθηµατικά αδιάφοροι µε την παλιά Ευρώπη, πίστεψαν ότι ο


χρόνος της γηραιάς ηπείρου είχε τελειώσει και ότι η εξέλιξη
της σηµαντικής τέχνης θα πραγµατοποιείτο σε µια περισσότερο
µοντέρνα κοινωνία όπως αυτή των Ηνωµένων Πολιτειών.
Εκφράζονταν ωσάν η ίδια η Ιστορία να τους παραστεκόταν
υποσχόµενη την εύνοιά της10. Μ.τ.Σ.

Οι εξελίξεις της περιόδου µετά το 1950 στις ΗΠΑ και οι όποιες συµπορεύσεις και διαφοροποιήσεις µε τους
συνθέτες στην Ευρώπη, θα πρέπει να εξεταστούν µέσα από αυτό το πρίσµα της κοινωνικής αισιοδοξίας και
της ιστορικής ανάγκης του νέου κόσµου να αυτοπροσδιοριστεί ως µια νέα και κυρίαρχη δύναµη στον
παγκόσµιο χάρτη. Οι Stevens και Swan εξήγησαν την στάση των καλλιτεχνών ως εξής:

Καθώς πλησίαζε το 1950, ένα συναίσθηµα πεπρωµένου άρχισε να


παρασύρει τον καλλιτεχνικό κόσµο. Αυτός ήταν ο Αιώνας της
Αµερικής...και οι Αµερικάνοι είχαν να παίξουν έναν ηρωικό
ρόλο11. Μ.τ.Σ.

Το γεγονός ότι οι ΗΠΑ δεν είχαν τις προκαταλήψεις που ενδυνάµωσε ο Παγκόσµιος Πόλεµος και η µαζική
µετανάστευση πολλών Ευρωπαίων µοντερνιστών που προηγήθηκε, δηµιούργησε το ελεύθερο πεδίο µέσα στο
οποίο καλλιεργήθηκαν πολυεπίπεδες αισθητικές τάσεις και ερευνητικά ενδιαφέροντα χωρίς τις ιδεοληψίες και
τις απολυτότητες που συναντούµε στην Ευρώπη την ίδια εποχή.
Ας παραθέσουµε σύντοµα κάποιες από αυτές τις τάσεις. Η µουσική για µαγνητοταινία (tape music)
εισήχθη στις Ηνωµένες Πολιτείες από την Ευρώπη και, αρχικά τουλάχιστον, δεν επηρέασε σε καθοριστικό
βαθµό τους Αµερικάνους συνθέτες. Όπως αναφέρει ο Alvin Lucier:

Η µαγνητοταινία τότε, δεν ήταν ένα µέσο για τη σύνθεση µε


ήχους, ήταν ένας µεταφορέας, ένας τρόπος να ηχογραφήσουµε και
να αναπαράξουµε τους ήχους, τον ένα µετά τον άλλον σε
χρονολογική σειρά12. Μ.τ.Σ.

5
Το San Francisco Tape Music Centre (SFTMC) ίδρυσε το 1961 ένα στούντιο ηλεκτρονικής µουσικής στο
Ωδείο της πόλης. Σηµαντικοί συνθέτες συνδέθηκαν µε αυτό, ανάµεσα στους οποίους οι Pauline Oliveiros,
Alvin Lucier, Morton Subotnick, Steve Reich και Terry Riley.
Παράλληλα, µεγάλες εταιρίες αλλά και πανεπιστηµιακά ιδρύµατα και ερευνητικά εργαστήρια ήταν
πρόθυµα να υποστηρίξουν ή τουλάχιστον να ανεχθούν, την έρευνα στους τοµείς της µουσικής τεχνολογίας
και της χρήσης υπολογιστών στη µουσική δηµιουργία. Η ραγδαία ανάπτυξη και παραγωγή υπολογιστικών
συστηµάτων από εταιρίες, προσέφερε τα τεχνολογικά µέσα για τη δηµιουργία µεθοδολογιών σύνθεσης οι
οποίες βασίζονταν και εκπορεύονταν από αυτά, όπως θα δούµε στη συνέχεια. Τόσο οι νέες τεχνικές σύνθεσης
ήχου, όπως η Frequency Modulation την οποία ανέπτυξε ο John Chowning και η οποία επηρέασε σε µεγάλο
βαθµό την εξέλιξη των συνθετητών, όσο και οι πρώτες γλώσσες προγραµµατισµού και τα ολοκληρωµένα
ψηφιακά περιβάλλοντα που ακολούθησαν, τροφοδοτήθηκαν από αυτήν την τεχνολογική ανάπτυξη.
Προς τα τέλη της δεκαετίας του 1950, ο Max Mathews κατασκεύασε έναν µετατροπέα αναλογικού
σήµατος σε ψηφιακό και έναν για τη µετατροπή του ψηφιακού σήµατος σε αναλογικό. Αυτό επέτρεψε την
είσοδο του ήχου στον υπολογιστή και, συνεπώς, τη δυνατότητα επεξεργασίας του µέσω ειδικών
προγραµµάτων. Η πρώτη απόπειρα στις ΗΠΑ έγινε το 1957 µε το πρόγραµµα MUSIC I του Mathews. Ο
ίδιος, σε άρθρο του στο περιοδικό Science το 1963, έγραψε:

Δεν υπάρχουν θεωρητικά όρια στην επίδοση των υπολογιστών ως


πηγή µουσικών ήχων, σε αντίθεση µε την επίδοση των
παραδοσιακών οργάνων13. Μ.τ.Σ.

Έναν χρόνο αργότερα, το 1964, ο Jean-Claude Risset ξεκίνησε την ερευνητική του εργασία στα Εργαστήρια
Bell ως προσκεκληµένος συνθέτης. Στο άρθρο του «Computer Study of Trumpet Tones» (1965) για τις
φασµατικές ποιότητες των τόνων της τροµπέτας, συνέδεσε τη µελέτη των ηχοχρωµάτων των παραδοσιακών
οργάνων µε τις πρωτοποριακές δυνατότητες που προσέφεραν οι υπολογιστές. Το 1985, αναφερόµενος στα
τότε κίνητρα της έρευνάς του, έγραψε σε ένα άρθρο του στο Computer Music Journal:

...η παλέτα των ήχων του υπολογιστή, δυνητικά απεριόριστη,


ήταν στην πραγµατικότητα περιορισµένη και δεν γνωρίζαµε µε
ποιον τρόπο να παράξουµε συγκεκριµένους ήχους14. Μ.τ.Σ.

1.2. Ιστορία των Γλωσσών Μουσικού Προγραµµατισµού. Από τη MUSIC στα Σηµερινά
Περιβάλλοντα Μουσικού Προγραµµατισµού.
Η ικανότητα να χρησιµοποιούµε µοτίβα και αφηρηµένες δοµές, για παράδειγµα σε µία παρτιτούρα, µε σκοπό
να επικοινωνήσουµε συναισθήµατα µέσω µουσικής ή οργανωµένων ήχων, προϋποθέτει την ύπαρξη
περίπλοκων µηχανισµών µνήµης, τη συνειδητή τους χρήση αλλά και την ασυνείδητη ή υποσυνείδητη
λειτουργία των µηχανισµών του εγκεφάλου, τη λειτουργία δηλαδή της αντίληψης. Ένα παράδειγµα χρήσης
λογικών µηχανισµών στη µουσική εφάρµοσε ο Guido d’Arezzo (991-992), θεωρητικός της µουσικής στο
Μεσαίωνα, ο οποίος εισήγαγε πίνακες, µέσω των οποίων αντιστοιχούσε συλλαβές εκκλησιαστικών ύµνων σε
τονικά ύψη. Επίσης, εισήγαγε τους εκκλησιαστικούς τρόπους και το µουσικό πεντάγραµµο για τη
σηµειογραφία της µουσικής.
Από την άµεση σχέση µεταξύ τονικού ύψους και µήκους χορδής ή σωλήνα, στα τελευταία
υπολογιστικά µοντέλα της ανθρώπινης αντίληψης, οι µουσικοί πάντα αντλούσαν λύσεις και µεθοδολογίες από
τις επιστήµες. Τα πρώτα προγράµµατα για σύνθεση εµφανίστηκαν στις αρχές της δεκαετίας του 1950. Πριν
από αυτά, από τα µέσα περίπου του 19ου αιώνα, κατασκευαστές µουσικών οργάνων ενδιαφέρθηκαν να
κατασκευάσουν αυτόµατα όργανα µε αυλούς (pipe organs) που θα οδηγούνταν από διάτρητες κάρτες (Εικόνα
1.1) οι οποίες χρησιµοποιούνταν στην βιοµηχανία κλωστοϋφαντουργίας ήδη από τις αρχές του 19ου αιώνα
(Εικόνα 1.2).

6
Εικόνα 1.1 Διάτρητη κάρτα σε όργανο χορού των αδελφών Decap, Αµβέρσα (πηγή:
https://commons.wikimedia.org/wiki/File:Lochkarte_Tanzorgel.jpg?uselang=el).

Εικόνα 1.2 Κατασκευή τρυπών σε διάτρητη κάρτα. Τµήµα Υφαντικής Τέχνης Strzeminski Academy of Fine Arts, Podz,
Πολωνία (πηγή:
https://commons.wikimedia.org/wiki/File:PunchingJacquardCardPoland.jpg#/media/File:PunchingJacquardCardPolan
d.jpg).

Αυτά τα αυτόµατα όργανα αναζωπύρωσαν για ακόµη µία φορά τη συζήτηση, η οποία συνεχίζεται ακόµα,
σχετικά µε τη σχέση ανθρώπου, οργάνων και µουσικής. Δηµιουργούσαν µουσική µέσω πληροφοριών οι
οποίες θα µπορούσαν επίσης να χρησιµοποιηθούν για την πλέξη υφασµάτων. Επόµενη φυσική συνέχεια
υπήρξε η δηµιουργία των µηχανικών πιάνων. Πολλές εταιρίες άρχισαν από τις αρχές της δεκαετίας του 1900
να κατασκευάζουν πιάνα αναπαραγωγής (reproducing pianos) (Εικόνα 1.3). Αυτά τα όργανα µπορούσαν να
αναπαράξουν µέχρι και 16 εντάσεις (loudness) και µερικά να αλλάξουν την ένταση παιξίµατος. Ορισµένα
πιάνα έδιναν τη δυνατότητα στον πιανίστα να ηχογραφήσει µε αρκετή πιστότητα. Ο µηχανισµός
ηχογράφησης επέτρεπε µέχρι και 4000 τρύπες στον κύλινδρο ανά λεπτό, αριθµός που προσέγγιζε έναν

7
βιρτουόζο πιανίστα. Στον κύλινδρο, αποθηκευόταν µια σειρά από παραµέτρους οι οποίες περιέγραφαν τον
ήχο αλλά δεν ήταν οι ίδιες ο ήχος. Οι παράµετροι µπορούσαν να αλλάξουν, να µεταβληθούν και επιπλέον
τρύπες να προστεθούν στον κύλινδρο.

Εικόνα 1.3 Πιάνο αναπαραγωγής Welte-Mignon, 1927 (πηγή:


https://commons.wikimedia.org/wiki/File:Weltereproduktionsklavier.jpg#/media/File:Weltereproduktionsklavier.jpg).

Αυτό το είδος τεχνολογίας εξελίχθηκε πολύ στη διάρκεια του 20ού αιώνα αλλά οι βασικές αρχές παραµένουν
οι ίδιες. Το µέσο άλλαξε από ρολά χαρτιού και κυλίνδρους σε σκληρούς δίσκους, οπτικές ίνες και
διαδικτυακές πλατφόρµες αποθήκευσης. Η σηµαντικότερη ίσως εξέλιξη των µέσων υπήρξε ο υπολογιστής, η
ισχυρότερη µέχρι τώρα µηχανή επεξεργασίας που µπορεί όχι µόνο να διαχειριστεί αποθηκευµένες
πληροφορίες αλλά και να τις δηµιουργήσει.

1.2.1. Οι Πρώτοι Υπολογιστές.

Το να ορίσει κανείς ποιος ήταν ο πρώτος υπολογιστής που κατασκευάστηκε προϋποθέτει τον ακριβή ορισµό
των λειτουργιών που πρέπει να έχει ένας υπολογιστής. Αυτό το εγχείρηµα, όπως και µια ολοκληρωµένη
ιστορία των υπολογιστών και της υπολογιστικής τεχνολογίας ξεπερνάει τους στόχους αυτού του βιβλίου.
Άλλωστε, όπως συµβαίνει συχνά, πριν από την πραγµάτωση ενός ονείρου, προηγείται το όνειρο. Έτσι, ήδη το
1843, σχεδόν ένα αιώνα πριν από την κατασκευή του πρώτου υπολογιστή, η Augusta Ada Lovelace (1815-
1852), κόρη του Λόρδου Βύρωνα και ενήµερη της πρωτοποριακής εργασίας του Charles Babbage στις
υπολογιστικές µηχανές, µίλησε15 για τις δυνατότητες που αυτές οι µηχανές θα προσέφεραν ακόµη και στη
σύνθεση περίπλοκων µουσικών έργων16.
Σκοπός µας σε αυτό το κεφάλαιο, είναι να παραθέσουµε µια συνοπτική ιστορία των γλωσσών
µουσικού προγραµµατισµού και το αρχικό πλαίσιο, τη διαθέσιµη τεχνολογία των υπολογιστών µέσω της
οποίας δηµιουργήθηκαν οι πρώτες γλώσσες στα χρόνια µετά το τέλος του Δεύτερου Παγκοσµίου Πολέµου.
Στην προ-ηλεκτρονικών κυκλωµάτων εποχή, ο σχεδιασµός, η κατασκευή και η χρήση των τεράστιων σε
διαστάσεις υπολογιστών, ήταν υπόθεση κυρίως των ισχυρών στρατιωτικών δυνάµεων και των µεγάλων
ερευνητικών κέντρων και Πανεπιστηµίων. Οι υπολογιστές δε διέθεταν οθόνες αλλά εκτύπωναν τα
αποτελέσµατα των υπολογισµών τους. Η διαθέσιµη µνήµη τους, που έφτανε τα 192 Kilobytes το 1957, ήταν
κατά πολύ µικρότερη σε σύγκριση µε τις σηµερινές δυνατότητες. Ο προγραµµατισµός τους γινόταν µε
διάτρητες κάρτες ή κάρτες από χαρτί, στις οποίες ήταν αποθηκευµένες οι απαραίτητες πληροφορίες για τον
υπολογιστή (Εικόνα 1.4). Όπως αναφέρει ο Ceruzzi (2006):

8
Οι µηχανές διάτρητων καρτών ονοµάζονταν συχνά εξοπλισµός
ενότητας στοιχείων, επειδή κάθε σχετική πληροφορία για µια
συγκεκριµένη οντότητα (λόγου χάρη, µια εµπορική συναλλαγή)
κωδικοποιείται σε µία και µόνο κάρτα, η οποία µπορεί να
χρησιµοποιηθεί για διάφορους σκοπούς. Αυτό επιτυγχανόταν µε
το πέρασµα των καρτών από διάφορα µέρη του εξοπλισµού µε
σκοπό, για παράδειγµα, την καταµέτρηση, την ταξινόµηση, την
πινακοποίηση ή την εκτύπωση σε συγκεκριµένο σύνολο στηλών17.

Εικόνα 1.4 Κάρτα (χωρίς τρύπες) υπολογιστή σε FORTRAN. University of Missouri-Rolla. Τέλη δεκαετίας 1970 ( πηγή:
https://commons.wikimedia.org/wiki/File:Hollerith_card.jpg?uselang=el).

Ο Konrad Zuse (1910-1995), µε σπουδές µηχανικής στο Βερολίνο, υπήρξε ένας από τους πρωτοπόρους
ερευνητές στην τεχνολογία των υπολογιστών. Προσπαθώντας να αναπτύξει υπολογιστικές µεθόδους,
κατασκεύασε το 1938 τον Ζ1, έναν µηχανικό υπολογιστή. Το 1941, δηµιούργησε µαζί µε φίλους του στο
πατρικό του σπίτι την Z3, την πρώτη ηλεκτροµηχανική υπολογιστική µηχανή που µπορούσε να
προγραµµατιστεί, ενώ το 1942 ξεκίνησε την κατασκευή της διαδόχου Ζ4. Τo 1945-46, στα ερείπια της
ναζιστικής Γερµανίας, ολοκλήρωσε µια από τις πρώτες αλγοριθµικές γλώσσες προγραµµατισµού για τον
υπολογιστή Ζ4, η οποία ονοµάστηκε «Plankalkül» (Plan Calculus).
Ο πρώτος µη προγραµµατιζόµενος ηλεκτρονικός υπολογιστής Atanasoff-Berry (AB Computer)
(Εικόνα 1.5) ολοκληρώθηκε το 1942 από τον καθηγητή φυσικής John Vincent Atanasoff και τον βοηθό του
Clifford E. Berry. Σκοπός του ήταν η επίλυση σύνθετων µαθηµατικών προβληµάτων. Παρότι η εξέλιξή του
εγκαταλείφθηκε σύντοµα, η τεχνολογία η οποία αναπτύχθηκε για τον ABC οδήγησε λίγα χρόνια αργότερα
στην κατασκευή του ENIAC, του γνωστότερου και σηµαντικότερου ίσως υπολογιστή της εποχής.

9
Εικόνα 1.5 Atanasoff-Berry Computer, Durhum Center, Iowa State University, ΗΠΑ (ρέπλικα) (πηγή:
https://commons.wikimedia.org/wiki/File:Atanasoff-Berry_Computer_at_Durhum_Center.jpg?uselang=el).

Ο πρώτος προγραµµατιζόµενος ηλεκτρονικός υπολογιστής (ειδικού σκοπού όπως και ο ABC)


πρωτοπαρουσιάστηκε στα τέλη του 1943 από τον µηχανικό Tommy Flowers και ονοµάστηκε Colossus
(Εικόνα 1.6). Χρησιµοποιήθηκε για την αποκρυπτογράφηση κωδικοποιηµένων µηνυµάτων τα οποία
προέρχονταν από το αρχηγείο του γερµανικού στρατού κατά τη διάρκεια του Δεύτερου Παγκοσµίου
Πολέµου. Με το τέλος του πολέµου διεκόπη η παραγωγή αυτών των υπολογιστών.

Εικόνα 1.6 Ο υπολογιστής Colossus (πηγή: https://commons.wikimedia.org/wiki/File:Colossus.jpg#/media/File:


Colossus.jpg).

Ο πρώτος προγραµµατιζόµενος ηλεκτρονικός ψηφιακός υπολογιστής γενικού σκοπού υπήρξε ο ENIAC


(Electronic Numerical Integrator And Computer), ο οποίος κατασκευάστηκε στη Σχολή Moore
Ηλεκτρολόγων Μηχανικών του Πανεπιστηµίου της Πενσιλβάνιας από τους John Mauchly και J. Presper
Eckert, εγκαινιάζοντας την εποχή των ψηφιακών υπολογιστών στις ΗΠΑ (Εικόνα 1.7). Η επιλογή της λέξης
computer που εµφανίζεται µε το γράµµα C της ονοµασίας του, προσδιόρισε τον σκοπό της λειτουργίας του.
Πρωτολειτούργησε τον Δεκέµβριο του 1945 για τον στρατό των ΗΠΑ, µε σκοπό τον υπολογισµό, ανάµεσα
σε άλλα, της τροχιάς βληµάτων και οβίδων. Ήταν ικανός όχι µόνο να επιλύσει ένα ευρύ φάσµα µαθηµατικών
προβληµάτων – µπορούσε να ολοκληρώσει µέχρι 5000 πράξεις το δευτερόλεπτο – αλλά και να προωθήσει
την έρευνα στον πρωτόλειο τοµέα της τεχνητής νοηµοσύνης. O ENIAC, εγκατεστηµένος σε έναν όροφο, είχε

10
30 µέτρα µήκος, 3 µέτρα ύψος και διέθετε 70.000 αντιστάσεις, 10.000 πυκνωτές και 6.000 διακόπτες18. Ένας
χρήστης της εποχής θα χρησιµοποιούσε τους διακόπτες και θα συνέδεε µε καλώδια και βύσµατα τα διάφορα
τµήµατά του για να τον προγραµµατίσει. Παρότι λειτουργούσε ταχύτερα από όλες τις προϋπάρχουσες
µηχανές, ο ENIAC απαιτούσε τη σύνδεση και αποσύνδεση πλήθους καλωδίων και διακοπτών, µε συνέπεια τη
χρονοβόρα αναδιάταξή του κάθε φορά που έπρεπε να επιλύσει κάποιο νέο πρόβληµα. Από αυτήν την
πολύπλοκη και εξειδικευµένη διαδικασία γεννήθηκαν οι όροι programming (προγραµµατισµός), set up
(διατάσσω) και reset (αναδιατάσσω).

Εικόνα 1.7 Προγραµµατιστές χειρίζονται τον ENIAC στη Φιλαδέλφεια των ΗΠΑ (πηγή:
https://commons.wikimedia.org/wiki/File:Eniac.jpg#/media/File:Eniac.jpg).

Οι Mauchly και Eckert συνέβαλαν καθοριστικά στην εξέλιξη των υπολογιστικών µηχανών µε µια ακόµη
κατασκευή τους, τον υπολογιστή UNIVAC (UNIVersal Automatic Computer) ο οποίος παρουσιάστηκε το
1951. Προορισµένος επίσης να επιλύει σύνθετα προβλήµατα, µπορούσε να το κάνει χωρίς την καθολική
ανθρώπινη παρέµβαση, όπως άλλωστε προσδιορίζει η λέξη «automatic» στο όνοµά του. Πολλά από τα
χαρακτηριστικά τα οποία θεωρούνται σήµερα ως δεδοµένα, πρωτοεµφανίστηκαν στον UNIVAC. Μεταξύ
αυτών, τα αποθηκευµένα προγράµµατα (stored programs), τα ενδιάµεσα κυκλώµατα (buffers), η χρήση
επιπλέον bits για έλεγχο και η αριθµητική επεξεργασία.
Ο προγραµµατισµός έδωσε τη δυνατότητα – ή τουλάχιστον την ελπίδα της δυνατότητας – στους
συνθέτες να διασπάσουν τα µεγάλα, θεωρητικά και συχνά αδιευκρίνιστα προβλήµατα της µουσικής φόρµας,
της δόµησης του υλικού σε διαφορετικά επίπεδα και της ανάγκης για µια εξαιρετικά λεπτοµερή και ακριβή
στη διατύπωσή της σηµειογραφία, σε απλές και λογικές εντολές, ορίσµατα και παραµέτρους. Η τεχνολογία
των υπολογιστών απαίτησε την ποσοτικοποίηση της συνθετικής σκέψης και την παραµετροποίηση των
ποιοτήτων και των πολλαπλών επιλογών που είχε στη διάθεσή του ο συνθέτης. Άλλωστε, ένας υπολογιστής
ακόµα και σήµερα, δεν καταλαβαίνει µια υπαινικτική και σύνθετη εντολή, όπως για παράδειγµα «παίξε ένα
χαµηλό λα µε τον τρόπο ενός µελαγχολικού κιθαρίστα». Αντίθετα, µπορεί να κατανοήσει την ακρίβεια των
αριθµών και τη σαφή διατύπωση προκαθορισµένων εντολών, όπως «χρησιµοποίησε την τάδε γεννήτρια ήχου
και παίξε 440 Hz». H πρώτη περίοδος παραγωγής ηλεκτρονικών υπολογιστών µετά τον Δεύτερο Παγκόσµιο
Πόλεµο συνέπεσε χρονικά µε την επικράτηση του καθολικού σειραϊσµού στην Ευρώπη. Όταν ο σειραϊσµός
απαίτησε τον απόλυτο έλεγχο και την παραµετροποίηση όλων των µικροδοµών της παρτιτούρας, η
τεχνολογία των υπολογιστών ήταν εκεί για να τον προσφέρει.
Πολλά από τα πρώτα µουσικά έργα που δηµιουργήθηκαν µε τη βοήθεια υπολογιστή, ήταν σύντοµα
σε διάρκεια δηµοφιλή τραγούδια. Το 1956, οι µαθηµατικοί Martin Klein και Douglas Bolitho
χρησιµοποίησαν δεδοµένα και κανόνες τους οποίους εξήγαγαν αναλύοντας υπάρχοντα δηµοφιλή τραγούδια
για να προγραµµατίσουν έναν υπολογιστή Datatron. Το αποτέλεσµα ήταν η παρτιτούρα του τραγουδιού Push

11
Button Bertha19 σε στίχους του Jack Owens. Ο υπολογιστής παρήγαγε µόνο την παρτιτούρα. Το τραγούδι
ηχογραφήθηκε αργότερα µε παραδοσιακά όργανα.
Η σύνθεση ήχου, η αναπαραγωγή και η µετάδοσή του µέσω του υπολογιστή, κατέστη δυνατή µε την
παρεµβολή ενός µετατροπέα ψηφιακού σήµατος σε αναλογικό (digital to analog convertor, DAC), ενός
µετατροπέα δηλαδή ο οποίος µετατρέπει το ψηφιακό σήµα του υπολογιστή σε αναλογικό ηλεκτρικό σήµα που
αναπαράγεται από τα ηχεία (Σχήµα 5.1). Παρόλα αυτά, η παραγωγή µουσικής από υπολογιστή
πραγµατοποιήθηκε πριν από την έλευση του µετατροπέα. Ο δηµοσιογράφος του BBC Jonathan Fildes
αναφέρει20 ότι η πρώτη ηχογράφηση µουσικής παραγόµενης από υπολογιστή χρονολογείται το 1951. Το
φθινόπωρο εκείνης της χρονιάς, το BBC ηχογράφησε στο Πανεπιστήµιο του Μάντσεστερ τον υπολογιστή
Ferranti Mark 1 να εκτελεί το «God Save the King» και άλλα δηµοφιλή τραγούδια. Λίγα χρόνια αργότερα, το
1955, ο ίδιος υπολογιστής χρησιµοποιήθηκε για µια προσοµοίωση του παιχνιδιού των ζαριών του Μότσαρτ
από τους David Caplin και Dietrich Prinz στα Εργαστήρια Shell στο Άµστερνταµ.
Η Αυστραλία είναι ίσως η πρώτη χώρα στην οποία πραγµατοποιήθηκε, αν και χωρίς ηχογράφηση, η
πρώτη παραγωγή µουσικής από υπολογιστή. Όπως αναφέρει η ιστοσελίδα του Τµήµατος Πληροφοριακών και
Υπολογιστικών Συστηµάτων του Πανεπιστήµιου της Μελβούρνης21, ο CSIRAC22 (Εικόνα 1.8), ο πρώτος
υπολογιστής της Αυστραλίας, παρήγαγε και αναµετάδωσε µια µελωδία τον Αύγουστο του 1951 κατά τη
διάρκεια ενός συνεδρίου στο Σύδνεϋ για τις Αυτόµατες Υπολογιστικές Μηχανές23. Ο προγραµµατιστής και
µουσικός Geoff Hill προγραµµάτισε τον CSIRAC µε τέτοιον τρόπο ώστε ο υπολογιστής να διοχετεύει το
σήµα του απευθείας σε έναν ενισχυτή συνδεδεµένο µε ένα ηχείο. Ο CSIRAC χρησιµοποιήθηκε κυρίως για να
παίζει µε πρωτόλειο, είναι η αλήθεια, τρόπο απλές µελωδίες δηµοφιλών τραγουδιών της εποχής. Η εφηµερίδα
Melbourne Herald, στην πρώτη ίσως απόπειρα µουσικοκριτικής για έναν υπολογιστή, έγραψε στο φύλλο της
15ης Ιουνίου 1956:

Όταν (ο CSIRAC) άρχισε να παίζει το Gaudeamus Igitur, τον


ύµνο του Πανεπιστηµίου, ακούστηκε σα να έκανε αρµονική
απόψυξη ένα ψυγείο24. Μ.τ.Σ.

Εικόνα 1.8 Ο υπολογιστής CSIRAC (πηγή: https://commons.wikimedia.org/wiki/File:CSIRAC-Pano,-Melb.-Museum,-


12.8.2008.jpg#/media/File:CSIRAC-Pano,-Melb.-Museum,-12.8.2008.jpg).

Ο βασικός λόγος για τον οποίο ο CSIRAC δε διαδραµάτισε σηµαντικό ρόλο στην ιστορία της µουσικής µε
υπολογιστές, είναι ότι η οµάδα ανάπτυξής του δεν προσέλκυσε συνθέτες, σε αντίθεση µε την πρακτική που
αναπτύχθηκε στα εργαστήρια της τηλεφωνίας Bell των ΗΠΑ. Αυτό µπορεί να εξηγηθεί αν λάβουµε υπόψη
µια προσέγγιση της ιστορίας της τεχνολογίας η οποία ονοµάζεται κοινωνική κατασκευασιοκρατία (social
constructionism). Σύµφωνα µε αυτήν, ο σχεδιασµός, η ενσωµάτωση στα κοινωνικά δίκτυα και η αποδοχή των

12
υπολογιστικών συστηµάτων δεν εξαρτάται µόνο από την τεχνική βελτίωση του σχεδιασµού από τους
µηχανικούς αλλά και από µια σειρά κοινωνικών, πολιτικών και οικονοµικών διαπραγµατεύσεων µεταξύ
διαφορετικών επαγγελµατικών και κοινωνικών οµάδων.
Το 1957, ο Αµερικάνος µηχανικός και µουσικός Max Mathews (1926-2011) (Εικόνα 1.9) είχε τη
δυνατότητα να χρησιµοποιήσει έναν από τους πρώτους µετατροπείς ψηφιακού σήµατος σε αναλογικό, στο
τµήµα Ακουστικής Έρευνας των εργαστηρίων Bell στο New Jersey. Ο Mathews προέβλεψε την καθολική
χρήση των υπολογιστών στη δηµιουργία µουσικής. Στο άρθρο του 1963 στο περιοδικό Science, υποστήριξε
µεταξύ άλλων:

Η µουσική µε υπολογιστή φαίνεται να είναι ιδιαίτερα


υποσχόµενη σε τεχνικό επίπεδο...Τώρα, ο στόχος µας είναι να
προσελκύσουµε και να εκπαιδεύσουµε (σοβαρούς) συνθέτες στη
χρήση του25. Μ.τ.Σ.

Με τη βοήθεια του ερευνητή John Pierce, ο Mathews ξεκίνησε να γράφει προγράµµατα για σύνθεση
µουσικής υποβοηθούµενης από υπολογιστή. Ένα από τα κοµµάτια που προέκυψαν το Μάιο του 1957 από
αυτήν τη διαδικασία, ήταν το «In the Silver Scale»26 του γλωσσολόγου και επιστήµονα της ψυχοακουστικής
Newman Gutmann. Μια ανέκδοτη αφήγηση σχετική µε τη γέννηση του σύντοµου αυτού έργου διάρκειας
µόλις 20 δευτερολέπτων, αναφέρει τα εξής: το 1956, οι Max Mathews και John Pierce παρακολούθησαν µια
συναυλία στο Πανεπιστήµιο Drew του New Jersey. Ανάµεσα στα έργα που ακούστηκαν στη συναυλία ήταν
και ένα βαλς του αυστριακού πιανίστα και συνθέτη Artur Schnabel. Η απογοήτευση των δύο από το έργο και
την εκτέλεσή του ήταν έκδηλη οδηγώντας τους στη πεποίθηση ότι ο υπολογιστής µπορεί να τα καταφέρει
καλύτερα.

Εικόνα 1.9 Ο Max Mathews µε το Radio Baton (πηγή:


https://commons.wikimedia.org/wiki/File:Mathews260.jpg#/media/File:Mathews260.jpg).

Ο Mathews έγραψε έναν µεταγλωττιστή (compiler) ο οποίος µπορούσε να µεταφράσει απλές οδηγίες σε
κώδικα. Ο υπολογιστής στη συνέχεια, µετέτρεπε τον κώδικα σε σειρές δυαδικών ψηφίων οι οποίες ήλεγχαν
την ένταση των γεννητριών ήχου. Το «In the Silver Scale» ακούστηκε στα εργαστήρια της Bell στις 17 Μαΐου
1957 εγκαινιάζοντας την εποχή της σύνθεσης µουσικής υποβοηθούµενης από υπολογιστή. Την ίδια περίπου
εποχή πρωτοξεκίνησε η χρήση του όρου software (λογισµικό).

13
Το πρώτο έργο όµως που δηµιουργήθηκε εξ ολοκλήρου από υπολογιστή µε τεχνικές σύνθεσης ήχου,
ήταν το «Pitch Variations»27 του Newman Gutmann το 1957. Το έργο προέκυψε µέσα από την έρευνα του
Gutmann για την αντίληψη του τονικού ύψους και της οµιλίας.
Το πρώτο πρόγραµµα για τη δηµιουργία ήχου από υπολογιστή που δηµιουργήθηκε από τον Max
Mathews το 1957 ονοµάστηκε MUSIC I και ήταν ικανό να παράξει µονοφωνικές µη διατονικές κλίµακες. Το
πρόγραµµα, σε υπολογιστή IBM 70428 (International Business Machines), µπορούσε να ελέγξει το τονικό
ύψος, τη διάρκεια και την ένταση µιας τριγωνικής κυµατοµορφής χωρίς όµως δυναµικό έλεγχο της
περιβάλλουσας. Το MUSIC I εξελίχθηκε από τον Mathews και άλλους σε µια οικογένεια γλωσσών µουσικού
προγραµµατισµού µε το γενικό όνοµα MUSIC Ν.
Η πρώτη της οικογένειας υπήρξε η MUSIC II το 1958 µε δεκαέξι κυµατοµορφές και δυνατότητα
τεσσάρων φωνών. Το 1960, ο Mathews δηµιούργησε τη MUSIC III για τον IBM 7094, έναν από τους
πρώτους υπολογιστές µε τρανζίστορ. Η MUSIC III εισήγαγε έννοιες και λειτουργίες τις οποίες θα
συναντήσουµε σε µεταγενέστερες γλώσσες όπως η CSound: τη δυνατότητα δηµιουργίας ορχήστρας
(orchestra) και οργάνων (instruments) όπως και την έννοια της παρτιτούρας (score) µε την οποία ο χρήστης
µπορούσε να καθορίσει τόσο τη σειρά όσο και τις ποσοτικές παραµέτρους των νοτών. Το αρχείο ορχήστρας
περιείχε τις εντολές οι οποίες καθόριζαν τη σύνθεση των οργάνων ενώ το αρχείο παρτιτούρας περιείχε ένα
σύνολο οδηγιών για το πώς θα παίξουν τα όργανα του αρχείου ορχήστρας. Καινοτόµα υπήρξε και η εισαγωγή
των Unit Generators (UG ή UGens), υπορουτίνων οι οποίες µπορούσαν, για παράδειγµα, να παράξουν
κυµατοµορφές µε τη χρήση λίγων µόνων τιµών από τον προγραµµατιστή. Έτσι, ξεκίνησε η εφαρµογή της
σπονδυλωτής (modular) διάρθρωσης: τα UGens αποτέλεσαν τα βασικά δοµικά στοιχεία για την ηχητική
σύνθεση και επεξεργασία, τα οποία µπορούσαν να συνδεθούν µεταξύ τους όπως σε έναν σπονδυλωτό
συνθετητή (modular synthesiser). Για παράδειγµα, Unit Generators όπως ταλαντωτές, φίλτρα, περιβάλλουσες
κ.ά. συνδέονταν µεταξύ τους δηµιουργώντας όργανα (patches) για την παραγωγή ήχου.
Τόσο ο Max Mathews όσο και ο John Pierce που εκτελούσε χρέη εκτελεστικού διευθυντή
τηλεπικοινωνιών στο Bell Labs, αντιλήφθηκαν ότι η προσέλκυση συνθετών θα βοηθούσε καθοριστικά στη
συνέχεια της έρευνάς τους. Ήρθαν σε επικοινωνία και προσκάλεσαν, ανάµεσα σε άλλους, τους Edgar Varèse,
Milton Babbitt, Aaron Copland, Otto Luening και Vladimir Ussachevsky. Την ίδια εποχή, στο University of
Illinois at Urbana-Champaign, συνθέτες και επιστήµονες εργάζονταν για την παραγωγή µουσικής µε τον
υπολογιστή Illiac29. Ο John Pierce, ανυπόµονος να ενηµερωθεί για τη σχετική έρευνα, έγραψε το 1961 µια
επιστολή απευθυνόµενος στον ίδιο τον υπολογιστή:

Αγαπητέ υπολογιστή, έµαθα πως κάποιος έχει εργαστεί µαζί σου


για τη σύνθεση µουσικής…30. Μ.τ.Σ.

Οι συνθέτες, χηµικοί και καθηγητές στο University of Illinois at Urbana-Champaign οι οποίοι εργάζονταν µε
τον υπολογιστή Illiac και οι οποίοι προσκάλεσαν τον Pierce, ήταν οι Lejaren Hiller και Leonard Isaacson.
Από τη συνεργασία των Hiller και Isaacson είχε δηµιουργηθεί ήδη από το 1957 ένα από τα γνωστότερα και
σηµαντικότερα µουσικά έργα υποβοηθούµενα από υπολογιστή, το «Illiac Suite»31 για κουαρτέτο εγχόρδων. Ο
Isaacson και ο Hiller, µαθητής των Milton Babbit και Roger Sessions στη σύνθεση, χρησιµοποίησαν µοντέλα
πιθανοτήτων και προγραµµάτισαν κανόνες αντίστιξης. Τα µουσικά συµβάντα και οι διάρκειες που
αποτυπώθηκαν σε παρτιτούρα παρήχθησαν από γεννήτρια τυχαίων τιµών. Το Illiac Suite αποτελεί την πρώτη
σηµαντική και ολοκληρωµένη απόπειρα δηµιουργίας µουσικού έργου µε τεχνικές αλγοριθµικής σύνθεσης,
αλλά και χρήσης της Τεχνητής Νοηµοσύνης, καθώς ο υπολογιστής µπορούσε να αποφασίσει και να επιλέξει
ηχητικές ακολουθίες και µουσικά συµβάντα βασιζόµενος σε διεργασίες και κανόνες προκαθορισµένους από
τους προγραµµατιστές.
Το 1962, οι Max Mathews και Joan Miller ολοκλήρωσαν τη Music IV για τον υπολογιστή IBM 7094.
Μια παραλλαγή της υπήρξε η Music IV-Β η οποία δηµιουργήθηκε στο Πανεπιστήµιο Princeton από τους Jim
Randall, Hubert Howe και Godfrey Winham.

14
Μέχρι το 1965, οι γλώσσες της οικογένειας MUSIC N γράφονταν σε γλώσσα µηχανής assembly. Τα
προγράµµατα αποτυπώνονταν σε διάτρητες κάρτες, πρακτική που καθιστούσε τη µεταφορά τους από τον
υπολογιστή ενός ιδρύµατος σε αυτόν ενός άλλου µια δύσκολη και περίπλοκη υπόθεση. Αυτά τα προγράµµατα
φυσικά δεν µπορούσαν ακόµη να λειτουργήσουν σε πραγµατικό χρόνο (real time operation), ενώ για να
ακούσει ο συνθέτης το αποτέλεσµα του προγραµµατισµού έπρεπε συχνά να περιµένει αρκετές ηµέρες, είτε
εξαιτίας του υπολογιστικού χρόνου που χρειαζόταν ο υπολογιστής, είτε γιατί υπήρχε µακρά λίστα αναµονής
για τη χρήση του. Μετά από κοπιαστική και χρονοβόρα τροφοδότηση του υπολογιστή µε κείµενο, το αρχείο
από τον υπολογιστή περνούσε µέσω ενός µετατροπέα ψηφιακού σε αναλογικού στην ταινία ηχογράφησης
έτσι ώστε ο συνθέτης να ακούσει το ηχητικό αποτέλεσµα. Η συνήθης διαδικασία, όπως την περιγράφει ο Joel
Chadabe, ήταν η εξής:

Ο ήχος που φαντάστηκε ο συνθέτης παραγόταν από τον υπολογιστή


– ο οποίος στην εποχή της Music IV ήταν ο IBM 7094 – ως ένας
συνεχώς αυξανόµενος και άηχος πίνακας µε αριθµούς που
ονοµάζονταν δείγµατα (samples), τα οποία αποθηκεύονταν σε µια
µαγνητική ταινία υπολογιστή. Στη συνέχεια, µε µια ξεχωριστή
διαδικασία, αυτά τα δείγµατα µετατρέπονταν σε ήχο και
αποθηκεύονταν σε µαγνητοταινία ήχου32. Μ.τ.Σ.

Γενικότερα, η πρόσβαση σε υπολογιστές για οποιαδήποτε χρήση, υπήρξε µια χρονοβόρα και επίπονη
διαδικασία για πολλά χρόνια. Ο Ceruzzi (2006) αναφέρεται σε ένα σχετικό συµβάν:

Μετά τη δηµόσια παρουσίαση του ENIAC, πολλοί ζήτησαν να τον


χρησιµοποιήσουν. Ο Mauchly ανέφερε, για παράδειγµα, ότι τον
Μάρτιο του 1948 οι ιθύνοντες της Pratt & Whitney τον ρώτησαν
αν θα µπορούσαν να εκτελέσουν ένα επείγον πρόβληµα την
εβδοµάδα της 17ης Απριλίου. Αυτό του φάνηκε πολύ αστείο,
επειδή ο ENIAC ήταν τελείως κλεισµένος για τα επόµενα δύο
χρόνια!33.

Από τα µέσα της δεκαετίας του 1960, η εξέλιξη και εξάπλωση της τεχνολογίας των υπολογιστών οδήγησε
τους προγραµµατιστές στη δηµιουργία γλωσσών υψηλότερου επιπέδου. Αυτές οι γλώσσες περιείχαν ένα
ενδιάµεσο πρόγραµµα µε την ονοµασία compiler (µεταγλωττιστής), το οποίο µετέτρεπε τις εντολές των
γλωσσών σε γλώσσα µηχανής και, συνεπώς, µπορούσαν να εκτελεστούν από διαφορετικούς υπολογιστές.
Έτσι, το 1967, οι Hubert Howe και Godfrey Winham του Πανεπιστηµίου Princeton µετέφεραν τη γλώσσα
Music IV-Β στο περιβάλλον υψηλού επιπέδου FORTRAN (FORmula TRANslation) µετονοµάζοντάς την σε
Music IV-ΒF.
Πίσω στα εργαστήρια της Bell, ο Max Mathews ολοκλήρωσε τη Music V το 1968, την τελευταία της
οικογένειας MUSIC N που δηµιουργήθηκε εκεί. Αυτή τη φορά όµως είχε στην οµάδα κάποιους από τους
«σοβαρούς» συνθέτες που έψαχνε λίγα χρόνια πριν. Ανάµεσά τους οι Vladimir Ussachevsky, F. Richard
Moore και Jean-Claude Risset. Η Music V σε υπολογιστή IBM 7094 και σε περιβάλλον FORTRAN, µε
σπονδυλωτή δοµή και λειτουργία, έδινε τη δυνατότητα στον χρήστη να συνδυάζει κυµατοµορφές, ταλαντωτές
και άλλες γεννήτριες για τη δηµιουργία οργάνων (instruments). Ο IBM 7094 παρήγαγε τα ψηφιακά ηχητικά
αρχεία τα οποία αποθηκεύονταν σε µαγνητική ταινία. Ένας άλλος υπολογιστής, ο IBM 1620, τα µετέτρεπε σε
ήχο, διαδικασία η οποία µπορούσε να διαρκέσει µέχρι και δύο εβδοµάδες. Όπως αναφέρει ο Joel Chadabe34, ο
πηγαίος κώδικας της Music V αποστελλόταν σε άλλους υπολογιστές που µπορούσαν να τρέξουν τη γλώσσα,
µέσα σε δύο κουτιά µε περίπου 3.500 διάτρητες κάρτες και ένα σηµείωµα µε την ευχή «Καλή τύχη!».
Μεταξύ του 1968 και του 1971, ο Barry Vercoe ολοκλήρωσε τη γλώσσα Music 360 για τον
υπολογιστή IBM 360. Πολύ πιο γρήγορη από την προηγούµενη Music IV-ΒF, η Music 360 χρησιµοποιήθηκε
από πολλούς συνθέτες για αρκετά χρόνια. Με τη Music 360, ο Vercoe συνέθεσε το έργο «Synthetism» το

15
1970. Το 1973, καθηγητής πια στο MIT, o Vercoe δηµιούργησε τη γλώσσα Music 11 για τον µίνι υπολογιστή
PDP 11 των 16 bits (Εικόνα 1.10), η οποία µαζί µε την Music 360 θεωρείται απόγονος της Music IV-ΒF. Η
Music 11 προσέφερε τη δυνατότητα παραγωγής ήχου σε πραγµατικό χρόνο και εισήγαγε το διαχωρισµό
µεταξύ control rate (kr) και audio rate signal (ar) βελτιστοποιώντας την απόδοση της γλώσσας και του
υπολογιστή.

Εικόνα 1.10 Ο µίνι υπολογιστής PDP 11 της εταιρίας Digital Equipment Corporation (DEC). Στο Vienna Technical
Museum (πηγή: https://commons.wikimedia.org/wiki/File:Pdp-11-40.jpg?uselang=el).

Το 1972, άρχισε να αναπτύσσεται η γλώσσα προγραµµατισµού C η οποία αποτέλεσε ένα από τα


σηµαντικότερα προγραµµατιστικά περιβάλλοντα και µια χρήσιµη πλατφόρµα για την ανάπτυξη µουσικών
προγραµµάτων. Χρησιµοποιώντας οδηγίες ελέγχου στο περιβάλλον της C στον υπολογιστή PDP 11 και µε
έναν συνθετητή Alles, η Laurie Spiegel παρουσίασε το 1977 το «Improvisation on a Concerto Generator».
Ένα χρόνο αργότερα, το 1978, o συνθέτης Paul Lansky δηµιούργησε το αλγοριθµικό πρόγραµµα σύνθεσης
MIX στο Πανεπιστήµιο Princeton. Η ανάπτυξη αυτού του προγράµµατος οδήγησε αρχικά στο Cmix, το οποίο
παρείχε τη δυνατότητα επεξεργασίας ήχου µέσω αποθηκευµένων ρουτινών (cmix instruments) στο
περιβάλλον προγραµµατισµού της C. Στη δεκαετία του 1990, το Cmix εξελίχθηκε από τους Brad Garton και
David Topper στο RTCmix ή Real Time Cmix µε τη δυνατότητα χρήσης του σε πραγµατικό χρόνο.
Το 1969, ο Jean-Claude Risset επέστρεψε στο Παρίσι φέρνοντας µαζί του τη Music V την οποία
εγκατέστησε σε έναν υπολογιστή Hewlett-Packard. Σε µια προσπάθεια επανίδρυσης της γαλλικής
πρωτεύουσας ως πολιτιστικού κέντρου, ο Γάλλος πρόεδρος Georges Pompidou ανέθεσε στους αρχιτέκτονες
Renzo Piano, Richard Rogers και Gianfranco Franchini τη δηµιουργία ενός πολυθεµατικού πολιτιστικού
κέντρου στην πλατεία Beaubourg. Αν και το κέντρο, στο οποίο δόθηκε το όνοµα του Γάλλου προέδρου,
ολοκληρώθηκε το 1977, ο συνθέτης Pierre Boulez ξεκίνησε από τις αρχές της δεκαετίας του 1970 τη
δηµιουργία ενός µουσικού ερευνητικού ιδρύµατος το οποίο θα συστεγαζόταν µε το Κέντρο Ποµπιντού. Το
ίδρυµα ονοµάστηκε IRCAM (Institut de Recherche et Coordination Acoustique Musique) και αποτελεί µέχρι
σήµερα µια από τις σηµαντικότερες ευρωπαϊκές πηγές δηµιουργίας µουσικής µέσω της τεχνολογίας και της
πληροφορικής. Παρότι γαλλικής έµπνευσης και ιταλικής αρχιτεκτονικής, τα πρώτα προγράµµατα µουσικού
προγραµµατισµού που υιοθετήθηκαν στο νέο ίδρυµα προήλθαν από τις ΗΠΑ. Τα εργαστήρια Bell και το
Πανεπιστήµιο Stanford διοχέτευαν προγράµµατα για τους υπολογιστές PDP 10 και PDP 11 που διέθετε το
IRCAM σε όλη τη διάρκεια της δεκαετίας του 1970. Μια από τις βασικές επιδιώξεις του Ινστιτούτου ήταν η
σύνθεση και επεξεργασία ψηφιακού ήχου.
Το 1977, ο Γιάννης Ξενάκης (ή Iannis Xenakis όπως αναφέρεται συχνά) ολοκλήρωσε το UPIC (Unité
Polyagogique Informatique CEMAMu) στο Centre d’Etudes de Mathématique et Automatique Musicales στο
Παρίσι. Το σύστηµα περιελάµβανε µια ψηφιακή ταµπλέτα συνδεδεµένη σε έναν υπολογιστή Hewlett-
Packard. Ο χρήστης µπορούσε να ζωγραφίσει στην ταµπλέτα γραφήµατα µεταξύ των οποίων γραµµές,
σχήµατα, επίπεδα, κυµατοµορφές και περιβάλλουσες. Τα γραφήµατα µετατρέπονταν από τον υπολογιστή σε
ήχο.

16
Το CHANT, ένα πρόγραµµα φυσικής µοντελοποίησης παρουσιάστηκε το 1978 από τους Gerald
Bennett και Xavier Rodet στο IRCAM. Το CHANT βασίστηκε στην ανθρώπινη φωνή για την κατασκευή
µοντέλων σύνθεσης ήχου. Το 1979, ο F. Richard Moore δηµιούργησε τη γλώσσα Cmusic στα πρότυπα της
Music V, στο University of California at San Diego. Η Cmusic χρησιµοποιούσε επίσης αρχείο παρτιτούρας
(score) το οποίο όριζε τις βασικές παραµέτρους των οργάνων (instruments). Το 1981, ο Rodet ολοκλήρωσε το
FORMES, ένα περιβάλλον αντικειµενοστρεφούς προγραµµατισµού βασισµένο στο περιβάλλον της γλώσσας
LISP35.
Η δεκαετία του 1980 κυοφόρησε µεγάλες και σηµαντικές εξελίξεις στους τοµείς της υπολογιστικής
τεχνολογίας και των γλωσσών µουσικού προγραµµατισµού. Ήδη, από τις αρχές της δεκαετίας του 197036 η
εµφάνιση των µικρο-επεξεργαστών οδήγησε ταχύτατα στην ανάπτυξη γρήγορων υπολογιστών για οικιακή
χρήση. Μέχρι τα µέσα της δεκαετίας, οι προσωπικοί υπολογιστές προσήλκυσαν ένα µεγάλο µέρος συνθετών
και µουσικών εκτός πανεπιστηµιακών και ερευνητικών ιδρυµάτων. Το σχετικά χαµηλό κόστος των
υπολογιστών, η παράλληλη ανάπτυξη και εξάπλωση των συνθετητών και η εµφάνιση του πρωτοκόλλου
MIDI37 συνέτειναν στη ραγδαία ανάπτυξη της µουσικής τεχνολογίας στα χρόνια που ακολούθησαν. Η
µουσική εισέβαλε δυναµικά στην ψηφιακή εποχή της. Σε αυτό το περιβάλλον, µεταξύ του 1986 και του 1987,
οι Trevor Wishart, Tom Endrich, Richard Orton, Phil Ellis, Graham Hearn, Chris Fox και Andrew Bentley
παρουσίασαν την πρώτη έκδοση ενός συνεργατικού προγράµµατος µε την ονοµασία «Composers’ Desktop
Project» (CDP). Το CDP δηµιουργήθηκε για τον προσωπικό υπολογιστή Atari ST (Εικόνα 1.11) και
αποτέλεσε µια από τις πρώτες απόπειρες δηµιουργίας ενός ολοκληρωµένου προγράµµατος για τη σύνθεση
και την ηχητική επεξεργασία.

Εικόνα 1.11 Ο υπολογιστής Atari ST-1040ST (πηγή:


https://commons.wikimedia.org/wiki/File:Atari_1040STf.jpg#/media/File:Atari_1040STf.jpg).

Παράλληλα, την ίδια εποχή, ο Bill Schottstaedt του Πανεπιστηµίου Stanford ολοκλήρωσε τη γλώσσα
σύνθεσης ήχου Common Lisp Music (CLM), απογόνου της οικογένειας MUSIC N. Τόσο η CLM όσο και η
µεταγενέστερη γλώσσα σύνθεσης και ανάλυσης ήχου Nyquist του Roger Dannenberg, βασίστηκαν στη
γλώσσα προγραµµατισµού LISP.
Στα µέσα της δεκαετίας του 1980, ο Barry Vercoe του MIT Media Lab ολοκλήρωσε τη Csound η
οποία αποτέλεσε στην ουσία µεταφορά της γλώσσας Music 11 σε περιβάλλον C. H Csound είναι µια από τις
γνωστότερες ως σήµερα απογόνους της οικογένειας MUSIC N. Στη Csound τα όργανα ορίζονται ως αρχεία
ορχήστρας µε την κατάληξη .orc και η παρτιτούρα ως αρχείο µε κατάληξη .sco.
Κατά τη δεκαετία του 1980 η εξέλιξη των συνθετητών και των ελεγκτών (controllers) µαζί µε την
εµφάνιση του πρωτοκόλλου MIDI προσέφερε τη δυνατότητα ενός πλήρως εξοπλισµένου µουσικού στούντιο.
Ταυτόχρονα, οι προσωπικοί υπολογιστές εφοδιάστηκαν µε σηµαντική υπολογιστική δύναµη και ταχύτητα.
Αυτό επέφερε µε τη σειρά του τη δυνατότητα της ηχητικής σύνθεσης και επεξεργασίας σε πραγµατικό χρόνο
απελευθερώνοντας τους συνθέτες από τα χρονικά δεσµά της εργασίας τους σε µη πραγµατικό χρόνο (offline).
Στα µέσα της δεκαετίας, ο Miller S. Puckette συνέταξε ένα πρόγραµµα µε την ονοµασία Patcher για
υπολογιστή Mackintosh στο Ινστιτούτο IRCAM. Το πρόγραµµα εξελίχθηκε σε µια από τις πλέον
διαδεδοµένες ως σήµερα γλώσσες γραφικού προγραµµατισµού. Αρχικά ως Max, το πρόγραµµα προσέφερε
ένα ευέλικτο και φιλικό προς το χρήστη περιβάλλον ηχητικής σύνθεσης, επεξεργασίας και διάδρασης.
Απόγονος της Music V και φέρουσα το θρυλικό όνοµα του Max Mathews, η καινούργια γλώσσα καινοτόµησε

17
στον τοµέα της σπονδυλωτής (modular) διάρθρωσης. Στο περιβάλλον της, µπορεί ο χρήστης να ενώσει
σπονδυλωτά διαφορετικά υποπρογράµµατα ηχητικής σύνθεσης και επεξεργασίας. Το 1996, ο Puckette
παρουσίασε ένα παρόµοιο περιβάλλον προγραµµατισµού, ανοικτού κώδικα (open source) µε την ονοµασία
Pure Data (PD). Στην πρώιµη φάση τους τα δύο αυτά περιβάλλοντα είχαν διακριτούς στόχους. Το Pure Data
µπορούσε να επεξεργαστεί σήµατα ήχου ενώ το Max διαχειριζόταν εντολές MIDI. Τη λειτουργία της
επεξεργασίας ηχητικού σήµατος σε πραγµατικό χρόνο στο περιβάλλον Max, κλήθηκε µετά από λίγο να παίξει
ένα ένθετο πρόγραµµα (plugin) µε την ονοµασία MSP38 που δηµιούργησε ο David Zicarelli. Έτσι , η Max
µετονοµάστηκε σε Max/MSP39. Σήµερα, τα δύο προγράµµατα είναι ενοποιηµένα µε την κοινή ονοµασία Max.
Η Max και το Pure Data δροµολόγησαν την ανάπτυξη του γραφικού προγραµµατισµού, του περιβάλλοντος
δηλαδή εκείνου στο οποίο ο χρήστης, αντί να γράφει κώδικα, συνδέει µε καλώδια διάφορα αντικείµενα κάθε
ένα εκ των οποίων διενεργεί µια συγκεκριµένη λειτουργία. Το κύριο παράθυρο στο οποίο συµβαίνουν αυτές
οι συνδέσεις ονοµάζεται patcher.
Το 1996 ήταν και η χρονιά κατά την οποία ο James MacCartney παρουσίασε µια από τις ισχυρότερες
έως σήµερα γλώσσες αλγοριθµικής σύνθεσης σε περιβάλλον C++. Στο αντικειµενοστρεφές SuperCollider
κεντρικό δοµικό ρόλο εξακολουθεί να παίζει η έννοια Unit Generator (UGen), ενώ υποστηρίζεται τόσο το
πρωτόκολλο MIDI όσο και το Open Sound Control (OSC). Η αρχιτεκτονική δοµή του SuperCollider
αποτελείται από δύο τµήµατα τα οποία επικοινωνούν µέσω OSC: το server µε την ονοµασία scsynth και το
client µε την ονοµασία sclang. Το SuperCollider, µε σύνταξη παρόµοια των γλωσσών C και Lisp, διανέµεται
δωρεάν από το 2002 και είναι ένα από τα δηµοφιλέστερα περιβάλλοντα µουσικού προγραµµατισµού και live
coding.
Το OpenMusic είναι ένα περιβάλλον γραφικού προγραµµατισµού βασισµένο στη γλώσσα LISP, το
οποίο αναπτύσσεται στο IRCAM από το 1998 από τους Carlos Agon, Gérard Assayag και Jean Bresson.
Παρότι η λειτουργία του παραπέµπει στα περιβάλλοντα Max και Pure Data (τα προγράµµατα δηµιουργούνται
µε τη σύνδεση γραφικών αντικειµένων) το αποτέλεσµα µιας αλγοριθµικής διαδικασίας στο OpenMusic είναι
µια µουσική παρτιτούρα.
Ένα ακόµη περιβάλλον µουσικού προγραµµατισµού που διευκολύνει, όπως και το SuperCollider, τη
συγγραφή κώδικα σε πραγµατικό χρόνο (live coding), είναι το ChucK. Το πρόγραµµα, που µοιάζει µε τη
γλώσσα C, ανήκει στην κληρονοµιά των γλωσσών MUSIC N και χρησιµοποιεί την έννοια του UGen. Η
ανάπτυξή του ξεκίνησε το 2003 από τους Ge Wang και Perry R. Cook. Είναι πρόγραµµα ανοικτού κώδικα και
υποστηρίζει, όπως και τα Max και SuperCollider, τα πρωτόκολλα MIDI και OSC, καθώς και πολυκαναλικό
ήχο.
Τα τελευταία χρόνια έχουν αναπτυχθεί πολλά περιβάλλοντα τα οποία προσφέρουν δυνατότητες
προγραµµατισµού για τη σύνθεση και επεξεργασία ήχου. Κάποια από αυτά είναι τα εξής: το Reaktor (από τα
τέλη της δεκαετίας του 1990) της εταιρίας Native Instruments είναι δοµηµένο στη λογική ενός σπονδυλωτού
συνθετητή. Το AudioMulch, επίσης σπονδυλωτό περιβάλλον γραφικού προγραµµατισµού προσφέρει ένα
ευέλικτο εργαλείο ηχητικού σχεδιασµού. Το Kyma γράφτηκε το 1986 σε γλώσσα Smalltalk από την Carla
Scaletti και αποτελεί ένα εξειδικευµένο περιβάλλον ηχητικού σχεδιασµού, ηχητικής σύνθεσης και
επεξεργασίας που λαµβάνουν χώρα σε µια εξωτερική DSP µονάδα.
Στον Πίνακα 1.1 αναφέρονται τα βασικότερα περιβάλλοντα και οι γλώσσες µουσικού
προγραµµατισµού από τη δεκαετία του 1950.

Χρονολογία Γλώσσα προγραµµατισµού Χαρακτηριστικά Πληροφορίες για την εποχή


1957 MUSIC I Μονοφωνικό. Πρώτη εκτέλεση του
Έλεγχος τονικού Gruppen για τρεις ορχήστρες
ύψους, διάρκειας και του Karlheinz Stockhausen.
έντασης. Πρώτη εκτέλεση του
Pithoprakta για ορχήστρα του
Ιάννη Ξενάκη.
O Henri Pousseur συνέθεσε
το Scambi. Προβλήθηκε η
ταινία Forbidden Planet µε
ηλεκτρονική µουσική των
Louis και Bebe Barron.

18
1958 MUSIC II 4 φωνές. Wavetable Poème électronique του
oscillator. Edgar Varèse και Concrete
PH του Ξενάκη στο
Περίπτερο της Phillips στην
Παγκόσµια Έκθεση των
Βρυξελλών. Ο Luciano Berio
συνέθεσε τα Thema
(Omaggio a Joyce) και
Sequenza I για φλάουτο.
Προβλήθηκε η τηλεοπτική
σειρά Doctor Who µε
ηλεκτρονικούς ήχους.
1960 MUSIC III Unit Generators. Ο Karlheinz Stockhausen
Συνολικός έλεγχος ολοκλήρωσε το Kontakte, ο
του παραγώµενου Luciano Berio τα Visage και
ήχου. Momenti και ο John Cage το
Cartridge Music. Ο Vladimir
Ussachevsky συνέθεσε το
Wireless Fantasy. Ο Mathews
συνέθεσε το Numerology.
1962 Music IV-Β Παραλλαγή της Η εταιρία DECCA
Music IV στο κυκλοφόρησε το LP Music
Πανεπιστήµιο From Mathematics µε
Princeton. µουσική που δηµιουργήθηκε
µε τις γλώσσες MUSIC N στα
εργαστήρια της Bell. Μεταξύ
άλλων περιλαµβάνονται τα
έργα Fantasia (Orlando
Gibbons), Bicycle Build for
Two και Numerology (Max
Mathews), Variations in
Timbre and Attack και
Stochatta (John Pierce),
Theme and Variations (S. D.
Speeth), Pitch Variations
(Newman Guttman) και Noise
Study (James Tenney).
1967 Music IV-ΒF Σε περιβάλλον Ο John Chowning ανέπτυξε
FORTRAN στο την Frequency Modulation
Πανεπιστήµιο Synthesis (FM)
Princeton. πειραµατιζόµενος σε τεχνικές
vibrato σε περιβάλλον
γλώσσας MUSIC.
1968 Music V Σπονδυλωτή δοµή σε Ο Jean-Claude Risset
περιβάλλον δηµιούργησε έναν κατάλογο
FORTRAN. ήχων µέσω τεχνικών
σύνθεσης ήχου σε
περιβάλλον MUSIC V. Ο
Stockhausen ολοκλήρωσε το
Stimmung. Ο David Tudor
συνέθεσε το Rainforest I για
τον Merce Cunningham, έργο
για ενισχυµένους και
επεξεργασµένους ήχους
µικρών αντικειµένων
1968-1971 Music 360 Γρηγορότερη από τις O Jean-Claude Risset
υπάρχουσες γλώσσες συνέθεσε το Computer Suite
της εποχής. from Little Boy (1968) και το
Mutations (1969) και ο
Charles Dodge τα Changes

19
(1969) και Earth’s Magnetic
Field (1970). O John
Chowning συνέθεσε το
Sabelithe (1971).
1972 C programming Αναπτύχθηκε από Ο Ξενάκης ίδρυσε το
τον Dennis Ritchie CEMAMu κοντά στο Παρίσι.
στα εργαστήρια Bell. Ο Barry Truax ανέπτυξε τις
τεχνικές σύνθεσης POD 4 και
POD 5 στο Institute of
Sonology της Ολλανδίας.
1977 UPIC Μια ταµπλέτα Ο Ξενάκης συνέθεσε το
συνδεδεµένη µε Διάτοπο La Légende d’Eer
υπολογιστή χρησιµοποιώντας το UPIC.
επιτρέπει να
«σχεδιάσουµε» τον
ήχο.
1978 CHANT Φυσική Ο Ξενάκης συνέθεσε το
µοντελοποίηση. Mycènes Alpha σε UPIC. Το
Groupe de Recherches
Musicales (GRM) στο Παρίσι
ξεκίνησε την ανάπτυξη
λογισµικού για ηχητική
επεξεργασία, αρχικά σε
υπολογιστή PDP 11/60.
1979 Cmusic Αναπτύχθηκε από Ο Paul Lansky συνέθεσε το
τον Richard Moore Six Fantasies on a Poem by
σε γλώσσα C µε Thomas Campion. Ιδρύθηκε
δυνατότητα το International Computer
παραγωγής ήχου σε Music Association (ICMA).
πραγµατικό χρόνο.
1986 Kyma Περιβάλλον Κυκλοφόρησε στην αγορά ο
ηχητικής σύνθεσης. sampler Akai S900. Ιδρύθηκε
Πέραν του το Computer and Electronic
λογισµικού Music Studio στο Πεκίνο. Ο
περιλαµβάνει µια Trevor Wishart συνέθεσε το
εξωτερική DSP Vox 5.
µονάδα.
1987 Composers’ Desktop Project Συνεργατικό Ο Max Mathews
(CDP) περιβάλλον µε δηµιούργησε το µουσικό
πληθώρα εργαλείων όργανο-ελεγκτή Radio Baton.
ηχητικής
επεξεργασίας
Δεκαετία Common Lisp Music. Περιβάλλοντα Ένα από τα πρώτα έργα που
1980 Nyquist. Csound. Max ηχητικής σύνθεσης χρησιµοποίησαν τη Max
και επεξεργασίας. υπήρξε το Pluton (1988-9)
του Philippe Manoury για
πιάνο και ηλεκτρονικά.
1996 Pure Data. SuperCollider Η Pure Data είναι Ο Donald Buchla
ένα περιβάλλον κατασκεύασε τον ελεγκτή
γραφικού Lightning II. Αναπτύχθηκε το
προγραµµατισµού γραφικό περιβάλλον Cecilia.
ανοικτού κώδικα, Η εταιρία Steinberg
παρόµοιο της Max. κυκλοφόρησε λογισµικό µε
Το SuperCollider, VST plugins.
επίσης ανοικτού
κώδικα, είναι
περιβάλλον
αλγοριθµικής
σύνθεσης, ηχητικής
επεξεργασίας και

20
αλληλεπίδρασης σε
πραγµατικό χρόνο.
1998 OpenMusic. AudioMulch. Το OpenMusic είναι Ο Horacio Vaggione
Reaktor περιβάλλον συνέθεσε το Agon για
αντικειµενοστρεφούς πολυκάναλη µαγνητοταινία.
γραφικού Ο Cort Lippe συνέθεσε το
προγραµµατισµού Music for Hi Hat and
βασισµένο σε Computer.
Comon LISP. Τα
AudioMulch και
Reaktor είναι
σπονδυλωτά
περιβάλλοντα
ηχητικής σύνθεσης
και επεξεργασίας σε
πραγµατικό χρόνο.
2001 Processing Περιβάλλον και
γλώσσα ανοικτού
κώδικα µε
πολυσχιδή χρήση
στις ηλεκτρονικές
τέχνες.
2003 ChucK Περιβάλλον Ξεκίνησε η παραγωγή του
ηχητικής σύνθεσης Reactable στο Πανεπιστήµιο
και live coding. Pompeu Fabra της
Βαρκελώνης. Ο Karlheinz
Stockhausen ολοκλήρωσε την
όπερα Licht. Ιδρύθηκε το
Sonic Arts Research Centre
(SARC) στο Μπέλφαστ.
2005 Arduino. Impromptu. Το Arduino είναι µια Ιδρύθηκε η Princeton Laptop
OpenFrameworks πλατφόρµα ανοικτού Orchestra (PLOrk). Οι
κώδικα για τη υπολογιστές της Apple
δηµιουργία εξοπλίστηκαν µε λειτουργικό
αλληλεπιδραστικών σύστηµα OSX10.
περιβαλλόντων. Το
Impromptu είναι
βασισµένο στη
γλώσσα Scheme και
χρησιµοποιείται
ευρέως σε live
coding. Το
OpenFrameworks
είναι µια ψηφιακή
εργαλειοθήκη
ανοικτού κώδικα σε
C++.
2008 Max 5 Νέα έκδοση της Max Ο Gérard Pape συνέθεσε to
µε µεγάλες αλλαγές Héliophonie II, έργο για 8
και βελτιώσεις στο ηχητικά κανάλια και video.
GUI.
2009 Max for Ableton Live. Το Max for Live Ο Magnus Lindberg συνέθεσε
AudioMulch II καθιέρωσε µια το έργο Graffiti για ορχήστρα
συνεργατική και χορωδία, και ο Richard
πλατφόρµα µεταξύ Barret το Mesopotamia για 17
της Max και του όργανα και ηλεκτρονικά.
περιβάλλοντος
Ableton Live. Το
AudioMulch είναι
ένα σπονδυλωτό

21
πρόγραµµα ηχητικής
σύνθεσης και
επεξεργασίας.
2011 Csound for Ableton Live Σουίτα plugins η
οποία συνδυάζει τα
περιβάλλοντα
Ableton Live και
Max (µέσω του Max
for Live) µε τις
δυνατότητες
ηχητικής σύνθεσης
της Csound.

Πίνακας 1.1 Χρονολόγιο βασικών γλωσσών και περιβαλλόντων µουσικού προγραµµατισµού.

1.2.2. Τι Είναι το Πρόγραµµα;

Τα ψηφία της γλώσσας µε την οποία επικοινωνεί ο χρήστης και την οποία αναγνωρίζει ο υπολογιστής είναι το
0 και το 1. Ονοµάζονται δυαδικά ψηφία ή δυφία ή bits (από το binary digits) και αποτελούν τα δοµικά
στοιχεία της γλώσσας µηχανής (machine code) η οποία εκφράζεται στο δυαδικό σύστηµα. Ένα bit µπορεί να
αποκτήσει 2 τιµές: 0 και 1. Οι λέξεις (bytes), οι οποίες απαρτίζονται από ένα σύνολο bits, διακινούνται µέσω
των ηλεκτρονικών κυκλωµάτων του υπολογιστή (Πίνακας 1.2). Κατ’αναλογία, µπορούµε να παραβάλλουµε
το bit µε έναν ηλεκτρικό λαµπτήρα ο οποίος βρίσκεται σε ανοικτή (on-1) ή κλειστή (off-0) θέση.

1 1 1 1 0 0

Πίνακας 1.2 Ο αριθµός 60 του δεκαδικού συστήµατος, ο οποίος αντιστοιχεί στο πρωτόκολλο MIDI στη νότα ντο, όπως
αναπαρίσταται σε τιµές του δυαδικού συστήµατος (0, 1).

Το σύνολο των δυαδικών τιµών ή οδηγιών που διακινούνται µέσω των ηλεκτρονικών κυκλωµάτων µε σκοπό
την ολοκληρωµένη πραγµατοποίηση της ροής ενεργειών που εκτελεί ο υπολογιστής, ονοµάζεται πρόγραµµα.
Το πρόγραµµα περιγράφεται ως:
• Είναι µια σειρά οδηγιών οι οποίες ορίζουν στον υπολογιστή τι να κάνει και µε ποια σειρά.
• Οι οδηγίες δίνονται σε µια γλώσσα την οποία µπορεί να καταλάβει ο υπολογιστής (γλώσσα µηχανής).
• Αν ο υπολογιστής δεν αναγνωρίσει τις οδηγίες, εµφανίζει µήνυµα λάθους (error). Τα λάθη σε επίπεδο
προγραµµατισµού διαχωρίζονται σε συντακτικά (λάθος διατύπωση) ή σε λογικά, λάθη δηλαδή στη
λογική και στους συσχετισµούς του προγράµµατος

Στο παράδειγµα που ακολουθεί δίνεται µια σειρά οδηγιών για την ανεύρεση µιας διεύθυνσης. Αυτές οι
οδηγίες µπορούν να αποτελέσουν ένα πρόγραµµα, µεταφρασµένο σε γλώσσα µηχανής.

1. Προχώρησε βόρεια δύο τετράγωνα.


2. Στρίψε αριστερά 90°.
3. Περπάτησε ευθεία 50 µέτρα.
4. Στρίψε δεξιά 90°.
5. Άνοιξε την πόρτα.
6. Ανέβα 40 σκαλοπάτια.
7. Άνοιξε την πόρτα.
8. Προχώρησε µέσα.
9. Κλείσε την πόρτα.

Για να υπάρξει επιτυχία, οι παραπάνω οδηγίες πρέπει να δοθούν µε τη σωστή σειρά.

22
Ένα απλοποιηµένο παράδειγµα µε χρήση συνθήκης «if-then-else» µπορεί να συνταχθεί ως εξής:

«Αν ο µισθός είναι πάνω από 15.000 ευρώ, τότε αφαίρεσε 20% για φόρους, διαφορετικά αφαίρεσε
10%».

Το πρόγραµµα ελέγχει τις µεταβλητές τιµές και επιλέγει µεταξύ των εναλλακτικών δηλώσεων if, then και
else.

1.2.3. Γλώσσες Προγραµµατισµού.

Ο µικροεπεξεργαστής (microprocessor) είναι ένα ολοκληρωµένο κύκλωµα το οποίο ελέγχει όλες τις
λειτουργίες του υπολογιστή. Μπορεί να εκτελέσει 4 τύπους πράξεων:

1. Να µετακινήσει δεδοµένα (data) από µια θέση µνήµης σε µια άλλη.


2. Να αλλάξει δεδοµένα που βρίσκονται σε µια θέση µνήµης.
3. Να καθορίσει αν µια θέση µνήµης περιέχει συγκεκριµένα δεδοµένα.
4. Να αλλάξει την αλληλουχία των οδηγιών που εκτελεί.

Όλες αυτές οι ενέργειες εκτελούνται στέλνοντας, λαµβάνοντας ή παρακολουθώντας ηλεκτρονικούς παλµούς


(1-0, on-off). Ο υπολογιστής αναγνωρίζει αυτούς τους παλµούς σε µία από δύο καταστάσεις ή επίπεδα τάσης,
(ένα ηλεκτρονικό σήµα µπορεί να είναι είτε on είτε off).
Στην αρχή της ιστορίας των υπολογιστών δεν υπήρχαν µικροεπεξεργαστές. Ένα πρόγραµµα εκτελείτο
µε άµεσο χειρισµό αυτών των σηµάτων on και off. Ο χειριστής ανοιγόκλεινε µια σειρά διακοπτών
λειτουργώντας ως ελεγκτής και ήταν υποχρεωµένος να γράφει τις εντολές προς τον υπολογιστή
συντάσσοντας µακρές σειρές από ψηφία 0 και 1, να γράφει δηλαδή το πρόγραµµα απευθείας σε γλώσσα
µηχανής.

1.2.4. Assembly (Γλώσσες Χαµηλού Επιπέδου).

Με τη χρησιµοποίηση του δυαδικού συστήµατος, ο χειριστής έπρεπε να συντάξει δυσνόητους για την
ανθρώπινη αντίληψη κώδικες, οι οποίοι αποτελούνταν από πολλά δυαδικά ψηφία, για µια και µόνο εντολή.
Με την ανάπτυξη των υπολογιστών έγινε δυνατή η τροφοδότηση ενός προγράµµατος στον
υπολογιστή και στη συνέχεια η αίτηση προς αυτόν να εκτελεί τις οδηγίες του. Απαιτούνταν βέβαια πολλές
σειρές δυαδικών ψηφίων, ως την εµφάνιση των γλωσσών assembly.
Η assembly χρησιµοποιούσε µνηµονικούς κώδικες για να αναπαραστήσει τις εργασίες του
υπολογιστή. Ένας µνηµονικός κώδικας είναι µια εύκολη στην αποµνηµόνευση λέξη ή σύντµηση, η οποία
αναπαριστά µια πλήρη εργασία του µικροεπεξεργαστή. Για παράδειγµα:

• MOV (move) = Μετακίνησε πληροφορίες από µια θέση µνήµης σε άλλη.


• JMP (jump) = Μεταπήδησε σε άλλη θέση µνήµης.

Έτσι, αντί για τους δυσνόητους κώδικες του δυαδικού συστήµατος, ο χρήστης µπορούσε απλά να γράφει
κατανοητές λέξεις.
Στη συνέχεια, ένα πρόγραµµα assembler, µετέφραζε αυτές τις λέξεις στη γλώσσα µηχανής που
καταλαβαίνει ο υπολογιστής.

1.2.5. Γλώσσες Υψηλού Επιπέδου.

Σήµερα, χρησιµοποιούνται γλώσσες στις οποίες η συγγραφή του κώδικα βασίζεται πολύ περισσότερο στην
ανθρώπινη αντίληψη και στη φυσική γλώσσα, παρά σε µνηµονικούς κώδικες ή σε δυαδικά ψηφία. Οι
γλώσσες αυτές ονοµάζονται (πολύ) υψηλού επιπέδου (high level programming languages) και οι οδηγίες τους
είναι λέξεις που αναπαριστούν µια πλήρη πρακτική λειτουργία αντί για µια εργασία του µικροεπεξεργαστή.

23
Οι γλώσσες υψηλού επιπέδου επιτρέπουν επίσης τη µεταφορά των προγραµµάτων από έναν υπολογιστή σε
έναν άλλο.
Για παράδειγµα: Η λέξη PUTS στη γλώσσα C, διατάζει τον υπολογιστή να εµφανίσει κάποιες
συγκεκριµένες πληροφορίες στην οθόνη. Η ίδια εντολή θα απαιτούσε πολύ µεγαλύτερο πλήθος µνηµονικών
κωδικών της assembly και εκατοντάδες δυαδικών ψηφίων.
Για να γίνει κατανοητή η διαφορά µεταξύ της συγγραφής δυαδικού κώδικα και της σύνταξης µιας
γλώσσας υψηλού επιπέδου όπως η C, δίνεται το ακόλουθο παράδειγµα40.
Για να εµφανιστεί η λέξη «SYBEX» στην οθόνη:

Σε περιβάλλον C:

puts («SYBEX»)

Σε Assembly:

MOV AH, 9
MOV DX, OFFSET NAME
INT 21h
MOV AG, 4Ch
INT 21h
NAME DB «SYBEX»

Σε δυαδικές οδηγίες:

1011010000001001101110100000000100001011
1100110100100001101101000100110011001101
01011000

Ο υπολογιστής δεν κατανοεί στην πραγµατικότητα τι σηµαίνει η λέξη «puts». Έτσι, αυτή πρέπει να
µεταφραστεί στη γλώσσα του δυαδικού συστήµατος. Η µετάφραση εκτελείται µέσω:

1. µεταγλωττιστή (compiler), ή
2. διερµηνευτή (interpreter)

1.2.6. Μεταγλωττιστής.

Πολύ συχνά συγχέουµε τη µετάφραση µε τη διερµηνεία. Σε µια µετάφραση, για παράδειγµα από τα ελληνικά
στα αγγλικά, δηµιουργούµε αντίγραφα (hardcopies), τα οποία µπορούµε να κρατήσουµε σε ένα αρχείο και να
τα επαναχρησιµοποιήσουµε. Ο µεταγλωττιστής (compiler) κάνει την ίδια εργασία για µια γλώσσα
υπολογιστών.
Κατά τη δεκαετία του 1950, ο µεταγλωττιστής ήταν µια υπορουτίνα η οποία παρήγαγε ένα
εξειδικευµένο πρόγραµµα για την επίλυση συγκεκριµένων προβληµάτων. Ο Ceruzzi (2006) περιγράφει τη
λειτουργία του ως εξής:

Εάν οι ακολουθίες [εντολών] είχαν καταχωρηθεί µε τη µορφή


διατρήσεων πάνω σε δέσµες καρτών, τότε, συλλέγοντας την
κατάλληλη δέσµη, γράφοντας και καταχωρώντας τους µεταβατικούς
κώδικες µε τη µορφή διατρήσεων πάνω στις κάρτες και
συγκεντρώνοντας το αποτέλεσµα σε µια νέα δέσµη καρτών, θα
µπορούσε να προετοιµαστεί ένα πρόγραµµα. Μια τέτοια διεργασία
αποδόθηκε µε τον όρο µεταγλωττίζω (to compile)41.

24
Ο µεταγλωττιστής είναι από µόνος του ένα πρόγραµµα που (µε τη βοήθεια ενός άλλου προγράµµατος το
οποίο ονοµάζεται διασυνδετής (linker) µετατρέπει τις οδηγίες σε δυαδική µορφή για να τρέξει το πρόγραµµα.
Στη συνέχεια, δηµιουργεί ένα object αρχείο το οποίο είναι µια ενδιάµεση µορφή του προγράµµατος.
Εάν ο µεταγλωττιστής συναντήσει οδηγίες που δεν καταλαβαίνει, τότε θα µας ενηµερώσει. Σε αυτήν την
περίπτωση, θα πρέπει να διορθώσουµε τα λάθη που έχουµε κάνει στη σύνταξη και να συνεχίσουµε. Κατόπιν,
ο διασυνδετής µετατρέπει το object αρχείο σε εκτελέσιµο πρόγραµµα. Η διαδικασία αυτή δεν τρέχει το
πρόγραµµα, απλώς εκτελεί τη µετάφραση (Σχήµα 1.1).

Σχήµα 1.1 Ροή εντολών µε διαµεσολάβηση του µεταγλωττιστή.

Δίνεται ένα παράδειγµα στο Σχήµα 1.2:

Σχήµα 1.2 Ο µεταγλωττιστής και ο διασυνδετής µετατρέπουν τις οδηγίες µιας γλώσσας προγραµµατισµού υψηλού επιπέδου
σε δυαδικό κώδικα ή εκτελέσιµη γλώσσα µηχανής.

Όταν χρησιµοποιούµε έναν µεταγλωττιστή, το πρόγραµµα υπάρχει σε τρεις καταστάσεις:

1. Οι προτάσεις της γλώσσας αποθηκεύονται σε ένα αρχείο κειµένου (αρχείο πηγαίου κώδικα).
Μπορούµε να τροποποιούµε το αρχείο αυτό για να αλλάξουµε το πρόγραµµά µας.
2. Το µεταγλωττισµένο πρόγραµµα περιέχεται σε ένα object αρχείο.
3. Το τελικό αποτέλεσµα περιέχεται σε ένα εκτελέσιµο αρχείο το οποίο και τρέχουµε.

Παραδείγµατα µεταγλωττιζόµενων γλωσσών αποτελούν οι: FORTRAN (η πρώτη γλώσσα υψηλού επιπέδου
και γενικής χρήσης), C, C++, PASCAL και COBOL.

1.2.7. Διερµηνευτής.

Ο διερµηνευτής διερµηνεύει κάθε οδηγία προς τον ηλεκτρονικό υπολογιστή µε τη σειρά που εµφανίζεται, µε
τον ίδιο τρόπο µε τον οποίο ένας διερµηνέας διερµηνεύει κάθε πρόταση µε τη σειρά και στον χρόνο που την
ακούει (Σχήµα 1.3).

Σχήµα 1.3 Ο διερµηνευτής µετατρέπει τις οδηγίες µιας γλώσσας υψηλού επιπέδου σε δυαδικό κώδικα κάθε φορά που τρέχει
το πρόγραµµα.

Κατά συνέπεια, δεν υπάρχει καταγεγραµµένη µετάφραση. Με τον διερµηνευτή, το πρόγραµµα δεν υπάρχει σε
καµία άλλη µορφή, πέραν από τη µορφή του πηγαίου κώδικα.
Παραδείγµατα διερµηνευόµενης γλώσσας αποτελούν οι: Visual Basic, Perl, Python και Ruby.
Θεωρητικά, οι διερµηνευόµενες γλώσσες τρέχουν πιο αργά, καθώς απαιτούν κάθε φορά να
φορτώνουµε το διερµηνευτή στη µνήµη και κατόπιν να διερµηνεύουµε και να τρέχουµε κάθε γραµµή του
προγράµµατος ξεχωριστά.

25
Οι µεταγλωττιστές µετατρέπουν όλο το πρόγραµµα άπαξ. Έτσι, όταν τρέχουµε ένα µεταγλωττισµένο
πρόγραµµα, αυτό ήδη υπάρχει στη µορφή δυαδικών οδηγιών οι οποίες µπορούν να εκτελούνται άµεσα από
τον υπολογιστή.

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Αργκάν, Τ. Κ. Η Μοντέρνα Τέχνη. Ηράκλειο: Πανεπιστηµιακές Εκδόσεις Κρήτης, 2012.


Ceruzzi, P. E. Ιστορία της Υπολογιστικής Τεχνολογίας. Από τον ENIAC έως το Διαδίκτυο. Αθήνα: Κάτοπτρο,
2006, σελ. 43.
Neibauer, A. R. Το Πρώτο Πρόγραµµα σε C++. Αθήνα: Γκιούρδας, 1995.

Ξενόγλωσση Βιβλιογραφία.

Appleton, J. H., και C. Perera, The Development and Practice of Electronic Music. New Jersey: Prentice Hall
Inc., 1975, σελ. 1-21, 68-137.
Bernstein, D. The San Francisco Tape Music Center. 1960s Countercultur and the Avant-Garde. Berkeley:
University of California Press, 2008.
Bijker, W. E., H. P. Thomas και P. Trevor, The Social Construction of Technological Systems. Cambridge
MA: The MIT Press, 1987.
Chadabe, J. Electric Sound. New Jersey: Prentice-Hall Inc, 1997, σελ. 1-139.
Collins, N. και J. d’Escrivan, The Cambridge Companion to Electronic Music. Cambridge: Cambridge
University Press, 2007, σελ. 7-23, 55-71.
Emmerson, S. (επιµέλεια). Music, Electronic Media and Culture. Hampshire: Ashgate, 2000, σελ. 7-83.
Foster, H., R. Krauss, Y. A. Bois, B. H. D. Buchloh και D. Joselit, Art Since 1900. Modernism,
Antimodernism, Postmodernism. Λονδίνο: Thames & Hudson, 2005.
Lucier, A. και S. Douglas, Chambers. Scores by Alvin Lucier. Middletown: Wesleyan University Press, 1980,
σελ. 30-34.
Manning, P. Computer and Electronic Music. Oxford: Oxford University Press, 1993.
Mathews, M. «The Digital Computer as a Music Instrument», Science, τ. 142, αρ. 3592, Νοέµβριος 1963, σελ.
553-557.
Menabrea, L. F. «Notions sur la Machine Analytique de M. Charles Babbage», Bibliothèque Universelle de
Genève, 41e, σελ. 352-376, 1842. Γενεύη: Bibliotèque Universelle de Genève.
Meyer-Eppler, W. Elektronische Klangerzeugung: Elektronische Musik und Synthetische Sprache. Βόννη:
Ferdinand Dümmlers, 1949.
Risset, J. C. «Computer Music experiments 1964 –», Computer Music Journal, 9:1, σελ. 11-18, Άνοιξη 1985.
Cambridge MA: The MIT Press.
Risset, J. C. «Computer Study of Trumpet Tones», The Journal of the Acoustical Society of America, τ. 38,
αρ. 5, 1965, σελ. 912.
Roads, C. The Computer Music Tutorial. Cambridge MA: The MIT Press, 1996, σελ. 785-818.

26
Schaeffer, P. Traité des Objets Musicaux. Παρίσι: Editions du Seuil, 1966.
Schaeffer, P. A la Recherche d’une Musique Concrete. Παρίσι: Editions du Seuil, 1952.
Stevens, M. και A. Swan, De Kooning. An American Master. Ν. Υόρκη: Alfred A. Knopf, 2013.

27
Κεφάλαιο 2
Βασικά Χαρακτηριστικά του Ήχου.
Σύνοψη
Εξετάζονται τα βασικά χαρακτηριστικά του ήχου: ο ήχος ως φυσικό φαινόµενο και η κυµατική του διάσταση, τα
µεγέθη µιας ταλάντωσης, η χρονική και η φασµατική πληροφορία ενός σήµατος, η ψηφιακή αποτύπωση του
ήχου και τα διάφορα φαινόµενα που προκύπτουν από αυτήν, καθώς και τα κύρια ψυχοακουστικά
χαρακτηριστικά πρόσληψης του ήχου από τον άνθρωπο.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

2.1. Ταλαντώσεις Ήχου.

2.1.1. Ο Ήχος ως Κύµα.

Ο ήχος αποτελεί ένα κύµα το οποίο ταξιδεύει σε ένα υλικό µέσο, στερεό, υγρό ή αέριο. Στην καθηµερινότητά
µας προσλαµβάνουµε ηχητικά κύµατα τα οποία µεταδίδονται στον αέρα. Μπορούµε να αναπαραστήσουµε
ένα ηχητικό κύµα στις δύο διαστάσεις, σε ένα σύστηµα δηλαδή δύο κάθετων αξόνων x και y, όπου ο κάθετος
άξονας y αφορά τη µεταβολή που προκαλεί το κύµα στο µέσο που µεταδίδεται και η οποία συνήθως αφορά το
µέγεθος της πίεσης, και ο άξονας x τον χρόνο στον οποίο συντελείται η αντίστοιχη µεταβολή. Από αυτήν την
άποψη ο ήχος αποτελεί µια χρονική συνάρτηση µεταβολής της πίεσης.

Σχήµα 2.1 Αποτύπωση της ηχητικής πληροφορίας ως κυµατική συνάρτηση στον χρόνο.

Όπως φαίνεται και από το σχήµα (Σχήµα 2.1) η συνάρτηση αυτή αφορά µεταβολές στις τιµές πίεσης του
µέσου. Έτσι, για παράδειγµα, τη χρονική στιγµή t η τιµή αυτή αντιστοιχεί σε p , ενώ τη χρονική στιγµή t σε
5 a 9
p κ.ο.κ. Οι συνεχόµενες αυτές µεταβολές στις τιµές πίεσης επιφέρουν αντίστοιχες µεταβολές στα υλικά
b
σηµεία του µέσου. Για θετικές τιµές πίεσης παρουσιάζονται πυκνώσεις ενώ για αρνητικές, αραιώσεις στο
µέσο (Σχήµα 2.2).

28
Σχήµα 2.2 Πυκνώσεις και αραιώσεις στην ύλη του µέσου (κάτω µέρος σχήµατος) ως αποτέλεσµα της µεταβολής πίεσης
που επιφέρει ένα ηχητικό κύµα.

Ενώ µάλιστα συνηθίζεται το ηχητικό κύµα να αποτυπώνεται στους δύο άξονες, η διάδοση ενός κύµατος
πραγµατοποιείται και στις τρεις διαστάσεις του χώρου, καταλήγοντας έτσι σε σφαιρικές µετατοπίσεις µε
αντίστοιχες µεταβολές στο µέσο διάδοσης.

29
Σχήµα 2.3-2.6 Πυκνώσεις και αραιώσεις στην ύλη του µέσου κατά τη µετάδοση ενός ηχητικού κύµατος στον τρισδιάστατο
χώρο σε τέσσερα διαδοχικά χρονικά στιγµιότυπα.

Για πρακτικούς λόγους συνηθίζεται να απεικονίζουµε ένα ηχητικό κύµα στις δύο του διαστάσεις. Η
συγκεκριµένη µάλιστα µορφή που παρουσιάζει ένα κύµα ήχου ονοµάζεται κυµατοµορφή (waveform).
Τέσσερις τέτοιες πολύ διαδεδοµένες µορφές κυµάτων, δηλαδή κυµατοµορφές, απαντώνται πολύ συχνά στην
ηλεκτρονική µουσική. Αυτές είναι: η ηµιτονοειδής (sinewave), η πριονωτή (sawtooth), η τετραγωνική
(squarewave) και η τριγωνική (triangle) κυµατοµορφή.

30
Σχήµα 2.7 Οι τέσσερις βασικές κυµατοµορφές στην ηλεκτρονική µουσική: ηµιτονοειδής (α), πριονωτή (β), τετραγωνική (γ)
και τριγωνική (δ).

Μια ακόµη παρατήρηση αφορά στο γεγονός πως καθώς ο ήχος είναι κύµα, ακολουθεί τη γενικότερη κυµατική
συµπεριφορά των κυµάτων στη φυσική. Παρουσιάζει δηλαδή ανακλάσεις, συµβολές, ακυρώσεις κ.λπ.

2.1.2. Βασικά Χαρακτηριστικά Ταλάντωσης.

Σε γενικές γραµµές ένα ηχητικό κύµα µπορεί είτε να παρουσιάζει µοτίβα επαναληψιµότητας κατά την
ταλάντωσή του, να έχει δηλαδή µια περιοδικότητα, είτε να είναι απεριοδικό. Στην πρώτη περίπτωση
µπορούµε να εξάγουµε δύο χαρακτηριστικά µεγέθη σε σχέση µε την ταλάντωσή του:

• Τη συχνότητα ταλάντωσης.
• Το πλάτος ταλάντωσης.

Η συχνότητα (frequency) ενός κύµατος αφορά στο πλήθος (ή στους κύκλους) των επαναλήψεων της µίας
περιόδου ανά δευτερόλεπτο (Σχήµα 2.8). Ισχύει δηλαδή:

συχνότητα = κύκλοι / δευτερόλεπτο

Η συχνότητα εκφράζεται σε Hz.

31
Σχήµα 2.8 Παράδειγµα δύο περιοδικών κυµάτων µε διαφορετική συχνότητα ταλάντωσης. Στο επάνω µέρος του σχήµατος
το κύµα ταλαντώνεται µε συχνότητα ίση προς 3 Hz ενώ στο κάτω µέρος µε 14 Hz.

Κάθε ένας κύκλος επανάληψης ισοδυναµεί µε την περίοδο Τ της ταλάντωσης (Σχήµα 2.9). Ισχύει µάλιστα:

περίοδος Τ = 1 / συχνότητα

ή:

συχνότητα = 1 / Τ

Σχήµα 2.9 Μεγαλύτερες τιµές περιόδου αντιστοιχούν σε χαµηλότερες συχνότητες ταλάντωσης και αντίστροφα.

Ένα επόµενο σηµαντικό µέγεθος αποτελεί το πλάτος ταλάντωσης (amplitude) µιας κυµατοµορφής. Το πλάτος
ταλάντωσης αποτυπώνεται στον κάθετο άξονα και αφορά στη µέγιστη απόκλιση, κατ’ απόλυτη τιµή, από τον
οριζόντιο άξονα (Σχήµα 2.10).

32
Σχήµα 2.10 Παράδειγµα δύο ταλαντώσεων µε ίδιες συχνότητες αλλά διαφορετικά πλάτη ταλάντωσης.
Ισχύει µάλιστα α = 3β.

Σηµαντική επίσης πληροφορία η οποία µπορεί να αποβεί καθοριστική σε φαινόµενα άθροισης ή συµβολής
κυµατοµορφών αποτελεί η αρχική φάση (initial phase) της κυµατοµορφής. Με τον όρο αυτόν εννοούµε τη
χρονική στιγµή έναρξης της ταλάντωσης. Έτσι, σε όλα τα παραπάνω παραδείγµατα οι ταλαντώσεις ξεκινούν
από την κατάσταση ισορροπίας της κυµατοµορφής, έχουν δηλαδή αρχική φάση 0. Σε διαφορετική περίπτωση,
όταν δηλαδή η έναρξη της ταλάντωσης αντιστοιχεί σε κάποια άλλη χρονική στιγµή της περιόδου, λέµε πως η
ταλάντωση έχει αρχική φάση. Οι τιµές της αρχικής φάσης αποτυπώνονται είτε σε µοίρες, από 00 έως 3600,
είτε σε ακτίνια, από 0 έως 2π (Σχήµα 2.11).

Σχήµα 2.11 Τέσσερις χαρακτηριστικές αρχικές φάσεις ταλάντωσης: 00 ή 2π (α), π/2 ή 900 (β), π ή 1800 (γ), 3π/2 ή 2700 (δ).

33
2.2. Φασµατική Πληροφορία.

2.2.1. Ανάλυση Fourier.

Ένα πολύ σηµαντικό εργαλείο ανάλυσης του ήχου, αλλά και γενικότερα οποιουδήποτε άλλου κυµατικού
φαινοµένου, αφορά στην Ανάλυση Fourier. Η ανάλυση αυτή αποτελεί µια µαθηµατική διατύπωση σύµφωνα
µε την οποία οποιοδήποτε ηχητικό κύµα µπορεί να αναλυθεί σε ένα άθροισµα άπειρων όρων µιας µοναδικής
βασικής κυµατοµορφής. Η βασική αυτή κυµατοµορφή είναι η ηµιτονοειδής κυµατοµορφή. Οι όροι κάθε
τέτοιου αθροίσµατος ηµιτονοειδών διαφέρουν κάθε φορά ως προς τα επιµέρους χαρακτηριστικά τους.
Αποτελούνται δηλαδή από ηµιτονοειδείς µε διαφορετικές συχνότητες, πλάτη ταλάντωσης και, πιθανώς,
αρχικές φάσεις. Για αυτόν ακριβώς τον λόγο, επειδή τελικά κάθε κυµατοµορφή µπορεί να αναχθεί σε ένα
άθροισµα πολλών διαφορετικών ηµιτονοειδών η ηµιτονοειδής ως κυµατοµορφή καλείται πολλές φορές και
απλή ή µερική (simple sinewave ή partial), ενώ οποιαδήποτε άλλη καλείται σύνθετη (composite wave).
Σε µία µάλιστα ειδική περίπτωση της ανάλυσης αυτής, όταν οι συχνότητες ταλάντωσης των
επιµέρους ηµιτονοειδών αποτελούν ακέραια πολλαπλάσια µιας βασικής ηµιτονοειδούς, οι ηµιτονοειδείς αυτές
καλούνται αρµονικοί (harmonics): το πρώτο πολλαπλάσιο (x 1) αποτελεί τον πρώτο αρµονικό (ή τη βασική
συχνότητα), το δεύτερο πολλαπλάσιο (x 2) αποτελεί τον δεύτερο αρµονικό κ.ο.κ. Στις περιπτώσεις αυτές ο
παραγόµενος ήχος έχει διακριτό τονικά ύψος. Έτσι για παράδειγµα γνωστές σύνθετες κυµατοµορφές οι
οποίες αναλύονται σε αθροίσµατα αρµονικών είναι οι παρακάτω:

πριονωτή
συχνότητα πλάτος φάση
1ος αρµονικός fx1 1 0
2ος αρµονικός fx2 1/2 0
3ος αρµονικός fx3 1/3 0
4ος αρµονικός fx4 1/4 0
5ος αρµονικός fx5 1/5 0
6ος αρµονικός fx6 1/6 0
7ος αρµονικός fx7 1/7 0

Πίνακας 2.1 Ανάλυση της πριονωτής στις πρώτες επτά συνιστώσες της.

Όπως φαίνεται και από τον πίνακα 2.1 η πριονωτή αποτελείται από ένα άθροισµα άπειρων ηµιτονοειδών από
όλους τους αρµονικούς, µε πλάτη αντιστρόφως ανάλογα ως προς το αντίστοιχο πολλαπλάσιο του αρµονικού.
Οι αρχικές φάσεις των αρµονικών είναι µηδενικές.  

τετραγωνική
συχνότητα πλάτος φάση
1ος αρµονικός fx1 1 0
2ος αρµονικός – – –
3ος αρµονικός fx3 1/3 0
4ος αρµονικός – – –
5ος αρµονικός fx5 1/5 0
6ος αρµονικός – – –
7ος αρµονικός fx7 1/7 0

Πίνακας 2.2 Ανάλυση της τετραγωνικής στις τέσσερις πρώτες συνιστώσες της.

Η τετραγωνική κυµατοµορφή (πίνακας 2.2) παραλείπει τους άρτιους αρµονικούς και αποτελείται από ένα
άπειρο άθροισµα των περιττών µόνο αρµονικών, µε πλάτη αντιστρόφως ανάλογα ως προς το αντίστοιχο
πολλαπλάσιο του αρµονικού. Οι αρχικές φάσεις των αρµονικών είναι µηδενικές.  

34
τριγωνική
συχνότητα πλάτος φάση
1ος αρµονικός fx1 1 0
2ος αρµονικός – – –
3ος αρµονικός fx3 1/9 180
4ος αρµονικός – – –
5ος αρµονικός fx5 1/25 0
6ος αρµονικός – – –
7ος αρµονικός fx7 1/49 180

Πίνακας 2.3 Ανάλυση της τριγωνικής στις τέσσερις πρώτες συνιστώσες της.

Η τριγωνική κυµατοµορφή (πίνακας 2.3) αποτελείται από ένα άπειρο άθροισµα των περιττών µόνο
αρµονικών µε πλάτη αντιστρόφως ανάλογα ως προς το τετράγωνο του αντίστοιχου πολλαπλάσιου του
αρµονικού. Επιπρόσθετα, ανά [4n-1] αρµονικό, αντιστρέφεται η φάση του αρµονικού κατά το άθροισµα.
Αυτό ουσιαστικά έχει σαν αποτέλεσµα ανά δεύτερη συνιστώσα του αθροίσµατος να αντιστρέφεται το
πρόσηµο.
Με παρόµοιο τρόπο οποιοδήποτε ηχητικό κύµα µπορεί να αναλυθεί σε µια σειρά αθροίσµατος
αρµονικών ή µη, ηµιτονοειδών.

2.2.2. Φασµατική Αναπαράσταση.

Σε όλα τα παραπάνω παραδείγµατα ο ήχος αποτυπώνεται γραφιστικά ως κυµατική συνάρτηση στον χρόνο, ως
µια δηλαδή χρονική πληροφορία. Αυτό σε πολλές περιπτώσεις είναι ιδιαίτερα χρήσιµο, όπως για παράδειγµα
κατά την οπτική αναπαράσταση µιας κυµατοµορφής σε µια εφαρµογή επεξεργασίας ήχου (sound editor). Με
την ανάλυση Fourier µπορούµε να έχουµε και τη φασµατική αναπαράσταση ενός ηχητικού κύµατος. Η
φασµατική αναπαράσταση αποτελεί την απεικόνιση των ηµιτονοειδών από τις οποίες αποτελείται ένας ήχος
σε ένα σύστηµα κάθετων αξόνων όπου στον οριζόντιο άξονα αποτυπώνεται η τιµή συχνότητας της κάθε
ηµιτονοειδούς και στον κάθετο η τιµή πλάτους της. Ένα τέτοιο γράφηµα ονοµάζεται φασµατογράφηµα
(spectrogram). Ένα φασµατογράφηµα δύο διαστάσεων περιλαµβάνει στον οριζόντιο άξονα την πληροφορία
της συχνότητας και στον κάθετο την πληροφορία του πλάτους (Εικόνες 2.12, 2.13).

Σχήµα 2.12 Φασµατική ανάλυση της τριγωνικής κυµατοµορφής στις 8 πρώτες ηµιτονοειδείς συνιστώσες της.

35
Σχήµα 2.13 Φασµατική ανάλυση της τετραγωνικής κυµατοµορφής στις 8 πρώτες ηµιτονοειδείς συνιστώσες της.

Πληρέστερο σε ανάλυση, ιδιαιτέρως για τις φυσικές πηγές ήχου, θεωρείται το τρισδιάστατο
φασµατογράφηµα (Εικόνα 2.1). Αυτό συµβαίνει επειδή µια φυσική ηχητική πηγή δεν είναι σχεδόν ποτέ
στατική στην φασµατική συµπεριφορά της, γεγονός που αποτυπώνεται στον τρίτο επιπλέον άξονα ο οποίος
αφορά την χρονική διάσταση.

Εικόνα 2.1 Τρισδιάστατη φασµατογραφική απεικόνιση. Στον άξονα των συχνοτήτων (x) εµφανίζονται οι ηµιτονοειδείς που
περιέχει ο ήχος, το πλάτος των οποίων µεταβάλλεται διαρκώς για κάθε διαφορετική χρονική τιµή στον άξονα y
(πηγή: https://commons.wikimedia.org/wiki/File:Spectrogram.png_-_/media/File:Spectrogram.png).

2.2.3. Σύνθεση Κυµατοµορφών.

Με µια αντίστροφη λογική, χρησιµοποιώντας ως βάση την ανάλυση Fourier, µπορούµε να συνθέσουµε
οποιαδήποτε κυµατοµορφή αθροίζοντας απλές ηµιτονοειδείς. Αρκεί, κάθε ηµιτονοειδής κατά την άθροιση να
ακολουθεί τα δεδοµένα της ανάλυσης, την αντίστοιχη δηλαδή συχνότητα, το αντίστοιχο πλάτος ταλάντωσης
και την αντίστοιχη αρχική φάση. Μπορούµε να διαπιστώσουµε κάτι τέτοιο επιχειρώντας να ανασυνθέσουµε
την τετραγωνική κυµατοµορφή, αθροίζοντας πέντε ηµιτονοειδείς µε τιµές συχνότητας και πλάτους σύµφωνα
µε τα στοιχεία ανάλυσης των πέντε πρώτων συνιστωσών της, όπως αυτά αποτυπώθηκαν στον πίνακα 2.2
(Σχήµα 2.14).

36
Σχήµα 2.14 Άθροιση των πέντε πρώτων συνιστωσών (1ος, 3ος, 5ος 7ος και 9ος αρµονικός) µιας τετραγωνικής
κυµατοµορφής και το αποτέλεσµά της στο κάτω µέρος.

Από την παραπάνω απεικόνιση παρατηρούµε πως η παραγόµενη κυµατοµορφή του αθροίσµατος διαφέρει
σηµαντικά από την τετραγωνική. Αυτό συµβαίνει επειδή η µέθοδος της σύνθεσης µέσω άθροισης
ηµιτονοειδών απαιτεί όσο το δυνατό περισσότερους όρους άθροισης προκειµένου η τελική κυµατοµορφή να
µορφοποιηθεί κατάλληλα.

2.2.4. FFT-IFFT.

Εκτός της χρησιµότητας στο να προσλάβουµε τα φασµατικά χαρακτηριστικά µιας ηχητικής πηγής, η ανάλυση
Fourier καταδεικνύει πως ο ήχος ως πληροφορία µπορεί, εκτός από τη χρονική, να αποτυπωθεί ταυτόχρονα
και στη φασµατική του διάσταση. Και οι δύο αυτές αποτυπώσεις αποτελούν τις δύο όψεις της ίδιας πηγής.
Μπορούµε να µεταβούµε από τη χρονική στη φασµατική διάσταση µε τη βοήθεια ενός µαθηµατικού
µετασχηµατισµού που ονοµάζεται Fourier Transform (Μετασχηµατισµός Fourier) και ειδικότερα µέσω ενός
εξειδικευµένου αλγορίθµου που καλείται Fast Fourier Transform (FFT). Αντίστοιχα, µπορούµε να
µεταβούµε από τη φασµατική στη χρονική διάσταση µε τη χρήση ενός επιπλέον µετασχηµατισµού, του IFFT
(Inverse Fast Fourier Transform) (Σχήµα 2.15).

37
Σχήµα 2.15 Μετάβαση από τη χρονική (α) στη φασµατική διάσταση (β) µέσω FFT. Με έναν αντίστροφο µετασχηµατισµό
(Inverse FFT – IFFT) µπορούµε να µετατρέψουµε τη φασµατική (β) σε χρονική πληροφορία (γ).

2.3. Ψηφιακός Ήχος.

2.3.1. Δείγµατα Ήχου.

Σε αντίθεση µε τα αναλογικά συστήµατα ένα ψηφιακό µέσο, όπως µια ψηφιακή συσκευή ηχογράφησης ή
ένας υπολογιστής για παράδειγµα, µπορεί να διαχειριστεί πεπερασµένο πλήθος τιµών. Κατ’ αυτόν τον τρόπο
σε ένα ψηφιακό σύστηµα µια κυµατοµορφή ήχου δεν µπορεί να αναπαρασταθεί σαν ένα χρονικό συνεχές,
αλλά σαν ένα πλήθος από σηµεία τα οποία αφορούν χρονικά στιγµιότυπα της κυµατοµορφής. Κάθε τέτοιο
στιγµιότυπο αποτυπώνει την τιµή πλάτους της ταλάντωσης στην αντίστοιχη διακριτή χρονική στιγµή. Το
στιγµιότυπο αυτό ονοµάζεται δείγµα (sample) (Σχήµα 2.16).

38
Σχήµα 2.16 Η ψηφιακή αποτύπωση µιας κυµατοµορφής (α) ως σύνολο δειγµάτων ήχου (γ).

Όπως φαίνεται και από το σχήµα, οι χρονικές στιγµές κατά τις οποίες λαµβάνονται τιµές των δειγµάτων από
τη συνεχή κυµατοµορφή είναι περιοδικά επαναλαµβανόµενες και σηµατοδοτούνται από µια τετραγωνική
κυµατοµορφή (Σχήµα 2.16 - β), µια δηλαδή ακολουθία παλµών µε δύο καταστάσεις: τιµή 0 και τιµή 1. Όταν η
ακολουθία αυτή λαµβάνει τιµή 1, κατά το ξεκίνηµα δηλαδή κάθε παλµού, λαµβάνεται και µία τιµή-δείγµα
από την αρχική ηµιτονοειδή. Η συχνότητα µε την οποία ταλαντώνεται αυτή η κυµατοµορφή καλείται
συχνότητα δειγµατοληψίας (sampling frequency ή sampling rate) και ουσιαστικά καθορίζει το πλήθος των
δειγµάτων που θα ληφθούν από την αρχική αναλογική κυµατοµορφή. Ευνόητο είναι πως όσο περισσότερα
δείγµατα λαµβάνονται ανά δευτερόλεπτο, όσο δηλαδή µεγαλύτερη τιµή έχει η συχνότητα δειγµατοληψίας,
τόσο πιο πιστή θα είναι η αποτύπωση της αρχικής πληροφορίας. Κατ’ αντίστοιχο τρόπο η περίοδος
δειγµατοληψίας αντιστοιχεί στο χρονικό διάστηµα που µεσολαβεί ανάµεσα σε δύο διαδοχικά δείγµατα
(Σχήµα 2.17). Ισχύει µάλιστα:

περίοδος δειγµατοληψίας = 1/ συχνότητα δειγµατοληψίας

39
Σχήµα 2.17 Η περίοδος δειγµατοληψίας αφορά το χρονικό διάστηµα που µεσολαβεί ανάµεσα σε διαδοχικά δείγµατα ήχου.

2.3.2. Δειγµατοληψία.

Η διαδικασία της δειγµατοληψίας αφορά την αποτύπωση µιας συνεχούς πληροφορίας (αναλογικό σήµα) σε
ένα διακριτό και πεπερασµένο πλήθος τιµών (ψηφιακό σήµα), έναν δηλαδή µετασχηµατισµό µιας αρχικής
πληροφορίας. Ο µετασχηµατισµός αυτός επιφέρει διάφορα ανεπιθύµητα φαινόµενα τα οποία εξετάζονται
αναλυτικότερα µαζί µε τους τρόπους αντιµετώπισής τους.

2.3.2.1. Ψευδώνυµες Συχνότητες (Alias Frequencies).

Μπορούµε να κατανοήσουµε καλύτερα τη διαδικασία της δειγµατοληψίας και τα διάφορα φαινόµενα που
προκύπτουν από αυτήν µέσα από συγκεκριµένα παραδείγµατα. Ας ξεκινήσουµε µε ένα παράδειγµα όπου από
µία αρχική ηµιτονοειδή µε συχνότητα f0 ίση προς 7 Hz λαµβάνονται δείγµατα µε συχνότητα δειγµατοληψίας
fs ίση µε 6 Hz. Ενώνοντας τα σηµεία που αντιστοιχούν στα δείγµατα που προκύπτουν στο κάτω µέρος του
σχήµατος (Σχήµα 2.18), µπορούµε να αναπαραστήσουµε γραφιστικά την ηµιτονοειδή η οποία παράγεται από
τη διαδικασία της δειγµατοληψίας. Στη συγκεκριµένη περίπτωση παρατηρούµε πως εκτός από την αρχική
ηµιτονοειδή των 7 Hz µπορεί να σχεδιαστεί και µία δεύτερη ηµιτονοειδής µε συχνότητα 1 Hz.

40
Σχήµα 2.18 Η αρχική ηµιτονοειδής µε συχνότητα 7 Hz (α), η κυµατοµορφή δειγµατοληψίας ως µια ακολουθία παλµών µε
συχνότητα 6 Hz (β) και οι εξαγόµενες ηµιτονοειδείς στα 7 και 1 Hz (γ).

Οι δύο αυτές ερµηνείες της ίδιας πληροφορίας, όπως θα διαπιστώσουµε, δεν είναι οι µοναδικές. Με παρόµοιο
τρόπο η παραγόµενη ηµιτονοειδής από την παραπάνω δειγµατοληψία θα µπορούσε επίσης να έχει συχνότητα
ίση µε 13 Hz όπως φαίνεται και από το παρακάτω σχήµα (Σχήµα 2.19).

Σχήµα 2.19 Με συχνότητα δειγµατοληψίας 6 Hz (β) µία ηµιτονοειδής των 7 Hz (α) αναπαράγεται επίσης στα 13 Hz (γ).

41
Με παρόµοιο τρόπο εάν συνεχίζαµε να σχεδιάζουµε όλες τις δυνατές ηµιτονοειδείς που µπορούν να
παραχθούν ενώνοντας τα σηµεία-δείγµατα θα προέκυπταν ηµιτονοειδείς στα 19, 25 κ.ο.κ. Hz. Καταλήγουµε
λοιπόν στην διαπίστωση πως κατά τη διαδικασία της δειγµατοληψίας όταν από µία αρχική ηµιτονοειδή µε
συχνότητα f λαµβάνονται δείγµατα µε συχνότητα δειγµατοληψίας f τότε προκύπτει ένα πλήθος νέων
0 s
ηµιτονοειδών σε συχνότητες:

f + ( k x f ), όπου k ένας οποιοσδήποτε θετικός ή αρνητικός ακέραιος.


0 s

Οι συχνότητες αυτές καλούνται alias frequencies (ψευδώνυµες συχνότητες). Η σχέση αυτή φαίνεται καλύτερα
στο φασµατικό πεδίο (Σχήµα 2.20).

Σχήµα 2.20 Πιθανές εκδοχές µιας αρχικής ηµιτονοειδούς των 7 Hz κατά τη διαδικασία της δειγµατοληψίας µε συχνότητα
δειγµατοληψίας 6 Hz.

Η παραπάνω σχέση επεκτείνεται µάλιστα και σε αρνητικές τιµές συχνότητας, γνωρίζοντας πως µία αρνητική
τιµή συχνότητας ουσιαστικά σηµατοδοτεί µία ταλάντωση µε ανεστραµµένη φάση (π ή 1800) (Σχήµα 2.21,
2.22).

Σχήµα 2.21 Αποτύπωση ηµιτονοειδούς µε συχνότητα 5 Hz και ανεστραµµένη φάση (γ) κατά τη δειγµατοληψία
ηµιτονοειδούς 7 Hz (α) µε συχνότητα δειγµατοληψίας 6 Hz (β).

42
Σχήµα 2.22 Η παραπάνω περίπτωση ενσωµατωµένη στο φασµατικό πεδίο.

Το φαινόµενο της παραγωγής πολλαπλών ηµιτονοειδών επαναλαµβάνεται και για κάθε άλλη βασική
ηµιτονοειδή µε οποιαδήποτε αρχική συχνότητα, όπως φαίνεται και στο παρακάτω παράδειγµα όπου από µια
αρχική ηµιτονοειδή µε συχνότητα 2 Hz λαµβάνονται δείγµατα µε συχνότητα δειγµατοληψίας 6 Hz (Σχήµα
2.23).

Σχήµα 2.23 Δειγµατοληψία ηµιτονοειδούς µε βασική συχνότητα στα 2 Hz (α) και συχνότητα δειγµατοληψίας 6 Hz (β), η
οποία εκτός της βασικής στα 2 Hz (κόκκινο χρώµα) παράγει και ένα πλήθος από ψευδώνυµες στα -4 Hz (πορτοκαλί
χρώµα), 8 Hz (µπλε χρώµα) (γ) κ.ο.κ.

Ένα πρώτο λοιπόν φαινόµενο που δηµιουργείται κατά τη διαδικασία της δειγµατοληψίας είναι πως εκτός της
αρχικής ηµιτονοειδούς παράγονται και µια σειρά από ανεπιθύµητες ψευδώνυµες συχνότητες σε ακέραια
πολλαπλάσια της συχνότητας δειγµατοληψίας f από την αρχική συχνότητα f .
s 0

2.3.2.2. Συχνότητα Nyquist. Θόρυβος Επικάλυψης (Aliasing). Αναδίπλωση (Foldover).

Με βάση τα δύο παραπάνω παραδείγµατα δειγµατοληψίας σε δύο ηµιτονοειδείς στα 7 και 2 Hz και την
εµφάνιση των πολλαπλασίων τους, µπορούµε στη συνέχεια να ορίσουµε τις περιοχές εντός των οποίων
εµφανίζει επαναληψιµότητα το παραπάνω φαινόµενο για οποιαδήποτε αρχική συχνότητα ηµιτονοειδούς.
Καταλήγουµε έτσι στο παρακάτω σχήµα (Σχήµα 2.24):

43
Σχήµα 2.24 Περιοχές εντός των οποίων εµφανίζονται ψευδώνυµες συχνότητες (aliases) µιας βασικής κατά τη διαδικασία
της δειγµατοληψίας.

Από το παραπάνω σχήµα παρατηρούµε πως κάθε τέτοια περιοχή οριοθετείται από τα περιττά πολλαπλάσια
του ήµισυ της συχνότητας δειγµατοληψίας f / 2. Η συγκεκριµένη συχνότητα ονοµάζεται συχνότητα Nyquist
s
και, όπως θα διαπιστώσουµε, παίζει καθοριστικό ρόλο στη σωστή αποτύπωση του σήµατος κατά τη
διαδικασία της δειγµατοληψίας. Για να κατανοήσουµε καλύτερα την κρισιµότητα της συχνότητας αυτής ας
δούµε ένα παράδειγµα µιας σύνθετης κυµατοµορφής η οποία αποτελείται από ένα πλήθος ηµιτονοειδών µε
συχνότητες οι οποίες εκτείνονται σε ένα εύρος τιµών από –Β έως Β (Σχήµα 2.25).

Σχήµα 2.25 Σύνθετη κυµατοµορφή µε εύρος συχνοτήτων από –Β έως Β και οι επιµέρους ηµιτονοειδείς της.

Όπως και πριν, κατά τη διαδικασία της δειγµατοληψίας για κάθε µία ηµιτονοειδή της σύνθετης αυτής
κυµατοµορφής θα λάβουµε ακέραια πολλαπλάσια σύµφωνα µε τον τύπο:

f 0 + ( k x fs )

Αυτό θα έχει σαν αποτέλεσµα το αρχικό είδωλο να πολλαπλασιαστεί σε πολλαπλά αντίγραφα (Σχήµα 2.26)
όπως συνέβαινε και µε τις απλές ηµιτονοειδείς στα προηγούµενα παραδείγµατα. Παρατηρούµε επίσης πως
στο συγκεκριµένο παράδειγµα το συχνοτικό εύρος της κυµατοµορφής [-Β, Β] βρίσκεται ανάµεσα στο
διάστηµα [- f / 2, f / 2], ισχύει δηλαδή:
s s

Β < fs / 2 , όπου B η µέγιστη τιµή συχνότητας της κυµατοµορφής

Σχήµα 2.26 Πολλαπλασιασµός µιας αρχικής σύνθετης κυµατοµορφής (µεταξύ των τιµών –Β και Β) σε πολλαπλά
αντίγραφα.

44
Μπορούµε στη συνέχεια να ανασυνθέσουµε την αρχική κυµατοµορφή εάν αποκόψουµε τα πολλαπλά
αντίγραφά της. Αυτό γίνεται µε µία διάταξη φίλτρου το οποίο έχει ρυθµιστεί να αποκόψει όλες τις συχνότητες
µε τιµές µεγαλύτερες της f / 2 και µικρότερες της – f / 2. Κατ’ αυτόν τον τρόπο ανασυντίθεται το αρχικό
s s
σήµα (Σχήµα 2.27).

Σχήµα 2.27 Τα στάδια ανασύνθεσης του αρχικού σήµατος κατά τη διαδικασία της δειγµατοληψίας.

Ας δούµε στη συνέχεια τι θα συµβεί εάν µειώσουµε τη συχνότητα δειγµατοληψίας έτσι ώστε:

Β>f /2
s

Όπως φαίνεται και από το σχήµα (Σχήµα 2.28), καθώς το συχνοτικό εύρος [-Β, Β] είναι πλέον µεγαλύτερο
του διαστήµατος [-f /2, f /2] αυτό θα έχει σαν αποτέλεσµα να παρουσιαστούν περιοχές αλληλο-επικάλυψης
s s
µεταξύ των πολλαπλών ειδώλων του αρχικού σήµατος.

45
Σχήµα 2.28 Δηµιουργία περιοχών επικαλύψεων µε επακόλουθο τη δηµιουργία θορύβου (aliasing), όταν Β > SR/2.

Εάν στη συνέχεια ακολουθήσουµε τη διαδικασία ανασύνθεσης του αρχικού σήµατος απορρίπτοντας όλες τις
υπόλοιπες συχνότητες εκτός της περιοχής [-f /2, f /2], θα ανασυντεθεί ένα σήµα το οποίο θα διαφέρει
s s
σηµαντικά από το αρχικό. Θα έχουµε δηλαδή εισαγωγή θορύβου (aliasing) µε την προσθήκη παράπλευρων
συχνοτήτων στα άκρα του φάσµατός του (Σχήµα 2.29).

Σχήµα 2.29 Εισαγωγή θορύβου (aliasing) κατά την ανασύνθεση του σήµατος όταν Β > SR/2.

Εάν παρατηρήσουµε καλύτερα το παραπάνω εξαγόµενο σήµα, γραφιστικά µοιάζει σαν να αναδιπλώνεται
εκατέρωθεν στις περιοχές για τις οποίες ισχύει κατ’ απόλυτη τιµή: |f | > | fs / 2 | (Σχήµα 2.30). Το φαινόµενο
αυτό καλείται και αναδίπλωση (foldover).

46
Σχήµα 2.30 Το φαινόµενο της αναδίπλωσης.

Προκειµένου να αποφευχθεί αυτός ο τύπος θορύβου αρκεί όπως είδαµε να ισχύει Β < SR/2, η µέγιστη δηλαδή
συχνότητα που περιέχει το σήµα προς δειγµατοληψία πρέπει να είναι πάντοτε µικρότερη της συχνότητας
Nyquist. Γνωρίζοντας πως το ανθρώπινο αυτί αντιλαµβάνεται µέγιστες συχνότητες µέχρι την τιµή των 20000
Hz περίπου, η συχνότητα δειγµατοληψίας πρέπει να είναι τουλάχιστον διπλάσια από την τιµή αυτή. Για αυτόν
τον λόγο µια τυποποιηµένη συχνότητα δειγµατοληψίας για τον ψηφιακό ήχο είναι αυτή των 44100 Hz. Με
µία άλλη διατύπωση, προκειµένου να µην έχουµε προβλήµατα µε το φαινόµενο της αναδίπλωσης κατά τον
ψηφιακό ήχο χρειάζεται να λαµβάνονται 44100 δείγµατα ανά δευτερόλεπτο. Αντίστοιχα η περίοδος
δειγµατοληψίας ισοδυναµεί µε:

περίοδος δειγµατοληψίας = 1/44100 = 22,6 x 10 sec

το οποίο πρακτικά σηµαίνει πως κάθε 22,6 εκατοµµυριοστά του δευτερολέπτου λαµβάνεται και ένα δείγµα
ήχου. Αποµένει στη συνέχεια να δούµε τι ακριβώς αφορούν οι τιµές αυτές των δειγµάτων ήχου.

2.3.3. PCM Κωδικοποίηση.

Γενικά, ο ψηφιακός ήχος ακολουθεί διάφορους τύπους κωδικοποίησης µε πιο διαδεδοµένο αυτόν της PCM
(Pulse Code Modulation). Η κωδικοποίηση αυτή χρησιµοποιεί ένα συγκεκριµένο πλήθος bit προκειµένου να
µοιράσει σε διακριτές τιµές τις διαφορετικές στάθµες πλάτους που µπορεί να έχει µια κυµατοµορφή. Για να
κατανοηθεί καλύτερα η λειτουργία αυτή, θα εξεταστεί µια περίπτωση όπου χρησιµοποιείται ένα σύστηµα
τριών bit. Τα τρία αυτά bit µπορούν να έχουν τις εξής τιµές (Πίνακας 2.4):

47
bit-3 bit-2 bit-1 τιµή

0 0 0 0

0 0 1 1

0 1 0 2

0 1 1 3

1 0 0 4

1 0 1 5

1 1 0 6

1 1 1 7

Πίνακας 2.4 Το σύνολο τιµών που µπορούν να λάβουν τρία bit.

Με βάση τον παραπάνω πίνακα οι τιµές που µπορούν να αποτυπωθούν µε τη χρήση τριών bit είναι από 0
(000) έως 7 (111), οκτώ δηλαδή διαφορετικές τιµές – στάθµες πλάτους. Κατά τη διαδικασία ψηφιοποίησης
µιας κυµατοµορφής, κάθε χρονικό στιγµιότυπο – δείγµα που λαµβάνεται από αυτή αντιστοιχείται σε µία από
τις οκτώ αυτές διαφορετικές στάθµες πλάτους (Σχήµα 2.31).

Σχήµα 2.31 Τα εννέα πρώτα δείγµατα µιας κυµατοµορφής και η αντιστοιχία τους σε στάθµες πλάτους.

Παρατηρούµε πως για τα παραπάνω εννέα δείγµατα που λαµβάνονται από την κυµατοµορφή, οι στάθµες
πλάτους που έχει διαθέσιµες το σύστηµα κωδικοποίησης των 3-bit δεν επαρκούν για να περιγράψουν σωστά
την πληροφορία. Έτσι για παράδειγµα, ενώ για τα δείγµατα 6, 8 και 9 (δ6, δ8, δ9) αντιστοιχούν τιµές οι
οποίες είναι πολύ κοντά στην πραγµατική τους στάθµη, δε συµβαίνει το ίδιο και για τα υπόλοιπα. Τα
δείγµατα αυτά θα λάβουν αναγκαστικά την πλησιέστερη δυαδική τιµή. Καταλήγουµε έτσι σε µια αρκετά
διαφοροποιηµένη πληροφορία (Σχήµα 2.32).

48
Σχήµα 2.32 Ψηφιοποιηµένη πληροφορία. Με το κόκκινο χρώµα φαίνεται η αρχική πληροφορία (αναλογικό σήµα), ενώ µε
το µαύρο χρώµα, η ψηφιακή της αποτύπωση.

Αυτό έχει σαν αποτέλεσµα την εισαγωγή θορύβου. Ο θόρυβος αυτός καλείται θόρυβος κβαντισµού
(quantization noise) (Σχήµα 2.33).

Σχήµα 2.33 Εισαγωγή θορύβου κβαντισµού – εδώ φαίνεται µε το γκρίζο χρώµα.

Μια λύση για να αποφευχθεί κάτι τέτοιο είναι το να αυξήσουµε τα bit ανάλυσης. Έτσι, εάν αυξήσουµε τα bit
ανάλυσης κατά ένα bit θα έχουµε πλέον τις εξής διαθέσιµες τιµές:

bit-4 bit-3 bit-2 bit-1 τιµή

0 0 0 0 0

0 0 0 1 1

0 0 1 0 2

0 0 1 1 3

49
0 1 0 0 4

0 1 0 1 5

0 1 1 0 6

0 1 1 1 7

1 0 0 0 8

1 0 0 1 9

1 0 1 0 10

1 0 1 1 11

1 1 0 0 12

1 1 0 1 13

1 1 1 0 14

1 1 1 1 15

Πίνακας 2.5 Το σύνολο τιµών που µπορούν να λάβουν τέσσερα bit.

Πόσες επιπλέον τιµές µπορούν να αποτυπωθούν µε το επιπλέον bit κωδικοποίησης; Δεκαέξι, ακριβώς δηλαδή
οι διπλάσιες, αφού οι προηγούµενες διαθέσιµες τιµές θα επαναληφθούν δύο φορές: µία φορά µε το επιπλέον
bit να έχει την τιµή 0 και µία ακόµη µε το επιπλέον bit να έχει την τιµή 1 (Πίνακας 2.5). Κατά αυτόν τον
τρόπο επιτυγχάνεται καλύτερη προσέγγιση των αρχικών τιµών του αναλογικού σήµατος, µε αντίστοιχη
µείωση του θορύβου κβαντισµού (Σχήµα 2.34).

Σχήµα 2.34 Αυξάνοντας το πλήθος των bit ανάλυσης περιορίζεται ο θόρυβος κβαντισµού.

Αφού για κάθε επιπλέον bit ανάλυσης προκύπτει διπλασιασµός των τιµών αποτύπωσης, ο γενικός κανόνας
υπολογισµού του πλήθους τιµών που µπορούν να αποτυπωθούν µε ένα συγκεκριµένο πλήθος bit είναι:

πλήθος τιµών n-bit κωδικοποίησης: 2n

50
Το πλήθος των bit κωδικοποίησης που χρησιµοποιούνται σε ένα ψηφιακό µέσο καλείται και bit width ή bit
depth (bit ανάλυσης ή εύρος ανάλυσης). Μια πολύ διαδεδοµένη κωδικοποίηση πληροφορίας του ψηφιακού
ήχου είναι η PCM 16-bit. Η κωδικοποίηση αυτή χρησιµοποιεί 2 byte (16 bit) κωδικοποίησης. Αυτό σηµαίνει
πως κάθε δείγµα µπορεί να λάβει 216 ή 65536 διαφορετικές στάθµες αποτύπωσης. Επειδή µάλιστα τα
δείγµατα του ήχου αναλόγως τη φάση της ταλάντωσης (θετική ή αρνητική) λαµβάνουν τόσο θετικές όσο και
αρνητικές τιµές, οι τιµές αυτές µοιράζονται ως εξής:

τιµή µέγιστου πλάτους ταλάντωσης: 32767


τιµή κατάστασης ισορροπίας: 0
τιµή µέγιστου αρνητικού πλάτους: -32768

ή σχηµατικά:

Σχήµα 2.35 Ψηφιακή αποτύπωση 16-bit.

Κάθε ένα δείγµα ήχου από τα 44100 δείγµατα σε ένα δευτερόλεπτο χρησιµοποιεί λοιπόν 2 byte τα οποία
περιέχουν την τιµή που αντιστοιχεί στο πλάτος της κυµατοµορφής την αντίστοιχη χρονική στιγµή. Από την
παραπάνω διαπίστωση µπορούµε να εξάγουµε συµπεράσµατα και για το µέγεθος ενός αρχείου ασυµπίεστου
ήχου. Έτσι, για κάθε δευτερόλεπτο ψηφιακού ήχου απαιτούνται:

44100 δείγµατα x 2 byte = 88200 byte

Εάν µάλιστα το αρχείο είναι στερεοφωνικό, οι απαιτήσεις σε χωρητικότητα διπλασιάζονται, αφού


χρησιµοποιούνται άλλα δείγµατα για το δεξί και άλλα για το αριστερό κανάλι, ισχύει δηλαδή:

44100 δείγµατα x 2 byte x 2 κανάλια = 176400 byte

ή περίπου 172,2 Kbyte για κάθε δευτερόλεπτο.


Προκειµένου να συγκρίνουµε το µέγεθος αυτό µε τα αρχεία συµπιεσµένου ήχου, µετατρέπουµε την
παραπάνω πληροφορία σε bit:

176400 x 16 = 2822400 bit/sec ή 2,69 Mbit/sec

το οποίο ως µέγεθος απέχει σηµαντικά ακόµη και από τις καλύτερες τιµές συµπίεσης που συναντάµε στις
δικτυακές πλατφόρµες γενικότερα.

51
2.3.4. Δυναµικό Εύρος (Dynamic Range).

Τι θα συµβεί στην περίπτωση που ένα ή περισσότερα δείγµατα χρειαστεί να λάβουν τιµή µεγαλύτερη από τη
µέγιστη τιµή που µπορούν να λάβουν τα bit σε µία PCM κωδικοποίηση; Στα σηµεία όπου οι τιµές πλάτους
ξεπερνούν τα όρια δυναµικής του συστήµατος, τα δείγµατα αυτά, εφόσον δεν υπάρχει άλλη διαθέσιµη τιµή,
δέχονται αναγκαστικά τη µέγιστη τιµή πλάτους ταλάντωσης. Αυτό έχει σαν αποτέλεσµα την αλλοίωση της
αρχικής πληροφορίας, την εισαγωγή δηλαδή θορύβου στο σήµα. Το φαινόµενο αυτό ονοµάζεται ψαλιδισµός
(clipping), το οποίο αποτυπώνεται και οπτικά µε την κυµατοµορφή στα σηµεία αυτά να εµφανίζεται
πεπλατυσµένη. (Εικόνα 2.2). Ο ήχος µάλιστα σε αυτές τις περιπτώσεις ακούγεται παραµορφωµένος.

Εικόνα 2.2 Στις περιοχές α και β η κυµατοµορφή ξεπερνάει τα όρια του συστήµατος (ψαλιδισµός).

Αντίστοιχα, όπως υπάρχει ένα ανώτατο όριο αποτύπωσης τιµών πλάτους, υπάρχει και ένα κατώτατο όριο
πέρα από το οποίο οι µεταβολές στο πλάτος της κυµατοµορφής δεν ανιχνεύονται. Και στην περίπτωση αυτή
έχουµε αλλοίωση της πληροφορίας, εισαγωγή δηλαδή θορύβου στο ψηφιακό σήµα. Ένα σηµαντικό
χαρακτηριστικό µέγεθος ενός ψηφιακού συστήµατος ήχου το οποίο αποτυπώνει τέτοιες συµπεριφορές είναι
το εύρος δυναµικής (dynamic range ή DR). Το µέγεθος αυτό αφορά στη λογαριθµική έκφραση του εύρους
των τιµών πλάτους ταλάντωσης που µπορεί να αποτυπώσει ένα σύστηµα χωρίς θόρυβο, χωρίς δηλαδή
αλλοίωση της αρχικής πληροφορίας. Το εύρος των τιµών αυτών εκφράζεται ως ο λόγος της ανώτατης και της
κατώτατης τιµής που µπορεί να αποτυπωθεί χωρίς αλλοίωση στο σύστηµα. Πώς όµως ορίζονται τα όρια αυτά;
Αυτό φαίνεται καλύτερα στο παρακάτω παράδειγµα όπου χρησιµοποιείται ένα σύστηµα κωδικοποίησης 4-bit.
Στο συγκεκριµένο σύστηµα έχουµε 4 διαθέσιµα bit, µε αποτέλεσµα τη χρήση 16 επιπέδων στάθµης έντασης
(Σχήµα 2.36).

52
Σχήµα 2.36 Η ηµιτονοειδής 1 εφαρµόζεται ακριβώς στα όρια του συστήµατος σηµατοδοτώντας τα µέγιστα όρια
αποτύπωσης. Αντίθετα, η ηµιτονοειδής 2 τα ξεπερνάει µε αποτέλεσµα να παρουσιάζεται το φαινόµενο του ψαλιδισµού.

Εάν θεωρήσουµε πως η απόσταση µεταξύ δύο διαδοχικών επιπέδων στάθµης ισοδυναµεί µε τιµή α, τότε η
µέγιστη τιµή δυναµικής που µπορεί να αποτυπωθεί στο σύστηµα αυτό ισοδυναµεί µε:

15 x α (Σχήµα 2.36 - κυµατοµορφή 1)

Σε κάθε άλλη περίπτωση τιµής µεγαλύτερη αυτής (> 15 x α ), η κυµατοµορφή ψαλιδίζεται (Σχήµα 2.36 -
κυµατοµορφή 2). Άρα, γενικά, η µέγιστη τιµή δυναµικής Vmax ισοδυναµεί µε:

Vmax = (N-1) x α

όπου Ν: το διαθέσιµο πλήθος των επιπέδων στάθµης έντασης

Αντίστοιχα, χρειάζεται να βρούµε την ελάχιστη δυνατή ανιχνεύσιµη τιµή πλάτους Vmin. Στο παρακάτω
σχήµα (Σχήµα 2.37) απεικονίζονται δύο κυµατοµορφές: µία στα όρια της ελάχιστης αποτύπωσης και µία µη
ανιχνεύσιµη:

Σχήµα 2.37 Η ηµιτονοειδής 1 µε πλάτος ταλάντωσης α/2 ανιχνεύεται οριακά. Αντίθετα, οποιαδήποτε άλλη µε πλάτος < α/2
δεν µπορεί να ανιχνευθεί.

53
Όπως φαίνεται και από το σχήµα, η ηµιτονοειδής 1 µε συνολικό πλάτος ισοδύναµο µε α (α/2 + α/2)
αποτυπώνεται οριακά. Δηλαδή, τα δείγµατά της θα λαµβάνουν ένα από τα εξής επίπεδα στάθµης: είτε την
τιµή 1001 κατά το µέγιστο θετικό πλάτος ταλάντωσης, είτε την τιµή 0111 κατά το µέγιστο αρνητικό πλάτος
ταλάντωσης, είτε την τιµή 1000 για κάθε άλλη χρονική στιγµή. Η αποτύπωση αυτή αν και δεν είναι
ικανοποιητική καθώς εισάγει αρκετά σφάλµατα, παρ’ όλα αυτά, έστω και οριακά, λειτουργεί. Αντίθετα, για
κάθε άλλη ταλάντωση µικρότερη από αυτήν (<α/2), όπως για παράδειγµα στην ηµιτονοειδή 2 (Σχήµα 2.37),
καµία εναλλαγή τιµών δεν µπορεί να αποτυπωθεί αφού το πλάτος ταλάντωσης δεν είναι αρκετό για να φτάσει
σε κάποια από τις δύο ελάχιστες στάθµες. Αυτό έχει σαν αποτέλεσµα η κυµατοµορφή αυτή να λαµβάνει
πάντα τιµή 1000, να µην είναι δηλαδή ανιχνεύσιµη. Το ελάχιστο λοιπόν ανιχνεύσιµο δυναµικό όριο Vmin
ισοδυναµεί µε:

Vmin = α

Το Εύρος Δυναµικής (DR) ορίζεται ως ο λογαριθµικός λόγος των δύο παραπάνω µεγεθών, ως εξής:

DR = 20 log [Vmax / Vmin]

DR = 20 log [(N - 1) x α / α]

ή DR = 20 log (N - 1)

Έτσι για το παραπάνω σύστηµα (Ν = 15), ισχύει:

DR = 20 log 15 = 23.52 dB

Γνωρίζοντας µάλιστα ήδη πως:

Ν=2

όπου m: το πλήθος των bit κωδικοποίησης, η παραπάνω σχέση µπορεί να γραφεί και ως:

DR = 20 log (2 - 1)

η οποία δηλώνει πως όσο αυξάνονται τα bit κωδικοποίησης m, τόσο αυξάνεται το δυναµικό εύρος του
συστήµατoς. Ενδεικτικά, για ένα σύστηµα 16-bit κωδικοποίησης το δυναµικό εύρος είναι ισοδύναµο µε:

DR = 20 log (2 - 1) = 20 log 65535 = 96.3 dB

2.3.5. Από τον Αναλογικό στον Ψηφιακό Ήχο: Μια Αποτίµηση.

Τα πλεονεκτήµατα από τη χρήση της ψηφιακής πληροφορίας στα συστήµατα ήχου είναι πολλά: ευκολία και
ταχύτητα στην επεξεργασία, αποθηκευτικοί χώροι µε ολοένα και µεγαλύτερες χωρητικότητες, άυλη και
ταχύτατη µεταφορά, µεγάλες ταχύτητες στην ανεύρεση πληροφορίας, µεγάλη ανεκτικότητα σε σφάλµατα και
στη φυσική φθορά, µικρότερες και ανθεκτικότερες συσκευές αναπαραγωγής. Σε συνδυασµό µε το πολύ
χαµηλό κόστος στην απόκτηση συσκευών και λογισµικού διαχείρισης, επεξεργασίας, αναπαραγωγής και
αποθήκευσής του, καθιστούν τον ψηφιακό ήχο το κυρίαρχο µέσο αποτύπωσης της µουσικής και εν γένει της
ηχητικής πληροφορίας, τόσο κατά τις καθηµερινές χρήσεις όσο και σε ένα πλήθος εξειδικευµένων τοµέων,
υπηρεσιών και διαδικασιών.
Οι παραπάνω ιδιότητες πηγάζουν από ένα καθαρά µορφολογικό χαρακτηριστικό το οποίο αφορά
στην απολύτως µινιµαλιστική φύση του: σε αντίθεση µε την αναλογική πληροφορία, η οποία συνίσταται σε
ένα πλήθος δυνατών τιµών αντιστοίχισης, κατά την ψηφιακή αποτύπωση η πληροφορία ανάγεται τελικά σε
δύο και µόνο καταστάσεις.

54
Σχήµα 2.38 Ανοχή της ψηφιακής πληροφορίας στον θόρυβο. Παρ’ όλη την έκθεση της αρχικής πληροφορίας (α) σε σήµα
θορύβου (β), η αρχική πληροφορία παραµένει (γ) εφόσον το πλάτος θορύβου δεν ξεπερνάει την τιµή α.

Σχήµα 2.39 Η ίδια περίπτωση σε αναλογικό σήµα και η εµφανής αλλοίωση (γ) της αρχικής κυµατοµορφής (α).

Ταυτόχρονα µε τα πλεονεκτήµατα που συνάγονται από αυτή τη δοµική συµπεριφορά, το θεµελιώδες αυτό
χαρακτηριστικό παρουσιάζει επίσης µειονεκτήµατα. Όσο η αναλογική πληροφορία µπορεί θεωρητικά να
απειρίζεται σε ένα συνεχές, η δυαδική αποτύπωση παραµένει στον πυρήνα της µια διακριτή πληροφορία, µια
προσεγγιστική διαδικασία σε συµβολικό επίπεδο. Εάν µάλιστα αναλογιστούµε πως η ίδια η φύση του ήχου
αποτελεί ένα συνεχές πεδίο τιµών -οι οποίες αντιστοιχούν σε διαφοροποιήσεις στην πίεση του αέρα, ο
ψηφιακός τρόπος αποτύπωσης επενεργεί ως ένας επιπλέον µετασχηµατισµός µε όσες ελλείψεις µπορεί να
επιφέρει µια τέτοια λειτουργία.

55
Σχήµα 2.40 Διάγραµµα φθοράς της αρχικής πληροφορίας σε σχέση µε τον χρόνο. Η αναλογική πληροφορία υφίσταται µία
βαθµιαία αλλοίωση (α). Αντίθετα, η ψηφιακή πληροφορία παραµένει αναλλοίωτη. Σε περίπτωση όµως φθοράς του µέσου
υπόκειται σε ολική απώλεια (β).

2.4. Ψυχοακουστικά Φαινόµενα.

2.4.1. Η Αίσθηση του Τονικού Ύψους.

Το ανθρώπινο αυτί αντιλαµβάνεται συχνότητες το εύρος των οποίων ξεκινάει από τα περίπου 15-20 Hz µέχρι
περίπου τα 20000 Hz. Γενικά, όταν µια πηγή ταλαντώνεται µε χαµηλή συχνότητα δίνει την αίσθηση ενός
µπάσου ήχου. Αντίθετα, µια πηγή η οποία ταλαντώνεται µε υψηλή συχνότητα δίνει µία αίσθηση πρίµου ήχου.
Ένα βασικό χαρακτηριστικό στην πρόσληψη του τονικού ύψους αφορά στο γεγονός πως η κλίµακα των
συχνοτήτων προσλαµβάνεται από τον άνθρωπο µε λογαριθµικό τρόπο. Αυτό σηµαίνει πως τονικά ισοδύναµα
µεταξύ τους διαστήµατα δεν έχουν την ίδια συχνοτική απόσταση στο συχνοτικό φάσµα. Έτσι, για
παράδειγµα, ενώ η απόσταση µίας οκτάβας από το C3 (ντο κάτω από το µεσαίο) σε C4 (ντο µεσαίο)
ισοδυναµεί µε 130.8 Hz, ένα ίδιο διάστηµα οκτάβας από το A3 (λα κάτω από το µεσαίο) στο A4 (λα µεσαίο)
ισοδυναµεί µε 220 Hz, ενώ το ίδιο διάστηµα µία επόµενη οκτάβα υψηλότερα (Α4 σε Α5) έχει απόσταση ίση
µε 440 Hz (Σχήµα 2.41).

Σχήµα 2.41 Το ίδιο διάστηµα της οκτάβας σε τρεις διαφορετικές περιπτώσεις και οι αντίστοιχες συχνοτικές αποστάσεις.

56
Ενώ λοιπόν κατά την ακρόαση αντιλαµβανόµαστε το ίδιο µουσικό διάστηµα, η συχνοτική απόσταση
διαφέρει. Η λογαριθµική αυτή σχέση εκφράζεται ως δύναµη του 2. Ισχύει δηλαδή πως εάν κινηθούµε από µια
οποιαδήποτε συχνότητα α µία οκτάβα υψηλότερα η νέα συχνότητα β θα ισοδυναµεί µε:

β = 2 x α (Σχήµα 2.42)

ενώ, γενικεύοντας για οποιοδήποτε πλήθος οκτάβων:

β = 2k x α, όπου k το πλήθος οκτάβων που θέλουµε να µετακινηθούµε.

Σχήµα 2.42 Συχνοτική αποτύπωση του ίδιου διαστήµατος (µίας οκτάβας) για τους φθόγγους λα. Παρατηρούµε πως για
κάθε επόµενο διάστηµα, διπλασιάζεται η αµέσως προηγούµενη συχνότητα.

Με αντίστοιχο τρόπο µπορεί να αποτυπωθεί και η συχνότητα οποιουδήποτε άλλου διαστήµατος. Έτσι, εάν
στο δωδεκαφθογγικό σύστηµα µετακινηθούµε από µία αρχική συχνότητα α κατά n ηµιτόνια η νέα συχνότητα
θα έχει τιµή:

β = 2 n/12 x α

µε ειδική περίπτωση τα δώδεκα ηµιτόνια της οκτάβας (n = 12), όπου λαµβάνουµε διπλασιασµό συχνότητας.
Ο παραπάνω τύπος υπολογισµού συχνοτήτων µπορεί να γενικευθεί και για οποιοδήποτε άλλο
µουσικό σύστηµα. Για παράδειγµα, τόσο η ελληνική εκκλησιαστική όσο και η δηµοτική µουσική αντιστοιχεί
διαστηµατικά σε ένα σύστηµα 72 διαστηµάτων. Σε µία τέτοια περίπτωση οι διαστηµατικές αποστάσεις
υπολογίζονται συχνοτικά ως δυνάµεις κλασµάτων του 72. Ισχύει δηλαδή:

β’ = 2 n/72 x α’

2.4.2. Η Αντίληψη της Έντασης: η Κλίµακα dB SPL. Υποκειµενική Ένταση


(Loudness).
Η αντίληψη της έντασης του ήχου είναι άµεσα συνυφασµένη µε το πλάτος ταλάντωσης του: όσο µεγαλύτερο
είναι το πλάτος ταλάντωσης ενός ήχου, όσο µεγαλύτερη δηλαδή πίεση ασκείται στα µόρια του µέσου που
διαδίδεται ο ήχος, τόσο εντονότερα αντιλαµβανόµαστε τον ήχο. Το ανθρώπινο αυτί είναι ικανό να ανιχνεύσει
ένα µεγάλο εύρος µεταβολών στην πίεση του µέσου που διαδίδεται ο ήχος. Συγκεκριµένα, προσλαµβάνει
διαφοροποιήσεις οι οποίες ξεκινούν από µερικές δεκάδες εκατοµµυριοστών της µονάδας µέτρησης της
πίεσης, µέχρι κάποιες χιλιάδες της ίδιας µονάδας. Η µονάδα µέτρησης πίεσης καλείται Pascal και
συµβολίζεται µε Pa (Σχήµα 2.43).

57
Σχήµα 2.43 Η µονάδα µέτρησης Pascal ισοδυναµεί µε την πίεση που ασκεί ένα σώµα µάζας 100 gr (όσο δηλαδή περίπου
ένα µήλο) σε µια επιφάνεια 1m2 όταν αυτό επιταχύνεται µε επιτάχυνση 1m/sec2, ασκεί δηλαδή δύναµη 1 Newton. Με έναν
αντίστοιχο τρόπο η µεµβράνη στο εξωτερικό τµήµα του αυτιού δέχεται δονήσεις οι οποίες µέσω µιας σύνθετης ηλεκτρο-
χηµικο-µηχανικής διαδικασίας µετατρέπονται τελικά σε σήµατα στον εγκέφαλο.

Η ελάχιστη µεταβολή στην πίεση που µπορεί να αντιληφθεί το ανθρώπινο αυτί αφορά τον ήχο ενός
κουνουπιού σε απόσταση 3 περίπου µέτρων. Η πίεση που ασκείται από µία τέτοια πηγή ισοδυναµεί µε 20 µPa
(δηλαδή 0.000020 Pa ή 20x10-6 Pa). Η πολύ µικρή αυτή τιµή αφορά ουσιαστικά την κατώτατη ανιχνεύσιµη
τιµή πίεσης από το ανθρώπινο όργανο ακοής. Το αυτί επιδεικνύει σε γενικές γραµµές µεγάλη διακριτότητα
στις πολύ µικρές αυτές τιµές. Έτσι, ταυτόχρονα µε την παραπάνω σχεδόν ανεπαίσθητη µεταβολή στην πίεση
του αέρα, µπορεί για παράδειγµα να αντιληφθεί και την πίεση που ασκείται από ένα θρόισµα φύλλων ή µία
απαλή αναπνοή, διαφοροποιήσεις οι οποίες αντιστοιχούν σε περίπου 60 εκατοµµυριοστά της µονάδας Pascal,
60 δηλαδή µPa ή 60 x 10 Pa-6. Στον αντίποδα, ανταποκρίνεται και σε µεγάλες τιµές πίεσης από πηγές οι
οποίες εσωκλείουν τεράστια ποσά ενέργειας, η άµεση έκθεση στις οποίες µπορεί όµως να προκαλέσει µόνιµες
βλάβες στην ακοή. Τέτοιες περιπτώσεις αφορούν εξαιρετικά ισχυρές πηγές όπως η έκρηξη ενός ηφαιστείου ή
ο ήχος που παράγεται από µια τουρµπίνα αεριωθούµενου και οι οποίες αντιστοιχούν σε αρκετές χιλιάδες Pa.
Μια λοιπόν κλίµακα µέτρησης της έντασης του ήχου είναι αυτή ακριβώς που καταγράφει αυτές τις
µεταβολές στην πίεση του αέρα. Με βάση τα παραπάνω παραδείγµατα η κλίµακα αυτή πρέπει να είναι σαφώς
λογαριθµική προκειµένου να ανταποκρίνεται σε µεταβολές µεγάλου εύρους και υψηλής διακριτότητας. Για
την ακρίβεια µάλιστα η κλίµακα αυτή, δεν αποτυπώνει απόλυτες τιµές πίεσης αλλά τη σύγκρισή τους µε την
ελάχιστα ανιχνεύσιµη τιµή, η οποία καλείται και πίεση αναφοράς (reference level) και όπως είδαµε
αντιστοιχεί σε 20 µPa. Η κλίµακα καλείται κλίµακα dB SPL (Sound Pressure Level) µε µονάδα µέτρησης το
decibel (dB) και ορίζεται ως:

dB SPL (re: 20 µPa): 20 x log (p1 / p0)

όπου,
p1: η τιµή πίεσης της µετρήσιµης πηγής
p0: η τιµή πίεσης αναφοράς (20 µPa)

Έτσι, για παράδειγµα, ο παραπάνω τύπος υπολογισµού για p1 ίσο µε την ελάχιστη τιµή των 20 µPa εξάγει
τιµή ίση µε 0 dB (αφού p1 = p0 και log 1 = 0), ενώ για p1 = 60 µPa εξάγει τιµή 9.5 dB. Στο άλλο άκρο της
κλίµακας, για µεγάλες δηλαδή τιµές πίεσης όπως για παράδειγµα ο ήχος ενός τουφεκιού σε απόσταση 1 m µε
πίεση ίση προς 5000 Pa, η τιµή αυτή ισοδυναµεί µε 168 dB. Κατ’ αυτόν τον τρόπο παρατηρούµε πως µε την
παραπάνω λογαριθµική διαδικασία υπολογισµού οι τιµές κανονικοποιούνται.
Ενδιαφέρον έχει επίσης να δούµε τη διαφορά που θα προκύψει στην κλίµακα των dB SPL για κάθε
διπλασιασµό στην τιµή πίεσης. Έτσι εάν µία τιµή p2 ισοδυναµεί µε 2xp1 ισχύει:

58
20 x log (p2 / p1) =
= 20 x log (2xp1 / p1) =
= 20 x (log 2) =
= 6,205

το οποίο σηµαίνει πως για κάθε διπλασιασµό στην πίεση του µέσου προκύπτει µία αύξηση των περίπου 6 dB.
Αξίζει να σηµειωθεί πως η αύξηση αυτή είναι πολλαπλασιαστική. Όταν δηλαδή σε µία εφαρµογή
επεξεργασίας ήχου αυξάνουµε την ένταση µιας πηγής κατά 25 dB, η λογαριθµική αυτή αύξηση αντιστοιχεί σε
δεκαεξαπλασιασµό της αρχικής τιµής (2 x 2 x 2 x 2).
Εκτός από την dB SPL υπάρχουν και διάφορες άλλες κλίµακες που αποτυπώνουν το µέγεθος της
έντασης ενός ήχου, αναλόγως το φυσικό µέγεθος το οποίο κάθε φορά προσµετράται. Έτσι, µε αντίστοιχο
τρόπο, µπορούν να παραχθούν κλίµακες dB οι οποίες προσµετρούν τις µεταβολές που προκαλούνται από την
ενέργεια που εκλύεται ή τη φυσική ένταση (intensity) της ηχητικής πηγής. Όλες αυτές οι κλίµακες αφορούν
αντικειµενικές µετρήσεις φυσικών µεγεθών. Υπάρχει όµως και µια πολύ σηµαντική κλίµακα η οποία
διαφοροποιείται ως προς τις παραπάνω καθώς αποτυπώνει την υποκειµενική πρόσληψη, το πόσο δηλαδή
έντονα ακούγεται µια πηγή ανεξαρτήτως φυσικών µετρήσιµων µεγεθών. Η κλίµακα αυτή καλείται κλίµακα
υποκειµενικής έντασης ή ακουστότητας (loudness) µε µονάδα µέτρησης το phon (Σχήµα 2.44).

Σχήµα 2.44 Η κλίµακα υποκειµενικής έντασης αποτυπωµένη σε καµπύλες ισοδύναµης στάθµης (equal loudness curves).

Η κλίµακα αυτή προήλθε από µετρήσεις που έγιναν σε ένα µεγάλο πλήθος υποκειµένων. Αποτυπώνει σε
καµπύλες πόσο χρειάζεται να αυξοµειώνεται η φυσική ένταση µιας ηχητικής πηγής καθώς µεταβάλλεται η
συχνότητά της, προκειµένου αυτή να ακούγεται από τα υποκείµενα το ίδιο έντονα. Η πηγή αυτή αφορά µια
ηµιτονοειδή κυµατοµορφή. Η ηµιτονοειδής ξεκινάει να πάλλεται στα 1000 Hz µε αρχικές τιµές έντασης κάθε
φορά στα 0, 10, 20, 30 dB, κ.ο.κ. Στη συνέχεια, και ενώ η αρχική τιµή έντασης µένει σταθερή, µεταβάλλεται
η συχνότητα της ηµιτονοειδούς και ζητείται από τα υποκείµενα να αξιολογήσουν σε ποια τιµή έντασης
χρειάζεται να αναπαραχθεί η ηµιτονοειδής προκειµένου να ακούγεται το ίδιο δυνατά µε την αρχική τιµή. Οι
τιµές αυτές αποτυπώνονται σε καµπύλες. Έτσι, από τις καµπύλες παρατηρούµε πως οι χαµηλές συχνότητες
χρειάζονται πολύ σηµαντική ενίσχυση για να ακούγονται το ίδιο δυνατά, για αρχικές τιµές έντασης από 0 έως
περίπου τα 70 dB και λιγότερη ενίσχυση για τιµές από 80 έως και 90 dB. Όταν η αρχική πηγή πάλλεται µε
100 dB παρατηρούµε πως η αίσθηση της υποκειµενικής έντασης συµπίπτει µε αυτήν της αντικειµενικής.
Αυξηµένες τιµές έντασης παρατηρούµε επίσης πως χρειάζονται από τα 6000 Hz και άνω, ενώ το ακριβώς
αντίθετο συµβαίνει για συχνότητες µεταξύ 1000 και 6000 Hz: στη συχνοτική αυτή περιοχή και ιδιαίτερα στα

59
4000 Hz, η αρχική πηγή χρειάζεται µείωση προκειµένου να ακούγεται το ίδιο δυνατά µε την αρχική τιµή
έντασης. Επειδή οι καµπύλες αυτές αποτυπώνουν ισοδύναµες τιµές έντασης καλούνται και καµπύλες
ισοδύναµης στάθµης (equal loudness curves).

2.4.3. Μελέτες για τη Χροιά.


Η αίσθηση η οποία αναγνωρίζει την ταυτότητα µιας ηχητικής πηγής καλείται χροιά. Μπορούµε για
παράδειγµα και ξεχωρίζουµε τον ήχο ενός κλαρινέτου από αυτόν µιας τροµπέτας ακόµη και αν τα δύο αυτά
όργανα αναπαράγουν τον ίδιο µουσικό φθόγγο (πάλλονται δηλαδή στην ίδια συχνότητα) µε την ίδια ένταση.
Τι ακριβώς είναι αυτό που διαφοροποιεί τις δύο πηγές και µας δίνει την αίσθηση προσδιορισµού τους;
Διάφορες µελέτες για το φαινόµενο της χροιάς έχουν γίνει κατά διαστήµατα προσπαθώντας να το
προσεγγίσουν όσο το δυνατόν πληρέστερα.
Η κλασική θεωρία απαντάει στο παραπάνω ερώτηµα µέσα από τη φασµατική ανάλυση: κάθε ηχητική
πηγή έχει τη µοναδική ηχητική της υπογραφή η οποία συνίσταται σε ένα µοναδικό άθροισµα ηµιτονοειδών µε
διαφορετικά ανά περίπτωση χαρακτηριστικά (Σχήµα 2.45 - 2.46).

Σχήµα 2.45 Ανάλυση στις ηµιτονοειδείς συνιστώσες ενός φθόγγου C5 από τροµπέτα.

Σχήµα 2.46 Ανάλυση του ίδιου φθόγγου C5 από κλαρινέτο.

60
Το επιπλέον στοιχείο στην κλασική αυτή διατύπωση της χροιάς είναι πως κάθε τέτοια ηµιτονοειδή δεν είναι
στατική αλλά ακολουθεί τη δική της δυναµική εξέλιξη, έχει δηλαδή το δικό της περίγραµµα δυναµικής. Ένα
περίγραµµα δυναµικής, ή αλλιώς µία περιβάλλουσα πλάτους (amplitude envelope), αποτελεί µία χρονική
συνάρτηση η οποία περιγράφει την εξέλιξη της δυναµικής ενός ήχου. Συνήθεις περιβάλλουσες πλάτους οι
οποίες χρησιµοποιούνται στην ηλεκτρονική µουσική αποτελούν η απλή ASR (Attack-Sustain-Release)
(Σχήµα 2.47) και η ADSR (Attack-Decay-Sustain-Release) (Σχήµα 2.48).

Σχήµα 2.47 Περίγραµµα δυναµικής ASR.

Σχήµα 2.48 Περίγραµµα δυναµικής ADSR.

Στους φυσικούς ήχους τα περιγράµµατα αυτά είναι σαφώς πιο σύνθετα (Εικόνα 2.3). Το ενδιαφέρον στοιχείο
στη µελέτη της χροιάς είναι πως, εκτός από το γεγονός πως το περίγραµµα κάθε αρµονικού (ή εν γένει
µερικού) τόνου ενός σύνθετου ήχου είναι µοναδικό, µπορεί επίσης να διαφοροποιηθεί σηµαντικά στην
εξέλιξη του χρόνου. Έτσι, εάν η πηγή αφορά ένα φυσικό όργανο, οι διαφοροποιήσεις αυτές µπορεί, για
παράδειγµα, να προέρχονται από διαφορετικούς τρόπους εκτέλεσης του ίδιου τόνου (εντονότερο π.χ. φύσηµα
σε ένα πνευστό), εκτελεστικές χειρονοµίες κ.ο.κ.

61
Εικόνα 2.3 Εξέλιξη περιγραµµάτων δυναµικής των πρώτων δώδεκα αρµονικών ενός τόνου από τροµπέτα (από τη µελέτη
των Grey και Moorer: Lexicon of Analyzed Tones. Part 3: The Trumpet, Computer Music Journal, Vol. 2, No. 2 (Sep.,
1978), pp. 23-31).

Νεότερες µελέτες έχουν δείξει πως σηµαντικό επίσης ρόλο στη διαµόρφωση της χροιάς παίζει και το
συνηχητικό περιβάλλον. Συγκεκριµένες τεχνικές σύνθεσης ήχου, όπως η φυσική προτυποποίηση (physical
modelling) χρησιµοποιούν αυτήν την ιδιότητα επαναδιατυπώνοντας έτσι την προσέγγιση του προβλήµατος
από τη φασµατική στη χρονική-κυµατική διάσταση του ήχου.

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Διαµαντόπουλος, Τ., Η Μουσική των Υπολογιστών. Ο Ήχος, τα Βασικά Χαρακτηριστικά του & η Γέννησή του
από τον Υπολογιστή. Αθήνα: ΙΩΝ, 2014.

Ξενόγλωσση Βιβλιογραφία.

Dodge, C., και T. A Jerse, Computer Music: Synthesis, Composition, and Performance. New York: Schirmer,
1997.
Loy, G., Musimathics: The Mathematical Foundations of Music (Volume 1). MA, USA: MIT Press, 2011.
Lyons, R. G., Understanding Digital Signal Processing. NJ, USA: Prentice Hall, 2010.
Pohlmann, K., Principles of Digital Audio. New York: McGraw-Hill/TAB Electronics, 2010.
Rossing, T. D., F. R. Moore και P. A. Wheeler, The Science of Sound. Boston: Addison-Wesley, 2001.

62
Κεφάλαιο 3
Σύνθεση µε Ηλεκτρονικό Υπολογιστή.
Σύνοψη
Το πρώτο µέρος του κεφαλαίου ασχολείται µε τις αισθητικές συνέπειες οι οποίες προκύπτουν από τη χρήση του
υπολογιστή στη µουσική δηµιουργία. Χρησιµοποιείται ένα παράδειγµα για να περιγραφούν οι µεθοδολογικές
µεταβολές στη συνθετική διαδικασία µέσω της χρήσης των ψηφιακών διατάξεων που προσφέρει η µουσική
πληροφορική. Αναλύονται τα δοµικά πρότυπα ή δοµικά επίπεδα και οι δοµικές διαδικασίες που εµπλέκονται στη
σύνθεση µουσικής µε υπολογιστή. Τέλος, παρουσιάζονται τρία εργαλεία για την οπτική αναπαράσταση του ήχου:
ο παλµογράφος, ο αναλυτής φάσµατος και ο φασµατογράφος.

Προαπαιτούµενη γνώση
Απαιτείται η κατανόηση των εννοιών του Κεφαλαίου 2.

3.1. Η Τέχνη των Υπολογιστών.


Ας ξεκινήσουµε µε κάποιες κοινές παραδοχές.

• H µουσική µε/από/για υπολογιστή (computer music ή/και computer assisted composition)


αποτελεί διεπιστηµονικό πεδίο. Συνδέει επιδιώξεις και προσεγγίσεις της τέχνης µε
µεθοδολογίες και εργαλεία προερχόµενα από τις επιστήµες (πληροφορική, ακουστική,
µηχανική, ψυχολογία κ.ά.). Στην πραγµατικότητα, το πεδίο της διεπιστηµονικής συνεργασίας
είναι τόσο ελεύθερο και ανοικτό που µπορούµε να θεωρήσουµε ότι οποιοσδήποτε
συνδυασµός της µουσικής µε κάποιο επιστηµονικό αντικείµενο είναι εφικτός, µε την έννοια
ότι ένας συνθέτης µπορεί να αντλήσει µεθοδολογικά εργαλεία από οποιοδήποτε αντικείµενο.
• Ο όρος µουσική µε/από/για υπολογιστή δεν υπονοεί καµία αισθητική τάση ή αναφορά. Όπως
και ο όρος µουσική για ορχήστρα, αναφέρεται στο µέσο από το οποίο και για το οποίο θα
παραχθεί το µουσικό έργο και όχι στο αισθητικό περιεχόµενό του. Παρόλα αυτά υπάρχει µια
διαφοροποίηση. Ο όρος µουσική για ορχήστρα περιγράφει ένα έργο το οποίο έχει γραφτεί για
µια ορχήστρα και το οποίο αναπαράγεται από την ορχήστρα. Ο όρος µουσική µε/από/για
υπολογιστή αναφέρεται όχι µόνο σε ένα έργο το οποίο υπάρχει για, και θα αναπαραχθεί από
έναν υπολογιστή, αλλά και σε ένα έργο το οποίο ίσως έχει δηµιουργηθεί από τον ίδιο τον
υπολογιστή. Εδώ παρατηρούµε µια ποιοτική αναβάθµιση. Ο ρόλος του υπολογιστή, σε σχέση
µε αυτόν της ορχήστρας ή ενός οργάνου, µπορεί να είναι δυναµικός: µπορεί ο ίδιος να
συνθέσει και να αναπαράξει ένα µουσικό έργο από τον εαυτό του και για τον εαυτό του, να
είναι ο ίδιος ο συνθέτης, ο εκτελεστής και το όργανο. Έχουµε έτσι ένα κλειστό κύκλωµα στο
οποίο η παραγωγή και η εκτέλεση του µουσικού έργου µπορεί να πραγµατοποιηθεί από το
ίδιο µέσο. Λείπει όµως ένα βασικό στοιχείο: ο υπολογιστής δεν µπορεί να λάβει µέρος στη
βιωµατική αντίληψη του έργου, δεν µπορεί δηλαδή να ακούσει και να κρίνει την αισθητική
ποιότητα ενός έργου µε τον τρόπο µε τον οποίο ο συνθέτης ή ο εκτελεστής ενός οργάνου
µπορεί να το πράξει.
• Η άποψη ότι ο υπολογιστής δεν εντάσσεται στην ευρύτερη οικογένεια των µουσικών
οργάνων έχει µικρή βαρύτητα για τους παραπάνω συλλογισµούς. Καθώς οι υπολογιστές δεν
κατασκευάστηκαν αρχικά για τη δηµιουργία µουσικής (ούτε άλλωστε για την επεξεργασία
κειµένου) αλλά για µετρήσεις βαλλιστικών βολών του στρατού, δεν αποτελούν µέρος της
παραδοσιακής οικογένειας των µουσικών οργάνων. Προσφέρουν όµως ένα µέσο ή εργαλείο
για την παραγωγή, επεξεργασία και αναπαραγωγή του ηχητικού υλικού.

Στη σηµερινή εποχή της πληροφορίας (εποχή ψηφιακών και ασύρµατων µέσων), η έννοια του µουσικού
έργου και γενικότερα της µουσικής δηµιουργίας, χρειάζεται για µια ακόµη φορά αναθεώρηση. Η ανάπτυξη
των σύγχρονων τεχνολογιών παραγωγής, διαχείρισης και διάθεσης πληροφοριών επηρέασε σηµαντικά την
καθηµερινότητα των δυτικών κοινωνιών, µέρος της οποίας είναι η µουσική δηµιουργία. Το µουσικό έργο δεν
µπορεί πια να νοηθεί ως ένα συγκεκριµένο αγαθό που δηµιουργείται σε συγκεκριµένο χώρο, από ένα

63
συγκεκριµένο άτοµο, κωδικοποιείται σε σύµβολα (παρτιτούρα), αποθηκεύεται σε κάποιο µέσο εγγραφής
(δίσκο βινυλίου, συµπαγή δίσκο-CD, σκληρό δίσκο κ.ά.) και διατίθεται αυτούσιο στο κοινό. Το έργο σήµερα,
είναι η χρήση των πληροφοριών που το συνθέτουν.
Ποιά είναι τα εργαλεία που χρησιµοποιούνται σήµερα στη µουσική δηµιουργία και πώς την
επηρεάζουν; Ποιά είναι τα µέσα που επιλέγουν οι δηµιουργοί της µουσικής για να επικοινωνήσουν µε το
κοινό τους; Πώς δηµιουργείται σε αυτό το σηµείο η διάδραση µεταξύ δηµιουργών, µέσων και κοινού;

3.1.1. Μουσική Πληροφορική.

Οι αιώνες της γραπτής µουσικής παράδοσης στον Δυτικό πολιτισµό βασίστηκαν στο δίπολο συνθέτης-
εκτελεστής. Ο συνθέτης κατέγραφε τη µουσική του σκέψη σε ένα χαρτί, του οποίου τα σύµβολα ερµήνευε ο
µουσικός-εκτελεστής. Το ξεκάθαρο αυτό δίπολο µετακινείται σήµερα σε µια περιοχή στην οποία όχι µόνο οι
ρόλοι συνθέτη-εκτελεστή αποδοµούνται, αλλά και η ίδια η σηµασία του µουσικού έργου µεταµορφώνεται.
Τα όργανα δεν εξελίσσονται πια µηχανικά, όπως συνέβαινε µέχρι πρόσφατα, αλλά µέσω των
εργαλείων που προσφέρει η επιστήµη της πληροφορικής. Η αναζήτηση νέων ηχοχρωµάτων και η εφαρµογή
καινοτόµων µεθόδων στη σύνθεση νέων έργων, όπως για παράδειγµα η µοριακή δοµή του πετάλου ενός
λουλουδιού, οι νόµοι που διέπουν την κίνηση των υγρών ή των αερίων, η θεωρία του χάους, η Τεχνητή
Νοηµοσύνη, η Θεωρία των Παιγνίων κ.ά. απαιτούν από τη µουσική τέχνη να συµβαδίσει και να ενσωµατώσει
την τεχνογνωσία που παράγουν οι θετικές επιστήµες και η επιστήµη της Πληροφορικής. Αυτό άλλωστε, σε
ένα µεγάλο βαθµό, διαφαίνεται και από το γεγονός ότι οι πανεπιστηµιακές µουσικές σπουδές τείνουν να
ενσωµατώσουν στο αντικείµενό τους τοµείς των θετικών επιστηµών. Για µια ακόµη φορά, η Τέχνη αναζητά
τη µεθοδολογία της, αλλά και την αιτιολόγηση της ύπαρξής της, στην Επιστήµη. Με µια πολύ σηµαντική
όµως διαφορά που ξεχωρίζει τη σηµερινή από όλες τις προηγούµενες εποχές: τη συγχρονικότητα.

3.1.2. Συγχρονικότητα.

Πριν αναφερθώ σε ένα συγκεκριµένο παράδειγµα σύγχρονης µουσικής δηµιουργίας και στα ερωτήµατα που
αυτή προβάλλει, θα εξετάσω σύντοµα την έννοια της συγχρονικότητας, απαραίτητη προϋπόθεση για να
κατανοήσουµε πώς τα ψηφιακά µέσα χρησιµοποιούνται για την παραγωγή µουσικών έργων και ποιός είναι ο
πολιτιστικός αντίκτυπος αυτής της χρήσης. Ο ανθρωπολόγος Marc Augé (1999) επισηµαίνει ότι:

…στις µέρες µας ο πλανήτης έχει γίνει…ο ορίζοντας και το


πλαίσιο αναφοράς όλων των ανθρώπινων όντων και ότι οι
τεχνολογικές ανατροπές που επηρεάζουν ολόκληρη τη γη έχουν
φυσικά επιπτώσεις τόσο στον τρόπο µε τον οποίο γίνεται η
παρατήρηση όσο και στο αντικείµενό της, που διαρκώς
ανασυγκροτείται42.

Η αναφορά στις τεχνολογικές ανατροπές, στη µεθοδολογία της παρατήρησης και στην ανασυγκρότηση του
αντικειµένου της σχετίζεται και µε τη µουσική δηµιουργία: η παραγωγή του ήχου, οι επεξεργασίες που αυτός
υφίσταται στο στούντιο, η µορφοποίησή του σε καλλιτεχνικό προϊόν (µουσικό έργο), η αποθήκευσή του σε
κάποιο µέσο, η αναµετάδοση και η διακίνησή του επηρεάζονται σαφώς από τις νέες τεχνολογίες και από τον
βαθµό που αυτές ανατρέπουν τις παλαιότερες. Ένα παράδειγµα που δείχνει την αλληλεπίδραση όλων των
προηγούµενων περιπτώσεων είναι η αλλαγή κατά καιρούς των µέσων στα οποία εγγράφεται η µουσική. Στα
τελευταία µόνο χρόνια, ο δίσκος βινυλίου έδωσε τη θέση του στον συµπαγή δίσκο (CD) και αυτός, σιγά αλλά
σταθερά, σε σκληρούς δίσκους παντός τύπου και αποθηκευτικούς τόπους στο διαδίκτυο. Οι αλλαγές από τους
αναλογικούς στους ψηφιακούς τρόπους αποθήκευσης του ήχου, ανέδυαν πάντα ερωτήµατα σχετικά µε το
ποιος από αυτούς τους τρόπους αποδίδει µε µεγαλύτερη πιστότητα το φυσικό ηχητικό φαινόµενο. Το
πέρασµα όµως από τον συµπαγή δίσκο στα µικροσκοπικά µέσα αποθήκευσης όπως τα MP3 players (αλλά και
σε διαδικτυακούς τόπους), τα οποία χρησιµοποιούν µόλις το 10% του αποθηκευτικού χώρου που χρειάζεται
ένα CD, µετέφερε τη συζήτηση από την πιστότητα στη χωρητικότητα και από τη διατήρηση της φασµατικής

64
ποιότητας στην ευκολία της διαχείρισης και της µεταφοράς του ηχητικού-µουσικού υλικού. Αν και η διαµάχη
µεταξύ πιστότητας και χωρητικότητας δεν αποτελεί αντικείµενο αυτού του κεφαλαίου, αρκεί να αναφέρουµε
ότι συνέπεια της τεχνολογίας των MP3 players, που δίνει έµφαση στην ποσότητα αποθήκευσης και όχι τόσο
στην πιστότητα, αφού τα αποθηκευµένα αρχεία είναι συµπιεσµένα, είναι η αλλαγή σε όλες τις διαδικασίες
παραγωγής και αναπαραγωγής του µουσικού έργου43.
Επιστρέφοντας στην έννοια της συγχρονικότητας ξανασυναντούµε τον Marc Augé (1999) που µας
θυµίζει ότι ζούµε σε µια

…εποχή τεχνολογικής επανάστασης στον τοµέα των


επικοινωνιών…[που] χαρακτηρίζεται από µια τριπλή υπερβολή που
επηρεάζει τον χρόνο, τον χώρο και τις κοινωνικές σχέσεις: η
ιστορία επιταχύνεται, ο πλανήτης συρρικνώνεται, τα πεπρωµένα
εξατοµικεύονται…ο ίδιος ο κόσµος διαφοροποιείται και
πολλαπλασιάζεται44.

Στη συνέχεια του κειµένου του, ο συγγραφέας αναπτύσσει την εξής άποψη:

…ζούµε µια «επιτάχυνση της ιστορίας» – άλλη έκφραση της


«συρρίκνωσης του πλανήτη»… – η οποία προκύπτει ταυτόχρονα από
τις αντικειµενικές αλληλεπιδράσεις µέσα στο «σύστηµα-κόσµος»
και από τον ακαριαίο χαρακτήρα της πληροφόρησης και της
διάχυσης των εικόνων. Κάθε µήνα, σχεδόν κάθε µέρα, ζούµε
ιστορικά γεγονότα, µε συνέπεια τα όρια µεταξύ ιστορίας και
επικαιρότητας να γίνονται καθηµερινά πιο ασαφή. Οι παράµετροι
του χρόνου, όπως εκείνες του χώρου, γνωρίζουν µια εξέλιξη,
µια επανάσταση χωρίς προηγούµενο. Η νεωτερικότητά µας
δηµιουργεί άµεσο παρελθόν και ιστορία, µε τρόπο αχαλίνωτο,
όπως δηµιουργεί και ετερότητα, την ίδια στιγµή που
διατείνεται ότι σταθεροποιεί την ιστορία και ενοποιεί τον
κόσµο45.

Η ανάπτυξη των τηλεπικοινωνιών απελευθερώνει την πράξη της µουσικής δηµιουργίας από τους
περιορισµούς του χρόνου και του χώρου

…δηµιουργώντας στην πράξη τις συνθήκες της ταυτοχρονικότητας


και της πανταχού παρουσίας. Η εδραίωση στον κόσµο ισχυρών
τεχνολογικών πόρων που συνδέονται στενά µεταξύ τους,
σχετικοποιεί την έννοια του συνόρου…46.

Η παγκόσµια διάσταση που συχνά λαµβάνουν τοπικά καλλιτεχνικά γεγονότα, κυρίως µέσω της διασποράς
τους από τα τηλεπικοινωνιακά δίκτυα και το διαδίκτυο, µας αναγκάζει να µετατρέπουµε συνεχώς την
κλίµακα της παρατήρησης αυτών των γεγονότων, αλλά και τους τρόπους µε τους οποίους τα αφοµοιώνουµε
και τα εντάσσουµε στην πολιτισµική µας καθηµερινότητα. Την ίδια στιγµή που αυτά τα γεγονότα
δηµιουργούνται σε ένα στενά καθορισµένο γεωγραφικό τόπο (αίθουσα συναυλιών, στούντιο µετάδοσης
ραδιοφωνικών εκποµπών, τόποι ψυχαγωγίας), γίνονται κτήµα µιας παγκόσµιας κοινότητας που εµπεριέχει
όµως συχνά διαφορετικά και αντιφατικά χαρακτηριστικά. Αυτός ο δυϊσµός τοπικού και παγκόσµιου
δηµιουργεί την πολυµορφία αλλά και την πολυπλοκότητα της σηµερινής µουσικής τέχνης. Η πολυµορφία
αναπαράγεται µέσω διαδικασιών ρήξης µε τις παραδοσιακές πρακτικές: ενώ οι µουσικοί συνεχίζουν να
παίζουν – µε τον έναν ή τον άλλον τρόπο – τα όργανά τους, το ακροατήριό τους περιλαµβάνει δυνητικά το

65
σύνολο του πλανήτη και όχι απλά τους ακροατές που µπορεί να χωρέσει µια αίθουσα συναυλιών. Την ίδια
στιγµή που οι µουσικοί εκπέµπουν την ετερότητά τους µέσω της µουσικής τους, το διαδίκτυο «πακετάρει»
αυτήν την ετερότητα σε ένα προϊόν που, δυνητικά, απευθύνεται σε όλους. Ένας ακροατής λοιπόν, µπορεί να
λάβει αυτό το προϊόν από το σαλόνι του σπιτιού του στον Καναδά και ένας άλλος από το κινητό του
τηλέφωνο σε µια παραλία ενός µικρού νησιού στη Μεσόγειο. Το προϊόν αυτό καλείται να διαφυλάξει την
ετερότητά του κινούµενο µέσα σε ένα ταυτοποιητικό και ενοποιηµένο σύµπαν. Παρατηρώντας αυτόν τον
απόλυτο µοντερνισµό και τη συγχρονικότητα που παρέχει η τεχνολογία και το διαδίκτυο, αντιλαµβανόµαστε
την πολυπλοκότητα µέσα στην οποία αναπτύσσεται και καταναλώνεται το καλλιτεχνικό έργο. Οι
παρελθούσες εποχές δεν ήταν ενδεχοµένως απλούστερες από τη σηµερινή, οι κοινωνίες τους όµως είτε δεν
επικοινωνούσαν καθόλου είτε επικοινωνούσαν ελάχιστα. Η τεράστια καθηµερινή παραγωγή µουσικής, η
άµεση διακίνησή της, η δυνατότητα πρόσβασης και χρήσης της από τον χρήστη-ακροατή δηµιουργεί µια
ανεξέλεγκτη πολυµορφία που δεν είναι δυνατό να ερµηνευτεί από τις παραδοσιακά συντηρητικές µουσικές
θεωρίες. Η σηµερινή κατάσταση της συγχρονικότητας, της πολυµορφίας και της πολυπλοκότητας δεν
υποτάσσεται στα µεγάλα και παγιωµένα ερµηνευτικά σχήµατα του παρελθόντος. Αντίθετα, τα υποσκάπτει
συνεχώς γιατί η αναγνώριση της ποικιλίας της απαγορεύει κάθε απόπειρα συνολικής σύλληψης και
οµογενοποίησης.

3.1.3. Η Έννοια του Μουσικού Έργου.

Στο σηµείο αυτό, θα εξετάσουµε µια περίπτωση47 η οποία καταδεικνύει την πολυπλοκότητα που προκαλούν
τα σύγχρονα ψηφιακά µέσα δηµιουργίας και τον τρόπο µε τον οποίο επηρεάζουν τόσο την έννοια του
µουσικού έργου όσο και τα µορφικά και αισθητικά χαρακτηριστικά του. Στην Εικόνα 3.1 παρατηρούµε έναν
από τους σύγχρονους τύπους κωδικοποίησης ενός µουσικού έργου. Πρόκειται για τη σύνταξη ενός
αλγορίθµου-παρτιτούρας48, από τον φοιτητή Παναγιώτη Αµελίδη, στο γραφικό περιβάλλον µουσικού
προγραµµατισµού Max49. Η συγκεκριµένη παρτιτούρα, αν και σχετικά απλή, επιλέχθηκε γιατί δείχνει την
τάση αποµάκρυνσης πολλών νέων δηµιουργών από την παραδοσιακή γλώσσα της µουσικής γραφής και την
υιοθέτηση εργαλείων που προέρχονται από την πληροφορική και γενικότερα από τις θετικές επιστήµες.

Εικόνα 3.1 Patch σε περιβάλλον Max 5 του Παναγιώτη Αµελίδη (άδεια χρήσης από τον συνθέτη).

66
Είναι φανερό από την πρώτη µατιά ότι αυτός ο τύπος κωδικοποίησης διαφέρει από τη γνωστή σε όλους
παρτιτούρα µε τα πεντάγραµµα, τις νότες και τα ονόµατα των µουσικών οργάνων. Πρόκειται για µια
διακλάδωση, ή κατανοµή πληροφοριών, από το πάνω προς το κάτω µέρος της σελίδας. Ο ήχος ενός οργάνου,
στην περίπτωσή µας του φλάουτου, εισέρχεται µέσω ενός µικροφώνου σε έναν µετατροπέα αναλογικού
σήµατος σε ψηφιακό. Αφού µετατραπεί σε ψηφία του δυαδικού συστήµατος, µεταφέρεται στη συνέχεια µέσω
των µαύρων καλωδίων στα διάφορα αντικείµενα50 για να υποστεί επεξεργασία και να ενισχυθεί, πριν
καταλήξει σε έναν άλλο µετατροπέα ψηφιακού σήµατος σε αναλογικό και σταλεί στα ηχεία. Περιγράφοντας
την παρτιτούρα του, ο συνθέτης αναφέρει ότι δηµιουργήθηκε για µια συναυλία µε φλάουτο και
ηλεκτρονικούς ήχους. Ο ήχος του φλάουτου διοχετεύεται σε ένα αντικείµενο του αλγόριθµου (fiddle~)51, το
οποίο τον αναλύει και υπολογίζει τα επιµέρους συστατικά του φάσµατός του. Στη συνέχεια, το ηχητικό σήµα
από το φλάουτο πηγαίνει σε έναν επιλογέα (select) όπου επιλέγονται συγκεκριµένα τονικά ύψη από το φάσµα
του, τα οποία ελέγχουν όλες τις παραµέτρους ενός άλλου αντικειµένου (munger~), που µε τη σειρά του
εφαρµόζει µικροδοµικές επεξεργασίες (granulation) στον ήχο του φλάουτου. Έτσι, το φλάουτο αποτελεί όχι
µόνο την ηχητική πηγή για το ίδιο το έργο, αλλά και το εργαλείο µε το οποίο ελέγχεται ο αλγόριθµος-
παρτιτούρα. Θα µπορούσε κανείς να αναλύει τεχνικά και για πολλή ώρα το τι συµβαίνει και το τι θα
µπορούσε να συµβεί κάτω από διαφορετικές συνθήκες λειτουργίας του αλγορίθµου. Για παράδειγµα, τι θα
συνέβαινε αν άλλαζε καθ’ οιονδήποτε τρόπο η ροή των πληροφοριών ανάµεσα στα αντικείµενα του
αλγορίθµου; Ή, τι θα συνέβαινε αν ο επιλογέας (select) επέλεγε άλλα αντί των συγκεκριµένων τονικών υψών;
Αν τελικά αποφασίζαµε να µη χρησιµοποιήσουµε το φλάουτο αλλά κάποιο άλλο όργανο, κρατώντας όµως
τον ίδιο αλγόριθµο-παρτιτούρα, ποιές θα ήταν οι διαφορές; Όλες αυτές οι πιθανότητες αναφέρονται στη ροή
και στη χρήση των πληροφοριών που θα διακινηθούν µέσα στον αλγόριθµο. Μπορούµε να υποθέσουµε έναν
αριθµό τέτοιων πιθανοτήτων, αγνοώντας σίγουρα έναν πολλαπλάσιο αριθµό τους. Σε καµία περίπτωση όµως,
κοιτώντας την παρτιτούρα του Αµελίδη, δεν µπορούµε να περιγράψουµε το ίδιο το έργο, το πώς αυτό θα
ακουστεί. Αυτό γιατί, το σύµπαν των πιθανοτήτων που αυτή η παρτιτούρα προσφέρει, αντιστοιχεί σε ένα
σύµπαν πιθανών µουσικών έργων. Αν δεχτούµε ότι η παρτιτούρα είναι µια συγκέντρωση οδηγιών, τότε όλα
εξαρτώνται από το πώς κάποιος θα χρησιµοποιήσει αυτές τις οδηγίες. Στην περίπτωση της παραδοσιακής
παρτιτούρας, η κωδικοποίηση της σκέψης του συνθέτη σε σύµβολα πάνω στο χαρτί, γίνεται µε τέτοιον τρόπο
ώστε κάθε φορά που παίζεται το έργο του, να µένει ανεπηρέαστο από τις όποιες παρεµβατικές επιλογές του
εκτελεστή. Το σηµαντικό εκεί είναι το ίδιο το έργο, µοναδικό, αναλλοίωτο, ένα κορυφαίο δείγµα της
ανθρώπινης σκέψης. Πάνω σε αυτό το δεδοµένο στηρίχθηκαν όλες οι µέχρι τώρα αισθητικές προσεγγίσεις
των έργων τέχνης: στο γεγονός ότι το έργο παραµένει το ίδιο (µε µικρές ίσως µεταλλαγές) στους αιώνες και,
άρα, κάποιος µπορεί να το ακούει συχνά το ίδιο και απαράλλακτο, να το εξετάζει, να το αναλύει και τελικά
να εκφέρει άποψη για αυτό. Γενεές θεωρητικών της τέχνης εκπαιδεύτηκαν µε αυτόν τον συλλογισµό, σχολές
ιστορικών και µουσικολόγων ανεπτύχθησαν στην κληρονοµιά του γραπτού πολιτισµού που αρέσκεται να
κωδικοποιεί λεπτοµερώς τη σκέψη του.
Στο παράδειγµα όµως της παρτιτούρας του Αµελίδη δεν έχουµε να κάνουµε µε τη µεταφορά της
συνειδητής σκέψης του συνθέτη σε ένα γραπτό σύστηµα (παραδοσιακή παρτιτούρα) που θα τη διατηρήσει
και θα την αναπαράγει αναλλοίωτη ακόµη και µετά από αναρίθµητες συναυλίες και επανεκδόσεις, αλλά µε
ένα µηχανισµό οδηγιών, που περιγράφει µεν τη σκέψη του συνθέτη, αλλά όχι το µουσικό έργο. Άλλωστε,
κάθε φορά που αυτό θα εκτελείται θα είναι διαφορετικό ανάλογα µε τη χρήση των παραµέτρων του
αλγορίθµου και τους ήχους ή τα όργανα που θα χρησιµοποιηθούν. Το σηµαντικό σε αυτήν την περίπτωση
είναι ότι το έργο δεν υφίσταται σε µια γραµµική χρονική εξέλιξη µε αρχή, τέλος, προαποφασισµένη διάρκεια,
και προσεκτικά τακτοποιηµένα ενδιαµέσως όλα τα δοµικά και µορφικά του στοιχεία, όπως τα ρυθµικά και
µελωδικά µοτίβα, οι δυναµικές, οι ηχοχρωµατικοί συνδυασµοί κ.ά. Υπάρχει σε µια µη προβλέψιµη
κατάσταση που συχνά περιέχει και στοιχεία τυχαιότητας, κατά την οποία το έργο θα µπορούσε να ξεκινήσει
και να τελειώσει οποιαδήποτε στιγµή, να χρησιµοποιήσει οποιαδήποτε ηχοχρώµατα και να εξελιχθεί
σύµφωνα µε αποφάσεις που λαµβάνονται τη στιγµή της εκτέλεσής του. Παρότι ο συνθέτης προσθέτει έναν
προγραµµατικό χαρακτήρα ενσωµατώνοντας στην παρτιτούρα του σκέψεις όπως, «πάλη µε τα κύµατα»,
«τρικυµία», «βυθός» κ.ά. το έργο δεν είναι ούτε µορφικά ούτε αισθητικά προαποφασισµένο. Κατά συνέπεια,
η παρτιτούρα του Αµελίδη δεν είναι ένα έργο µε τον κοινά αποδεκτό ορισµό της λέξης, αλλά ένα σύστηµα
διακίνησης πληροφοριών, ένα µοντέλο οδηγιών για το πώς θα µπορούσε να είναι ένα έργο. Από αυτήν την
άποψη, θα µπορούσε να λειτουργήσει σαν ένα εγχειρίδιο για τη δηµιουργία πολλαπλών και διαφορετικών

67
µορφικών κατασκευών µε αποκλίνουσες αισθητικές. Τελικά, το ποιο έργο θα ακουστεί στη συναυλία θα
εξαρτηθεί από ποιες και τι είδους πληροφορίες θα διακινηθούν από τα µαύρα καλώδια που ενώνουν τα
διαφορετικά τµήµατα του αλγορίθµου. Μήπως λοιπόν, αυτή η διακίνηση των πληροφοριών είναι πιο
σηµαντική από το ίδιο το έργο; Μήπως ταυτίζεται µε το έργο;

3.1.4. Φαινόµενα Οµογενοποίησης και Αφαίρεσης.

Αυτά τα ερωτήµατα µας οδηγούν στη διατύπωση της παρακάτω άποψης. Η ψηφιακή τεχνολογία που
χρησιµοποιείται στη µουσική δηµιουργία, αν και συχνά εξαιρετικά περίπλοκη, παίζει ένα ρόλο απλοποιητικό:
προκαλεί φαινόµενα οµογενοποίησης. Σήµερα, η µεγάλη πλειοψηφία των µουσικών σε όλον τον πλανήτη
χρησιµοποιεί τα ίδια τεχνολογικά µέσα για τη δηµιουργία και τη διακίνηση της µουσικής, ανεξάρτητα από το
είδος της. Το σύνολο του υλισµικών και των λογισµικών πακέτων που χρησιµοποιούνται στην ηχογράφηση,
στη σύνθεση, στα διάφορα στάδια ηχητικής επεξεργασίας και στην αναπαραγωγή της µουσικής, παράγεται
από συγκεκριµένες εταιρίες που το διακινούν παγκόσµια. Το γεγονός ότι η τιµή αγοράς τέτοιων πακέτων
είναι σχετικά προσιτή, οδήγησε σε ένα είδος «εκδηµοκρατισµού» της µουσικής δηµιουργίας και της
διακίνησής της: οποιοσδήποτε µουσικός, σε οποιοδήποτε µέρος του κόσµου µπορεί να συνθέσει οποιοδήποτε
είδος µουσικής θελήσει στο σπίτι του και να το διακινήσει από εκεί. Η χρήση όµως της ίδιας τεχνολογίας52
από όλους οµογενοποιεί, σε ένα µεγάλο βαθµό, αισθητικά τη µουσική: κάποιο συγκεκριµένο λογισµικό
µπορεί να εκτελέσει έναν πεπερασµένο αριθµό λειτουργιών, «χρωµατίζοντας» τελικά τον ήχο που παράγει
εξαιτίας των αλγορίθµων που χρησιµοποιεί. Για παράδειγµα, κάποιο εφέ που προσθέτει αντήχηση στη
µουσική χρωµατίζει µε τον ίδιο τρόπο µια φωνή κλασσικού τραγουδιού και ένα αφρικάνικο κρουστό. Αυτή η
οµογενοποίηση οδηγεί πολύ συχνά σε µουσικές «ίδιου χρώµατος» και υποτάσσει την αισθητική ελευθερία
του δηµιουργού, την ίδια στιγµή που ενοποιεί τις µουσικές κοινότητες. Αρχικά αναλύοντας και στη συνέχεια
αντιδρώντας σε αυτό το φαινόµενο, πολλοί δηµιουργοί επιλέγουν να χρησιµοποιήσουν την ψηφιακή
τεχνολογία µε έναν αφαιρετικό τρόπο. Γυρίζοντας πίσω στην παρτιτούρα του Αµελίδη, παρατηρούµε ακριβώς
αυτό: ένα έργο που δεν έχει κανένα ιδιωµατικό γνώρισµα, κανέναν προκαθορισµένο και χρωµατισµένο ήχο,
καµία µορφική και δοµική βεβαιότητα. Αντίθετα, αρκείται σε µία βασική, οικουµενική και αρχετυπική αξία:
στείλε όποιον ήχο θέλεις στον αλγόριθµο και διακίνησε όποιες πληροφορίες θέλεις. Το µοντέλο είναι εδώ,
έτοιµο να δεχτεί ένα σύµπαν πληροφοριών. Είτε στείλουµε το νιαούρισµα µιας γάτας, είτε το σόλο ενός
φλάουτου, οι πληροφορίες θα διακινηθούν, το έργο θα γεννηθεί.

3.1.5. Αφαιρετικός Ρεαλισµός.

Η εκτεταµένη χρήση υπολογιστών και ψηφιακών διατάξεων επέφερε αναπόφευκτες και δραµατικές αλλαγές
στη µουσική δηµιουργία και στη σχέση των ακροατών µε αυτή. Εάν συνυπολογίσουµε την τεράστια διάδοση
του διαδίκτυου, τότε αντιµετωπίζουµε ένα πρωτόγνωρο ιστορικά δίκτυο από µηχανές και µέσα που παράγουν
και διακινούν τα µουσικά έργα. Ο υπολογιστής παίζει εδώ έναν κεντρικό ρόλο. Αν και δεν αναφέρεται στη
µουσική, ο Peter Rechenberg (1992) στο βιβλίο του «Εισαγωγή στην Πληροφορική» επισηµαίνει:

Το γεγονός ότι ο υπολογιστής είναι εργαλείο για τη δηµιουργία


µοντέλων και την προσοµοίωση των πιο διαφορετικών διεργασιών
µε τρόπο που αφήνει πολύ πίσω οποιαδήποτε άλλη µέθοδο
δηµιουργίας µοντέλων έχει εκτεταµένες συνέπειες…Οι
δυνατότητες χρήσης του για προσοµοίωση δείχνουν ότι ο
υπολογιστής είναι κάτι πολύ περισσότερο από απλή µηχανή
επεξεργασίας δεδοµένων, ότι µέσα σε ένα γενικό σύστηµα
ανθρώπων, µηχανών και υπολογιστών µπορεί να παίξει πολλούς
ρόλους και να υποκαταστήσει πολλές πτυχές της
πραγµατικότητας53.

68
Η φράση «δηµιουργία µοντέλων» µας προσφέρει εδώ τη βασική αιτιολόγηση της χρήσης του ηλεκτρονικού
υπολογιστή στη µουσική δηµιουργία. Αυτό που αναπαρίσταται όµως µε αυτά τα µοντέλα δεν είναι κάποια
χαρακτηριστικά ή συµπεριφορές µιας συγκεκριµένης διεργασίας, αλλά µια αφηρηµένη και γενικευµένη
σκέψη: οτιδήποτε θεωρούµε ότι ισχύει σε µια συγκεκριµένη περίπτωση (ήχος του φλάουτου που υφίσταται
επεξεργασία από την παρτιτούρα-αλγόριθµο), µπορεί να γενικευθεί σε καθολικό χαρακτηριστικό όλων των
πιθανών αντίστοιχων περιπτώσεων (όλοι οι πιθανοί ήχοι που υφίστανται επεξεργασία από την παρτιτούρα-
αλγόριθµο). Η σηµερινή ψηφιακή µουσική τέχνη προσεγγίζει την ατοµική εµπειρία της ανθρώπινης σκέψης
απορρίπτοντας την αναζήτηση της µιας, ιδανικής και τέλειας φόρµας. Οδηγείται έτσι σε έναν αφαιρετικό
ρεαλισµό για να εκφράσει περισσότερο µια πρόθεση παρά ένα σύνολο συγκεκριµένων χαρακτηριστικών. Το
συγκεκριµένο ενδιαφέρει µόνο στον βαθµό που αντανακλά το γενικό. Αυτός ο εκτοπισµός του ιδεαλισµού,
που παλαιότερα εξέφραζε την επιθυµία να προσεγγιστεί η µορφική τελειότητα στο συγκεκριµένο, δηλώνει
σήµερα το ενδιαφέρον για την ποικιλία που προσφέρει η σκέψη. Η ατοµικότητα είναι πιο ελκυστική από την
τελειότητα, ο ρεαλισµός πιο πρόσφορος από τον ιδεαλισµό. Το «κυνικό αυτί» κουρδίζεται σήµερα στους
σκληρούς ήχους της καθηµερινότητας απορρίπτοντας την αρµονία, τη µορφική ολοκλήρωση, την ιδανική
τελειότητα. Χρησιµοποιώντας µε ευκολία τα ψηφιακά µέσα, η νέα γενιά των µουσικών δηµιουργών, φαίνεται
να εµπαίζει τη λόγια τέχνη του παρελθόντος, κατεδαφίζοντας το κεντρικό της οικοδόµηµα: την αναζήτηση
του τέλειου54 έργου τέχνης. Με αυτήν την έννοια, µπορούµε ίσως να διακρίνουµε κάποια παιχνιδιάρικα
στοιχεία από το ελληνιστικό ροκοκό55 στην ψηφιακή µουσική τέχνη: στοιχεία που εκπροσωπούν το ατοµικό,
την καθηµερινότητα και την αποµάκρυνση από το ιδεατό56.
Τείνουµε λοιπόν να ανάγουµε ως περισσότερο σηµαντική την ικανότητα της σκέψης µας να
παρατηρεί, να αναλύει, να εξάγει συµπεράσµατα και στη συνέχεια να γενικεύει δηµιουργώντας µοντέλα που
θα χρησιµοποιηθούν στη δηµιουργία µουσικών έργων, παρά τη φυσική µαστοριά της κατασκευής ενός
ανεξάρτητου και αναλλοίωτου έργου. Η πολυπλοκότητα στην οποία αναφερθήκαµε πιο πάνω, εστιάζεται σε
αυτήν ακριβώς την ικανότητα της σκέψης που, λόγω της βελτίωσης των µέσων διερεύνησης και υπολογισµού
(ψηφιακά συστήµατα, υπολογιστές), γίνεται ολοένα και πιο πολύπλοκη καθώς έρχεται αντιµέτωπη µε µια
πραγµατικότητα που αντιστέκεται στα πολύ απλά εργαλεία παρατήρησης και καταγραφής της. Έτσι, αυτό
που προσφέρεται ως µουσικό έργο (στην περίπτωση Αµελίδη) δεν είναι ένα κλειστό προϊόν περιορισµένο στη
χρονική του διάρκεια, αλλά η ίδια η σκέψη του συνθέτη µοντελοποιηµένη σε κάποιον αλγόριθµο. Αν µάλιστα
αυτός ο αλγόριθµος είχε την ικανότητα να αυτο-οργανώνεται και να αυτο-εξελίσσεται, θα µπορούσαµε να
µιλήσουµε για το συνδυασµό των σκέψεων συνθέτη-υπολογιστή. Αυτό άλλωστε επισηµαίνει ο Robert Rowe
(2001) υποστηρίζοντας ότι:

Ο σχεδιασµός προγραµµάτων για υπολογιστές που θα αναγνωρίζουν


και θα σκέφτονται λογικά σύµφωνα µε τις ανθρώπινες µουσικές
έννοιες, επιτρέπει τη δηµιουργία εφαρµογών για την εκτέλεση
έργων, την εκπαίδευση και την παραγωγή, απηχώντας και
ενδυναµώνοντας τη φύση της ανθρώπινης µουσικότητας57. Μ.τ.Σ.

3.1.6. Θετική και Αρνητική Στάση Απέναντι στην Ψηφιακή Τεχνολογία.

Πέρα από τη θετική στάση απέναντι στην ψηφιακή µουσική τεχνολογία και τη διαφαινόµενη θέληση των
νέων µουσικών να την υιοθετήσουν, ένα µέρος του µουσικόφιλου κοινού κρατά µια επιφυλακτική έως
αρνητική υποδοχή στη µουσική που παράγεται από αυτήν. Η κριτική του εστιάζεται κυρίως σε δύο
επιχειρήµατα:58

• Η ψηφιακή µουσική τεχνολογία ασχολείται περισσότερο µε την τεχνολογία παρά µε τη


µουσική.

69
• Η χρήση της αποτελεί πραγµατικό κίνδυνο για την ανθρώπινη επικοινωνία, ενώ παράλληλα
απειλεί και την επαγγελµατική αποκατάσταση των µουσικών.

Το πρώτο επιχείρηµα περιγράφει ένα φαινόµενο που εύκολα µπορεί να παρατηρηθεί και να εξηγηθεί. Πολύ
συχνά ακούµε µουσικούς να µιλούν59 ενθουσιασµένοι για τον τελευταίο αλγόριθµο που συνέταξαν και για τον
τρόπο µε τον οποίο αυτός επεξεργάζεται τα δεδοµένα που δέχεται από διάφορους ήχους ή από αισθητήρες60.
Η έµφαση σε αυτήν την περίπτωση δίνεται περισσότερο στην τεχνολογική κατασκευή και λιγότερο (συχνά
καθόλου) στην αισθητική της παραγόµενης µουσικής. Αυτό µπορεί να εξηγηθεί µε δύο τρόπους. Από τη µια
πρέπει να λάβουµε υπόψη µας ότι η ψηφιακή τεχνολογία χρησιµοποιείται µικρό σχετικά διάστηµα στη
µουσική. Εκτός λοιπόν από το γεγονός ότι δεν έχει ακόµη πλήρως αναπτυχθεί και τελειοποιηθεί (σε αντίθεση
µε τη µηχανική τελειοποίηση των παραδοσιακών οργάνων), οι µουσικοί πολλές φορές δεν είναι επαρκώς
εκπαιδευµένοι σε αυτήν. Χρειάζεται συχνά κόπος και χρόνος για να συνταχθεί από τον µουσικό ένα
αλγοριθµικό πρόγραµµα που θα χρησιµοποιηθεί στη σύνθεσή του, µε συνέπεια να µη διατίθεται ο ανάλογος
χρόνος για την ποιότητα της µουσικής που παράγεται από αυτό. Από την άλλη, η άποψη που αναπτύχθηκε πιο
πάνω, ότι τα προγράµµατα αποτελούν µοντέλα για πιθανά έργα αποκλίνουσας αισθητικής και όχι για την
κατασκευή ενός µοναδικού έργου, εξηγεί τη βαρύνουσα σηµασία που αποδίδεται στο τεχνολογικό κοµµάτι
της µουσικής δηµιουργίας. Πρέπει εδώ να προσθέσουµε ως επιχείρηµα και τη νεο-αναγεννησιακή τάση που
χαρακτηρίζει πολλούς νέους µουσικούς: η σκέψη είναι αυτή που έχει σηµασία και που αποτυπώνεται στη
σύνταξη του αλγορίθµου-παρτιτούρας. Το έργο και η αισθητική του µπορούν να πάρουν όποια µορφή
θελήσει ο χρήστης.
Το δεύτερο επιχείρηµα πηγάζει κυρίως από το γεγονός ότι οι υπολογιστές και γενικότερα τα ψηφιακά
συστήµατα αναλαµβάνουν λειτουργίες που παλαιότερα απαιτούσαν τη φυσική προσπάθεια και την άµεση
εµπλοκή ανθρώπων. Αν και αυτή η παραδοχή έγινε αποδεκτή από τα κοινωνικά σύνολα µε θετικό τρόπο σε
ό,τι αφορά σε χειρωνακτικές εργασίες και επιστηµονικές εφαρµογές, συναντά κάποια αντίσταση σε ζητήµατα
που αφορούν στην τέχνη. Παρότι η ψηφιακή εποχή άνοιξε νέους δρόµους στην εκφραστικότητα των
δηµιουργών σε όλη τη γη, προκάλεσε αναταραχή στην αποδοχή των δηµιουργηµάτων τους. Είναι ακόµη
δύσκολο για έναν ακροατή να δεχθεί το γεγονός ότι το έργο που ακούει σε µια συναυλία είναι αποτέλεσµα
της αντίδρασης ή της αλληλεπίδρασης ενός υπολογιστή και όχι της φυσικής ενέργειας που καταθέτει ένας
οργανοπαίκτης στο όργανό του. Όταν ο οργανοπαίκτης κρούει την επιφάνεια ενός κρουστού οργάνου, εκτός
από τον ήχο που παράγει, προσφέρει στον ακροατή του µια αιτιακή σχέση (φυσική ενέργεια: κρούση –
αποτέλεσµα ενέργειας: ήχος) που τον βοηθά να κατανοήσει τη µουσική που παράγεται. Ακόµη και στην
περίπτωση που το έργο είναι ηχογραφηµένο και άρα δεν υπάρχει οπτική επικοινωνία µε τον οργανοπαίκτη, ο
ακροατής µπορεί να συµπεράνει την αιτιακή σχέση που γεννά τη µουσική που ακούει. Στην περίπτωση της
χρήσης υπολογιστών σε συναυλίες, η θεµελιώδης αυτή αιτιακή σχέση χάνεται. Ο ακροατής δεν έχει άµεση
επαφή µε την πηγή του έργου και µε τον τρόπο µε τον οποίο αυτό δηµιουργείται. Ακόµη όµως και αν
καταργείται η αισθησιοκρατία, η επικοινωνία παραµένει αφού απαραίτητη προϋπόθεση για τη χρήση των
υπολογιστών και των ψηφιακών διατάξεων είναι η συµµετοχή του ανθρώπου-µουσικού61.
Η γλώσσα της δυτικής µουσικής δεν υφίσταται σήµερα αποκλειστικά ως ένα παραδοσιακό σύστηµα
µε καθορισµένους νόµους που σχηµατοποιήθηκαν στο πέρασµα του χρόνου από µεγάλους και φωτισµένους
δασκάλους. Στις ηµέρες µας, η έλευση των ψηφιακών µέσων επανέφερε στο προσκήνιο, για µια ακόµη φορά,
τον κοινωνικό της ρόλο. Η πληθώρα των τεχνολογικών µέσων και η ευκολία χρήσης τους εκδηµοκράτισε τη
µουσική δηµιουργία και την κατέστησε κτήµα ενός µεγάλου αριθµού ανθρώπων οι οποίοι, σε προηγούµενες
εποχές, ήταν αµέτοχοι και απλοί παρατηρητές-ακροατές της µουσικής πράξης. Υπάρχουν λοιπόν πολλές
διαφορετικές µουσικές γλώσσες σήµερα, πολλές αποκλίνουσες αισθητικές προσεγγίσεις, πολλές και ποικίλες
πρακτικές δηµιουργίας οι οποίες εξαρτώνται από τις τεχνολογικές καινοτοµίες – καινοτοµίες στους τοµείς της
κυκλοφορίας και της µετάδοσης της πληροφορίας που δηµιουργούν τις «…συνθήκες του ακαριαίου και της
πανταχού παρουσίας» (Augé, 1999, σελ. 35). Οποιοσδήποτε ήχος ακουστεί σε µια γωνιά του πλανήτη µπορεί
µέσω του διαδικτύου να γίνει κτήµα της ανθρωπότητας. Ωστόσο, δεν υπάρχει πάντα ο επαρκής χρόνος για να
αφοµοιωθούν όλες αυτές οι πρακτικές. H απόπειρα να κατανοήσουµε και να εξηγήσουµε την επιρροή των
ψηφιακών µέσων στη µουσική δηµιουργία, ισούται µε την προσπάθεια ενός ιστορικού να εξηγήσει το
σήµερα. Προσπάθεια τουλάχιστον παρακινδυνευµένη, αν σκεφτούµε την πληθώρα των δυνατοτήτων που

70
αυτά τα µέσα προσφέρουν και την αδυναµία να διαγνώσουµε ποιες από αυτές θα επικρατήσουν. Μουσικοί
και ακροατές δρούµε σε ένα έργο που εξελίσσεται και του οποίου το τέλος µάς είναι άγνωστο. Η σύγχρονη
ψηφιακή µουσική είναι µουσική εν τω γίγνεσθαι και η συνειδητοποίηση της ιστορικής εξέλιξής της θα αφεθεί
στον µουσικολόγο του µέλλοντος, αν λάβουµε υπόψη µας ότι ο όρος συνειδητοποίηση δηλώνει µόνο µια
συγκεκριµένη στιγµή της εξέλιξης, κατά κανόνα το τέλος της. Αν κάτι µπορούµε να υποστηρίξουµε,
εξετάζοντας την επίδραση που ασκεί η ψηφιακή τεχνολογία στη µουσική δηµιουργία, είναι, δανειζόµενοι τα
λόγια του ιστορικού Fernand Braudel (2001), ότι:

…προβάλλει, µέσα στον κυκεώνα της σηµερινής πραγµατικότητας,


µια δεσπόζουσα «γραµµή φυγής», η οποία, άσχετα µε το πόσο
αληθινή µπορεί να είναι, οδεύει κατευθείαν προς το µέλλον, κι
έτσι αναδεικνύει τα πιο σηµαντικά σηµερινά προβλήµατα και
προσπαθεί να τα σηµατοδοτήσει62.

Η µουσική δεν κάνει τίποτε άλλο από το να αναπαράγει και να ερµηνεύει την κοινωνική πραγµατικότητα, τις
σχέσεις δηλαδή των ανθρώπων µεταξύ τους και προς τη φύση. Η αισθητική ποιότητα ενός έργου, το
περιεχόµενό του, η µορφολογία και το στυλ του, δεν µπορούν να ερµηνευθούν ανεξάρτητα από τη σηµερινή
κοινωνική πραγµατικότητα και τον τρόπο που αυτή διαµορφώνεται. Τα θέµατα της συγχρονικότητας, της
συρρίκνωσης του χώρου και της επιτάχυνσης του χρόνου έχουν προκαλέσει ευδιάκριτες ανακατατάξεις και η
µουσική δεν µπορεί να µείνει ανεπηρέαστη από αυτές. Μπορεί µόνο να αφεθεί να υπάρξει, χωρίς πιέσεις ούτε
για αισθητικιστική απαισιοδοξία, ούτε για βεβιασµένη ευφροσύνη.

3.2. Αισθητικές και Τεχνικές Αποφάσεις του Συνθέτη και του Υπολογιστή στη
Διαδικασία της Σύνθεσης.
Ο David Cottle (2006) εξηγεί τους λόγους για τους οποίους χρησιµοποιεί τον ηλεκτρονικό υπολογιστή στη
σύνθεση µουσικής: είναι γρήγορος, ακριβής, σύνθετος, πλήρης και ολοκληρωµένος, υπάκουος και άβουλος. Οι
υπολογιστές διαθέτουν σήµερα µεγάλη υπολογιστική ισχύ, γεγονός που τους επιτρέπει να επεξεργάζονται
πλήθος δεδοµένων σε πραγµατικό χρόνο ενθαρρύνοντας έτσι τον συνεχή πειραµατισµό. Είναι ακριβείς γιατί
µπορούν εύκολα για παράδειγµα, να διαγνώσουν και να αναπαράγουν τη διαφορά δύο συχνοτήτων 440,000
Hz και 440,001 Hz αλλά και όλες τις µικροδιαφοροποιήσεις στο χρόνο, στην ένταση και στο φασµατικό
περιεχόµενο. Είναι σύνθετοι γιατί έχουν την ικανότητα να επεξεργαστούν ταυτόχρονα µε εύκολο και
αξιόπιστο τρόπο πολλές και διαφορετικές σύνθετες έννοιες. Είναι πλήρεις µε την έννοια ότι ο ηλεκτρονικός
υπολογιστής θα εξετάσει όλους τους πιθανούς συνδυασµούς για τη διευθέτηση ενός προβλήµατος, σε
αντίθεση µε τον άνθρωπο ο οποίος λόγω της επίκτητης εξειδικευµένης γνώσης του αλλά και πολλών
προκαταλήψεων, θα απορρίψει κάποιους από αυτούς. Είναι υπάκουοι και άβουλοι µε την έννοια ότι
υπηρετούν γενικούς κανόνες και όχι παραδοχές ή αυθαίρετα συµπεράσµατα.
Ο Cottle δίνει το εξής παράδειγµα: ας υποθέσουµε ότι έχουµε τη σειρά C C B G A B C C A G. Ο
εκπαιδευµένος µουσικός, και όχι ένας οποιοσδήποτε άνθρωπος, είναι πιθανό να καταλήξει σε συγκεκριµένο
συµπέρασµα βλέποντας τη συγκεκριµένη σειρά. Ίσως προσπαθήσει να καταλάβει αν πρόκειται για κάποια
γνωστή µελωδία και ίσως ακόµη, επιχειρήσει να την τραγουδήσει. Ο µουσικός θα οδηγηθεί στο συγκεκριµένο
συµπέρασµα επειδή έχει εκπαιδευτεί να βλέπει µια σειρά από συγκεκριµένα κεφαλαία γράµµατα ως τη
διαστηµατική ακολουθία µιας µελωδικής γραµµής. Όπως γράφει ο Cottle, µπροστά στη θέα των κεφαλαίων
γραµµάτων ο υπολογιστής θα έξυνε το εικονικό του κεφάλι µε απορία.
Αν και ο Cottle συνδέει την εξειδικευµένη γνώση µε τη στενότερη θέαση ενός ζητήµατος και ίσως µε
την προκατάληψη, ο ηλεκτρονικός υπολογιστής, δειλός και άβουλος κατά πολλούς, µυωπικός και,
φαινοµενικά, καταδικασµένος να ταλαντώνεται στο άπειρο από το ένα στο µηδέν και από το µηδέν στο ένα
αγνοώντας τον ενδιάµεσο χώρο, προσφέρει ακριβώς αυτήν τη βρεφική αγνωσία, τη µόνη παραδοχή τού «Εν
οίδα (1) ότι ουδέν οίδα (0)». Έτσι, ο υπολογιστής παίζει το ρόλο ενός υπηρέτη που βασικός του σκοπός είναι
να ερµηνεύει τα δεδοµένα µε όλους τους πιθανούς τρόπους, απέναντι στον συνθέτη ο οποίος έχει εκπαιδευτεί
να τα ερµηνεύει µε τον «καλύτερο».

71
3.2.1. Δοµικά Πρότυπα.

Στην παραδοσιακή οργανική µουσική ως βασικά δοµικά πρότυπα, ή δοµικά στοιχεία, θεωρούνται τα εξής:

• Η µελωδία.
• Η αρµονία.
• Ο ρυθµός.

Η µελωδία σχηµατίζει ένα συνεκτικό φθογγικό σύνολο σχετικά σύντοµο σε διάρκεια (Εικόνα 3.2). Μπορεί να
υποστεί επεξεργασία και να αναπτυχθεί χωρίς όµως να απολέσει τη συνεκτικότητα και την αναγνωρισιµότητά
της.

Εικόνα 3.2 Εναρκτήρια µελωδία από το Seven Spaces of Ether (Θ. Λώτης, 2013) για κλαρινέτο και ηλεκτρονικά. Τµήµατα
της µελωδίας λειτουργούν ως επιµέρους δοµικά πρότυπα τα οποία υπόκεινται στη συνέχεια του έργου σε επεξεργασία.
Seven Spaces of Ether (http://www.lotis.gr/).

Η αρµονία οργανώνει σε κάθετο επίπεδο το φασµατικό περιεχόµενο του µουσικού έργου (Εικόνα 3.3).
Μπορεί επίσης να υποστεί επεξεργασία και να αναπτυχθεί σε τέτοιο βαθµό ώστε να απολέσει πλήρως την
όποια αρχική συνεκτικότητά της.

Εικόνα 3.3 Αρµονική ανάπτυξη της συγχορδίας Σολ µείζων.

Ο ρυθµός διαιρεί και αρθρώνει την έννοια του χρόνου (Εικόνα 3.4). Συνδέεται άµεσα µε το
καρδιοαναπνευστικό σύστηµα, το οποίο µε τη σειρά του επηρεάζει και επηρεάζεται από τον ρυθµό. Ο
παλµός, βασικό συστατικό του ρυθµού, µπορεί να ανιχνευθεί και να ταυτιστεί µε το εύρος των χτύπων της
καρδιάς και κυµαίνεται µεταξύ 40 και 208 χτύπων ανά λεπτό (bits per minute ή bpm).

Συχνοτικό εύρος παλµών:

40 * 1/60 ≈ 0.6 Hz (Grave, Largo...)


208 * 1/60 ≈ 3.5 Hz (...Prestissimo)

Εικόνα 3.4 Το βασικό ρυθµικό δοµικό πρότυπο του son στην παραδοσιακή µουσική της Κούβας.

72
Παρότι το δοµικό πρότυπο µπορεί να παραµείνει αναλλοίωτο ή να υποστεί ελάχιστες µετατροπές στη
διάρκεια ενός έργου, όπως στην περίπτωση των clave στο κουβανέζικο son, πολύ συχνά είναι δυναµικό και
επιτρέπει την ανάπτυξη και εξέλιξή του. Στις περισσότερες περιπτώσεις των µελωδικών συστοιχιών και των
ρυθµικών ακολουθιών, τα δοµικά πρότυπα αναπτύσσονται, µεταλλάσσονται και επανέρχονται σε έναν διαρκή
κύκλο συνεχούς εξέλιξης.
Στη µουσική µε υπολογιστές χρησιµοποιούµε τρία δοµικά πρότυπα ή δοµικά επίπεδα, συχνά
αλληλοσυµπληρούµενα:

1. Το µικροσκοπικό επίπεδο. Αυτό αναφέρεται στο α-τοµικό και αδιάσπαστο επίπεδο του ήχου
κατά το αντίστοιχο της µονοχρωµατικής ακτινοβολίας του φωτός. Τα χαρακτηριστικά του
περιλαµβάνουν παραµέτρους όπως η συχνότητα (frequency), το πλάτος (amplitude) και η
διάρκεια των συστατικών ενός ήχου. Η παράµετρος µιας οποιασδήποτε συχνότητας εδώ, δεν
αναφέρεται στη θεµέλιο συχνότητα µιας νότας αλλά στη συχνότητα µιας µόνο αρµονικής της.
Κατά συνέπεια, στο µικροσκοπικό επίπεδο επεξεργαζόµαστε τα φυσικά χαρακτηριστικά των
επιµέρους συστατικών του ήχου και όχι τη βιωµατική ολιστική αντίληψη που έχουµε από
αυτόν (συχνότητα και όχι τονικό ύψος, πλάτος και όχι δυναµική). Στο µικροσκοπικό επίπεδο,
οι υπολογιστές επεξεργάζονται εξαιρετικά ακριβείς και λεπτοµερείς διαφοροποιήσεις στις
παραµέτρους του ήχου. Για παράδειγµα, ο χρόνος και οι διάρκειες µετρούνται συνήθως σε
χιλιοστά του δευτερολέπτου και όχι σε µετρικές αξίες τετάρτων, ογδόων κ.ο.κ.).
Στο µικροσκοπικό επίπεδο, συναντούµε διάφορες τεχνικές σύνθεσης ήχου, οι οποίες
χρησιµοποιούν αλγόριθµους µε προκαθορισµένες ή τυχαίες τιµές για την παραγωγή και
επεξεργασία του ήχου. Στο παρακάτω παράδειγµα, έχουµε τρεις γεννήτριες παραγωγής
ηµιτονοειδών συχνοτήτων (SinOsc) στο περιβάλλον SuperCollider. Ο έλεγχος των
παραµέτρων των γεννητριών (συχνότητα, φάση, εντάσεις και διάρκεια) γίνεται µε
συγκεκριµένες τιµές τις οποίες αναλαµβάνει να επεξεργαστεί ο υπολογιστής. Η συχνότητα
της πρώτης γεννήτριας ορίζεται σε 200 Hz, της δεύτερης σε 800 Hz, ενώ για την τρίτη
ορίζεται ένα καθοδικό γκλισάντο από τα 1.000 Hz στα 100 Hz σε διάρκεια 20
δευτερολέπτων. Άρα, για κάθε παράµετρο του ήχου που θα παραχθεί από τις γεννήτριες,
ορίζουµε µια συγκεκριµένη τιµή, ή ένα εύρος τιµών µέσα στο οποίο θα κινηθεί
(Xline.kr(1000, 100, 20)).

{ SinOsc.ar(freq: 200, phase: 0, mul: 0.5) + SinOsc.ar(freq: 800, phase:0,


mul:0.5) + SinOsc.ar(XLine.kr (1000, 100, 20)) }.play;

2. Το επίπεδο της νότας. Συνδυάζει τα χαρακτηριστικά µιας νότας, όπως το τονικό ύψος
(συχνότητα της θεµελίου), την ένταση, τη διάρκεια και το ηχόχρωµα (σε αυτήν την
περίπτωση ως ηχόχρωµα εννοείται το όργανο) για την παραγωγή της. Στο παρακάτω
παράδειγµα σε περιβάλλον SuperCollider, ορίζουµε έναν βρόγχο (loop) από πίνακες µε MIDI
νότες, καθεµία εκ των οποίων διαρκεί 0.125 του δευτερολέπτου. Σε αντίθεση µε το
µικροσκοπικό επίπεδο, εδώ δε δίνονται τα επιµέρους συστατικά της νότας, όπως το σύνολο
των αρµονικών της και οι επιµέρους εντάσεις τους.

Pbindef(\playNotes, \dur, 0.125, \midinote, Pseq([ {[37, 42, 48, 52].choose},


{[64, 68, 78, 92].choose}, 50, 52, 41, 120, {[20, 30, 36,
42].choose}],inf)).play;

3. Το επίπεδο των δοµικών µονάδων (building blocks). Θα πρέπει από την αρχή να
διευκρινίσουµε ότι η έννοια του building block είναι µεταβαλλόµενη και προσαρµόζεται σε
διαφορετικά δοµικά επίπεδα. Πρόκειται δηλαδή για µια έννοια passe-partout η οποία
αναφέρεται κατά βούληση σε οποιοδήποτε δοµικό στοιχείο, από µια αδιάσπαστη ηµιτονοειδή
συχνότητα ως ένα σύνθετο ρυθµικό µοτίβο. Εδώ, θα χρησιµοποιήσουµε την έννοια σε ένα
µεσο-δοµικό επίπεδο το οποίο περιλαµβάνει µικρά µελωδικά µοτίβα, ρυθµικά σχήµατα και
ηχογραφηµένα ηχητικά δείγµατα (samples) που µπορούν να διασπαστούν σε µικρότερα
τµήµατα, σε αντίθεση µε τον α-τοµικό και αδιάσπαστο χαρακτήρα που συναντούµε στο
µικροσκοπικό επίπεδο. Για παράδειγµα, ένας ηχογραφηµένος ήχος ή ένα ρυθµικό µοτίβο

73
µπορεί να διασπαστεί σε µικρότερα τµήµατα. Η χρήση τέτοιων δοµικών µονάδων αποτελεί
µια από τις δηµοφιλέστερες πρακτικές στη σύνθεση πολλών ειδών ηλεκτρονικής µουσικής,
µεταξύ των οποίων η συγκεκριµένη µουσική των δεκαετιών του 1950 και 1960, η
ακουσµατική µουσική και η pop ηλεκτρονική µουσική (electronica, techno, hip-hop κ.ά.).
Ρυθµικά σχήµατα και ηχογραφηµένα ηχητικά δείγµατα συνδυάζονται για να δηµιουργηθούν
ρυθµικοί βρόγχοι (loops) και µεσο-µακρο-δοµικές ενότητες του µουσικού έργου (Εικόνα
3.5). Ένα ενδιαφέρον στοιχείο των δοµικών µονάδων είναι η δυνατότητα που προσφέρουν
για επεξεργασίες: ένα µελωδικό µοτίβο ή ένας ήχος αποτελούν δυναµικές µορφές οι οποίες
µπορούν να αναπτυχθούν και να υποστούν επεξεργασία.

Εικόνα 3.5 Μίξη ηχητικών δειγµάτων (samples) σε περιβάλλον Logic Pro 8 (από το έργο «Πορτραίτο Γυναίκας σε
Διαδήλωση», Θ. Λώτης).

Το έργο Konkrete Etüde του Karlheinz Stockhausen αποτελεί ένα ενδεικτικό παράδειγµα
σύνθεσης που χρησιµοποιεί ηχογραφηµένα ηχητικά δείγµατα ως δοµικές µονάδες, ήδη από το
1952. Ο συνθέτης ηχογράφησε ένα προετοιµασµένο πιάνο, στη συνέχεια έκοψε τη
µαγνητοταινία σε µικρότερα τµήµατα τα οποία συνέδεσε µεταξύ τους σε διαφορετική σειρά
αφού πρώτα τα επεξεργάστηκε.

3.2.2. Εξαγωγή Γνωρισµάτων και Δοµικές Διαδικασίες.

Η εξαγωγή γνωρισµάτων (feature extraction) προκύπτει από ποικίλες διαδικασίες ανάλυσης ενός σήµατος και
αναφέρεται πρώτιστα στην αναγνώριση των ποσοτικών χαρακτηριστικών του. Καθένα από αυτά τα
χαρακτηριστικά περιέχει ένα τµήµα της συνολικής πληροφορίας του σήµατος, όπως η αναγνώριση
συχνοτήτων και τονικών υψών, µουσικού µέτρου και παλµών κ.ά. Συνδυαζόµενα σε αλγοριθµικές
κατασκευές δοµικών προτύπων µας δίνουν τη δυνατότητα να δηµιουργήσουµε µεγαλύτερες δοµές.
Οι διαφορετικές τεχνικές στη σύνθεση µουσικής µε υπολογιστή, µας οδηγούν στην αναγκαιότητα να
αποδεχτούµε διαφορετικά επίπεδα (χαµηλότερα ή υψηλότερα) και ιεραρχήσεις των γνωρισµάτων στη

74
διαδικασία δόµησης του ηχητικού υλικού. Για παράδειγµα, στην αλγοριθµική σύνθεση ήχου, η εξαγωγή και
χρήση των γνωρισµάτων του ηχητικού σήµατος µας επιτρέπει να κατασκευάσουµε µεγαλύτερες δοµές. Μέσω
τεχνικών φασµατικής ανάλυσης µπορούµε να αναγνωρίσουµε όλη τη σειρά των συχνοτήτων των αρµονικών
µιας νότας και των επιµέρους εντάσεών τους. Στη συνέχεια, συνδυάζοντας αυτά τα δεδοµένα µπορούµε να
ανασυνθέσουµε τη νότα διατηρώντας ή αλλάζοντας το φασµατικό της περιεχόµενο. Πρόκειται για µια µέθοδο
βάσης-κορυφής (bottom-up) η οποία ξεκινάει από ένα χαµηλό επίπεδο διαχείρισης δεδοµένων και οδηγεί σε
ένα υψηλότερο επίπεδο δοµικών κατασκευών. Στην ακουσµατική µουσική, στην οποία χρησιµοποιούµε
υψηλότερες δοµικές µονάδες, όπως τα ηχογραφηµένα ηχητικά δείγµατα, η µέθοδος βάσης-κορυφής παραµένει
παρόµοια αλλά χρησιµοποιεί δοµικές µονάδες υψηλότερου επιπέδου, µε την έννοια ότι ένα ηχογραφηµένο
ηχητικό δείγµα µπορεί να διασπαστεί σε µικρότερα τµήµατα. Στον αντίποδα της µεθόδου βάσης-κορυφής
συναντούµε την αντίστροφη δοµική διαδικασία της µεθόδου κορυφής-βάσης (top-down) (Σχήµα 3.1).

3.2.3. Μέθοδοι Βάσης-Κορυφής και Κορυφής-Βάσης.

Στην ουσία πρόκειται για δύο διαφορετικές µεθόδους σύλληψης και οργάνωσης της διαδικασίας σύνθεσης
ήχου και µουσικής µε υπολογιστή. Η επιλογή της µεθόδου υποδεικνύει, σε µεγάλο βαθµό, την ιεράρχηση της
σκέψης του συνθέτη και τους τρόπους επεξεργασίας του υλικού του.

Σχήµα 3.1 Σχηµατοποίηση µεθόδων βάσης-κορυφής και κορυφής-βάσης.

Ένα αρχετυπικό παράδειγµα της συνθετικής µεθόδου βάσης-κορυφής στην κοσµολογία αποτελεί η
δηµιουργία οµάδων (groups) και συστάδων (clusters) γαλαξιών από τους πρωταρχικούς γαλαξίες αερίων. Η
συγκεκριµένη µέθοδος βασίζεται στον επιλεκτικό συνδυασµό δεδοµένων για τη δηµιουργία σύνθετων δοµών.
Κάθε δεδοµένο του συστήµατος βάσης ορίζεται µε λεπτοµέρεια. Τα δεδοµένα που εξάγονται µέσω
αναλυτικών µεθόδων ή οι µικρότερες διαθέσιµες µονάδες του συστήµατος βάσης συνδυάζονται
δηµιουργώντας µεγαλύτερες επιµέρους δοµές, οι οποίες µε τη σειρά τους απαρτίζουν το σύνολο του έργου.
Όπως ο επιλεκτικός συνδυασµός γραµµάτων οδηγεί σε συγκεκριµένες λέξεις και φράσεις, έτσι και η
οµαδοποίηση αρµονικών συχνοτήτων, εντάσεων, onset detection, χρονικών διαρκειών και φάσεων συνθέτουν
µια νότα ή ένα φασµατικό περιεχόµενο. Ο αντικειµενοστρεφής προγραµµατισµός (object-oriented
programming) αποτελεί υπόδειγµα µεθόδου βάσης-κορυφής όπου δοµές δεδοµένων που ονοµάζονται
αντικείµενα (objects) συνδυάζονται για τη σχεδίαση όλο και µεγαλύτερων δοµών. Στην παραδοσιακή
µουσική, η προεπιλογή του ρυθµού, του µέτρου, των δυναµικών, των οργάνων της ενορχήστρωσης και άλλων
επιµέρους στοιχείων αποτελεί µέθοδο βάσης-κορυφής για τη σύνθεση του έργου. Πρέπει να επισηµανθεί ότι η
επιλογή των δεδοµένων του συστήµατος βάσης επηρεάζει και καθορίζει σε µεγάλο βαθµό το µουσικό έργο
που προκύπτει.
Η µέθοδος κορυφής-βάσης αναφέρεται στη µακροδοµή και ξεκινά από την, συχνά αφαιρετική,
ολιστική σύλληψη του έργου. Στην αρχή σχηµατοποιούνται οι µεγάλες δοµές του έργου οι οποίες στη

75
συνέχεια διαιρούνται σε επιµέρους τοπικές δοµές ή συστάδες. Η µέθοδος είναι αφαιρετική γιατί συχνά
οφείλει να βασιστεί στην πρόβλεψη για το πώς θα λειτουργήσουν και θα αλληλεπιδράσουν οι επιµέρους
δοµές. Στην περίπτωση στην οποία η µέθοδος κορυφής-βάσης χρησιµοποιείται για τη δηµιουργία ενός
προγράµµατος για τον υπολογιστή, προαποφασίζουµε όλες τις βασικές λειτουργίες τις οποίες θα επιτελεί το
πρόγραµµα. Στη συνέχεια, ορίζουµε όλα τα προαπαιτούµενα στοιχεία που απαιτούνται για κάθε µια από τις
λειτουργίες και τις υπορουτίνες, συνεχίζοντας µε αυτόν τον τρόπο µέχρι να οριστούν όλα τα δεδοµένα της
βάσης.
Συχνά, στη σύνθεση µουσικής µε υπολογιστή χρησιµοποιούµε υβριδικά συστήµατα στα οποία οι
µέθοδοι βάσης-κορυφής και κορυφής-βάσης συνδυάζονται. Στη σύνθεση γενικότερα, οι δύο µέθοδοι
συνδυάζονται σε µια συµβιωτική σχέση αµοιβαιότητας, στην οποία το πέρασµα από τη µια στην άλλη
εξαρτάται από τους µικροδοµικούς ή/και µακροδοµικούς συσχετισµούς.

3.3. Οπτικές Αναπαραστάσεις του Ήχου.


Ο Curtis Roads (1996) µας παρέχει µια συνοπτική ιστορική ανασκόπηση της προσπάθειας για τη φασµατική
ανάλυση και την οπτική αναπαράσταση του ήχου στο βιβλίο του «The Computer Music Tutorial»63. Ο όρος
φάσµα (spectrum) επινοήθηκε από τον Isaac Newton το 1781 για να περιγράψει την ανάλυση µιας φωτεινής
δέσµης λευκού φωτός στις µονοχρωµατικές συχνότητες του φάσµατός της, οι οποίες προέκυπταν όταν το φως
διαπερνούσε ένα γυάλινο πρίσµα. Την ίδια εποχή, οι ερευνητές του ηχητικού φαινοµένου και οι µουσικοί
γνώριζαν ότι οι τονικοί ήχοι ήταν αποτέλεσµα του συνόλου των αρµονικών ταλαντώσεων γύρω από τη
θεµελιώδη συχνότητα του τόνου. Αυτό που έλειπε ήταν µια συστηµατική µέθοδος και η ανάλογη τεχνολογία
που θα επέτρεπε την ανάλυση και κατηγοριοποίηση αυτών των ταλαντώσεων. Ο Hermann Helmholtz στο
βιβλίο του «On the Sensations of Tone» το 1863 περιέγραψε την κατάσταση ως εξής:

Δεν είµαστε ακόµη σε θέση να περιγράψουµε απευθείας στο χαρτί


τις ταλαντώσεις όλων των (ηχητικών) σωµάτων που δονούνται,
παρότι έχει επιτευχθεί πρόσφατα µεγάλη πρόοδος για αυτόν τον
σκοπό64. Μ.τ.Σ.

Η βασική ιδέα ότι σύνθετες δονήσεις µπορούν να αναλυθούν σε ένα σύνολο απλών σηµάτων διατυπώθηκε το
1822 όταν ο Γάλλος φυσικός και µαθηµατικός Jean-Baptiste Joseph Fourier εξέδωσε στο Παρίσι το σύγγραµα
«Théorie Analytique de la Chaleur». Ο Fourier απέδειξε ότι κάθε περιοδικό σήµα µπορεί να αναλυθεί και να
απεικοστεί ως ένα σύνολο ακέραιων πολλαπλάσιων της θεµελίου συχνότητας (440 Hz, 2 x 440 Hz, 3 x 440
Hz, 4 x 440 Hz, κ.ο.κ. ή f = 440, 2 x f, 3 x f, 4 x f, κ.ο.κ.). Αυτή η διαδικασία ονοµάστηκε αρµονική ανάλυση.
Όπως θα δούµε στη συνέχεια, ορισµένες µέθοδοι αναπαράστασης του ήχου παράγουν στατικές
παραστάσεις (static plots), ενώ άλλες αποκαλύπτουν τη συνολική εξέλιξη του φάσµατός του σε όλη τη
διάρκειά του (time-varying plots). Σε συνέχεια του Κεφαλαίου 2, στο οποίο εξετάσαµε τρόπους ανάλυσης
του ηχητικού σήµατος και φασµατικής αναπαράστασής του, θα παρουσιάσουµε εδώ τρεις βασικές οπτικές
απεικονιστικές µεθόδους του ηχητικού σήµατος (παλµογράφος, αναλυτής φάσµατος και φασµατογράφος).
Κάθε µέθοδος απεικόνισης που βασίζεται στην ανάλυση ενός ηχητικού σήµατος, προσαρµόζει τις
πληροφορίες που περιέχει το σήµα, τα γνωρίσµατά του, σε ένα υποθετικό µοντέλο. Για παράδειγµα, οι
απεικονίσεις που βασίζονται στην ανάλυση Fourier αποδίδουν τον ήχο ως ένα άθροισµα ηµιτονοειδών
κυµατοµορφών.

3.3.1. Παλµογράφος (Oscilloscope).

Ο παλµογράφος είναι ένα ηλεκτρονικό όργανο για τη µέτρηση και απεικόνιση φαινοµένων που
µεταβάλλονται στον χρόνο, όπως η τάση, η συχνότητα και η διαφορά φάσης µεταξύ εναλλασσόµενων
σηµάτων. Η απόδοση της κυµατοµορφής σε έναν παλµογράφο αντιστοιχεί στις αυξοµοιώσεις της πίεσης του
αέρα ή στις αυξοµοιώσεις της τάσης (voltage variations) του ηλεκτρικού ρεύµατος στο καλώδιο. Στην Εικόνα

76
3.6 εµφανίζονται δύο ηµιτονοειδείς κυµατοµορφές µε δύο διαφορετικά πλάτη (1.0 και 0.5), οι οποίες
προκύπτουν από τις παρακάτω γραµµές κώδικα σε SuperCollider.

1 { SinOsc.ar(freq:440, phase:0, mul:1.0) }.play;


2 { SinOsc.ar(freq:440, phase:0, mul:0.5) }.play;
3 { SinOsc.ar(freq:880, phase:0, mul:1.0) }.play;
4 { SinOsc.ar(freq:880, phase:0, mul:0.5) }.play;

Στα τµήµατα 1 και 2 της Εικόνας 3.6, η συχνότητα της κυµατοµορφής είναι 440 Hz και η διάρκεια 1 ms. Το
πλάτος της κυµατοµορφής είναι 1.0 για το τµήµα 1 και 0.5 για το τµήµα 2. Στα τµήµατα 3 και 4,
απεικονίζεται η διπλάσια συχνότητα των 880 Hz στην ίδια χρονική διάρκεια. Τα πλάτη της κυµατοµορφής
είναι επίσης 1.0 και 0.5 αντίστοιχα.

Εικόνα 3.6 Οπτική απεικόνιση δύο ηµιτονοειδών κυµατοµορφών µε διαφορετικές στάθµες σε παλµογράφο (πηγή:
http://academo.org/demos/virtual-oscilloscope/).

Όπως µπορούµε να συµπεράνουµε από την Εικόνα 3.6, ο παλµογράφος απεικονίζει τον τύπο της
κυµατοµορφής (ηµιτονοειδής, τριγωνική, πριονωτή κ.ο.κ) στο πεδίο του χρόνου (time domain). Είναι
δύσκολο όµως να εξάγουµε πληροφόρηση για την απεικονιζόµενη συχνότητα όσο ο χρόνος απεικόνισης
µεγαλώνει. Επίσης, ο παλµογράφος δεν αποδίδει τη σειρά των αρµονικών και µη αρµονικών συχνοτήτων των
σύνθετων φασµάτων και άρα, δεν παρέχει πληροφορίες σχετικά µε την κατανοµή της φασµατικής ενέργειας.

3.3.2. Αναλυτής Φάσµατος (Spectrum Analyzer).

Ο αναλυτής φάσµατος αποδίδει µια στιγµιαία εικόνα αποτυπώνοντας την κατανοµή της φασµατικής
ενέργειας ανά περιοχή. Δε µας παρέχει πληροφορίες για την εξέλιξη του φάσµατος στο χρόνο. Στην Εικόνα
3.7 βλέπουµε τη διάταξη των αρµονικών µιας πριονωτής κυµατοµορφής µε θεµελιώδη συχνότητα 880 Hz ως
µια στατική αναπαράσταση λογαριθµικής (dB) κλίµακας. Ο κάθετος άξονας αποδίδει το πλάτος και ο
οριζόντιος τις συχνότητες των αρµονικών από αριστερά προς τα δεξιά (f = 880, 2 x f, 3 x f, 4 x f, κ.ο.κ. ).

77
Εικόνα 3.7 Ανάλυση φάσµατος πριονωτής κυµατοµορφής.

Η ανάλυση της Εικόνας 3.8 αφορά ένα σύνθετο φάσµα µε σηµαντική κατανοµή ενέργειας στις χαµηλές και
µεσαίες συχνοτικές περιοχές. Πρόκειται για µια στατική γραφική αναπαράσταση της περιβάλλουσας η οποία
αποτυπώνει τις κορυφές του φάσµατος.

Εικόνα 3.8 Ανάλυση σύνθετου φάσµατος ανά συχνοτικές περιοχές.

3.3.3. Φασµατογράφος. Φασµατογράφηµα (Spectrogram).

Ο φασµατογράφος αποδίδει ένα είδος «ακτινογραφίας» του ήχου καταγράφοντας τη φασµατοµορφολογική


εξέλιξή του στον χρόνο. Από αυτήν την άποψη, µας παρέχει µια συνολική και πλήρη εικόνα της φασµατικής
ενέργειας του ήχου (frequency domain). Στην Εικόνα 3.9 βλέπουµε το φασµατογράφηµα ενός ηχοτοπίου.
Στον οριζόντιο άξονα αποτυπώνεται ο χρόνος και στον κάθετο οι συχνότητες. Οι σχετικές εντάσεις
αποτυπώνονται µε τη διαφοροποίηση των χρωµάτων. Το κόκκινο χρώµα δηλώνει τις ψηλές στάθµες, το µπλε
τις χαµηλότερες και το µαύρο τις περιοχές σιωπής.

78
Εικόνα 3.9 Φασµατογράφηµα σύνθετου φάσµατος.

Εµφανίζεται έτσι η τρισδιάστατη εξέλιξη ενός σύνθετου φάσµατος στην οποία οι επιµέρους εντάσεις (τρίτη
διάσταση) αποτυπώνονται µε χρωµατικές διαφοροποιήσεις. Στο φασµατογράφηµα παρακολουθούµε µε
ακρίβεια τις χρονικές µεταβολές και την εξέλιξη όλων των φασµατικών παραµέτρων (συχνότητα, πλάτος),
αποκτώντας έτσι µια ολιστική αντίληψη για τη µορφή και τη χροιά του ήχου. Θα πρέπει φυσικά να
επισηµάνουµε ότι η παρατήρηση της οπτικής αναπαράστασης του φάσµατος ενός ήχου δε µας βοηθά να
καταλάβουµε το πώς θα ακουστεί ο ήχος. Μια απεικόνιση µας παρέχει στοιχεία για τα µετρήσιµα φυσικά
χαρακτηριστικά του ήχου και όχι τις βιωµατικές πληροφορίες που εξάγουµε κατά την ακρόασή του.

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Λώτης, Θ. «Ψηφιακή Μουσική Δηµιουργία», Ψηφιακά Μέσα. Ο Πολιτισµός του Ήχου και του Θεάµατος,
Κοκκώνης, Μ., Γ. Πασχαλίδης και Φ. Μπαντιµαρούδης (επιµέλεια). Αθήνα: Κριτική, 2010, σελ. 249-
271.
Μπαµπινιώτης, Γ. Λεξικό της Νέας Ελληνικής Γλώσσας. Αθήνα: Κέντρο Λεξικολογίας ΕΠΕ, 2002, σελ. 1748.
Augé, M. Για µια Ανθρωπολογία των Σύγχρονων Κόσµων. Αθήνα: Αλεξάνδρεια, 1999, σελ. 81.
Belting, H., H. Dilly, W. Kemp, W. Sauerländer και M. Warnke Martin (επιµέλεια), Εισαγωγή στην Ιστορία
της Τέχνης. Θεσσαλονίκη: Βάνιας, 1995.
Braudel, F. Γραµµατική των Πολιτισµών. Αθήνα: ΜΙΕΤ, 2001, σελ. 46-7.
Fleming J. και H. Honour, Ιστορία της Τέχνης. Αθήνα: Υποδοµή, 1991.
Layton, R. Η Ανθρωπολογία της Τέχνης. Αθήνα: Εκδόσεις του Εικοστού Πρώτου, 2003.
Pollitt, J. J. Η Τέχνη στην Ελληνιστική Εποχή. Αθήνα: Δηµ. Παπαδήµα, 2006, σελ. 186-7.

79
Rechenberg, P. Εισαγωγή στην Πληροφορική. Αθήνα: Κλειδάριθµος, 1992, σελ. 250.

Ξενόγλωσση Βιβλιογραφία.

Berger, K. Musica Ficta: Theories of Accidental Inflections in Vocal Polyphony from Marchetto da Padova to
Gioseffo Zarlino. Cambridge: Cambridge University Press, 1987.
Boas, F. Primitive Art. Ν. Υόρκη: Dover, 1955.
Cope, D. Hidden Structure: Music Analysis Using Computers. Middleton: A-R Editions, 2008.
Cottle, D. M. Computer Music with Examples in SuperCollider 3. University of California Santa Barbara,
2006.
Fourier, J-B. J. Théorie Analytique de la Chaleur. Παρίσι: Chez Firmin Didot père et fils, 1822.
Haselberger, H. «Methods of Studying Ethnological Art», Current Anthropology, τ. 2, αρ. 4, σελ. 341-384,
Οκτώβριος 1961. Σικάγο: University of Chicago Press.
Helmholtz, Η. On the Sensations of Tone as a Physiological Basis for the Theory of Music. Ν. Υόρκη: Dover
Publications, 1954.
House H. και C. Hardie. Aristotle’s Poetic: A Course of Eight Lectures. Λονδίνο: Rupert Hart-Davis, 1956.
Klein, W. Vom Antiken Rokoko. Βιέννη: Bieber, 1921.
Mathews, M. V. «The Digital Computer as a Musical Instrument», Science, τ. 142, αρ. 3592, σελ. 553-557,
Νοέµβριος 1963. Washington: Science/AAAS.
Pople, A. (επιµέλεια), Theory, Analysis and Meaning in Music. Cambridge: Cambridge University Press,
2006.
Roads, C. The Computer Music Tutorial. Cambridge MA: The MIT Press, 1996, σελ. 1075-6.
Rowe, R. Machine Musicianship. Cambridge MΑ: The MIT Press, 2001.
Russolo, L. L’Arte dei Rumori. Μιλάνο: Edizioni Futuriste di Poesia, 1916.
Schillinger, J. The Mathematical Basis of the Arts. Ν. Υόρκη: Da Capo Press, 1976.
Virilio, P. L’ Éspace Critique. Παρίσι: Christian Bourgois, 1984.

80
Κεφάλαιο 4
Σύνθεση Ήχου.
Σύνοψη
Παρουσιάζεται µια σύντοµη ιστορική ανασκόπηση στους παράγοντες που συνέβαλαν στο να υλοποιηθεί ως
σώµα γνώσης η Σύνθεση Ήχου καθώς και µια αναφορά στους διάφορους τύπους κατηγοριοποίησης των
τεχνικών της (περισσότερα στο Κεφάλαιο 1). Στη συνέχεια αναλύονται oκτώ βασικές αντιπροσωπευτικές
τεχνικές: Αθροιστική Σύνθεση (Additive Synthesis), Αφαιρετική Σύνθεση (Subtractive Synthesis), Τεχνικές
Διαµόρφωσης (AM Synthesis, Ring Modulation, FM Synthesis), Σύνθεση Πινάκων Κυµατοµορφής (Wavetable
Synthesis), Σειρές Καθυστέρησης (Delay Lines) και Μικροδοµική Σύνθεση (Granular Synthesis).

Προαπαιτούµενη γνώση
Απαιτείται γνώση των βασικών λειτουργιών του προγραµµατιστικού περιβάλλοντος SuperCollider για την
καλύτερη κατανόηση των παραδειγµάτων κώδικα που συνοδεύουν τις διάφορες τεχνικές σύνθεσης.

4.1. Αλγόριθµοι Σύνθεσης Ήχου.

Ως Σύνθεση Ήχου (Sound Synthesis) προσδιορίζεται το σύνολο των τεχνικών και των αλγορίθµων οι οποίοι
ως σκοπό έχουν την αλγοριθµική ηχοχρωµατική σύνθεση. Η ανάγκη αυτή προέκυψε ήδη από τα πρώτα
χρόνια παραγωγής ηλεκτρονικής µουσικής στα studio της ραδιοφωνίας της Κολωνίας (WDR Elektronische
Musik Studios), όπου οι συνθέτες είχαν στη διάθεση τους ένα πλήθος από γεννήτριες ήχου προκειµένου να
παράγουν ηλεκτρονικά έργα. Ο Karlheinz Stockhausen στις δύο πρώτες του σπουδές ηλεκτρονικής µουσικής
«Studie I» (1952) και «Studie II» (1953) κάνει εκτεταµένη χρήση άθροισης ενός πλήθους ηµιτονοειδών
γεννητριών προκειµένου να παράγει φάσµα σύνθετων κυµατοµορφών. Σε άλλα του έργα («Gesang der
Jünglinge» – 1955-56, «Telemusik» – 1965) ενέπλεξε µια τεχνική διαµόρφωσης η οποία χρησιµοποιεί το
γινόµενο δύο απλών ηµιτονοειδών για την αναπαραγωγή σύνθετου φάσµατος. Οι δύο αυτές τεχνικές
αποτελούν αντίστοιχα την Αθροιστική ή Προσθετική Σύνθεση (Additive Synthesis) και την τεχνική
Διαµόρφωσης Δακτυλίου (Ring Modulation), µια ειδική εφαρµογή της Διαµόρφωσης Πλάτους (Amplitude
Modulation). Όπως και άλλοι συνθέτες της εποχής του πειραµατίστηκε επίσης µε τη χρήση φίλτρων
προοιωνίζοντας έτσι την Αφαιρετική Σύνθεση (Subtractive Synthesis).
Λίγα χρόνια νωρίτερα στον άλλο σηµαντικό πόλο της ηλεκτροακουστικής µουσικής, στα studio της
γαλλικής ραδιοφωνίας στο Παρίσι όπου κυριάρχησε η Musique Concrète, ο Pierre Schaeffer και οι
συνοδοιπόροι του έθεσαν ουσιαστικά τα θεµέλια της Σύνθεσης Δειγµατοληψίας (Sampling Synthesis), µια
ευρεία τεχνική σύνθεσης ήχου που θα επανέλθει σε διαφορετικές περιόδους µε διάφορες εκδοχές. Σε µια
τέτοια περίπτωση, το 1958 ο Iannis Xenakis παρουσίασε το έργο «Concrete PH», το οποίο αφορούσε ένα
collage πολλαπλών τµηµάτων µικρής διάρκειας µιας ηχογραφηµένης ηχητικής πηγής, συνθέτοντας έτσι το
πρώτο έργο Μικροδοµικής Σύνθεσης (Granular Synthesis), τεχνική την οποία εξέλιξε σε άλλα µεταγενέστερα
έργα του.
Στα τέλη της δεκαετίας του 1950 δηµιουργήθηκε ένας τρίτος πόλος της Νέας Μουσικής στις ΗΠΑ µε
δύο κυρίαρχες τάσεις: αφενός µε την παραγωγή έργων µε τον συνθετητή Mark II στο Columbia-Princeton
Electronic Music Center και αφετέρου µε τη χρήση των γλωσσών προγραµµατισµού MUSIC-N, οι οποίες
αρχικά αναπτύχθηκαν στα εργαστήρια Bell Labs από τον Max Mathews. Η παραγωγή έργων από τον Mark II
απαιτούσε µια αλγοριθµική λογική συνδεσµολογίας (patching) µεταξύ των διαφόρων γεννητριών µονάδων
του προκειµένου να αποδώσει συγκεκριµένες ηχοχρωµατικές δοµές. Μια αντίστοιχη λογική οργάνωσης
ηχητικών δοµών ακολουθήθηκε και στα προγράµµατα που παρήγαγαν τα πρώτα έργα µουσικής σύνθεσης
µέσω υπολογιστή µε τις γλώσσες προγραµµατισµού MUSIC-Ν. Με τις δύο πρώτες αυτές απόπειρες
ουσιαστικά µπήκαν για πρώτη φορά τα θεµέλια της αλγοριθµικής οργάνωσης στην ηχοχρωµατική σύνθεση.
Η βασική δοµή για την παραγωγή ήχου στις γλώσσες MUSIC-N αφορούσε πίνακες (lookup table) οι
οποίοι είχαν προ-αποθηκευµένες τις τιµές ταλάντωσης µιας περιόδου µερικών γνωστών κυµατοµορφών
(ηµιτονοειδής, τριγωνική κ.λπ.) υλοποιώντας έτσι την τεχνική Σύνθεσης Πινάκων Κυµατοµορφής (Wavetable
Synthesis). Στις επόµενες δύο δεκαετίες σταδιακά αναπτύχθηκαν, µε συστηµατικό πλέον τρόπο, ένα πλήθος
από τεχνικές για την αλγοριθµική σύνθεση ηχοχρώµατος µέσω υπολογιστή. Έτσι, στα µέσα της δεκαετίας του

81
1960 ο Jean-Claude Risset ανέπτυξε αλγορίθµους Προσθετικής Σύνθεσης µε σκοπό την αναπαραγωγή
γνωστών φυσικών ηχητικών πηγών. Αντίστοιχα, στις αρχές της δεκαετίας του 1970 ο John Chowning
χρησιµοποίησε και εξέλιξε τη γενική θεωρία της Διαµόρφωσης Συχνότητας (Frequency Modulation) στο
ακουστικό φάσµα προκειµένου να αναπαράγει ηχοχρωµατικές δοµές, θεµελιώνοντας έτσι την Σύνθεση
Διαµόρφωσης Συχνότητας (FM Synthesis). Στις δεκαετίες του 1970 και 1980 εξερευνήθηκαν και
υλοποιήθηκαν µια σειρά από τεχνικές για την αναπαραγωγή ανθρωπίνων φωνηµάτων από υπολογιστή
βασισµένες στη χρήση φίλτρων και στην Αφαιρετική Σύνθεση οι οποίες προσδιορίσθηκαν µε τον γενικό όρο
Formant Synthesis. Χρήση των τεχνικών αυτών έκανε και ο συνθέτης Charles Dodge σε έργα του.
Οι παραπάνω περιπτώσεις είναι ενδεικτικές καθώς ένα πολύ µεγάλο πλήθος διαφορετικών
αλγοριθµικών προσεγγίσεων για ηχοχρωµατική σύνθεση αναπτύχθηκε και χρησιµοποιήθηκε από διάφορους
συνθέτες σε διαφορετικές χρονικές περιόδους. Ως επακόλουθο η Σύνθεση Ήχου αποτέλεσε έναν από τους
κύριους τοµείς έρευνας και εξέλιξης της ηλεκτροακουστικής µουσικής δηµιουργίας. Σε γενικές γραµµές το
σύνολο των τεχνικών Σύνθεσης Ήχου µπορεί να κατηγοριοποιηθεί µε βάση:

• Τον τύπο επέµβασής τους, σε σχέση µε το χρονικό ή το φασµατικό επίπεδο της αρχικής
πληροφορίας.
• Το αποτέλεσµα της επέµβασής τους, σε σχέση µε την προσθήκη ή µη νέου φασµατικού
περιεχοµένου.

Στην πρώτη περίπτωση οι τεχνικές Σύνθεσης Ήχου διαχωρίζονται στις φασµατικές τεχνικές και στις τεχνικές
χρονικής διάστασης ή δειγµάτων ήχου. Ο διαχωρισµός αυτός προσδιορίζεται από το είδος της πληροφορίας
που επεξεργάζεται ο αλγόριθµος της Σύνθεσης Ήχου. Στην δεύτερη περίπτωση τεχνικές οι οποίες
επεµβαίνουν στην αρχική πληροφορία χωρίς να παράγουν επιπλέον φασµατικό περιεχόµενο καλούνται
γραµµικές (linear), ενώ τεχνικές οι οποίες προσθέτουν νέο φασµατικό περιεχόµενο µη γραµµικές (non-linear).
Στα επόµενα κεφάλαια αναλύονται χαρακτηριστικές τεχνικές οι οποίες αντιπροσωπεύουν τις κατηγορίες
αυτές.

4.2. Φασµατικές, Γραµµικές Τεχνικές: Αθροιστική Σύνθεση. Αφαιρετική


Σύνθεση.

Χαρακτηριστικοί τύποι φασµατικών τεχνικών αποτελούν η Αθροιστική Σύνθεση και η Αφαιρετική Σύνθεση
καθώς η επεξεργασία των αλγορίθµων σύνθεσης πραγµατοποιείται στο φασµατικό επίπεδο. Ταυτόχρονα
αποτελούν γραµµικές τεχνικές καθώς το παραγόµενο φάσµα δεν περιέχει πρόσθετη φασµατική πληροφορία.

4.2.1. Αθροιστική Σύνθεση (Additive Synthesis).

4.2.1.1. Βασικές Αρχές. Άθροιση Ταλαντωτών.

Η Αθροιστική ή Προσθετική Σύνθεση βασίζεται στην ανάλυση Fourier σύµφωνα µε την οποία ένα
οποιοδήποτε σήµα µπορεί να αναλυθεί σε ένα άθροισµα άπειρων απλών ηµιτονοειδών. Με µια αντίστροφη
λογική µπορούµε λοιπόν να συνθέσουµε µια σύνθετη κυµατοµορφή αθροίζοντας τις επιµέρους ηµιτονοειδείς
της. Ένας τυπικός αλγόριθµος αθροιστικής σύνθεσης περιλαµβάνει ένα πλήθος ηµιτονοειδών ταλαντωτών
καθένας από τους οποίους ταλαντώνεται µε τα δικά του χαρακτηριστικά και των οποίων οι έξοδοι
αθροίζονται, παράγοντας έτσι µια τελική σύνθετη κυµατοµορφή (Σχήµα 4.1).

82
Σχήµα 4.1 Τυπικό διάγραµµα άθροισης τριών ηµιτονοειδών a, b και c.

Στο περιβάλλον του SuperCollider ο αλγόριθµος αυτός πραγµατοποιείται αθροίζοντας τις εξόδους γεννητριών
SinOsc:

(
SynthDef("simple_additive_01", {
arg out=0, amp1, freq1, amp2, freq2, amp3, freq3, main= 0.5;
var sig1, sig2, sig3, output;

sig1 = SinOsc.ar(freq1, 0, amp1);


sig2 = SinOsc.ar(freq2, 0, amp2);
sig3 = SinOsc.ar(freq3, 0, amp3);

output = sig1+sig2+sig3;

Out.ar(out, [1,1]*output*main);
}
).send(s);
)

s.sendMsg("/s_new", "simple_additive_01", 1001, 0, 1, \amp1, 0.1, \freq1, 100,


\amp2, 0.1, \freq2, 100.8, \amp3, 0.1, \freq3, 101.6);

s.sendMsg("/n_free", 1001);

Εναλλακτικά µπορούµε να αναπαράγουµε την ίδια δοµή µιας SinOsc πολλαπλές φορές, µε διαφορετικά κάθε
φορά χαρακτηριστικά αναπαραγωγής:

(
SynthDef("simple_additive_02", {
arg out=0, amp, freq, main= 0.5;
var sig;

sig = SinOsc.ar(freq, 0, amp);

Out.ar(out, [1,1]*sig*main);
}
).send(s);
)

(
s.sendMsg("/s_new", "simple_additive_02", 1001, 0, 1, \amp, 0.1, \freq, 100);

83
s.sendMsg("/s_new", "simple_additive_02", 1002, 0, 1, \amp, 0.1, \freq, 100.8);
s.sendMsg("/s_new", "simple_additive_02", 1003, 0, 1, \amp, 0.1, \freq, 101.6);
)

(
s.sendMsg("/n_free", 1001);
s.sendMsg("/n_free", 1002);
s.sendMsg("/n_free", 1003);
)

4.2.1.2. Πίνακες Σύνθετων Κυµατοµορφών.

Εκτός της απλής ηµιτονοειδούς ταλάντωσης µπορούµε επίσης να ταλαντώσουµε έναν πίνακα ο οποίος
περιέχει τιµές µιας περιόδου σύνθετης κυµατοµορφής. Η σύνθετη αυτή κυµατοµορφή δηµιουργείται από την
άθροιση ηµιτονοειδών τα επιµέρους χαρακτηριστικά των οποίων επιλέγουµε εµείς.
Στο περιβάλλον του SC η κλάση η οποία αναπαριστά έναν πίνακα γενικότερα, είναι η κλάση
Buffer. Δηµιουργούµε γενικά έναν πίνακα ως εξής:

s.sendMsg("/b_alloc", bufnum, numFrames, numChannels);

bufnum Η αρίθµηση του πίνακα.


numFrames Πλήθος frame.
numChannels Πλήθος καναλιών.

Συνηθίζεται το πλήθος των frame να δίδεται ως δύναµη του δύο. Ως πλήθος frame ανά δευτερόλεπτο
ορίζεται:

s.sampleRate * numChannels

όπου η µέθοδος s.sampleRate επιστρέφει τη συχνότητα δειγµατοληψίας.

Μετά τη χρήση του πίνακα οι θέσεις µνήµης που καταλαµβάνει πρέπει να ελευθερώνονται µε τη µέθοδο
free:

s.sendMsg("/b_free", bufnum);

Οι µέθοδοι οι οποίοι γεµίζουν έναν τέτοιο πίνακα µε άθροιση ηµιτονοειδών είναι οι sine1, sine2 και
sine3. Η πρώτη µέθοδος δέχεται τα σχετικά πλάτη ταλάντωσης κάθε επιµέρους ηµιτονοειδούς (ως ακέραιο
πολλαπλάσιο µιας βασικής συχνότητας), η δεύτερη δέχεται ως επιπλέον όρισµα τιµές συχνοτήτων κάθε
επιµέρους ηµιτονοειδούς και η τρίτη δέχεται και την πληροφορία της αρχικής φάσης ταλάντωσης:

s.performList(\sendMsg, \b_gen, bufnum, \sine1, flag, [amp1, amp2, amp3, ...]);


s.performList(\sendMsg, \b_gen, bufnum, \sine2, flag, [freq1, amp1, freq2, amp2,
freq3, amp3, ...]);
s.performList(\sendMsg, \b_gen, bufnum, \sine3, flag, [freq1, amp1, phase1,
freq2, amp2, phase2, freq3, amp3, phase3, ...]);

Με γενικά ορίσµατα:

flag Ένα ακέραιο άθροισµα των επιµέρους


τιµών 1, 2, 4, όπου:
1 [normalize]: προσδιορίζει πως οι τιµές
των επιµέρους ηµιτονοειδών θα
κανονικοποιηθούν, έτσι ώστε το τελικό
πλάτος της σύνθετης κυµατοµορφής να
ισούται µε µονάδα.

84
2 [asWavetable]: προσδιορίζει πως οι
τιµές του πίνακα θα κωδικοποιηθούν µε
µορφή η οποία µπορεί να χρησιµοποιηθεί
από κάποιον ταλαντωτή, θα αφορούν
δηλαδή τιµές κυµατοµορφής.
4 [clearFirst]: προσδιορίζει εάν
προηγούµενες τιµές του πίνακα θα
εξαλειφθούν πριν αυτός χρησιµοποιηθεί
ξανά.
ampN Τα σχετικά πλάτη των επιµέρους
ηµιτονοειδών.
freqN Οι σχετικές τιµές συχνότητας των
επιµέρους ηµιτονοειδών.
phaseN Οι σχετικές τιµές φάσης των επιµέρους
ηµιτονοειδών.

Τελικά η γεννήτρια η οποία αναλαµβάνει να ταλαντώσει έναν τέτοιο πίνακα είναι η Osc:

Osc.ar(bufnum, freq: 440, phase: 0, mul: 1, add: 0)

bufnum Ο πίνακας από τον οποίο θα ταλαντωθούν


οι τιµές.
freq Η βασική συχνότητα ταλάντωσης σε Hz.
phase Η αρχική φάση ταλάντωσης της τελικής
σύνθετης κυµατοµορφής σε ακτίνια.
mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Ένα παράδειγµα µε τη χρήση και των τριών παραπάνω µεθόδων, όπου κάθε µέθοδος χρησιµοποιεί έναν
διαφορετικό πίνακα:

(
s.sendMsg("/b_alloc", 13, 1024, 1);
a= [1.0, 0.8, 0.7, 0.5];
s.performList(\sendMsg, \b_gen, 13, \sine1, 7, a);
)
(
s.sendMsg("/b_alloc", 14, 1024, 1);
f= [1, 1.2, 1.3, 1.4];
a= [1.0, 0.8, 0.7, 0.5];
s.performList(\sendMsg, \b_gen, 14, \sine2, 7, [f,a].lace(8));
)
(
s.sendMsg("/b_alloc", 15, 1024, 1);
f= [1, 1.2, 1.3, 1.4];
a= [1.0, 0.8, 0.7, 0.5];
p= [0, 0.5, 0.5, 1]* 2pi;
s.performList(\sendMsg, \b_gen, 15, \sine3, 7, [f,a,p].lace(12));
)

(
SynthDef("partial_additive",{ arg bufnum, freq;
var sig;
sig = Osc.ar(bufnum, freq, 0, 0.2);
Out.ar(0, [1,1]*sig);
}

85
).send(s);
)

s.sendMsg("/s_new", "partial_additive", 1001, 0, 1, \bufnum, 13, \freq, 200);


s.sendMsg("/s_new", "partial_additive", 1002, 0, 1, \bufnum, 14, \freq, 200);
s.sendMsg("/s_new", "partial_additive", 1003, 0, 1, \bufnum, 15, \freq, 200);

(
s.sendMsg("/n_free", 1001);
s.sendMsg("/n_free", 1002);
s.sendMsg("/n_free", 1003);
s.sendMsg("/b_free", 13);
s.sendMsg("/b_free", 14);
s.sendMsg("/b_free", 15);
)

4.2.2. Αφαιρετική Σύνθεση (Subtractive Synthesis).

Σε αντίθεση µε την Αθροιστική Σύνθεση όπου ένα σύνθετο σήµα προκύπτει από την άθροιση επιµέρους
ηµιτονοειδών, κατά την Αφαιρετική Σύνθεση δηµιουργείται ηχοχρωµατικό περιεχόµενο µε την αντίστροφη
διαδικασία: χρησιµοποιώντας ως αρχική πηγή ένα σήµα µε πλούσιο φασµατικό περιεχόµενο, νέες
ηχοχρωµατικές δοµές παράγονται εφαρµόζοντας σε αυτό µια σειρά από φίλτρα. Συνήθεις τέτοιες πηγές
αποτελούν πηγές θορύβου, στενοί χρονικά παλµοί καθώς και πηγές οι οποίες αποτελούνται από µεγάλο
πλήθος ηµιτονοειδών.

4.2.2.1. Ο Θόρυβος ως Σήµα.

Εάν θελήσουµε να κατατάξουµε τα σήµατα µε βάση τη φασµατική τους πυκνότητα, στο ένα άκρο αυτής της
κατάταξης έχουµε την απλή ηµιτονοειδή η οποία στον φασµατικό άξονα των συχνοτήτων αποτελείται από
µια µόνο τιµή, τη συχνότητα δηλαδή ταλάντωσης της. Στον αντίποδα υπάρχει µια ηχητική πηγή η οποία
αποτελείται από όλο το δυνατό πλήθος ηµιτονοειδών του ακουστικού φάσµατος. Η πηγή αυτή καλείται
θόρυβος (noise), η φασµατική απεικόνιση του οποίου αποτελείται από ένα συνεχές πλήθος τιµών κάθε µια εκ
των οποίων αντιστοιχεί και σε µια διαφορετική συνιστώσα. Με βάση την ενεργειακή κατανοµή του φάσµατος
υπάρχουν διάφοροι τύποι θορύβου:

• Λευκός Θόρυβος (White Noise).


Θόρυβος µε γραµµικά ισοδύναµη φασµατική κατανοµή (Εικόνα 4.1).

86
Εικόνα 4.1 Φασµατική αποτύπωση λευκού θορύβου (πηγή:
https://commons.wikimedia.org/wiki/File:White_noise_spectrum.svg).

• Ροζ Θόρυβος (Pink Noise ή 1 / f Noise).


Θόρυβος µε λογαριθµικά ισοδύναµη φασµατική κατανοµή, ισοδύναµη δηλαδή κατανοµή ενέργειας
ανά οκτάβα: η ενέργεια µεταβάλλεται µειούµενη αντιστρόφως ανάλογα ως προς τη συχνότητα (–3
dB ανά οκτάβα) (Εικόνα 4.2).

Εικόνα 4.2 Φασµατική αποτύπωση ροζ θορύβου (πηγή:


https://commons.wikimedia.org/wiki/File:Pink_noise_spectrum.svg).

• Brownian ή Κόκκινος Θόρυβος (Brown Noise ή Red Noise ή 1 / f 2 ).


Θόρυβος µε φασµατική κατανοµή αντιστρόφως ανάλογη ως προς το τετράγωνο της συχνότητας (–6
dB ανά οκτάβα): το σήµα ακολουθεί την Brownian κίνηση (Εικόνα 4.3).

87
Εικόνα 4.3 Φασµατική αποτύπωση Brownian θορύβου (πηγή:
https://commons.wikimedia.org/wiki/File:Brown_noise_spectrum.svg).

• Γκρίζος Θόρυβος (Grey Noise).


Θόρυβος µε φασµατική κατανοµή αντίστοιχη προς τις ισοδύναµες ψυχοακουστικές καµπύλες
(καµπύλες ισοδύναµης στάθµης ή equal loudness curves) (Εικόνα 4.4).

Εικόνα 4.4 Φασµατική αποτύπωση γκρίζου θορύβου (πηγή:


https://commons.wikimedia.org/wiki/File:Gray_noise_spectrum.svg).

Εκτός των παραπάνω, συναντάµε επίσης και τον µπλε θόρυβο (blue noise) του οποίου η ενεργειακή κατανοµή
µεταβάλλεται µε αντίστροφο τρόπο από αυτόν του ροζ θορύβου (αύξηση 3 dB ανά οκτάβα), καθώς και τον
βιολετί θόρυβο (violet noise) η ενεργειακή κατανοµή του οποίου µεταβάλλεται µε τρόπο αντίστροφο από
αυτόν του Brownian (αύξηση 6 dB ανά οκτάβα). Οι διαφορετικές χρωµατικές ονοµασίες πηγάζουν από τη
θέση τους στο φάσµα, κατά µια αντιστοιχία µε τις χρωµατικές διαβαθµίσεις του φωτός (Εικόνα 4.5).

88
Εικόνα 4.5 Χρωµατική αποτύπωση των διαφόρων τύπων θορύβου µε βάση την ενεργειακή τους κατανοµή: βιολετί, µπλε,
γκρίζος, ροζ, κόκκινος (Brownian) (πηγή: https://commons.wikimedia.org/wiki/File:The_Colors_of_Noise.png).

Λόγω ακριβώς αυτής της δοµικής συµπεριφοράς του, ο θόρυβος αποτελεί το κατ’ εξοχήν µη περιοδικό σήµα.
Από αυτήν την άποψη στη χρονική του διάσταση αποτυπώνεται ως ένα σήµα το οποίο δεν εµφανίζει κανένα
µοτίβο επαναληψιµότητας. Έτσι, εάν θελήσουµε να τον αποτυπώσουµε ψηφιακά, οι τιµές δειγµάτων του
αποτελούν τυχαίες διάσπαρτες τιµές στον χρονικό άξονα χωρίς καµία περιοδικότητα.

4.2.2.2. Γεννήτριες Θορύβου.

Ο θόρυβος ως πηγή ήχου αφορά τυχαίες τιµές δειγµάτων στον χρόνο. Στο περιβάλλον του SuperCollider
υπάρχει η γεννήτρια LFNoise0 η οποία παράγει ένα πλήθος τέτοιων τυχαίων τιµών:

LFNoise0.ar(freq: 500, mul: 1, add: 0)

freq Η συχνότητα παραγωγής τυχαίων


δειγµάτων.
mul Πολλαπλασιαστικός συντελεστής επί των
δειγµάτων.
add Αθροιστικός συντελεστής επί των
δειγµάτων (dc offset).

µε παράδειγµα:

{ LFNoise0.ar([MouseX.kr(1,3000), MouseX.kr(1,3000)],[0.25, 0.25]) }.play;

Παραλλαγές της κλάσης αυτής αποτελούν οι LFNoise1 και LFNoise2 οι οποίες παράγουν και τις
ενδιάµεσες τιµές ανάµεσα στα τυχαία δείγµατα, µε γραµµική (linear interpolation) και τετραγωνική (quadratic
interpolation) σύζευξη αντίστοιχα. Η LFClipNoise παράγει µε τυχαία σειρά τις τιµές -1 και +1.
Σε σχέση µε τις γνωστές πηγές θορύβου (white, pink, brown, gray) το περιβάλλον του SuperCollider
παρέχει αντίστοιχες κλάσεις:

WhiteNoise.ar(mul: 1, add: 0)
PinkNoise.ar(mul: 1, add: 0)
BrownNoise.ar(mul: 1, add: 0)

89
GrayNoise.ar(mul: 1, add: 0)

mul Πολλαπλασιαστικός συντελεστής επί των


δειγµάτων.
add Αθροιστικός συντελεστής επί των
δειγµάτων (dc offset).

µε παραδείγµατα:

{ WhiteNoise.ar(0.25) }.play;
{ PinkNoise.ar(0.25) }.play;
{ BrownNoise.ar(0.25) }.play;
{ GrayNoise.ar(0.25) }.play;

4.2.2.3. Γεννήτριες Στενών Χρονικά Παλµών.

Ένας στιγµιαίος παλµός (impulse) αναλύεται σε ένα συνεχές συχνοτικό φάσµα. Το ανώτερο συχνοτικό όριο
του φάσµατος ισοδυναµεί µε 1/Δ , όπου Δ το χρονικό εύρος του παλµού. Ισχύει λοιπόν πως όσο χρονικά
t t
στενότερος παρουσιάζεται ο παλµός, τόσο επεκτείνεται το συχνοτικό του φάσµα στις υψηλές συχνότητες.
Στο περιβάλλον του SC υπάρχουν δύο γεννήτριες που παράγουν τυχαίους παλµούς, η Dust και η
Dust2. Η Dust παράγει τυχαίους παλµούς µε πλάτος από 0 έως 1, ενώ η Dust2 µε πλάτος από -1 έως +1:

Dust.ar (density: 0, mul: 1, add: 0)


Dust2.ar(density: 0, mul: 1, add: 0)

density Η πυκνότητα παραγωγής τυχαίων


παλµών, ανά δευτερόλεπτο.
mul Πολλαπλασιαστικός συντελεστής επί των
παλµών.
add Αθροιστικός συντελεστής επί των παλµών
(dc offset).

µε παραδείγµατα:

(
SynthDef("testing_Dust", { arg out=0, density;
var sig;
sig = Dust.ar([density, density], 0.5, 0);
Out.ar(out, [1,1]*sig);
}).send(s);
)

s.sendMsg("/s_new", "testing_Dust", 1001, 0, 1, "density", 2);


s.sendMsg("/n_set", 1001, "density", 12);
s.sendMsg("/n_set", 1001, "density", 120);
s.sendMsg("/n_set", 1001, "density", 500);
s.sendMsg("/n_set", 1001, "density", 1000);

s.sendMsg("/n_free", 1001);

4.2.2.4. Φίλτρα. Γενικά Στοιχεία.

Τα τέσσερα κλασσικά αναλογικά φίλτρα που χρησιµοποιούνται στην Αφαιρετική Σύνθεση είναι το φίλτρο
χαµηλής διέλευσης (low-pass filter), το φίλτρο υψηλής διέλευσης (high-pass filter), το φίλτρο διέλευσης ζώνης
(band-pass filter) και το φίλτρο αποκοπής ζώνης (band-reject ή band-stop filter).

90
Ένα φίλτρο χαµηλής διέλευσης επιτρέπει τη διέλευση στις χαµηλές συχνότητες και αποκόπτει τις
υψηλές. Αυτό αποτυπώνεται στο διάγραµµα του φίλτρου όπου φαίνεται η καµπύλη απόκρισής του (Σχήµα
4.2-κόκκινο χρώµα). Στις χαµηλές συχνότητες η καµπύλη αυτή εµφανίζεται σε ευθεία γραµµή στα 0 dB,
επιφέρει δηλαδή µηδενικές µεταβολές σε οποιοδήποτε σήµα βρίσκεται σε αυτή τη συχνοτική περιοχή. Από
µια συχνότητα και έπειτα η καµπύλη του φίλτρου αρχίζει να φθίνει µειώνοντας µε αντίστοιχο τρόπο την ισχύ
του σήµατος ώσπου τελικά πέφτει σε επίπεδα µη ανιχνεύσιµα. Η συχνότητα η οποία σηµατοδοτεί την
παραπάνω µεταβολή στη συµπεριφορά του φίλτρου ονοµάζεται συχνότητα αποκοπής (cut-off frequency) και
αφορά τη συχνότητα η οποία αντιστοιχεί σε µείωση –3 dB από την κατάσταση µηδενικής µεταβολής. Ο
τρόπος στη συνέχεια µε τον οποίο επεµβαίνει το φίλτρο στο συχνοτικό φάσµα προσδιορίζεται από τον βαθµό
καµπυλότητας του (roll-off) και αφορά τη µεταβολή που επιφέρει στην ισχύ του σήµατος σε dB ανά οκτάβα, ή
σε dB ανά δεκαπλασιασµό της συχνότητας. Στη συγκεκριµένη περίπτωση οι τιµές αυτές αντιστοιχούν σε –6
dB/οκτάβα, ή –20 dB/δεκαπλασιασµό της συχνότητας. Τα δύο παραπάνω µεγέθη χαρακτηρίζουν τη
συµπεριφορά ενός φίλτρου, τον βαθµό δηλαδή απόκρισής του (filter response): όσο πιο απότοµα
χαρακτηριστικά µετάβασης παρουσιάζει, τόσο µεγαλύτερη απόκριση έχει το φίλτρο, είναι δηλαδή πιο οξύ
στη συµπεριφορά του. Το χαρακτηριστικό αυτό καλείται και τάξη φίλτρου (filter order) και στην παραπάνω
περίπτωση οι τιµές αυτές αντιστοιχούν σε φίλτρα 1ης τάξης (1st order filters).

Σχήµα 4.2 Φίλτρο χαµηλής διέλευσης 1ης τάξης. Όπως φαίνεται και από το διάγραµµα για κάθε διπλασιασµό συχνότητας,
για κάθε δηλαδή διάστηµα οκτάβας (π.χ. από τα 10 στα 20 Hz), η καµπύλη απόκρισης µειώνεται κατά -6 dB, ή για κάθε
δεκαπλασιασµό συχνοτήτων (π.χ. από τα 10 στα 100 Hz) η µείωση αντιστοιχεί σε -20 dB. Η συχνότητα αποκοπής ορίζεται
στα -3 dB από τη µέγιστη τιµή (0 dB).

Με αντίστοιχο τρόπο ένα φίλτρο χαµηλής διέλευσης 2ης τάξης (2nd order) επιφέρει µειώσεις –12dB/οκτάβα
ή –40 dB/δεκαπλασιασµό συχνότητας. Η συχνότητα αποκοπής υπολογίζεται σε µείωση –6 dB από την
κατάσταση µηδενικής µεταβολής (Σχήµα 4.3).

91
Σχήµα 4.3 Φίλτρο χαµηλής διέλευσης 2ης τάξης. Για κάθε διπλασιασµό συχνότητας, διάστηµα δηλαδή οκτάβας (π.χ. από
τα 10 στα 20 Hz), η καµπύλη απόκρισης µειώνεται κατά -12 dB, ή για κάθε δεκαπλασιασµό συχνοτήτων (π.χ. από τα 2 στα
20 Hz) η µείωση αντιστοιχεί σε -40 dB. Η συχνότητα αποκοπής ορίζεται στα -6 dB από τη µέγιστη τιµή (0 dB).

Ένα φίλτρο υψηλής διέλευσης αποκόπτει τις χαµηλές συχνότητες και επιτρέπει τη διέλευση στις υψηλές.
Ένας τέτοιος τύπος φίλτρου 1ης τάξης µεταβάλλεται κατά +6 dB/οκτάβα ή +20 dB/δεκαπλασιασµό
συχνότητας. Η συχνότητα αποκοπής του φίλτρου προσδιορίζεται στα –3 dB από τη µέγιστη τιµή των 0 dB
(Σχήµα 4.4).

Σχήµα 4.4 Φίλτρο υψηλής διέλευσης 1ης τάξης. Για κάθε διπλασιασµό συχνότητας, διάστηµα δηλαδή οκτάβας (π.χ. από τα
0.1 στα 0.2 Hz), η καµπύλη απόκρισης αυξάνεται κατά 6 dB, ή για κάθε δεκαπλασιασµό συχνοτήτων (π.χ. από τα 2 στα 20
Hz) η αύξηση αντιστοιχεί σε 20 dB. Η συχνότητα αποκοπής αντιστοιχεί στα -3 dB από τη µέγιστη τιµή (0 dB).

Αντίστοιχα, ένα φίλτρο 2ης τάξης µεταβάλλεται κατά +12 dB/οκτάβα ή +40 dB/ δεκαπλασιασµό συχνότητας.
Η συχνότητα αποκοπής ορίζεται στα –6 dB από τη µέγιστη τιµή του φίλτρου (0 dB) (Σχήµα 4.5).

92
Σχήµα 4.5 Φίλτρο υψηλής διέλευσης 2ης τάξης. Για κάθε διπλασιασµό συχνότητας, διάστηµα δηλαδή οκτάβας (π.χ. από τα
0.1 στα 0.2 Hz), η καµπύλη απόκρισης αυξάνεται κατά 12 dB, ή για κάθε δεκαπλασιασµό συχνοτήτων (π.χ. από τα 0.03 στα
0.3 Hz) η αύξηση αντιστοιχεί σε 40 dB. Η συχνότητα αποκοπής αντιστοιχεί στα -6 dB από τη µέγιστη τιµή (0 dB).

Υπάρχουν επίσης φίλτρα µεγαλύτερης τάξης τα οποία επιδρούν µε ακόµη πιο έντονα χαρακτηριστικά
µετάβασης. Τα φίλτρα 3ης τάξης, για παράδειγµα, επεµβαίνουν µεταβάλλοντας την ισχύ του σήµατος κατά 18
dB/οκτάβα ή 60 dB/ δεκαπλασιασµό συχνότητας. Ο γενικός τύπος υπολογισµού είναι (n x 6) dB /οκτάβα ή (n
x 20) dB /δεκαπλασιασµό συχνότητας, όπου n η τάξη του φίλτρου.
Εκτός από τους παραπάνω τύπους φίλτρων υπάρχουν και φίλτρα τα οποία επεµβαίνουν σε
συγκεκριµένες περιοχές του φάσµατος. Ένα φίλτρο διέλευσης ζώνης επιτρέπει τη διέλευση σε µια µόνο
συχνοτική περιοχή αποκόπτοντας τις εκατέρωθεν περιοχές του (Σχήµα 4.6).

Σχήµα 4.6 Φίλτρο διέλευσης ζώνης.

93
Ένα φίλτρο διέλευσης ζώνης αφορά στην ουσία τον συνδυασµό δύο φίλτρων υψηλής και χαµηλής διέλευσης.
Η καµπύλη του φίλτρου ορίζεται σε +6 dB/οκτάβα κατά την άνοδο και σε –6 dB/οκτάβα κατά την κάθοδο (ή
αντίστοιχα κατά +/–20 dB ανά δεκαπλασιασµό συχνότητας). Ένα βασικό µέγεθος το οποίο προσδιορίζει
αυτού του τύπου τα φίλτρα είναι η µεταβλητή Q. Η µεταβλητή αυτή προσδιορίζεται ως:

Q = f / bw
c

όπου f είναι η κεντρική συχνότητα στην οποία εστιάζει το φίλτρο και το µέγεθος bw προσδιορίζει το
c
συχνοτικό εύρος διέλευσης του φίλτρου. Το εύρος αυτό σηµατοδοτείται από δύο εκατέρωθεν συχνότητες για
τις οποίες η µείωση σε dB από τη µέγιστη τιµή του φίλτρου (0 dB) ισοδυναµεί σε –3 dB. Κατ’ αυτόν τον
τρόπο ένα φίλτρο διέλευσης ζώνης προσδιορίζεται άµεσα από τη µεταβλητή Q. Όσο µεγαλύτερη τιµή έχει
αυτή, τόσο πιο στενό εµφανίζεται το φίλτρο (Σχήµα 4.7).

Σχήµα 4.7 Διαγράµµατα φίλτρων διέλευσης ζώνης µε διαφορετικές τιµές Q.

Τέλος, ένα φίλτρο αποκοπής ζώνης λειτουργεί µε µια ακριβώς αντίστροφη λογική: αποκόπτει µια
συγκεκριµένη συχνοτική περιοχή η οποία επίσης προσδιορίζεται από τη µεταβλητή Q (Σχήµα 4.8).

94
Σχήµα 4.8 Φίλτρο αποκοπής ζώνης.

Μια τελευταία παρατήρηση αφορά στη µείωση των 3 dB η οποία προσδιορίζει εν γένει τις συχνότητες
αποκοπής των φίλτρων. Εάν θέλουµε να βρούµε την τιµή αυτή ως ποσοστό α επί του συνολικού πλάτους Α
ενός σήµατος ισχύει:

–3 = 20 log(α x A / A)
–3 = 20 log(α)
log(α) = -0.15
α = 0.707

Το οποίο σηµαίνει πως η µείωση των 3 dB αντιστοιχεί στο 70% περίπου της αρχικής ισχύος του σήµατος.

4.2.2.5. Γεννήτριες Φίλτρων Χαµηλής/Υψηλής Διέλευσης.

Η γεννήτρια LPF υλοποιεί ένα φίλτρο χαµηλής διέλευσης δεύτερης τάξης (–12dB/οκτάβα):

LPF.ar(in: 0, freq: 440, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η συχνότητα αποκοπής (cutoff
frequency).
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

Η γεννήτρια HPF υλοποιεί ένα φίλτρο υψηλής διέλευσης δεύτερης τάξης (+12dB/οκτάβα):

HPF.ar(in: 0, freq: 440, mul: 1, add: 0)

in Το σήµα εισόδου.

95
freq Η συχνότητα αποκοπής (cutoff
frequency).
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

Παραδείγµατα χρήσης των δύο αυτών φίλτρων, µε την οριζόντια θέση του ποντικιού MouseX να ορίζει τη
συχνότητα αποκοπής:

{ LPF.ar(WhiteNoise.ar, MouseX.kr(1e2,2e4,1), 0.2) }.play;


{ HPF.ar(WhiteNoise.ar, MouseX.kr(1e2,2e4,1), 0.2) }.play;

4.2.2.6. Γεννήτριες Φίλτρων Διέλευσης/Αποκοπής Ζώνης.

Η γεννήτρια BPF υλοποιεί ένα φίλτρο διέλευσης ζώνης δεύτερης τάξης (–12dB/οκτάβα):

BPF.ar(in: 0, freq: 440, rq: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η κεντρική συχνότητα fc του φίλτρου.
rq Η τιµή 1/Q, όπου Q = fc/(f2–f1) και f2, f1
οι δύο εκατέρωθεν συχνότητες της
κεντρικής, κατά τις οποίες η καµπύλη του
φίλτρου βρίσκεται στο 70% της µέγιστης
τιµής του.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

Αντίστοιχα, η BRF υλοποιεί ένα φίλτρο αποκοπής ζώνης δεύτερης τάξης (–12dB/οκτάβα):

BRF.ar(in: 0, freq: 440, rq: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η συχνότητα αποκοπής (cutoff
frequency).
rq Η τιµή 1/Q, όπου Q = fc/(f2–f1) και f2, f1
οι δύο εκατέρωθεν συχνότητες της
κεντρικής, κατά τις οποίες η καµπύλη του
φίλτρου βρίσκεται στο 70% της µέγιστης
τιµής του.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

Παραδείγµατα χρήσης των παραπάνω φίλτρων µε την οριζόντια θέση του ποντικιού MouseX να ορίζει την
τιµή 1/Q:

{ BPF.ar(WhiteNoise.ar, MouseX.kr(1e2,2e4,1), 0.4, 0.4) }.play;


{ BRF.ar(WhiteNoise.ar, MouseX.kr(1e2,2e4,1), 0.4, 0.2) }.play;

96
4.2.2.7. Τεχνικές Φασµατικής Ανασύνθεσης: FOF Synthesis, Resonators.

Η κατηγορία αυτών των τεχνικών αφορά στην ανασύνθεση ηχητικών πηγών µε οδηγό τη φασµατική τους
κατανοµή. Λαµβάνοντας ως αρχική πηγή ένα σήµα θορύβου µπορούµε γενικά να το διαµορφώσουµε
τονίζοντας ή ελαχιστοποιώντας συγκεκριµένες φασµατικές του περιοχές µέσω φίλτρων, παράγοντας έτσι ένα
σήµα, το φάσµα του οποίου αποτελείται από εξάρσεις ή µειώσεις αντίστοιχες µε αυτές της πηγής που θέλουµε
να προσοµοιώσουµε.
Μια χαρακτηριστική τεχνική αυτού του είδους αποτελεί η FOF (Fonction d'Onde Formantique) η
οποία βασίζεται στην ιδιότητα που έχουν κάποιες φυσικές πηγές ήχου να παρουσιάζουν συγκεκριµένες
περιοχές συχνοτικής έξαρσης. Χαρακτηριστική πηγή αυτού του τύπου είναι η ανθρώπινη φωνή. Η τεχνική
αυτή αναπτύχθηκε κατά τη δεκαετία του 1980 (Xavier Rodet, 1984) και βασίζεται στην έννοια των Formants,
τα οποία αφορούν περιοχές συχνοτικών εξάρσεων στο φασµατικό πεδίο. Κάθε τέτοια φασµατική έξαρση
µπορεί ουσιαστικά να υλοποιηθεί από ένα φίλτρο διέλευσης το οποίο επεµβαίνει σε µια αρχική πηγή µε
αδιαµόρφωτο φασµατικό περιεχόµενο, όπως µια πηγή θορύβου. Αθροίζοντας ένα πλήθος από διαφορετικά
Formants µε συγκεκριµένα χαρακτηριστικά επέµβασης καταλήγουµε στην ανασύνθεση της ηχητικής πηγής.

Σχήµα 4.9 Διάγραµµα FOF Synthesis.

Στο περιβάλλον του SC µια χαρακτηριστική κλάση για τον συγκεκριµένο τύπο ανασύνθεσης είναι η κλάση
Klank:

Klank.ar(specificationsArrayRef, input, freqscale: 1, freqoffset: 0, decayscale:


1)

specificationsArrayRef Ένας πίνακας ο οποίος περιέχει τρεις


διαφορετικούς επιµέρους πίνακες:
• [freq1, freq2, …], ένας πίνακας
κεντρικών συχνοτήτων φίλτρων
διέλευσης
• [amp1, amp2, …], ένας πίνακας
σχετικών εντάσεων των φίλτρων
(για τιµή nil τα φίλτρα έχουν
ένταση ίση µε τη µονάδα)
• [ring_t1, ring_t2, …], ένας
πίνακας ο οποίος περιγράφει τους
χρόνους µείωσης ισχύος κατά –60
dB, για κάθε φίλτρο
input Η αρχική πηγή.
freqscale Πολλαπλασιαστικός συντελεστής επί των
τιµών συχνοτήτων.

97
freqoffset Αθροιστικός συντελεστής επί των τιµών
συχνοτήτων.
decayscale Πολλαπλασιαστικός συντελεστής επί των
τιµών χρόνου αποκοπής.

Παραδείγµατα:

{ Klank.ar(`[[800, 1071, 1353, 1723], nil, [1, 1, 1, 1]], PinkNoise.ar(0.007))


}.play;
{ Klank.ar(`[[200, 671, 1153, 1723], nil, [1, 1, 1, 1]], PinkNoise.ar([0.007,
0.007])) }.play;

και ένα κοντινό παράδειγµα στα ανθρώπινα φωνητικά:

(
SynthDef("help_Klank", { arg out=0, i_freq;
var klank, n, harm, amp, ring;
// harmonics
harm = \harm.ir(Array.series(4, 1, 1).postln);
// amplitudes
amp = \amp.ir(Array.fill(4, 0.05));
// ring times
ring = \ring.ir(Array.fill(4, 1));
klank = Klank.ar(`[harm, amp, ring], {ClipNoise.ar(0.003)}.dup, i_freq);
Out.ar(out, klank); }).send(s);
)

s.sendMsg("/s_new","help_Klank", 1001, 1, 1, "\i_freq", 300);


s.sendMsg("/s_new","help_Klank", 1002, 1, 1, "\i_freq", 330);
s.sendMsg("/s_new","help_Klank", 1003, 1, 1, "\i_freq", 350);

s.sendMsg("n_free", 1001);
s.sendMsg("n_free", 1002);
s.sendMsg("n_free", 1003);

Άλλες τεχνικές στηρίζονται στην ιδιότητα την οποία έχουν αρκετές πηγές να χρωµατίζουν φασµατικά έναν
ήχο µε µια αντίστοιχη λογική ακουστικής συµπεριφοράς αντηχείων, φυσικών χώρων ή ακουστικών
κοιλοτήτων δηµιουργώντας έτσι το φαινόµενο της συνήχησης (resonance). Αρκετά περιβάλλοντα ηχητικής
σύνθεσης παρέχουν µια σειρά από τέτοια συνηχητικά φίλτρα (resonant filters) τα οποία επενεργούν σε µια
αρχική πηγή χρωµατίζοντας την µε βάση συγκεκριµένα φασµατικά χαρακτηριστικά. Τρεις βασικές κλάσεις
στο περιβάλλον του SuperCollider οι οποίες λειτουργούν µε αυτήν τη λογική είναι οι Resonz, Ringz και
Formlet.

Resonz.ar(in: 0, freq: 440, bwr: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η συχνότητα συνήχησης.
bwr Η τιµή 1/Q, όπου Q = fc/(f2–f1) και f2, f1
οι δύο εκατέρωθεν συχνότητες της
κεντρικής, κατά τις οποίες η καµπύλη του
φίλτρου βρίσκεται στο 70% της µέγιστης
τιµής του.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

98
µε παραδείγµατα:

{ Resonz.ar(WhiteNoise.ar(0.5), MouseX.kr(1000,1800), 0.05) }.play


{ Resonz.ar(WhiteNoise.ar(0.5), 2000, MouseX.kr(0.001,0.01), MouseY.kr(1, 5))
}.play

Η Ringz λειτουργεί όπως η Resonz µε τη διαφορά πως αντί για τον συντελεστή Q, χρησιµοποιεί έναν
συντελεστή χρόνου µείωσης του σήµατος κατά –60 dB. Η Ringz χρησιµοποιείται ως µονάδα Formant στην
κλάση Klank. Συντάσσεται ως εξής:

Ringz.ar (in: 0, freq: 440, decaytime: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η συχνότητα συνήχησης.
decaytime O χρόνος µείωσης κατά –60 dB.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

µε παράδειγµα:

{ Ringz.ar(WhiteNoise.ar(0.005), 2000, 0.5) }.play

Η κλάση Formlet αναπαράγει ένα συνηχητικό φίλτρο στο οποίο, αντί της συνήθους συµµετρίας της
καµπύλης απόκρισης που παρουσιάζουν τα φίλτρα διέλευσης εκατέρωθεν της κεντρικής συχνότητας,
µπορούν να προσδιοριστούν διαφορετικοί χρόνοι ανόδου (attack time) και χρόνοι καθόδου (decay time) του
φίλτρου. Αλγοριθµικά είναι ισοδύναµο µε:

Ringz(in, freq, decaytime) - Ringz(in, freq, attacktime)

Συντάσσεται ως εξής:

Formlet.ar(in: 0, freq: 440, attacktime: 1, decaytime: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
freq Η συχνότητα συνήχησης.
attacktime O χρόνος ανόδου ενίσχυσης κατά +60 dB.
decaytime O χρόνος καθόδου µείωσης κατά –60 dB.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών της εξόδου.
add Αθροιστικός συντελεστής επί των τιµών
της εξόδου (dc offset).

µε χαρακτηριστικό παράδειγµα:

{ Formlet.ar(WhiteNoise.ar(0.005), 2000, 0.5, 0.1) }.play;

4.3. Φασµατικές, Μη-Γραµµικές Τεχνικές: Διαµόρφωση Πλάτους (AM), Ring


Modulation, Διαµόρφωση Συχνότητας (FM).

Με τον όρο διαµόρφωση εννοούµε την επέµβαση σε κάποιο από τα χαρακτηριστικά της ταλάντωσης ενός
σήµατος (πλάτος, συχνότητα, φάση) µε βάση τα χαρακτηριστικά µιας άλλης ταλάντωσης. Το σήµα το οποίο
υφίσταται τη διαµόρφωση ονοµάζεται φορέας (carrier), ενώ το σήµα το οποίο επεµβαίνει στα

99
χαρακτηριστικά του φορέα διαµορφωτής (modulator). Οι τεχνικές διαµόρφωσης αποτελούν φασµατικές µη-
γραµµικές τεχνικές καθώς εισάγουν µη προ-υπάρχουσα φασµατική πληροφορία. Δύο βασικές τεχνικές
διαµόρφωσης είναι η Διαµόρφωση Πλάτους και η Διαµόρφωση Συχνότητας, καθώς και η τεχνική της
Διαµόρφωσης Δακτυλίου (Ring Modulation) η οποία αποτελεί ειδική περίπτωση της Διαµόρφωσης Πλάτους.

4.3.1. Διαµόρφωση Πλάτους (Amplitude Modulation).

Κατά τη Διαµόρφωση Πλάτους µια ηµιτονοειδής ταλάντωση (σήµα διαµορφωτή) διαµορφώνει τις τιµές
πλάτους του σήµατος φορέα (Σχήµα 4.10).

Σχήµα 4.10 Διάγραµµα Διαµόρφωσης Πλάτους.

Κατ’ αυτόν τον τρόπο το πλάτος ταλάντωσης του φορέα AMP µεταβάλλεται διαρκώς µε βάση την
ηµιτονοειδή ταλάντωση που παράγεται από τον διαµορφωτή. Οι τιµές δηλαδή πλάτους µεταβάλλονται
περιοδικά σε ένα εύρος τιµών [AMP+a, AMP-a], µε συχνότητα περιοδικότητας ίση προς τη συχνότητα του
διαµορφωτή FREQm (Σχήµα 4.11).

100
Σχήµα 4.11 Εάν οι τιµές που παράγονται από µια ταλάντωση (i) αθροιστούν σε µια σταθερή τιµή πλάτους AMP (ii), τότε
θα προκύψει µια διαρκώς µεταβαλλόµενη τιµή πλάτους ταλάντωσης AMP’ (iii). Εάν στη συνέχεια η τιµή αυτή
χρησιµοποιηθεί σαν πλάτος σε µια δεύτερη ταλάντωση, τότε η παραγόµενη κυµατοµορφή θα εµφανίζεται να µεταβάλλει
διαρκώς το πλάτος της σε ένα εύρος τιµών [AMP-a, AMP+a] µε περίοδο µεταβολής ίση προς την περίοδο της αρχικής
ταλάντωσης 1/FREQm (iv).

Σε αρκετούς αλγόριθµους διαµόρφωσης το πλάτος a του διαµορφωτή συνηθίζεται να δίνεται ως ποσοστό επί
της τιµής AMP του φορέα. Ισχύει δηλαδή:

a = AMP x i

όπου i το ποσοστό διαµόρφωσης εκφρασµένο σε δεκαδική τιµή. Έτσι για i = 0 δεν παρουσιάζεται καθόλου
διαµόρφωση αφού το γινόµενο AMP x i στην περίπτωση αυτή ισούται µε µηδέν. Αντίστοιχα για ποσοστό
100%, δηλαδή i = 1, έχουµε πλήρη διαµόρφωση. Ο δείκτης αυτός i, καλείται και συντελεστής διαµόρφωσης
(index of modulation) (Σχήµα 4.12).

101
Σχήµα 4.12 Αλγόριθµος Διαµόρφωσης Πλάτους µε την τιµή πλάτους του διαµορφωτή εκφρασµένη ως ποσοστό επί του
πλάτους φορέα AMP (συντελεστής διαµόρφωσης i).

Το παραγόµενο φάσµα αποτελείται από τη συχνότητα του φορέα καθώς και δύο πλευρικές εκατέρωθεν
συχνότητες σε απόσταση ίση προς τη συχνότητα του διαµορφωτή µε πλάτος ίσο προς AMP x i/2 (Σχήµα
4.13).

Σχήµα 4.13 Παραγόµενο φάσµα από την κλασική Διαµόρφωση Πλάτους.

Έτσι, για χαµηλές τιµές συχνότητας του διαµορφωτή, δηλαδή από 1 έως περίπου 15 Hz, παράγεται το
φαινόµενο του tremolo. Για µεγάλες µάλιστα τιµές του συντελεστή διαµόρφωσης παράγονται και
διακροτηµατικά φαινόµενα (Σχήµα 4.14):

//***tremolo effect (modulating frequencies between 1 and 15 Hz)


(
SynthDef("am-tremolo", { arg out=0, c_freq, c_amp, main=0.2;
var mod, car, index;

index = MouseY.kr(0,1); //index of modulation


mod = SinOsc.ar(MouseX.kr(1,15), 0, index*c_amp); //modulator
car = SinOsc.ar(c_freq, 0, mod + c_amp); //carrier
Out.ar(out, [1,1]*car*main);
}
).send(s);
)

102
s.sendMsg("/s_new", "am-tremolo", 1001, 0, 1, "c_freq", 100, "c_amp", 0.2);

//different carrier frequencies


s.sendMsg("/n_set", 1001, "c_freq", 200);
s.sendMsg("/n_set", 1001, "c_freq", 400);
s.sendMsg("/n_set", 1001, "c_freq", 1000);
s.sendMsg("/n_set", 1001, "c_freq", 4000);

s.sendMsg("/n_free", 1001);

Σχήµα 4.14 Παραγωγή διακροτηµατικών φαινοµένων µε συντελεστή διαµόρφωσης στο 100% (i = 1).

Καθώς η τιµή συχνότητας του διαµορφωτή καθορίζει και την απόσταση των παραγόµενων πλευρικών
συχνοτήτων από τη κεντρική συχνότητα του φορέα (Σχήµα 4.13), για υψηλότερες τιµές συχνότητας του
διαµορφωτή, από δηλαδή περίπου 20 Hz και άνω, παράγεται νέο φασµατικό περιεχόµενο µε ακουστικά
διακριτές πλευρικές συχνότητες:

//*** separating side frequencies (modulating frequencies between 20 and 1500 Hz)
(
SynthDef("am-2", { arg out=0, c_freq, c_amp, main=0.2;
var mod, car, index;

index = MouseY.kr(0,1); // index of modulation


mod = SinOsc.ar(MouseX.kr(20,1500), 0, index*c_amp); //modulator
car = SinOsc.ar(c_freq, 0, mod + c_amp); //carrier
Out.ar(out, [1,1]*car*main);
}
).send(s);
)

s.sendMsg("/s_new", "am-2", 1002, 0, 1, "c_freq", 100, "c_amp", 0.2);

//different carrier frequencies

103
s.sendMsg("/n_set", 1002, "c_freq", 200);
s.sendMsg("/n_set", 1002, "c_freq", 400);
s.sendMsg("/n_set", 1002, "c_freq", 1000);
s.sendMsg("/n_set", 1002, "c_freq", 4000);

s.sendMsg("/n_free", 1002);

Σε πολλές περιπτώσεις σχεδίασης αλγορίθµων Διαµόρφωσης Πλάτους το σήµα διαµόρφωσης παρουσιάζεται


ως µονοπολικό (unipolar) [Roads, 1999]. Σε αντίθεση µε το διπολικό σήµα (bipolar) του οποίου οι τιµές
ταλάντωσης κυµαίνονται µεταξύ -1 και 1, το µονοπολικό σήµα ταλαντώνεται µεταξύ 0 και 1 (Σχήµα 4.15).

Σχήµα 4.15 Διπολικό (άνω) και µονοπολικό (κάτω) σήµα ταλάντωσης.

Αυτού του τύπου οι κυµατοµορφές είναι ιδιαίτερα χρήσιµες σε περιπτώσεις που χρησιµοποιούνται για να
περιγράψουν φαινόµενα τα οποία αφορούν µεγέθη ρυθµίσεων στον ήχο και δεν µπορούν να περιέχουν
αρνητικές τιµές. Τέτοια παραδείγµατα αποτελούν η κίνηση ενός δείκτη θέσεων µνήµης σε πίνακες, buffer
κ.λπ., µια περιβάλλουσα πλάτους, η κίνηση µιας ηχητικής πηγής σε ένα στερεοφωνικό πεδίο (panning) κ.ο.κ.
Στην περίπτωση που η ταλάντωση του διαµορφωτή αφορά µονοπολικό σήµα, η µονοπολικότητα διασφαλίζει
πως κατά την ελάχιστη τιµή του διαµορφωτή (τιµή πλάτους 0) το σήµα του φορέα δε θα παρουσιάζει
διαµόρφωση, ενώ κατά τη µέγιστη τιµή του διαµορφωτή (πλάτος a) το σήµα φορέα διαµορφώνεται πλήρως,
παρουσιάζοντας έτσι µια κανονικότητα. Προκειµένου να υλοποιηθεί κάτι τέτοιο αρκεί το σήµα διαµόρφωσης
να έχει αθροιστική µετατόπιση των τιµών του (DC-offset) και, επακόλουθα, οι τιµές που παράγονται να
διαιρεθούν κατά το ήµισυ (Σχήµα 4.16).

104
Σχήµα 4.16 Διαδικασία µετατροπής του διπολικού (i) σε µονοπολικό (v) σήµα ταλάντωσης, µε αθροιστική µετατόπιση κατά
a (ii και iii) και επακόλουθη ελάττωση των τιµών κατά το ήµισυ (iv και v).

Στο περιβάλλον του SuperCollider όλες οι µονάδες γεννητριών παρέχουν ένα όρισµα add το οποίο
αντιστοιχεί στην τιµή αθροιστικής µετατόπισης των παραγόµενων τιµών τους. Ειδικότερα, στην κλάση
SinOsc το όρισµα αυτό απαντάται τέταρτο στη σειρά ορισµάτων της.

(
SynthDef("am-unipolar", { arg out=0, c_freq, c_amp, main=0.2;
var mod, car, index, mod_amp;
index = MouseY.kr(0,1);
mod_amp = index*c_amp;
mod = SinOsc.ar(MouseX.kr(1,15), 0, mod_amp, mod_amp); //modulator-unipolar
car = SinOsc.ar(c_freq, 0, mod/2 + c_amp); //carrier
Out.ar(out, [1,1]*car*main);
}
).send(s);
)

4.3.2. Πολλαπλασιασµός Σηµάτων (Ring Modulation).

Μια παραλλαγή της Διαµόρφωσης Πλάτους αποτελεί η τεχνική της Διαµόρφωσης Δακτυλίου (Ring
Modulation), κατά την οποία οι έξοδοι δύο ταλαντωτών πολλαπλασιάζονται µεταξύ τους (Σχήµα 4.17).

105
Σχήµα 4.17 Αλγόριθµος πολλαπλασιασµού σηµάτων (Ring Modulation).

Στην πιο απλή του µορφή ο αλγόριθµος υλοποιείται από δύο ηµιτονοειδείς. Το παραγόµενο φάσµα µοιάζει
σηµαντικά µε αυτό της Διαµόρφωσης Πλάτους. Εµφανίζει δηλαδή τις δύο πλευρικές συχνότητες στα σηµεία
(FREQ1-FREQ2) και (FREQ1+FREQ2), χωρίς όµως να εµφανίζει κεντρική συχνότητα φορέα (Σχήµα 4.18).

Σχήµα 4.18 Παραγόµενο φάσµα από τον πολλαπλασιασµό δύο ηµιτονοειδών. Η συχνότητα φορέα fc απουσιάζει.

Με υλοποίηση στο περιβάλλον του SuperCollider:

(
SynthDef("rm", { arg out=0, amp1=0.5, amp2=0.5, main=0.7;
var mod1, mod2, sig;
mod1 = SinOsc.ar(MouseX.kr(3,30), 0, amp1); //source-1: sinewave
mod2 = SinOsc.ar(MouseY.kr(30,1000), 0, amp2); //source-2: sinewave
sig = mod1*mod2;
Out.ar(out, [1,1]*sig*main);
}
).send(s);
)

s.sendMsg("/s_new", "rm", 1001, 0, 1);


s.sendMsg("/n_free", 1001);

Άλλες υλοποιήσεις της τεχνικής αυτής αφορούν τον πολλαπλασιασµό ηµιτονοειδούς µε ένα σύνθετο σήµα.
Στην περίπτωση αυτή για κάθε µερική συχνότητα fc1, fc2, ... , fcn του σύνθετου σήµατος παράγεται και ένα
νέο ζευγάρι τιµών [fcn – fm, fcn + fm] εκατέρωθεν τους (Σχήµα 4.19).

106
Σχήµα 4.19 Παραγόµενο φασµατικό περιεχόµενο από τον πολλαπλασιασµό µιας απλής ηµιτονοειδούς fm µε σύνθετη
κυµατοµορφή η οποία αποτελείται από αρµονικούς fc1, fc2, fc3, fc4, κ.ο.κ.

Ιδιαίτερο ενδιαφέρον έχει η τεχνική αυτή όταν το ένα σήµα αποτελείται από παλµούς χαµηλής συχνότητας,
καθώς αυτοί ουσιαστικά επενεργούν ως διακοπτόµενες περιβάλλουσες δυναµικής επί του δεύτερου σήµατος:

(
SynthDef("rm-2", { arg out=0, freq2;
var mod1, mod2, sig;
mod1 = Pulse.ar(MouseX.kr(1,20),0.5, 0.2); //source-1: low frequency pulses
mod2 = SinOsc.ar(freq2, 0, MouseY.kr(0,1)); //source-2: sinewave
sig = mod1*mod2;
Out.ar(out, [1,1]*sig);
}
).send(s);
)
s.sendMsg("/s_new", "rm-2", 1002, 0, 1, "freq2", 140);
s.sendMsg("/n_set", 1002, "freq2", 440);
s.sendMsg("/n_set", 1002, "freq2", 4400);

s.sendMsg("/n_free", 1002);

Μια τρίτη περίπτωση, τέλος, αφορά και τα δύο σήµατα να είναι σύνθετα. Τότε οι µερικές του ενός σήµατος
µετατοπίζονται εκατέρωθεν σε πολλαπλάσια αποστάσεων fm1, fm2, fm3,… των θέσεων των µερικών του
άλλου σήµατος (Σχήµα 4.20).

Σχήµα 4.20 Πολλαπλασιασµός δύο σύνθετων σηµάτων αποτελούµενοι από αρµονικούς. Οι αρµονικοί fm1, fm2 και fm3
του ενός σήµατος µετατοπίζονται εκατέρωθεν των αρµονικών fc1, fc2, fc3 κ.ο.κ του άλλου, σε σύνολα προσθαφαιρέσεων
[fc1-fm1, fc1-fm2, fc1-fm3], [fc1+fm1, fc1+fm2, fc1+fm3] κ.λπ.

107
Ακολουθεί ένα παράδειγµα όπου στο περιβάλλον του SuperCollider παλµοί χαµηλής συχνότητας
διαµορφώνουν έναν στιγµιαίο παλµό (κλάση Impulse), πηγή ιδιαίτερα πλούσια σε πλήθος αρµονικών, µε
αποτέλεσµα την παραγωγή ενός ιδιαίτερου ηχοχρώµατος:

(
SynthDef("rm-3", { arg out=0, main=0.5;
var mod1, mod2, sig;
mod1 = Pulse.ar(MouseX.kr(1,20),0.5, 0.5); //source-1: low frequency pulses
mod2 = Impulse.ar(MouseY.kr(1,1000), 0, 0.5); //source-2: impulse
sig = mod1*mod2;
Out.ar(out, [1,1]*sig*main);
}
).send(s);
)

s.sendMsg("/s_new", "rm-3", 1003, 0, 1);


s.sendMsg("/n_free", 1003);

4.3.3. Διαµόρφωση Συχνότητας (Frequency Modulation).

Κατά τη Διαµόρφωση Συχνότητας η συχνότητα ενός ταλαντωτή φορέα (carrier) διαµορφώνεται µε βάση τις
τιµές που παράγει ένας ταλαντωτής διαµόρφωσης (modulator). Οι τιµές του διαµορφωτή αθροίζονται µε µια
σταθερή τιµή συχνότητας FREQ πριν καταλήξουν στον ταλαντωτή φορέα (Σχήµα 4.21).

Σχήµα 4.21 Αλγόριθµος της Διαµόρφωσης Συχνότητας.

Κατ’ αυτόν τον τρόπο το σήµα που παράγεται στην έξοδο έχει περιοδικώς µεταβαλλόµενη συχνότητα µε
εύρος τιµών [FREQ-a, FREQ+a]. Η περιοδικότητα αυτή ισοδυναµεί µε την περίοδο του διαµορφωτή (Σχήµα
4.22).

108
Σχήµα 4.22 Κατά τη Διαµόρφωση Συχνότητας η τιµή συχνότητας του φορέα FREQ (ii) µεταβάλλεται µε βάση τις τιµές
ταλάντωσης του φορέα (i). Οι νέες τιµές FREQ’ (iii) παράγουν ένα σήµα µε περιοδικά µεταβαλλόµενη συχνότητα και
περίοδο µεταβολής ίση µε την περίοδο του διαµορφωτή 1/FREQm (iv).

Το φάσµα το οποίο παράγεται αποτελείται από ένα σύνθετο σήµα το οποίο περιέχει τη συχνότητα του φορέα
καθώς και ένα πλήθος πλευρικών συχνοτήτων σε αποστάσεις ακέραιων πολλαπλασίων της fm εκατέρωθεν
της συχνότητας φορέα, σε ζεύγη δηλαδή τιµών [fc + (n x fm), fc – (n x fm)] όπου n το ακέραιο πολλαπλάσιο.
Οι πλευρικές συχνότητες εκτείνονται χονδρικά σε µια έκταση ισοδύναµη µε το εύρος τιµών που παράγει ο
ταλαντωτής διαµόρφωσης, τιµή δηλαδή ίση προς 2a (Σχήµα 4.23). Το βασικό λοιπόν χαρακτηριστικό το
οποίο καθορίζει τον βαθµό διαµόρφωσης είναι το πλάτος µε το οποίο ταλαντώνεται ο ταλαντωτής
διαµόρφωσης, χαρακτηριστικό το οποίο καλείται και βάθος διαµόρφωσης (depth of modulation). Αυξάνοντας
το πλάτος του διαµορφωτή αυξάνεται αντίστοιχα και το βάθος διαµόρφωσης, ενώ ταυτόχρονα µεγαλώνει και
το πλήθος παράπλευρων συχνοτήτων το οποίο παράγεται από τη διαµόρφωση.

Σχήµα 4.23 Παραγόµενο φάσµα κατά τη Διαµόρφωση Συχνότητας.

Για τον παραπάνω λόγο οι τιµές πλάτους του διαµορφωτή σε αρκετούς αλγόριθµους Διαµόρφωσης
Συχνότητας δίδονται σε Hz. Η σχέση µάλιστα αυτή αποτυπώνεται καλύτερα µε τον συντελεστή διαµόρφωσης
i, όπου:

109
i = a / fm

ή:

a = i x fm

Η παραπάνω σχέση φανερώνει πως το παραγόµενο φάσµα εκτείνεται σε πολλαπλάσια i της συχνότητας
διαµόρφωσης fm, το πλήθος των οποίων σχετίζεται µε το πλάτος a του διαµορφωτή. Έτσι, αυξάνοντας τον
συντελεστή i αυξάνεται και το πλήθος των πλευρικών παραγόµενων συχνοτήτων του φάσµατος. Σε αρκετούς
αλγορίθµους µάλιστα το πλάτος του διαµορφωτή συνηθίζεται να διατυπώνεται µε βάση την παραπάνω σχέση
(Σχήµα 4.24).

Σχήµα 4.24 Ο αλγόριθµος Διαµόρφωσης Συχνότητας µε το πλάτος του διαµορφωτή εκφρασµένο ως γινόµενο του
συντελεστή διαµόρφωσης επί της συχνότητας διαµορφωτή.

Τα χαρακτηριστικά των πλευρικών συχνοτήτων, οι τιµές δηλαδή πλάτους και φάσης τους, καθορίζονται µε
ακρίβεια από µια οµάδα µαθηµατικών συναρτήσεων, οι συναρτήσεις Bessel 1ου τύπου (Εικόνα 4.6). Οι
συναρτήσεις αυτές συµβολίζονται ως Jn(x), όπου n ο βαθµός ή η τάξη (order) της συνάρτησης.

110
Εικόνα 4.6 Απεικόνιση τριών διαφορετικών βαθµών των συναρτήσεων Bessel 1ου τύπου: του µηδενικού βαθµού µε
κόκκινο χρώµα, του πρώτου µε πράσινο και του δεύτερου βαθµού µε µπλε χρώµα (πηγή:
https://commons.wikimedia.org/wiki/File:Bessel_Functions_(1st_Kind,_n%3D0,1,2).svg_-
_/media/File:Bessel_Functions_(1st_Kind,_n%3D0,1,2).svg).

Αναλόγως τον βαθµό της, κάθε τέτοια συνάρτηση περιγράφει τις τιµές πλάτους και φάσης της αντίστοιχης
πλευρικής συχνότητας του παραγόµενου φάσµατος. Έτσι, η καµπύλη συνάρτησης 1ου βαθµού J1(x)
περιγράφει το πλάτος και τη φάση του πρώτου ζεύγους πλευρικών συχνοτήτων, δηλαδή των fc-fm και fc+fm,
η καµπύλη συνάρτησης 2ου βαθµού J2(x) περιγράφει τις τιµές πλάτους και φάσης του δεύτερου ζεύγους
πλευρικών συχνοτήτων, δηλαδή των fc-2fm και fc+2fm κ.ο.κ. Η καµπύλη µηδενικού βαθµού J0(x) περιγράφει
το πλάτος και τη φάση µε την οποία θα εµφανιστεί η συχνότητα του φορέα fc. Όλες οι παραπάνω
πληροφορίες συναρτώνται µε την τιµή του συντελεστή διαµόρφωσης i, ο οποίος αποτυπώνεται στον άξονα x
του διαγράµµατος. Αναλόγως λοιπόν την τιµή του i στον άξονα x, λαµβάνουµε την αντίστοιχη τιµή στον
άξονα y ως πληροφορία της τιµής πλάτους και φάσης από κάθε καµπύλη για κάθε µια πλευρική συνιστώσα.
Η πληροφορία της φάσης κάθε συνιστώσας συνάγεται εµµέσως από την τιµή του πλάτους: εάν από το
διάγραµµα προκύπτει αρνητική τιµή πλάτους, όπως φαίνεται για παράδειγµα για i = 5 στις συναρτήσεις
µηδενικού και πρώτου βαθµού, ισχύει ως τιµή πλάτους η απόλυτη τιµή και φάση ίση προς 1800. Για τις
συχνότητες της φθίνουσας πλευράς ισχύει µάλιστα πως ανά περιττό πολλαπλάσιο η πληροφορία της φάσης
αναστρέφεται. Ισχύει δηλαδή:

Ζεύγος Φθίνουσα Πλευρά Αύξουσα Πλευρά


Πλευρικών
Συνιστωσών συχνότητα πλάτος φάση συχνότητα πλάτος φάση
1ο fc-fm J1(i) 1800 J1(i) fc-fm 0
2ο fc-2fm J2(i) 0 J2(i) fc-2fm 0
3ο fc-3fm J3(i) 1800 J3(i) fc-3fm 0
4ο fc-4fm J4(i) 0 J4(i) fc-4fm 0
5ο fc-5fm J5(i) 1800 J5(i) fc-5fm 0

Πίνακας 4.1 Τιµές συχνότητας, πλάτους και φάσης για τα πρώτα πέντε παραγόµενα ζεύγη πλευρικών συνιστωσών κατά τη
Διαµόρφωση Συχνότητας.

111
Για πολύ χαµηλές συχνότητες διαµόρφωσης της τάξης του 1 έως περίπου 15 Hz και κατ΄ αντιστοιχία µικρές
τιµές συντελεστή διαµόρφωσης, από δηλαδή περίπου 1 έως 10, παράγεται το φαινόµενο του vibrato:

(
SynthDef("fm-vibrato", { arg out=0, c_freq, c_amp, main=0.2;
var mod, car, m_freq;
m_freq = MouseX.kr(1,15); //modulation frequency
mod = SinOsc.ar(m_freq, 0, MouseY.kr(0,10)*m_freq); //modulator
car = SinOsc.ar(c_freq+mod, 0, c_amp); //carrier
Out.ar(out, [1,1]*car*main);
}
).send(s);
)

s.sendMsg("/s_new", "fm-vibrato", 1001, 0, 1, "c_freq", 100, "c_amp", 0.2);


//different carrier frequencies
s.sendMsg("/n_set", 1001, "c_freq", 200);
s.sendMsg("/n_set", 1001, "c_freq", 400);
s.sendMsg("/n_set", 1001, "c_freq", 1000);
s.sendMsg("/n_set", 1001, "c_freq", 4000);

s.sendMsg("/n_free", 1001);
)

Για µεγαλύτερες τιµές συχνότητας διαµόρφωσης και συντελεστή διαµόρφωσης, παράγεται ένα ιδιαίτερα
πλούσιο φασµατικό περιεχόµενο. Καθώς µάλιστα οι πλευρικές συχνότητες µεγαλώνουν δηµιουργείται πλήθος
αναδιπλώσεων στο συχνοτικό φάσµα µε πολύ ενδιαφέροντα ηχοχρωµατικά χαρακτηριστικά.

(
SynthDef("fm-2", { arg out=0, c_freq, c_amp, main=0.2;
var mod, car, m_freq;
m_freq = MouseX.kr(20,1500); //modulation frequency
mod = SinOsc.ar(m_freq, 0, MouseY.kr(0,100)*m_freq); //modulator
car = SinOsc.ar(c_freq+mod, 0, c_amp); //carrier
Out.ar(out, [1,1]*car*main);
}
).send(s);
)

s.sendMsg("/s_new", "fm-2", 1002, 0, 1, "c_freq", 100, "c_amp", 0.2);


//different carrier frequencies
s.sendMsg("/n_set", 1002, "c_freq", 200);
s.sendMsg("/n_set", 1002, "c_freq", 400);
s.sendMsg("/n_set", 1002, "c_freq", 1000);
s.sendMsg("/n_set", 1002, "c_freq", 4000);

s.sendMsg("/n_free", 1002);
)

4.4. Χρονικές, Γραµµικές Τεχνικές: Σύνθεση Πινάκων Κυµατοµορφής, Σειρές


Καθυστέρησης.

Κατά τις χρονικές-γραµµικές τεχνικές σύνθεσης οι αλγόριθµοι Σύνθεσης Ήχου επεµβαίνουν στα δείγµατα
ήχου από τα οποία αποτελείται το αρχικό σήµα ενώ ταυτόχρονα δεν προσθέτουν επιπλέον φασµατικό
περιεχόµενο. Οι επεµβάσεις αυτές στα δείγµατα του αρχικού σήµατος αφορούν τρεις τύπους: α) χρονικής
καθυστέρησης των δειγµάτων, β) κλιµάκωσης δειγµάτων και γ) χρονικής καθυστέρησης µε ταυτόχρονη
κλιµάκωση. Η Σύνθεση Πίνακα Κυµατοµορφής αποτελεί µια τεχνική κλιµάκωσης δειγµάτων, καθώς οι τιµές
από τις οποίες αποτελείται ένας πίνακας µπορούν να αυξηθούν ή να µειωθούν πολλαπλασιαστικά

112
επιφέροντας µεταβολές στην πληροφορία του πλάτους. Αντίστοιχα, µια κατηγορία τεχνικών οι οποίες
επιφέρουν καθυστέρηση µε ταυτόχρονη κλιµάκωση στα δείγµατα τα οποία επεξεργάζονται, αποτελούν οι
τεχνικές Σειρών Καθυστέρησης.

4.4.1. Σύνθεση Πινάκων Κυµατοµορφής (Wavetable Synthesis).

Η Σύνθεση Πινάκων Κυµατοµορφής αποτελεί µια θεµελιώδη τεχνική Σύνθεσης Ήχου καθώς αφορά την
πρωταρχική δοµή στην οποία βασίστηκαν οι πρώτες γλώσσες προγραµµατισµού προκειµένου να παραχθεί
ήχος από τον υπολογιστή. Ταυτόχρονα, ως συνθετική δοµή αποτελεί ένα προγραµµατιστικό µοντέλο στο
οποίο βασίστηκαν όλα τα επόµενα προγραµµατιστικά περιβάλλοντα ηχητικής σύνθεσης.
Ένας πίνακας κυµατοµορφής περιέχει τις τιµές µιας περιόδου ταλάντωσης της κυµατοµορφής. Οι
τιµές αυτές βρίσκονται αποθηκευµένες σε διαδοχικές θέσεις του πίνακα στη µνήµη του υπολογιστή (Σχήµα
4.25).

Σχήµα 4.25 Πίνακας ηµιτονοειδούς κυµατοµορφής δεκάεξι θέσεων.

Η µονάδα η οποία αναλαµβάνει να εξάγει αυτές τις τιµές, να ταλαντώσει δηλαδή την κυµατοµορφή η οποία
βρίσκεται αποθηκευµένη στον πίνακα, ονοµάζεται ταλαντωτής (oscillator). Η µονάδα του ταλαντωτή δέχεται
ως ορίσµατα τη συχνότητα και το πλάτος της επιθυµητής ταλάντωσης.

Σχήµα 4.26 Η µονάδα του ταλαντωτή.

113
Τα πρώτα περιβάλλοντα προγραµµατισµού για ηχητική σύνθεση παρείχαν ένα πλήθος από τέτοιους πίνακες
κυµατοµορφής, καθένας από τους οποίους αντιστοιχούσε σε µια διαφορετική βασική κυµατοµορφή: την
ηµιτονοειδή, την τετραγωνική, την τριγωνική ή την πριονωτή κυµατοµορφή (Σχήµα 4.27-4.29).

114
Σχήµα 4.27-4.29 Πίνακες τετραγωνικής, πριονωτής και τριγωνικής κυµατοµορφής .

Στο περιβάλλον του SuperCollider υπάρχουν οι ταλαντωτές SinOsc και Saw οι οποίοι αναπαράγουν
ηµιτονοειδείς και πριονωτές κυµατοµορφές αντίστοιχα, καθώς και η Pulse η οποία αναπαράγει
τετραγωνικούς παλµούς, εν γένει:

SinOsc.ar(freq: 440, phase: 0, mul: 1, add: 0)


SinOsc.kr(freq: 440, phase: 0, mul: 1, add: 0)

freq Η συχνότητα ταλάντωσης σε Hz.


phase Η αρχική φάση ταλάντωσης σε ακτίνια.
mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Saw.ar(freq: 440, mul: 1, add: 0)


Saw.kr(freq: 440, mul: 1, add: 0)

freq Η συχνότητα ταλάντωσης σε Hz.


mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Pulse.ar(freq: 440, width: 0.5, mul: 1, add: 0)


Pulse.kr(freq: 440, width: 0.5, mul: 1, add: 0)

freq Η συχνότητα ταλάντωσης σε Hz.


width Το εύρος του παλµού σε αναλογία 0 έως
1. Για να αναπαραχθεί τετραγωνική
κυµατοµορφή το εύρος πρέπει να ισούται
µε 0.5.
mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Όλες ο παραπάνω γεννήτριες αναπαράγουν ψηφιακό σήµα εντός των ορίων της συχνότητας Nyquist (band-
limited). Ειδικά για την τριγωνική κυµατοµορφή υπάρχει η γεννήτρια LFTri η οποία παράγει πλήθος
αρµονικών χωρίς φραγµό ως προς τον ανώτατο αρµονικό (non band-limited). Αν και οι αρµονικοί µειώνονται

115
ως προς το τετράγωνο του αντίστοιχου πολλαπλασίου τους, µε αποτέλεσµα τη δυσκολία ανίχνευσής τους στις
πολύ υψηλές συχνότητες, υπάρχει η περίπτωση σε µια πολύ υψηλή θεµελιώδη συχνότητα να παραχθεί
θόρυβος αναδίπλωσης (foldover). Στην περίπτωση αυτή πρέπει να εφαρµοστεί ένα φίλτρο χαµηλής διέλευσης
στη συχνότητα Nyquist, όπως είδαµε στην Δειγµατοληψία (2.3.2.).

LFTri.ar(freq: 440, iphase: 0, mul: 1, add: 0)


LFTri.kr(freq: 440, iphase: 0, mul: 1, add: 0)

freq Η συχνότητα ταλάντωσης σε Hz.


phase Η αρχική φάση ταλάντωσης σε εύρος
τιµών από 0 έως 4.
mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Εκτός από τις παραπάνω περιπτώσεις όπου χρησιµοποιείται ένας µοναδικός πίνακας κυµατοµορφής υπάρχει
επίσης και η περίπτωση όπου πολλαπλοί πίνακες κυµατοµορφής συνδυάζονται ταυτόχρονα µε διαδοχική
αθροιστική λογική. Κάθε τέτοια κυµατοµορφή αναπαράγεται µε βάση ένα περίγραµµα δυναµικής µε τρόπο
ώστε, στο χρόνο που το περίγραµµα της πραγµατοποιεί κάθοδο (fade-out), το περίγραµµα της επόµενης
κυµατοµορφής πραγµατοποιεί ταυτόχρονη άνοδο (fade-in). Κατ’ αυτόν τον τρόπο έχουµε διαδοχικές
εναλλαγές διαφορετικών κυµατοµορφών. Η τεχνική αυτή ονοµάζεται Wavetable Crossfading (Διαδοχική
Εναλλαγή Πινάκων Κυµατοµορφής) (Σχήµα 4.30).

Σχήµα 4.30 Διάγραµµα διαδοχικής εναλλαγής πινάκων κυµατοµορφής.

Η κλάση VOsc στο περιβάλλον του SuperCollider µπορεί να χρησιµοποιηθεί για να σαρώσει διαδοχικούς
πίνακες κυµατοµορφής:

VOsc.ar(bufpos, freq: 440, phase: 0, mul: 1, add: 0)

bufpos Ο πίνακας από τον οποίο θα ταλαντωθούν


οι τιµές.
freq Η βασική συχνότητα ταλάντωσης σε Hz.

116
phase Η αρχική φάση ταλάντωσης της τελικής
σύνθετης κυµατοµορφής σε ακτίνια.
mul Πολλαπλασιαστικός συντελεστής (πλάτος
ταλάντωσης).
add Αθροιστικός συντελεστής (dc offset).

Ακολουθεί ένα χαρακτηριστικό κοµµάτι κώδικα, στο οποίο χρησιµοποιούνται οκτώ διαφορετικοί πίνακες (10
– 17) οι οποίοι γεµίζουν µε ένα γεωµετρικά αυξανόµενο πλήθος αρµονικών, από 1 έως 64, µε τη χρήση της
µεθόδου sine1:

(
// allocate tables 10 to 17
8.do {|i| s.sendMsg(\b_alloc, 10+i, 1024); };
)

(
// fill tables 10 to 17
8.do({|i|
var n, a;
// generate array of harmonic amplitudes
n = (i+1)**2; // num harmonics for each table: [1,4,9,16,25,36,49,64]
a = {|j| ((n-j)/n).squared }.dup(n);
// fill table
s.listSendMsg([\b_gen, 10+i, \sine1, 7] ++ a);
}
);
)

(
SynthDef("crossf_wt", { arg out=0, main=0.2;
var sig;
sig = VOsc.ar(MouseX.kr(10,17), MouseY.kr(80,2870), 0, 0.3);
Out.ar(out, [1,1]*sig*main);
}
).send(s);
)

s.sendMsg("/s_new", "crossf_wt", 1001, 0, 1);

s.sendMsg("/n_free", 1001);

(
// free buffers 10 to 17
8.do {|i| s.sendMsg(\b_free, 10+i, 1024); };
)

Στον παραπάνω κώδικα η οριζόντια κίνηση του ποντικιού (MouseX) καθορίζει την τιµή του πίνακα από την
οποία θα σαρωθούν οι τιµές της αντίστοιχης κυµατοµορφής, ενώ η κάθετη (MouseY) αφορά τη συχνότητα µε
την οποία θα ταλαντωθεί ο αντίστοιχος πίνακας. Παρατηρούµε πως για υψηλές συχνότητες ταλάντωσης
παρουσιάζονται φαινόµενα αναδίπλωσης (foldover). Και σε αυτή την περίπτωση χρειάζεται η χρήση ενός
φίλτρου.

4.4.2. Σειρές Καθυστέρησης (Delay Lines).

Μια σειρά καθυστέρησης αφορά ένα κύκλωµα το οποίο δέχεται ένα αρχικό σήµα στην είσοδό του, επεµβαίνει
σε αυτό µε συνδυαστικές χρονικές καθυστερήσεις και τελικά παράγει µια τροποποιηµένη µορφή του στην
έξοδο. Ειδικότερα, η ψηφιακή υλοποίηση µιας σειράς καθυστέρησης (Digital Delay Line - DDL) αφορά ένα

117
κύκλωµα το οποίο τροφοδοτείται µε δείγµατα ήχου και αναπαράγει νέες τιµές δειγµάτων στην έξοδό του οι
οποίες αποτελούν συνδυαστικές καθυστερήσεις προγενέστερων τιµών του κυκλώµατος. Αναλόγως τον τύπο
του κυκλώµατος και τις τιµές των παραµέτρων του, παράγεται ένα ευρύ πλήθος από διαφορετικά φαινόµενα
στον ήχο τα οποία αφορούν επεµβάσεις στο χρονικό επίπεδο (καθυστερήσεις του σήµατος), επεµβάσεις στο
φασµατικό πεδίο (διαφορετικές υλοποιήσεις ψηφιακών φίλτρων), επεµβάσεις στο χρονικό-φασµατικό πεδίο
(flanging, phasing, chorus, harmonizer, pitch-shifter) καθώς και φαινόµενα αντήχησης (reverb).

4.4.2.1. Απλές Σειρές Καθυστέρησης: FIR Φίλτρα.

Στην πιο απλή του µορφή ένα κύκλωµα ψηφιακής σειράς καθυστέρησης αφορά την απλή καθυστέρηση των
δειγµάτων εισόδου (delay) (Σχήµα 4.31).

Σχήµα 4.31 Απλό κύκλωµα καθυστέρησης. Κάθε τρέχον δείγµα x[n] αθροίζεται µε ένα προγενέστερο δείγµα το οποίο έχει
καθυστερήσει κατά Δ δείγµατα.

Ισχύει δηλαδή:

y [n] = χ [n] x a + χ [n – Δ] x b

όπου:

χ [n], το τρέχον δείγµα εισόδου


Δ, η καθυστέρηση σε τιµές δειγµάτων
α και b, πολλαπλασιαστικοί συντελεστές επί των δειγµάτων
y [n], η έξοδος του κυκλώµατος

Σε άλλες περιπτώσεις σχεδίασης η καθυστέρηση σηµειώνεται ως D και αφορά τη χρονική τιµή


καθυστέρησης. Σχετίζοντας µεταξύ τους την τιµή καθυστέρησης δειγµάτων Δ µε την τιµή χρονικής
καθυστέρησης D ισχύει:

D = Δ x 1/sr

Η παραπάνω σχέση διατυπώνει πως ο χρόνος καθυστέρησης του κυκλώµατος µπορεί να αποτυπωθεί είτε ως
πλήθος δειγµάτων, είτε ως χρονική τιµή, η οποία ισοδυναµεί µε το γινόµενο των δειγµάτων καθυστέρησης επί
τη χρονική διάρκεια του ενός δείγµατος, δηλαδή την περίοδο δειγµατοληψίας.
Αναλόγως την τιµή καθυστέρησης D και τις τιµές των πολλαπλασιαστικών συντελεστών a και b το
παραπάνω κύκλωµα επεµβαίνει µε συγκεκριµένους τρόπους στο σήµα εισόδου. Εάν D = 1/sr ή Δ = 1, η
καθυστέρηση δηλαδή αφορά ένα δείγµα, τότε το κύκλωµα συµπεριφέρεται ως φίλτρο διέλευσης. Πιο
συγκεκριµένα, εάν η καθυστέρηση του ενός δείγµατος αθροίζεται σε κάθε επόµενο δείγµα, τότε το κύκλωµα
υλοποιεί ένα φίλτρο χαµηλής διέλευσης. Αντίθετα, εάν η καθυστέρηση του ενός δείγµατος αφαιρείται από
κάθε επόµενο δείγµα, τότε το κύκλωµα υλοποιεί ένα φίλτρο υψηλής διέλευσης. Επειδή µάλιστα οι
πολλαπλασιαστικοί συντελεστές a και b ισούνται µε 0.5, τα φίλτρα αυτά καλούνται και φίλτρα µέσης τιµής
(averaging filter). Ισχύει δηλαδή:

y [n] = χ [n] x 0.5 + χ [n – 1] x 0.5

118
Η παραπάνω συµπεριφορά του κυκλώµατος αποτυπώνεται και στη χρονική διάσταση όπου για χαµηλές
συχνότητες ταλάντωσης το σήµα αναπαράγεται αυτούσιο –µε µια µικρή διολίσθηση φάσης (Σχήµα 4.32), ενώ
για υψηλές συχνότητες ταλάντωσης το σήµα αποκόπτεται πλήρως (Σχήµα 4.33).

Σχήµα 4.32 Αρχικό σήµα (α), κλιµάκωση των δειγµάτων του κατά συντελεστή 0.5 (β), καθυστέρηση του αρχικού σήµατος
κατά ένα δείγµα µε ταυτόχρονη κλιµάκωση κατά 0.5 (γ), το νέο παραγόµενο σήµα (δ) µετά την άθροιση των (β) και (γ).
Στην απεικόνιση (δ) µαζί µε το νέο σήµα (κόκκινο χρώµα) έχει σχεδιαστεί και το αρχικό σήµα (γκρίζο χρώµα), προκειµένου
να φανεί η µικρή διολίσθηση φάσης που επιφέρει το φίλτρο.

119
Σχήµα 4.33 Χαρακτηριστική περίπτωση υλοποίησης φίλτρου χαµηλής διέλευσης: εάν το αρχικό σήµα (α) ταλαντώνεται σε
υψηλές συχνότητες, το σήµα στην έξοδο του κυκλώµατος µετά από τις αθροίσεις (β) και (γ) αποκόπτεται πλήρως (εδώ Δ =
2 δείγµατα).

Στο ίδιο παραπάνω κύκλωµα εάν κάθε τρέχον δείγµα αντί να αθροίζεται αφαιρείται από το προηγούµενό του,
τότε το κύκλωµα λειτουργεί ως φίλτρο υψηλής διέλευσης. Στην περίπτωση αυτή ισχύει δηλαδή:

y [n] = χ [n] x 0.5 – χ [n – 1] x 0.5

Τη συγκεκριµένη λειτουργία µπορούµε να τη διαπιστώσουµε και στη χρονική διάσταση εάν στα παραπάνω
σχήµατα (Σχήµατα 4.32-4.33) αντιστρέψουµε τη φάση του σήµατος (γ), καθώς το σήµα καθυστέρησης
αφαιρείται. Στην περίπτωση που το σήµα έχει χαµηλή συχνότητα ουσιαστικά ακυρώνεται, ενώ στις υψηλές
συχνότητες αναπαράγεται αυτούσιο.
Στο περιβάλλον του SuperCollider µπορούµε να υλοποιήσουµε µια τέτοια σειρά µε τις κλάσεις
Delay1 και Delay2 οι οποίες υλοποιούν σειρές καθυστέρησης ενός δείγµατος (Δ = 1 ή D = 1/sr) ή δύο
δειγµάτων (Δ = 2 ή D = 2/sr) αντίστοιχα:

Delay1.ar(in, mul: 1, add: 0)


Delay2.ar(in, mul: 1, add: 0)

in Το σήµα εισόδου.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Ο παρακάτω ενδεικτικός κώδικας δέχεται ως σήµα εισόδου µια πριονωτή κυµατοµορφή:

120
//Low Pass Filter:
(
{
a=Saw.ar(100,0.2);
a+Delay1.ar(a)
}.play
)

//High Pass Filter:


(
{
a=Saw.ar(100,0.2);
a-Delay1.ar(a)
}.play
)

Σηµειώνεται πως στις παραπάνω υλοποιήσεις χρειάζεται να θέσουµε στην παράµετρο blockSize του Server
τιµή ίση προς 1. Στην παράµετρο αυτή δηλώνεται η συχνότητα µε την οποία µεταβάλλονται οι τιµές των
µεταβλητών ρυθµίσεων του περιβάλλοντος (k-rate variables). Οι µεταβλητές αυτές αφορούν φαινόµενα
ρυθµίσεων του ήχου καθώς και διάφορες επεµβάσεις στα ηχητικά δείγµατα οι οποίες δεν απαιτούν την ίδια
υπολογιστική ανάλυση µε αυτές των δειγµάτων ήχου (a-rate variables), όπως για παράδειγµα οι τιµές ενός
περιγράµµατος δυναµικής,. Η εξ ορισµού τιµή του περιβάλλοντος είναι 64, γεγονός που σηµαίνει πως µια
µεταβλητή ρυθµίσεων ανανεώνεται κάθε 64 x 1/sr δευτερόλεπτα. Ταυτόχρονα όµως, η παράµετρος
blockSize αφορά και το πλήθος των δειγµάτων ήχου που επεξεργάζεται οµαδικά η εφαρµογή του Server.
Στην περίπτωση υλοποίησης σειρών καθυστέρησης ενός ή δύο δειγµάτων, η τιµή αυτή πρέπει να βρίσκεται
στη µέγιστη δυνατή ανάλυση, στο ένα δηλαδή δείγµα ανά 1/sr. Αυτό υλοποιείται ως εξής:

//Get the local server's options


o = Server.local.options;
//Post blockSize value
o.blockSize.postln;
//Set it to a new value
o.blockSize = 1; // The next time it boots, this will take effect

Όπως φαίνεται και από τον παραπάνω κώδικα η νέα αυτή τιµή της παραµέτρου blockSize θα ισχύσει µετά
την επανεκκίνηση του Server.

4.4.2.2. Κυκλική Προσωρινή Μνήµη (Circular Buffer).

Όσο ο χρόνος καθυστέρησης D του κυκλώµατος αυξάνεται, νέα ηχοχρωµατικά φαινόµενα δηµιουργούνται
στον ήχο. Προκειµένου ένα προγραµµατιστικό περιβάλλον να διαχειριστεί τέτοια φαινόµενα καθυστέρησης
χρησιµοποιείται µια προσωρινή µνήµη (buffer). Στις διαδοχικές θέσεις της µνήµης αυτής αποθηκεύονται
διαδοχικές τιµές εισόδου x[n] προκειµένου µια σειρά καθυστέρησης να ανατρέξει σε κάποια περασµένη τιµή.
Όταν η µνήµη γεµίσει από τιµές, τότε για κάθε επόµενη νέα τιµή η µνήµη επανεγγράφεται ξεκινώντας από την
πρώτη θέση της µε ταυτόχρονη διαγραφή των προϋπαρχουσών τιµών. Για τον λόγο αυτόν, ο συγκεκριµένος
τύπος µνήµης ονοµάζεται και κυκλικός (circular buffer) (Σχήµα 4.34).

121
Σχήµα 4.34 Παράδειγµα κυκλικής µνήµης 16 θέσεων. Ο δείκτης εγγραφής ε δείχνει την θέση που αποθηκεύεται το τρέχον
δείγµα εισόδου x[n] του κυκλώµατος, ενώ ο δείκτης ανάκτησης α την θέση από όπου θα ανακτηθεί κάποιο δείγµα x[n-D],
καθυστερηµένο δηλαδή κατά χρόνο D (εδώ Δ = 8 δείγµατα). Όταν ο δείκτης εγγραφής ε αποθηκεύσει και στην τελευταία
θέση της µνήµης την τρέχουσα τιµή, ξεκινάει την εγγραφή τιµών από την αρχή του πίνακα διαγράφοντας τις προγενέστερες
τιµές. Ο δείκτης ανάκτησης καλείται και tap.

4.4.2.3. Φίλτρα Κτένας (Comb Filter).

Εάν στο παραπάνω κύκλωµα απλής σειράς καθυστέρησης οι τιµές του χρόνου καθυστέρησης D
µεταβάλλονται µεταξύ του 0.1 ms έως και περίπου 10 ms, τότε το κύκλωµα αναπαράγει φαινόµενα φίλτρου
κτένας (comb filter). Ένα φίλτρο κτένας παρουσιάζει πολλαπλά ισοµερώς κατανεµηµένα σηµεία διέλευσης
και ακύρωσης, σε ακέραια πολλαπλάσια µιας βασικής συχνότητας (Σχήµα 4.35). Για τον λόγο αυτόν ένα
φίλτρο κτένας συµπεριφέρεται και ως συνηχητικό.

122
Σχήµα 4.35 Φασµατική απεικόνιση της απόκρισης φίλτρου κτένας.

Η τιµή του D καθορίζει το πλήθος και τη θέση των κορυφών και των µηδενικών σηµείων του φίλτρου. Η
πρώτη κορυφή του φίλτρου εντοπίζεται στη συχνότητα:

f = 1/D x f
0 s

όπου f η συχνότητα δειγµατοληψίας, ενώ τα επόµενα σηµεία έξαρσης (κορυφές) θα εµφανιστούν στις
s
συχνότητες 2 f0, 3 f0, 4 f0 κ.ο.κ.
Στο περιβάλλον του SuperCollider φίλτρα κτένας υλοποιεί η κλάση CombN. Φίλτρα κτένας υλοποιούν
και οι δύο υπο-κλάσεις της, CombL και CombC, παρέχοντας την επιπλέον δυνατότητα γραµµικής και κυβικής
σύζευξης, αντίστοιχα, στις τιµές που παράγουν (linear και cubic interpolation). Η σύνταξή τους έχει ως εξής:

CombN.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add: 0)


CombL.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add: 0)
CombC.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add: 0)

in Το σήµα εισόδου.
maxdelaytime Το µέγεθος του κυκλικού buffer σε
δευτερόλεπτα
delaytime Ο χρόνος καθυστέρησης D του
κυκλώµατος
decaytime Ο χρόνος απόσβεσης του σήµατος κατά
– 60 dB
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Στα παρακάτω παράδειγµα το µέγεθος του buffer (maxdelaytime) είναι σταθερού µεγέθους, ίσο προς 0.01.
Ο χρόνος καθυστέρησης (delaytime) µεταβάλλεται µε βάση την κίνηση του ποντικιού στον οριζόντιο
άξονα x, µε εύρος τιµών από 0.001 έως 0.01, ενώ ο χρόνος απόσβεσης (decaytime) ελέγχεται από την
κίνηση του ποντικιού στον κάθετο άξονα y, µε εύρος τιµών από 0.05 έως 1.

//CombN - no interpolation
(
SynthDef("simple_CombN", { arg out=0, maxdelaytime = 0.01;
var sig, source;
source = WhiteNoise.ar(0.01);

123
sig = CombN.ar(source, maxdelaytime, MouseX.kr(0.001,0.01), MouseY.kr(0.05,1));
Out.ar(out, [1,1]*sig);
}).send(s);
)

//CombL - linear interpolation


(
SynthDef("simple_CombL", { arg out=0, maxdelaytime = 0.01;
var sig, source;
source = WhiteNoise.ar(0.01);
sig = CombL.ar(source, maxdelaytime, MouseX.kr(0.001,0.01), MouseY.kr(0.05,1));
Out.ar(out, [1,1]*sig);
}).send(s);
)

//CombC - cubic interpolation


(
SynthDef("simple_CombC", { arg out=0, maxdelaytime = 0.01;
var sig, source;
source = WhiteNoise.ar(0.01);
sig = CombC.ar(source, maxdelaytime, MouseX.kr(0.001,0.01), MouseY.kr(0.05,1));
Out.ar(out, [1,1]*sig);
}).send(s);
)

s.sendMsg("/s_new", "simple_CombN", 1401, 1, 1);


s.sendMsg("/n_free", 1401);

s.sendMsg("/s_new", "simple_CombL", 1402, 1, 1);


s.sendMsg("/n_free", 1402);

s.sendMsg("/s_new", "simple_CombC", 1403, 1, 1);


s.sendMsg("/n_free", 1403);

4.4.2.4. Φαινόµενα Καθυστέρησης (Delay).

Για τιµές του D µεγαλύτερες των 10 ms και µέχρι περίπου τα 50 ms το κύκλωµα καθυστέρησης παράγει ένα
δεύτερο είδωλο της αρχικής πηγής πολύ κοντά στο αρχικό, σε βαθµό που το ανθρώπινο αυτί δεν µπορεί να τα
ξεχωρίσει. Η αίσθηση που προκαλείται από αυτόν τον ανεπαίσθητο διπλασιασµό του αρχικού σήµατος,
αφορά ένα σήµα περισσότερο γεµάτο σε όγκο χωρίς να παράγεται κάποια αντίστοιχη αύξηση στη συνολική
ένταση του παραγόµενου σήµατος. Για τιµές καθυστέρησης µεγαλύτερες των 50 ms το αυτί αντιλαµβάνεται
τον διαχωρισµό των δύο σηµάτων µε αποτέλεσµα την παραγωγή ενός δεύτερου ειδώλου µε χρονική
καθυστέρηση.
Στο περιβάλλον του SuperCollider οι κλάσεις που υλοποιούν τα φαινόµενα αυτά είναι οι DelayN,
DelayL και DelayC, µε τις δύο τελευταίες να πραγµατοποιούν γραµµική και κυβική σύζευξη στα
παραγόµενα δείγµατα.

DelayN.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, mul: 1, add: 0)


DelayL.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, mul: 1, add: 0)
DelayC.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, mul: 1, add: 0)

in Το σήµα εισόδου.
maxdelaytime Το µέγεθος του κυκλικού buffer σε
δευτερόλεπτα
delaytime Ο χρόνος καθυστέρησης D του
κυκλώµατος
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.

124
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Στο παρακάτω παράδειγµα ως σήµα εισόδου λαµβάνεται ένα αρχείο ήχου. Στο SC η διαχείριση των αρχείων
ήχου πραγµατοποιείται από την κλάση Buffer. Η µέθοδος read της κλάσης αυτής αναλαµβάνει να
καταλάβει έναν χώρο µνήµης και να αποθηκεύσει στις θέσεις της τα δείγµατα του αρχείου που περιγράφεται
στο δεύτερο όρισµά της. Η ανάκτηση των δειγµάτων αυτών, προκειµένου να χρησιµοποιηθούν ως σήµα
εισόδου στο κύκλωµα καθυστέρησης, γίνεται µε την κλάση PlayBuf. Η προσωρινή κυκλική µνήµη του
κυκλώµατος καθυστέρησης έχει σταθερό µέγεθος ενός δευτερολέπτου (µεταβλητή maxdelaytime), ενώ
κατά την αναπαραγωγή της ηχητικής δοµής simple_Delay δοκιµάζονται διαφορετικές τιµές καθυστέρησης
των δειγµάτων (µεταβλητή delaytime) προκειµένου να γίνουν αντιληπτά τα υπό εξέταση φαινόµενα.

b = Buffer.read(s, Platform.resourceDir +/+ "sounds/a11wlk01.wav");


(
SynthDef("simple_Delay", { arg out=0, maxdelaytime = 1, delaytime;
var sig, source;
source = PlayBuf.ar(1, b, BufRateScale.kr(b));
sig = DelayN.ar(source, maxdelaytime, delaytime, 1, 0);
Out.ar(out, [source,sig]);
}).send(s);
)

//boosting soundfile image, delaytime >> 0.01 -> 0.05


s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 0.01);
s.sendMsg("/n_free", 1301);
s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 0.05);
s.sendMsg("/n_free", 1301);
//separating images (echo), delaytime >> 0.05 -> ...
s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 0.06);
s.sendMsg("/n_free", 1301);
s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 0.1);
s.sendMsg("/n_free", 1301);
s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 0.5);
s.sendMsg("/n_free", 1301);
s.sendMsg("/s_new", "simple_Delay", 1301, 1, 1, \delaytime, 1);
s.sendMsg("/n_free", 1301); b.free;

Υπάρχει, τέλος, και η περίπτωση µια σειρά καθυστέρησης να περιλαµβάνει περισσότερους από έναν δείκτη
ανάκτησης (tap), µε αποτέλεσµα το σήµα να καθυστερείται σε περισσότερα του ενός χρονικά σηµεία. Σε
αυτές τις περιπτώσεις το κύκλωµα αναφέρεται και ως multitap delay line, δηλαδή ως σειρά καθυστέρησης
πολλαπλών σηµείων.

4.4.2.5. Αναδροµικά Κυκλώµατα.

Μια άλλη κατηγορία κυκλωµάτων υλοποιεί ένα πλήθος από φαινόµενα παρόµοια µε αυτά των FIR
κυκλωµάτων. Τα κυκλώµατα αυτά συνδυάζουν στην έξοδό τους τρέχουσες τιµές εισόδου x[n] µε
προγενέστερες τιµές εξόδου y[n-D] (Σχήµα 4.36). Για τον λόγο αυτόν καλούνται αναδροµικά.

Σχήµα 4.36 Αναδροµικό κύκλωµα (IIR filter).

125
Για το παραπάνω κύκλωµα ισχύει:

y[n] = χ [n] x a + y[n – D] x b

Καθώς στην έξοδο του κυκλώµατος αθροίζονται προγενέστερες τιµές του χρειάζεται προσοχή στη ρύθµιση
του πολλαπλασιαστικού συντελεστή b, ο οποίος ρυθµίζει το ποσοστό ανατροφοδότησης στο κύκλωµα
(feedback). Εάν το ποσοστό αυτό πλησιάσει τη µονάδα, τότε το σύστηµα γίνεται ασταθές και, καθώς οι τιµές
αθροιστικά αυξάνονται ανεξέλεγκτα, προκαλείται κορεσµός στις δυναµικές. Η µορφή αυτή θορύβου καλείται
παραµόρφωση ανατροφοδότησης (feedback distortion).
Εάν ο χρόνος καθυστέρησης D είναι µικρότερος των περίπου 10 ms, τότε το κύκλωµα
συµπεριφέρεται ως αναδροµικό φίλτρο κτένας (IIR Comb filter). Η συχνοτική απόκριση αποτελείται από ένα
πλήθος στενών κοιλοτήτων σε ακέραια πολλαπλάσια µιας βασικής συχνότητας (Σχήµα 4.37).

Σχήµα 4.37 Αναδροµικό φίλτρο κτένας (IIR Comb filter).

Στο περιβάλλον του SC προκειµένου να υλοποιηθούν αναδροµικά κυκλώµατα χρησιµοποιούνται οι κλάσεις


LocalIn και LocalOut. Η κλάση LocalOut εγγράφει δείγµατα ήχου σε ένα εσωτερικό δίαυλο δεδοµένων
(audio bus) µιας ηχητικής δοµής, ο οποίος πρέπει πρώτα να έχει καθοριστεί από την κλάση LocalIn. Με
κάθε ολοκλήρωση ενός κύκλου δειγµάτων του SC (µεταβλητή blocksize), η LocalIn διαβάζει τις τιµές
που έχει εγγράψει στον προηγούµενο κύκλο η LocalOut κ.ο.κ. Κατ΄ αυτόν τον τρόπο δηµιουργείται ένας
ανατροφοδοτούµενος βρόγχος, στις τιµές του οποίου µπορούµε ενδιάµεσα να επέµβουµε µε οποιονδήποτε
τρόπο.
Στην παρακάτω ηχητική δοµή το κύκλωµα τροφοδοτείται στην είσοδό του µε την είσοδο του
µικροφώνου (κλάση SoundIn) γι’αυτό χρειάζονται ακουστικά κατά την εκτέλεσή της. Στον ενδιάµεσο κύκλο
µεταξύ εγγραφής και διαβάσµατος τιµών (write/read), µια γεννήτρια DelayN καθυστερεί τα δείγµατα τα
οποία διαβάστηκαν από την LocalIn, και τα οποία αφορούν προγενέστερες τιµές που προέρχονται από την
LocalOut. Κατ’ αυτόν τον τρόπο υλοποιείται ένα αναδροµικό κύκλωµα καθυστέρησης. Προσοχή χρειάζεται
στις τιµές του συντελεστή ανατροφοδότησης feedback οι οποίες εκφράζονται ως ποσοστό επί των
προγενέστερων τιµών του κυκλώµατος και δεν πρέπει να ξεπερνούν το 90%, καθώς επίσης και στη συνολική
ένταση στα ακουστικά η οποία πρέπει να βρίσκεται σε χαµηλή στάθµη:

//IIR Comb - delaytime < 0.01


(
SynthDef("simple_IIR_Comb", { arg out=0, maxdelaytime = 1, delaytime = 0.2,
feedback =0.8, dry=0.2;
var sig, source, in, local;
source = SoundIn.ar(0);
local = LocalIn.ar(2) + source.dup; // read previous values, add to source

126
local = DelayN.ar(local, 0.01, 0.005); // delay sound
LocalOut.ar(local * feedback); //write values
Out.ar(0, [1,1]*(local + source*dry));
}).send(s);
)

//Use headphones - turn volume down!


s.sendMsg("/s_new", "simple_IIR_Comb", 1301, 1, 1);
s.sendMsg("/n_set", 1301, \feedback, 0.9); //do not exceed 90% feedback !!
s.sendMsg("/n_set", 1301, \delaytime, 0.001);
s.sendMsg("/n_free", 1301);

Για τιµές καθυστέρησης µικρότερες των 0.01 δευτερολέπτων, ο παραπάνω αλγόριθµος υλοποιεί ένα φίλτρο
κτένας. Για µεγαλύτερες τιµές, ο αλγόριθµος υλοποιεί το φαινόµενο της καθυστέρησης (delay). Καθώς,
µάλιστα, οι προγενέστερες καθυστερήσεις ανατροφοδοτούνται διαρκώς –µε φθίνουσα ένταση, ανάλογη προς
τον συντελεστή ανατροφοδότησης (µεταβλητή feedback), το κύκλωµα υλοποιεί ένα φαινόµενο πολλαπλών
καθυστερήσεων:

//IIR delay - delaytime > 0.05


(
SynthDef("simple_IIR_delay", { arg out=0, maxdelaytime = 1, delaytime = 0.08,
feedback = 0.8, dry = 0.5;
var sig, source, in, local;
source = SoundIn.ar(0);
local = LocalIn.ar(2) + source.dup; // read feedback, add to source
local = DelayN.ar(local, maxdelaytime, delaytime); // delay sound
LocalOut.ar(local * feedback); //write values
Out.ar(0, [1,1]*(local + source*dry));
}).send(s); )

//Use headphones - turn volume down!!!


s.sendMsg("/s_new", "simple_IIR_delay", 1401, 1, 1);
s.sendMsg("/n_set", 1401, \delaytime, 0.05);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_set", 1401, \delaytime, 0.18);
s.sendMsg("/n_set", 1401, \feedback, 0.8);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_set", 1401, \delaytime, 0.25);
s.sendMsg("/n_set", 1401, \feedback, 0.8);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_set", 1401, \delaytime, 0.5);
s.sendMsg("/n_set", 1401, \feedback, 0.8);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_set", 1401, \delaytime, 0.75);
s.sendMsg("/n_set", 1401, \feedback, 0.8);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_set", 1401, \delaytime, 1);
s.sendMsg("/n_set", 1401, \feedback, 0.8);
s.sendMsg("/n_set", 1401, \feedback, 0.4);
s.sendMsg("/n_free", 1401);

Από την εκτέλεση του αλγορίθµου παρατηρούµε πως το φαινόµενο µεταβάλλεται σηµαντικά αλλάζοντας τον
χρόνο καθυστέρησης της ανατροφοδότησης. Η διάρκεια του φαινοµένου και το πλήθος των επαναλήψεων
καθορίζεται από τον συντελεστή ανατροφοδότησης feedback. Για µεγάλο ποσοστό (80%) το φαινόµενο
επαναλαµβάνεται αρκετές φορές πριν σιγήσει. Σε γενικές γραµµές, η τιµή αυτή δεν πρέπει να ξεπερνάει το
90% καθώς δηµιουργούνται φαινόµενα κορεσµού.

127
4.4.2.6. Φίλτρα Ολικής Διέλευσης (Allpass Filters).

Όπως φαίνεται και από την ονοµασία του, η επέµβαση που επιφέρει ένα φίλτρο ολικής διέλευσης (allpass
filter) σε ένα σήµα δεν αφορά το συχνοτικό του περιεχόµενο αλλά τη φάση του σήµατος, παρουσιάζοντας
έτσι απόκριση φάσης (phase response). Έτσι, η συχνότητα αποκοπής αντιστοιχεί σε διολίσθηση φάσης κατά
–90 µοίρες, ενώ και οι υπόλοιπες συχνότητες διολισθαίνουν µε βάση την καµπύλη απόκρισης του φίλτρου
(Σχήµα 4.38).

Σχήµα 4.38 Επτά διαγράµµατα απόκρισης φάσης φίλτρου ολικής διέλευσης για επτά διαφορετικές συχνότητες αποκοπής
(καµπύλες από αριστερά προς τα δεξιά): 262 Hz, 524 Hz, 1048 Hz, 2096 Hz, 4192, 8384 Hz και 16768 Hz. Κάθε
συχνότητα αποκοπής αντιστοιχεί σε διολίσθηση φάσης κατά -90 µοίρες.

Ο γενικός τύπος ενός φίλτρου ολικής διέλευσης είναι (Σχήµα 4.39):

y[n] = (-g x χ [n]) + χ[n – D] + (g x y[n – D])

Σχήµα 4.39 Διάγραµµα κυκλώµατος ολικής διέλευσης.

128
Στο περιβάλλον του SuperCollider η κλάση AllpassN υλοποιεί φίλτρα ολικής διέλευσης, καθώς επίσης και
οι υπο-κλάσεις της AllpassL και AllpassC, οι οποίες επιπρόσθετα παρέχουν αντίστοιχα γραµµική και
κυβική σύζευξη στις τιµές που παράγουν. Η σύνταξή τους έχει ως εξής:

AllpassN.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add:


0)
AllpassL.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add:
0)
AllpassC.ar(in: 0, maxdelaytime: 0.2, delaytime: 0.2, decaytime: 1, mul: 1, add:
0)

in Το σήµα εισόδου.
maxdelaytime Το µέγεθος του buffer σε δευτερόλεπτα
delaytime Ο χρόνος καθυστέρησης D του
κυκλώµατος
decaytime Ο χρόνος απόσβεσης του σήµατος κατά
– 60 dB
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Με µια χαρακτηριστική υλοποίηση:

//AllpassN - no interpolation
(
SynthDef("simple_AllpassN", { arg out=0, maxdelaytime = 0.01;
var sig, source;
source = WhiteNoise.ar(0.1);
sig = AllpassN.ar(source, maxdelaytime, MouseX.kr(0.0001,0.01),
MouseY.kr(0.05,0.2));
Out.ar(out, [1,1]*(sig+source));
}).send(s); )

s.sendMsg("/s_new", "simple_AllpassN", 1401, 1, 1);


s.sendMsg("/n_free", 1401);

Τα φίλτρα ολικής διέλευσης µαζί µε τα φίλτρα κτένας χρησιµοποιούνται ανάµεσα σε άλλες εφαρµογές και για
αντηχητικά φαινόµενα (reverberation). Μια τέτοια περίπτωση αφορά τον συνδυασµό τεσσάρων παράλληλων
αναδροµικών φίλτρων κτένας και στη συνέχεια δύο εν σειρά φίλτρων ολικής διέλευσης (Σχήµα 4.40).

Σχήµα 4.40 Διάγραµµα κυκλώµατος δοµής αντήχησης.

129
Και µε αντίστοιχη υλοποίηση στο περιβάλλον του SuperCollider:

//a simple reverb unit (4 parallel comb -> 2 in a row allpass)


//DO NOT increase feedback more than 0.2!!
//use headphones - be cautious!

( SynthDef("simple_reverb", { arg out=0, maxdelaycomb = 1, maxdelayallpass =


0.01, delaytime = 0.6, feedback1 =0.2, feedback2 =0.2, feedback3 =0.2, feedback4
=0.2, dry=0.2;
var source, in, local, local_add, local1, local2, local3, local4, allp1, allp2;

//source
source = SoundIn.ar(0);
//4 parallel IIR_comb delay
local = LocalIn.ar(2) + source.dup; // read feedback, add to source
local1 = DelayN.ar(local, maxdelaycomb, Rand(0.0001,delaytime)); // comb-delay-1
local2 = DelayN.ar(local, maxdelaycomb, Rand(0.0001,delaytime)); // comb_delay-2
local3 = DelayN.ar(local, maxdelaycomb, Rand(0.0001,delaytime)); // comb_delay-3
local4 = DelayN.ar(local, maxdelaycomb, Rand(0.0001,delaytime)); // comb-delay-4
LocalOut.ar((local1 * feedback1) + (local2 * feedback2) + (local3 * feedback3) +
(local4 * feedback4)); //write values
allp1 = AllpassN.ar(local, maxdelayallpass, Rand(0.0001,0.01), Rand(0.05,0.2));
allp2 = AllpassN.ar(allp1, maxdelayallpass, Rand(0.0001,0.01), Rand(0.05,0.2));
Out.ar(0, [1,1]*(allp2 + source*dry));
}).send(s);
)

s.sendMsg("/s_new", "simple_reverb", 1301, 1, 1);


s.sendMsg("/n_free", 1301);

Στον παραπάνω αλγόριθµο προσοχή χρειάζεται στο αθροιστικό σύνολο των πολλαπλασιαστικών
συντελεστών feedback1, feedback2, feedback3 και feedback4 το οποίο δεν πρέπει να ξεπερνά την
τιµή 0.8 (80%). Προσοχή, επίσης, χρειάζεται κατά την ακρόαση από τα ακουστικά καθώς οποιαδήποτε µικρή
τροποποίηση στον αλγόριθµο µπορεί να επιφέρει µεγάλες τιµές κορεσµού στο κύκλωµα.

4.5. Χρονικές, Μη-Γραµµικές Τεχνικές: Μικροδοµική Σύνθεση (Granular


Synthesis).

4.5.1. Γενικά Στοιχεία.

Η Μικροδοµική Σύνθεση αποτελεί µια τεχνική σύνθεσης η οποία εστιάζει στη χρήση πολλαπλών µικρο-
δοµών ήχου ή ηχητικών κόκκων (microsounds ή sonic grains) το σύνολο των οποίων απαρτίζουν µακροδοµές
ήχου. Οι διάρκειες των µικροδοµών αυτών βρίσκονται στα όρια της ανθρώπινης αντίληψης και ποικίλλουν
µεταξύ 1/1000 του δευτερολέπτου (1 ms) και 1/10 του δευτερολέπτου (100 ms). Καθώς η πυκνότητα των
µικροδοµών αυτών αυξάνεται, η αίσθηση της πρόσληψης σταδιακά µεταβάλλεται από διακριτά σηµεία, σε
παλµούς (τακτικά επαναλαµβανόµενα µοτίβα σηµείων), γραµµές (αίσθηση τόνου) και επιφάνειες (ηχητικές
υφές).
Η ιδέα της µικροδόµησης της ηχητικής πληροφορίας προτάθηκε αρχικά από τον φυσικό Dennis
Gabor την δεκαετία του 1940. Εστιάζοντας κυρίως στον χώρο των επικοινωνιών και της ανθρώπινης
αντίληψης, ο Gabor πρότεινε πως κάθε ήχος µπορεί να αναλυθεί σε µια ελάχιστη ηχητική πληροφορία
(acoustical quanta), η οποία απαρτίζεται από πολλαπλάσια διακριτών χρονικών και συχνοτικών µονάδων.
Ο Iannnis Xenakis στις δεκαετίες του 1950 και 1960 ήταν ο πρώτος συνθέτης που υλοποίησε για
πρώτη φορά έργα Μικροδοµικής Σύνθεσης και υποστήριξε τη δική του θεωρητική προσέγγιση
χρησιµοποιώντας κατά κύριο λόγο στοχαστικές διαδικασίες προκειµένου να οργανώσει τις συµπεριφορές των
µικροδοµών κατά τη χρονική τους εξέλιξη.

130
Στις δεκαετίες του 1970, 1980 και 1990 σηµαντική συνεισφορά στη συγκεκριµένη τεχνική είχαν
επίσης και οι συνθέτες Curtis Roads και Barry Truax τεκµηριώνοντας µια πιο ολοκληρωµένη θεωρητική
ανάλυση της σύνθεσης και παράγοντας ένα πλήθος έργων βασισµένων σε αυτήν. Ο Truax υλοποίησε για
πρώτη φορά την Μικροδόµηση σε Πραγµατικό Χρόνο (Real-time Granulation – Truax, 1988), ενώ ο Roads,
ανάµεσα σε πολλά άλλα, παρουσίασε µια ιδιαίτερη τεχνική σύνθεσης για Μικροδοµική Σύνθεση την Pulsar
Synthesis (Roads, 2001).
Πολλοί άλλοι συνθέτες συνεισέφεραν επίσης µε δικές τους προτάσεις, οι οποίες είτε αποτελούσαν
προεκτάσεις παλαιότερων τεχνικών σύνθεσης (FOG: FOF granular – Michael Clarke, 1993), είτε αφορούν
τεχνικές ανάλυσης οι οποίες χρησιµοποιούνται προκειµένου να τροφοδοτήσουν µε δεδοµένα ανάλυσης τη
συγκεκριµένη τεχνική (PSOLA analysis – Peeters and Rodet 1999, Schnell, et al. 2000), είτε ακόµη
αποτελούν υβριδικές µορφές συνδυάζοντας άλλες προγενέστερες τεχνικές (Grainlet Synthesis – Curtis Roads,
1996).
Σε αντίθεση, λοιπόν, µε άλλες τεχνικές σύνθεσης ήχου, το βασικό χαρακτηριστικό της Μικροδοµικής
Σύνθεσης είναι πως δεν αφορά µια τεχνική µε συγκεκριµένη αλγοριθµική προσέγγιση αλλά περιλαµβάνει ένα
πλήθος διαφορετικών υλοποιήσεων κάθε µια από τις οποίες αναπαράγει συγκεκριµένες αισθητικές και
δοµικές προσεγγίσεις. Ένα δεύτερο χαρακτηριστικό είναι πως οι υλοποιήσεις αυτές δεν εστιάζουν στον
εξατοµικευµένο έλεγχο κάθε µικροδοµής αλλά σε διαδικασίες οργάνωσης του υλικού σε µακροσκοπικό
επίπεδο. Από µια λοιπόν άποψη η Μικροδοµική Σύνθεση αφορά τόσο µια τεχνική σύνθεσης ήχου όσο και µια
τεχνική σύνθεσης φόρµας.

4.5.2. Η Βασική Δοµή: Κόκκοι Ήχου (Sonic Grains).


Η βασική δοµή της Μικροδοµικής Σύνθεσης είναι ένας κόκκος ήχου (sonic grain). Τα χαρακτηριστικά µιας
τέτοιας δοµής περιλαµβάνουν την κυµατοµορφή του κόκκου (grain waveform), το περίγραµµα του κόκκου
(grain envelope), τη συχνότητα του κόκκου (grain frequency), το πλάτος του κόκκου (grain amplitude) καθώς
και τη διάρκειά του (grain duration) (Σχήµα 4.41). Προκειµένου να παραχθεί ένα ηχητικό σύνολο χρειάζεται
να συνδυαστεί ένα πλήθος µερικών χιλιάδων τέτοιων ηχητικών κόκκων. Η συνάθροιση αυτή αποτελεί ένα
ηχητικό νέφος (sonic cloud).

Σχήµα 4.41 Ένας ηχητικός κόκκος (sonic grain) καθώς και τα χαρακτηριστικά του.

Κάθε µια από τις παραπάνω παραµέτρους διαµορφώνουν σε σηµαντικό βαθµό το συνολικό αποτέλεσµα. Για
διάρκειες µικρότερες των περίπου 2 ms το ανθρώπινο αυτί δεν είναι ικανό να ανιχνεύσει τα ιδιαίτερα
χαρακτηριστικά του κόκκου. Η εντύπωση που προσλαµβάνεται σε αυτήν τη χρονική κλίµακα είναι αντίστοιχη
µε αυτήν που προκαλεί µια στιγµιαία διαταραχή (click). Παρ’ όλα αυτά, µεταβάλλοντας την κυµατοµορφή και
τη συχνότητα του κόκκου µπορούµε να αντιληφθούµε ηχοχρωµατικές διαφοροποιήσεις των διαταραχών
αυτών. Για διάρκειες µεγαλύτερες των περίπου 5 ms και κυρίως από τα 25 ms και άνω, η τονικότητα ενός

131
κόκκου αρχίζει να γίνεται διακριτή. Οι διάρκειες των ηχητικών κόκκων εντός ενός ηχητικού νέφους µπορεί
να είναι τεσσάρων διαφορετικών τύπων: είτε οµοιόµορφες, δηλαδή όλοι οι κόκκοι να έχουν την ίδια σταθερή
διάρκεια, είτε να µεταβάλλονται σε συνάρτηση µε το χρόνο, είτε να είναι τυχαίας τιµής µεταξύ µιας
ελάχιστης και µιας µέγιστης χρονικής διάρκειας, είτε να είναι συνυφασµένες µε κάποια άλλη παράµετρο όπως
για παράδειγµα την περίοδο της κυµατοµορφής του ηχητικού κόκκου. Ιδιαίτερα κατά την τελευταία
περίπτωση τονίζεται πως η διάρκεια του κόκκου θα πρέπει να είναι τουλάχιστον ισοδύναµη µε την περίοδο
της κυµατοµορφής του. Στην αντίθετη περίπτωση, η κυµατοµορφή δεν προλαβαίνει να ολοκληρωθεί µε
αποτέλεσµα την παραγωγή µονοπολικών σηµάτων.
Σηµαντικό ρόλο στην ηχοχρωµατική σύνθεση παίζει και το περίγραµµα του κόκκου. Συνήθεις τύποι
περιγραµµάτων αποτελούν η καµπύλη Gauss (κανονικής κατανοµής), η µερικώς Gaussian καµπύλη (Quasi-
Gaussian), γραµµικές συναρτήσεις µετάβασης (τραπεζοειδής, τριγωνική), η καµπύλη Sinc function, η
εκθετικώς µειούµενη καµπύλη (expodec), η εκθετικώς αυξανόµενη καµπύλη (rexpodec) κ.λπ. Κάθε τέτοιο
περίγραµµα διαµορφώνει µε διαφορετικό τρόπο το ηχητικό αποτέλεσµα. Έτσι, για παράδειγµα, η καµπύλη
Sinc δηµιουργεί µια έντονη αίσθηση διαµόρφωσης, οι εκθετικώς µειούµενες καµπύλες µια αίσθηση ρυθµικής
δοµής, οι εκθετικώς αυξανόµενες µια αίσθηση χρονικής αναστροφής (reverse effect) κ.ο.κ. Σε κάθε
περίπτωση, η συνολική αίσθηση του ήχου µεταβάλλεται σηµαντικά όταν η χρήση ενός συγκεκριµένου τύπου
περιγράµµατος συνδυάζεται µε µεταβολές στη διάρκεια του κόκκου.
Η επιλογή της κυµατοµορφής ενός ηχητικού κόκκου µπορεί να αφορά οποιονδήποτε τύπο. Εκτός από
τους βασικούς τύπους της ηµιτονοειδούς, της πριονωτής, της τετραγωνικής ή της sinc function, η
κυµατοµορφή αυτή µπορεί να αποτελεί οποιοδήποτε σύνθετο σήµα, είτε ακόµη και τµήµατα δειγµάτων από
έναν αποθηκευµένο ήχο. Ο συνδυαστική χρήση τέτοιων κυµατοµορφών παράγει τελικά µια αίσθηση
χρωµατικής διαβάθµισης στη δοµή του νέφους. Διακρίνονται τρεις τέτοιοι τύποι νεφών [Roads, 1991]:
µονοχρωµατικός (monochrome), όπου περιέχεται µια µοναδική κυµατοµορφή, πολυχρωµατικός (polychrome),
όταν περιέχονται δύο ή περισσότερες κυµατοµορφές, διαχρωµατικός (transchrome), όταν η κυµατοµορφή του
κόκκου εξελίσσεται από από µια αρχική κυµατοµορφή σε µια τελική κατά τη διάρκεια εξέλιξης του ηχητικού
νέφους.
Το συχνοτικό εύρος των παραγόµενων κόκκων µπορεί να αφορά είτε µια στενή συχνοτικά περιοχή µε
διακριτά τονικά χαρακτηριστικά, είτε µια ευρεία περιοχή µε άνω και κάτω συχνοτικό όριο. Στην πρώτη
περίπτωση, εάν οι τιµές συχνοτήτων παραµένουν σταθερές καθ’ όλη τη διάρκεια αναπαραγωγής κόκκων,
σχηµατίζεται η αίσθηση ενός σταθερού τόνου (Σχήµα 4.42-α). Εναλλακτικά η τιµή αυτή της κεντρικής
συχνότητας µπορεί να µεταβάλλεται κατά µια σταθερή αύξουσα ή φθίνουσα κίνηση αναπαράγοντας
φαινόµενα glissando (Σχήµα 4.42-β). Μπορεί επίσης διαφορετικές οµάδες κόκκων να αναπαράγονται σε
διαφορετικά τονικά επίκεντρα δηµιουργώντας έτσι την αίσθηση παράλληλων τονικά φωνών (stratus clouds –
στρώµατα νεφών) (Σχήµα 4.42-γ).

132
Σχήµα 4.42 Τρεις διαφορετικές περιπτώσεις συχνότητας ταλάντωσης ηχητικών κόκκων στενού συχνοτικού εύρους: (α)
παραγωγή τόνου, (β) παραγωγή glissando, (γ) στρώµατα νεφών (stratus clouds).

Στη δεύτερη περίπτωση όπου οι κόκκοι ταλαντώνονται σε ένα ανοικτό συχνοτικό εύρος µε άνω και κάτω
συχνοτικό όριο, οι διατάξεις των ηχητικών κόκκων στο συχνοτικό φάσµα µπορεί είτε να αφορούν νέφη
σωρείτες (cumulus clouds), όπου οι συχνότητες ταλάντωσης των κόκκων κατανέµονται ισοµερώς µεταξύ δύο
σταθερών άκρων (Σχήµα 4.43-α), είτε την κίνηση του νέφους προς µια κατεύθυνση µε διαρκή σύγκλιση των
δύο άκρων του φάσµατος (Σχήµα 4.43-β), είτε ακόµα τη διαρκή µεταβολή των άνω και κάτω άκρων του
φάσµατος ταλάντωσης µε αποτέλεσµα διαφορετικές φασµατικές διασπορές σε διαφορετικές χρονικές στιγµές
(Σχήµα 4.43-γ).

133
Σχήµα 4.43 Τρεις περιπτώσεις συχνοτικής διασποράς των κόκκων ενός νέφους: (α) σταθερής απόστασης (νέφη σωρείτες -
cumulus clouds), (β) συγκλίνουσα, (γ) δυναµικά µεταβαλλόµενη.

Ο συντελεστής πυκνότητας (FF – fill factor) αποτυπώνει την ηχητική πύκνωση που παρουσιάζει ένα ηχητικό
νέφος και αποτελεί συνδυασµό της µέσης διάρκειας D των κόκκων του νέφους καθώς και της µέσης
πυκνότητας τους d, το πλήθος δηλαδή των κόκκων που περιέχει ανά δευτερόλεπτο:

FF = D x d

Σύµφωνα µε την παραπάνω διατύπωση, ένα νέφος το οποίο περιέχει κόκκους µε µεγαλύτερες τιµές διάρκειας
παρουσιάζει µια πιο πυκνή υφή σε σχέση µε ένα νέφος ίδιας πυκνότητας αλλά µε κόκκους µικρότερων τιµών
διάρκειας. Σε γενικές γραµµές για τιµές FF < 0.5 το νέφος παρουσιάζεται αραιό, για FF περίπου ίσο µε
µονάδα το νέφος παρουσιάζεται σχετικά πυκνό, ενώ για τιµές µεγαλύτερες της µονάδας το νέφος περιέχει
αλληλο-επικαλυπτόµενους κόκκους.

134
4.5.3. Αλγόριθµοι Μικροδοµικής Σύνθεσης.

Στην πιο απλή µορφή Μικροδοµικής Σύνθεσης µια γεννήτρια ηχητικών κόκκων αποτελείται από έναν
ταλαντωτή ο οποίος περιλαµβάνει έναν πίνακα κυµατοµορφής καθώς και έναν πίνακα περιγράµµατος (Σχήµα
4.44).

Σχήµα 4.44 Αλγόριθµος αναπαραγωγής ηχητικών κόκκων στην απλούστερη του µορφή µε τις εξής µεταβλητές:
κυµατοµορφή κόκκου (grain WAVE), πλάτος ταλάντωσης κόκκου (grain AMP), περιβάλλουσα κόκκου (grain ENV),
συχνότητα ταλάντωσης κόκκου (grain FREQ), διάρκεια κόκκου (grain DUR) καθώς και χωροθέτησή του στο πολυκάναλο
πεδίο (grain POS).

Ο συγκεκριµένος αλγόριθµος ενώ παρέχει έναν πλήρη έλεγχο στις παραµέτρους οργάνωσης των ηχητικών
κόκκων, παρουσιάζει πολύ µεγάλες δυσκολίες στην υλοποίησή του. Εάν για κάθε κόκκο απαιτείται έλεγχος n
πλήθους παραµέτρων και d είναι η πυκνότητα των κόκκων, τότε καταλήγουµε σε ένα πλήθος n x d
παραµέτρων που πρέπει να ελέγχονται ανά δευτερόλεπτο. Καθώς η τιµή n είναι συνήθως µεγαλύτερη του
δέκα και ταυτόχρονα, σε αρκετές περιπτώσεις, η τιµή πυκνότητας µπορεί να είναι µεγαλύτερη της χιλιάδας, ο
έλεγχος των τιµών αυτών πρακτικά είναι αδύνατος. Για τον λόγο αυτόν έχουν κατά διαστήµατα αναπτυχθεί
ένα πλήθος από διαφορετικές τεχνικές ελέγχου µακροδοµών. Ο Gabor, ήδη από τη δεκαετία του 1940,
προκειµένου να περιγράψει καλύτερα τις µικροδοµές αυτές, πρότεινε τη χρήση πινάκων κατανοµής ενέργειας
(Gabor matrices) µε ταυτόχρονη χρήση της χρονικής και φασµατικής πληροφορίας (Σχήµα 4.45).

135
Σχήµα 4.45 Ένας πίνακας Gabor (Gabor matrix) αποτυπώνει τη φασµατική πληροφορία ενός σήµατος σε συνάρτηση µε
τον χρόνο, σε διακριτά χρονο-συχνοτικά πλέγµατα. Κάθε τέτοιο πλέγµα εµφανίζει µεγαλύτερη ή µικρότερη συγκέντρωση
ενέργειας ή ακόµα και πλήρη απουσία, αναλόγως το αποτέλεσµα της ανάλυσης. Στο συγκεκριµένο παράδειγµα υπάρχει
συγκέντρωση ενέργειας στις υψηλές και χαµηλές κυρίως συχνότητες.

Ο Xenakis κατά την πρώτη του µικροδοµική σύνθεση («Concrete PH», 1958 – έργο για µαγνητοταινία)
χρησιµοποίησε µια µοναδική ηχητική πηγή: τον ήχο που παράγεται από πυρακτωµένη χόβολη. Στη συνέχεια
κατέτµησε τη µαγνητοταινία σε πολλαπλά διαφορετικά τµήµατα και τα συνένωσε σε διαφορετικά σύνολα
µεταβάλλοντας ταυτόχρονα τις ταχύτητες αναπαραγωγής τους. Οι παραπάνω χειρισµοί του συνθέτη στο
υλικό της µαγνητοταινίας αφορούσαν περισσότερο µια πηγαία επέµβαση στο υλικό. Σε µια πιο συστηµατική
προσπάθεια οργάνωσης της µικροδοµικής πληροφορίας, το 1959 παρουσιάζει το έργο για 9 έγχορδα και
µαγνητοταινία «Analogique A et B» στο οποίο κάνει χρήση πινάκων (screens). Κάθε τέτοιος πίνακας
αποτελείται από ένα πλέγµα δύο διαστάσεων (συχνοτικό φάσµα F – ένταση G) τα κελιά του οποίου
παρουσιάζουν πυκνώσεις, αραιώσεις ή απουσία ηχητικών κόκκων (Σχήµα 4.46). Ένα σύνολο από τέτοιους
πίνακες αποτελούν διαδοχικά χρονικά στιγµιότυπα τα οποία αποτυπώνουν την εξέλιξη ενός ηχητικού
συµβάντος και τα οποία ο Xenakis ονόµασε book. (Σχήµα 4.47). Για τη φασµατική/δυναµική διασπορά των
στοιχείων κάθε πίνακα καθώς και τη πυκνότητά τους χρησιµοποίησε στατιστικές κατανοµές και στοχαστικές
εν γένει διαδικασίες.

Σχήµα 4.46 Πίνακας κατανοµής ηχητικών κόκκων κατά Xenakis (screen). Στο συγκεκριµένο παράδειγµα στις υψηλές
συχνότητες παρατηρείται πύκνωση, στις µεσαίες αραιή παρουσία και στις χαµηλές απουσία τους. Η οµαδοποίηση
γειτονικών κελιών σε ένα ενιαίο σύνολο αποτελούν αυτόνοµα ηχητικά νέφη (clouds) – εδώ µε γκρίζο χρώµα.

136
Σχήµα 4.47 Χρονική εξέλιξη ενός ηχητικού συµβάντος ως αποτύπωση διαδοχικών χρονικών στιγµιότυπων (book).

Στις δεκαετίες του 1980 και 1990 σηµαντική συνεισφορά στη συγκεκριµένη τεχνική είχαν επίσης και οι
συνθέτες Barry Truax και Curtis Roads. Ο Truax δηµιούργησε συνθέσεις µέσα από τεχνικές µικροδόµησης
πηγών ήχου προερχόµενες είτε από προ-ηχογραφηµένους ήχους (αρχεία ήχου) από το φυσικό περιβάλλον είτε
από γεννήτριες ήχου. Η τεχνική που ακολούθησε περιελάµβανε δύο στάδια: το στάδιο δηµιουργίας
διαδικασιών ρυθµίσεων και ελέγχου (control functions) και το στάδιο ηχητικής σύνθεσης µέσα από βάσεις
δεδοµένων ήχου (sound database) (Σχήµα 4.48).

Σχήµα 4.48 Τα στάδια Μικροδοµικής Σύνθεσης κατά Barry Truax.

Κατά το πρώτο στάδιο η δηµιουργία διαδικασιών ελέγχου προέρχεται είτε από την ανάλυση δεδοµένων ήχου
µέσω συγκεκριµένων τεχνικών ανάλυσης (π.χ. Short-Time Fourier Transform, Wavelet Transform), είτε µέσω
αλγοριθµικών διαδικασιών (π.χ. αναπαραγωγή πινάκων ηχητικών νεφών). Και στις δύο περιπτώσεις οι
διαδικασίες ελέγχου κατηγοριοποιούνται σε δύο βασικές κατηγορίες: στις αιτιοκρατικές (deterministic) και
στις πιθανοκρατικές (stochastic). Μια αιτιοκρατική διαδικασία αφορά µια διαδικασία κατά την οποία τα
αποτελέσµατά που παράγει µπορούν να προβλεφθούν µε ακρίβεια µέσα από µαθηµατικά µοντέλα, καθώς
προηγούµενες τιµές της µπορούν να χρησιµοποιηθούν για να εξάγουν µελλοντικά αποτελέσµατα. Αντίθετα,
µια πιθανοκρατική διαδικασία αναπαράγει αποτελέσµατα τα οποία δεν µπορούν να προβλεφθούν µε ακρίβεια
καθώς είτε αποτελεί µια σύνθετη διαδικασία, είτε αφορά µια διαδικασία η οποία δεν µπορεί να κατανοηθεί
πλήρως. Με έναν αντίστοιχο τρόπο, σύµφωνα και µε τον Roads, οι διαδικασίες σύνθεσης κατά τη
Μικροδοµική Σύνθεση µπορούν να κατηγοριοποιηθούν σε δύο κατηγορίες: στις σύγχρονες µεθόδους
(synchronous methods), οι οποίες βασίζονται κυρίως σε αιτιοκρατικές διαδικασίες και στις ασύγχρονες
µεθόδους (asynchronous methods), οι οποίες κατά κύριο λόγο βασίζονται σε πιθανοκρατικές διαδικασίες.
Παράδειγµα τεχνικής της πρώτης κατηγορίας αποτελεί η FOF synthesis για µικροδόµηση ήχου, ενώ οι
τεχνικές που ακολούθησε ο Xenakis µε τους πίνακες κατανοµής (screens) αποτελεί παράδειγµα της δεύτερης
κατηγορίας.
Το δεύτερο στάδιο αφορά στη δηµιουργία βάσεων δεδοµένων που παράγονται από τις διαδικασίες
ρυθµίσεων και ελέγχου προκειµένου να χρησιµοποιηθούν στις ατοµικές παραµέτρους της Μικροδοµικής
Σύνθεσης (Πίνακας 4.2).

Παράµετρος Τύπος Παραµέτρου


ρυθµός εµφάνισης κόκκου (grain rate) ατοµική
διάρκεια κόκκου (grain duration) ατοµική
πλάτος κόκκου (grain amplitude) ατοµική

137
συχνότητα κόκκου (grain frequency) ατοµική
περίγραµµα κόκκου (grain envelope) ατοµική
αρχείο ήχου κόκκου (grain soundfile) ατοµική
πλήθος ροών κόκκων (number of streams) γενική
επικάλυψη κόκκου (grain overlap) γενική

Πίνακας 4.2 Παράµετροι Μικροδοµικής Σύνθεσης καθώς και ο τύπος τους κατά Truax.

Κάθε ατοµική παράµετρος αποκτά διαφορετική βαρύτητα αναλόγως τον τύπο Μικροδοµικής Σύνθεσης που
ακολουθείται. Ο Curtis Roads κατηγοριοποιεί έξι διαφορετικούς τύπους Μικροδοµικής Σύνθεσης αναλόγως
τον τρόπο οργάνωσης της ηχητικής πληροφορίας:

• Πίνακες και Πλέγµατα στo Χρονο-συχνοτικό Επίπεδο (Matrices and Screens on the Time-Frequency
Plane).
• Τονικά Σύγχρονη Μικροδοµική Σύνθεση (Pitch-Synchronous Granular Synthesis, PSGS).
• Σύγχρονη και Mερικώς-Σύγχρονη Μικροδοµική Σύνθεση (Synchronous and Quasi-Synchronous
Granular Synthesis, SGS, QSGS).
• Ασύγχρονη Μικροδοµική Σύνθεση (Asynchronous Granular Synthesis).
• Φυσικά και Αφαιρετικά Πρότυπα (Physical and Abstract Models).
• Μικροδόµηση Αποθηκευµένου Ήχου (Granulation of Sampled Sound).

Οι Πίνακες και τα Πλέγµατα στο Χρονο-Συχνοτικό Επίπεδο παράγονται από µετασχηµατισµούς ενός
χρονικού σήµατος σε φασµατική πληροφορία. Συνηθέστερους τέτοιους µετασχηµατισµούς αποτελούν ο
µετασχηµατισµός Fourier βραχέως χρόνου (Short-Time Fourier Transform ή STFT) και ο µετασχηµατισµός
Wavelet. Ο πρώτος αφορά µια ειδική περίπτωση του κλασικού µετασχηµατισµού Fourier σε πολλαπλά µικρά
χρονικά παράθυρα της αρχικής πληροφορίας. Ο δεύτερος αποτελεί έναν παρόµοιο µετασχηµατισµό µε
λογαριθµική όµως αποτύπωση των καναλιών της συχνοτικής ανάλυσης καθώς και µεταβαλλόµενο µέγεθος
του χρονικού παράθυρου ανάλυσης, ανάλογο ως προς την συχνότητα ανάλυσης. Η πληροφορία αυτή, στη
συνέχεια, οργανώνεται σε διακριτά πεδία τιµών και αποτυπώνεται σε δισδιάστατους πίνακες συχνότητας-
πλάτους, προκειµένου να χρησιµοποιηθεί ακολούθως µε διάφορους τρόπους. Συνηθέστερος είναι αυτός της
χρονικής ανασύνθεσης του σήµατος: αντιστρέφοντας τους παραπάνω µετασχηµατισµούς µπορούµε να
ανασυνθέσουµε το σήµα στο χρονικό επίπεδο αφού πρώτα έχουµε επέµβει στα δεδοµένα της ανάλυσης. Κατ’
αυτόν τον τρόπο µπορούµε να µεταβάλλουµε την τονικότητα ή τη διάρκεια του αρχικού σήµατος χωρίς οι
µεταβολές που επιφέρονται στο ένα µέγεθος να επηρεάζουν το άλλο. Μια παρόµοια λογική οργάνωσης της
πληροφορίας σε πίνακες, οι οποίοι όµως δεν έχουν παραχθεί από διαδικασίες ανάλυσης αλλά από
στοχαστικές διαδικασίες, είναι αυτή που, όπως είδαµε προηγουµένως, ακολουθήθηκε από τον Xenakis
(screens).
Ο δεύτερος τύπος σύνθεσης (Pitch-Synchronous Granular Synthesis ή PSGS – De Poli, Piccialli,
1991) αποτελεί και αυτός µια τεχνική ανάλυσης–ανα-σύνθεσης σήµατος, µε σκοπό την αναπαραγωγή
διακριτών τονικά ήχων µε µια ή περισσότερες περιοχές φασµατικής έξαρσης (formants). Η τεχνική αυτή
περιλαµβάνει τέσσερα στάδια επεξεργασίας. Κατά το πρώτο στάδιο πραγµατοποιείται φασµατική ανάλυση σε
µια αρχική πηγή ήχου η οποία αποτυπώνεται σε έναν πίνακα χρόνου - συχνοτήτων, παρόµοιο µε τους πίνακες
Gabor. Ο πίνακας αυτός χωρίζεται σε πλέγµατα καθένα από τα οποία αντιστοιχεί σε µια περίοδο της τονικής
ανάλυσης και αποτελεί έναν διαφορετικό κόκκο (Σχήµα 4.45). Στο επόµενο στάδιο, στον άξονα των
συχνοτήτων του πίνακα χρησιµοποιείται ένας συγκεκριµένος αλγόριθµος ο οποίος εξάγει από κάθε πλέγµα
κόκκου πληροφορία η οποία αντιστοιχεί σε πολλαπλασιαστικούς συντελεστές φίλτρου. Κατ’ αυτόν τον τρόπο
η απόκριση του φίλτρου αντιστοιχεί στη συχνοτική απόκριση κάθε πλέγµατος. Στον χρονικό άξονα του
πίνακα και σε κάθε πλέγµα κόκκου ένας άλλος αλγόριθµος συχνοτικής ανάλυσης εξάγει τη χρονική περίοδο
της κάθε βασικής συχνότητας. Το τελικό στάδιο αποτελεί το στάδιο της ανα-σύνθεσης, µε βάση τις δύο
παραπάνω πληροφορίες. Μια ακολουθία στενών παλµών (pulse train) συχνότητας ίσης προς τη βασική
συχνότητα που αναλύθηκε από το προηγούµενο στάδιο χρησιµοποιείται ως σήµα εισόδου σε µια σειρά από
παράλληλα φίλτρα FIR, µε συντελεστές ισοδυνάµους µε αυτούς της παραπάνω ανάλυσης. Κατ΄αυτόν τον
τρόπο για κάθε πλέγµα ενός χρονικό διαστήµατος Δt παράγεται µια σειρά από ηχητικούς κόκκους καθένας

138
από τους οποίους επικαλύπτεται από τους γειτονικούς του. Το ηχητικό αποτέλεσµα αφορά τελικά τονικά
σύγχρονες επικαλυπτόµενες ροές κόκκων.
Η τεχνική της Σύγχρονης Μικροδοµικής Σύνθεσης (Synchronous Granular Synthesis–SGS) αφορά
ροές οι οποίες αποτελούνται από ακολουθίες ηχητικών κόκκων σε τακτά επαναλαµβανόµενα χρονικά
διαστήµατα (synchronous), αναπαράγοντας έτσι ρυθµικά µοτίβα. Αυξοµειώνοντας την πυκνότητα των
κόκκων ανά δευτερόλεπτο εντός της ροής, παράγονται φαινόµενα επιτάχυνσης (accelerandi) ή επιβράδυνσης
(rallentandi) αντίστοιχα. Εάν η πυκνότητα των κόκκων αυξηθεί σηµαντικά αναπαράγεται η αίσθηση τόνου,
µε χαρακτηριστική συχνοτική απόκριση η οποία σε µερικές περιπτώσεις παρουσιάζει και πλευρικές
συχνότητες. Κατά την τεχνική των µερικώς σύγχρονων ροών (Quasi-Synchronous Granular Synthesis–QSGS)
το χρονικό διάστηµα µεταξύ των διαδοχικών κόκκων δεν είναι σταθερό, και το ηχητικό αποτέλεσµα
προσοµοιάζει αρκετά µε αυτό της τεχνικής της Ασύγχρονης Μικροδοµικής Σύνθεσης.
Στην περίπτωση της Ασύγχρονης Μικροδοµικής Σύνθεσης (Asynchronous Granular Synthesis –AGS)
οι ηχητικοί κόκκοι αναπαράγονται σε χρονικά ασύµµετρα διαστήµατα (asynchronous), µε αποτέλεσµα τη
δηµιουργία ηχητικών νεφών. Η τεχνική αυτή συνίσταται, επακόλουθα, στη διαχείριση συγκεκριµένων
παραµέτρων οι οποίες αποτυπώνουν ποιοτικά και ποσοτικά χαρακτηριστικά τόσο στο ατοµικό επίπεδο του
ηχητικού κόκκου όσο και στο γενικό επίπεδο διαχείρισης του νέφους.
Οι τεχνικές Φυσικής Προτυποποίησης (Physical Modeling) αποτυπώνουν την ακουστική και
µηχανική συµπεριφορά ενός συστήµατος ήχου. Με αντίστοιχο τρόπο, κατά διαστήµατα έχουν προταθεί
διάφορα µοντέλα αποτύπωσης συµπεριφοράς συστηµάτων παραγωγής µικροδοµών. Συµπληρωµατικά, τα
Αφαιρετικά Πρότυπα αφορούν φυσικά µοντέλα αποτύπωσης εικονικών συστηµάτων µέσα από αφαιρετικές
διαδικασίες. Διαδικασίες τέτοιου τύπου µπορεί να αφορούν υπολογιστικούς αλγορίθµους, χαοτικές
συναρτήσεις κ.ο.κ. οι οποίες αναπαράγουν τιµές που µπορούν να χρησιµοποιηθούν σε µια ή περισσότερες
παραµέτρους της Μικροδοµικής Σύνθεσης.
Κατά τη Μικροδόµηση Αποθηκευµένου Ήχου, τέλος, ένα αρχείο ήχου κατατέµνεται σε πολλαπλά
τµήµατα καθένα από τα οποία αποτελεί έναν ηχητικό κόκκο. Κάθε τέτοιο τµήµα µπορεί να υποστεί
επεξεργασία και στη συνέχεια να αναδιαταχθεί χρονικά σε σχέση µε τα υπόλοιπα.

4.5.4. Υλοποιήσεις.

Στο περιβάλλον του SuperCollider παρέχονται οι κλάσεις GrainBuf, GrainIn, GrainSin και GrainFM οι
οποίες υλοποιούν διαδικασίες παραγωγής ηχητικών κόκκων.
Η κλάση GrainBuf µας επιτρέπει να διαχειριστούµε δείγµατα ενός αρχείου ήχου υλοποιώντας έτσι
µια τεχνική Μικροδόµησης Αποθηκευµένου Ήχου. Για τον σκοπό αυτόν χρησιµοποιείται µια προσωρινή
µνήµη την οποία υλοποιεί η κλάση Buffer. Παράλληλα δίνεται η δυνατότητα να χρησιµοποιηθεί και µια
δεύτερη προσωρινή µνήµη στην οποία αποθηκεύονται οι τιµές ενός περιγράµµατος, το οποίο θα εφαρµοστεί
στους κόκκους.

GrainBuf.ar (numChannels: 1, trigger: 0, dur: 1, sndbuf, rate: 1, pos: 0, interp:


2, pan: 0, envbufnum: -1, maxGrains: 512, mul: 1, add: 0)

numChannels Το πλήθος καναλιών που θα παραχθεί στο


σήµα εξόδου. Εάν αυτό είναι µονοφωνικό
τότε η µεταβλητή pan δεν λαµβάνεται
υπόψη.
trigger Ένα σήµα το οποίο σηµατοδοτεί την
έναρξη παραγωγής του ηχητικού κόκκου.
dur Το µέγεθος του κόκκου σε δευτερόλεπτα.
sndbuf Η προσωρινή µνήµη (buffer) η οποία έχει
αποθηκευµένο το ηχητικό δείγµα. Το
buffer αυτό πρέπει να αφορά µονοφωνικό
σήµα.
rate Η ταχύτητα αναπαραγωγής του
αποθηκευµένου ήχου
pos Η θέση αναπαραγωγής κόκκων στο

139
αρχείο ήχου (0: αρχή του αρχείου ήχου, 1:
τέλος του αρχέιου ήχου)
interp Η µέθοδος σύζευξης των κόκκων (1:
χωρίς σύζευξη, 2: γραµµική σύζευξη, 4:
κυβική σύζευξη)
pan Η χωρική τοποθέτηση των κόκκων.
envbuf Μια προσωρινή µνήµη (buffer) στην
οποία αποθηκεύονται οι τιµές ενός
περιγράµµατος το οποίο θα εφαρµοστεί
στους κόκκους. Η τιµή -1 χρησιµοποιεί εξ
ορισµού ένα περίγραµµα τύπου Hann.
maxGrains Το µέγιστο πλήθος αναπαραγόµενων
κόκκων ανά δευτερόλεπτο.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Το ακόλουθο παράδειγµα χρησιµοποιεί µια γεννήτρια Impulse, η οποία ενεργοποιεί τη δηµιουργία κόκκων,
και δύο γεννήτριες θορύβου τυχαίων τιµών (LFNoise1 και LFNoise2), οι οποίες αναπαράγουν τιµές για την
ταχύτητα αναπαραγωγής του αποθηκευµένου ήχου και την θέση αναπαραγωγής κόκκων στο αρχείο ήχου. Η
θέση του ποντικιού X αποτυπώνει τη χωρική τοποθέτηση των κόκκων σε εύρος left-right:

(
var winenv;
b = Buffer.read(s, Platform.resourceDir +/+ "sounds/a11wlk01-44_1.aiff");
// a custom envelope
winenv = Env([0, 1, 0], [0.5, 0.5], [8, -8]);
z = Buffer.sendCollection(s, winenv.discretize, 1);

SynthDef(\buf_grain_test, {arg gate = 1, amp = 1, sndbuf, envbuf;


var pan, env, freqdev;
// use mouse x to control panning
pan = MouseX.kr(-1, 1);
env = EnvGen.kr(Env([0, 1, 0], [1, 1], \sin, 1), gate, levelScale: amp,
doneAction: 2);
Out.ar(0, GrainBuf.ar(2, Impulse.kr(10), 0.1, sndbuf, LFNoise1.kr.range(0.5, 2),
LFNoise2.kr(0.1).range(0, 1), 2, pan, envbuf) * env)
}).send(s);
)

// use built-in Hann env


x = Synth(\buf_grain_test, [\sndbuf, b, \envbuf, -1])
// switch to the custom env
x.set(\envbuf, z)
x.set(\envbuf, -1);

x.set(\gate, 0);

Η κλάση GrainIn χρησιµοποιεί ένα σήµα εισόδου προκειµένου να το κατατµήσει σε ηχητικούς κόκκους.
Υλοποιεί δηλαδή µια τεχνική Μικροδόµηση σε Πραγµατικό Χρόνο (Real-time Granulation):

GrainIn. ar (numChannels: 1, trigger: 0, dur: 1, in, pan: 0, envbufnum: -1,


maxGrains: 512, mul: 1, add: 0)

140
numChannels Το πλήθος καναλιών που θα παραχθεί στο
σήµα εξόδου. Εάν αυτό είναι µονοφωνικό
τότε η µεταβλητή pan δε λαµβάνεται
υπόψη.
trigger Ένα σήµα το οποίο σηµατοδοτεί την
έναρξη παραγωγής του ηχητικού κόκκου.
dur Το µέγεθος του κόκκου σε δευτερόλεπτα.
in Το σήµα εισόδου.
pan Η χωρική τοποθέτηση των κόκκων.
envbuf Μια προσωρινή µνήµη (buffer) στην
οποία αποθηκεύονται οι τιµές ενός
περιγράµµατος το οποίο θα εφαρµοστεί
στους κόκκους. Η τιµή -1 χρησιµοποιεί εξ
ορισµού ένα περίγραµµα τύπου Hann.
maxGrains Το µέγιστο πλήθος αναπαραγόµενων
κόκκων ανά δευτερόλεπτο.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Με ένα χαρακτηριστικό παράδειγµα το οποίο χρησιµοποιεί ως σήµα εισόδου την είσοδο του µικροφώνου
(κλάση SoundIn) -κατά την εκτέλεση χρειάζεται η χρήση ακουστικών:

(
var winenv;
// a custom envelope
winenv = Env([0, 1, 0], [0.5, 0.5], [8, -8]);
z = Buffer.sendCollection(s, winenv.discretize, 1);

SynthDef(\in_grain_test, {arg gate = 1, amp = 1, envbuf;


var pan, env, sig;
// use mouse x to control panning
pan = MouseX.kr(-1, 1);
env = EnvGen.kr(Env([0, 1, 0], [1, 1], \sin, 1), gate, levelScale: amp,
doneAction: 2);
sig = SoundIn.ar(0);
Out.ar(0, GrainIn.ar(2, Impulse.kr(12), 0.1, sig, pan, envbuf) * env)
}).send(s);
)

// use built-in env


x = Synth(\in_grain_test, [\envbuf, -1])
// switch to the custom env
x.set(\envbuf, z)
x.set(\envbuf, -1);

x.set(\gate, 0);

Η κλάση GrainSin χρησιµοποιεί ως σήµα µικροδόµησης µια ηµιτονοειδή κυµατοµορφή:

GrainSin.ar(numChannels: 1, trigger: 0, dur: 1, freq: 440, pan: 0, envbufnum: -1,


maxGrains: 512, mul: 1, add: 0)

numChannels Το πλήθος καναλιών που θα παραχθεί στο


σήµα εξόδου. Εάν αυτό είναι µονοφωνικό
τότε η µεταβλητή pan δε λαµβάνεται

141
υπόψη.
trigger Ένα σήµα το οποίο σηµατοδοτεί την
έναρξη παραγωγής του ηχητικού κόκκου.
dur Το µέγεθος του κόκκου σε δευτερόλεπτα.
freq Η συχνότητα της ηµιτονοειδούς.
pan Η χωρική τοποθέτηση των κόκκων.
envbuf Μια προσωρινή µνήµη (buffer) στην
οποία αποθηκεύονται οι τιµές ενός
περιγράµµατος το οποίο θα εφαρµοστεί
στους κόκκους. Η τιµή -1 χρησιµοποιεί εξ
ορισµού ένα περίγραµµα τύπου Hann.
maxGrains Το µέγιστο πλήθος αναπαραγόµενων
κόκκων ανά δευτερόλεπτο.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Στο παρακάτω παράδειγµα η κεντρική συχνότητα της ηµιτονοειδούς µεταβάλλεται δυναµικά µε τη χρήση
µιας γεννήτριας παραγωγής τυχαίων τιµών θορύβου WhiteNoise, το εύρος των τιµών της οποίας ελέγχεται
από την κίνηση του ποντικιού στον κατακόρυφο άξονα Y:

(
var winenv;
// a custom envelope
winenv = Env([0, 1, 0], [0.5, 0.5], [8, -8]);
z = Buffer.sendCollection(s, winenv.discretize, 1);

SynthDef(\sin_grain_test, {arg gate = 1, amp = 1, envbuf;


var pan, env, freqdev;
// use mouse x to control panning
pan = MouseX.kr(-1, 1);
// use WhiteNoise and mouse y to control deviation from center pitch
freqdev = WhiteNoise.kr(MouseY.kr(0, 400));
env = EnvGen.kr(Env([0, 1, 0], [1, 1], \sin, 1), gate, levelScale: amp,
doneAction: 2);
Out.ar(0, GrainSin.ar(2, Impulse.kr(10), 0.1, 440 + freqdev, pan, envbuf) * env)
}).send(s);
)

// use built-in env


x = Synth(\sin_grain_test, [\envbuf, -1])
// switch to the custom env
x.set(\envbuf, z)
x.set(\envbuf, -1);

x.set(\gate, 0);

Η κλάση GrainFM χρησιµοποιεί ένα σήµα το οποίο προέρχεται από Διαµόρφωση Συχνότητας για να
κατατµήσει µέρη του σε ηχητικούς κόκκους.

GrainFM.ar(numChannels: 1, trigger: 0, dur: 1, carfreq: 440, modfreq: 200, index:


1, pan: 0, envbufnum: -1, maxGrains: 512, mul: 1, add: 0)

numChannels Το πλήθος καναλιών που θα παραχθεί στο


σήµα εξόδου. Εάν αυτό είναι µονοφωνικό
τότε η µεταβλητή pan δεν λαµβάνεται

142
υπόψη.
trigger Ένα σήµα το οποίο σηµατοδοτεί την
έναρξη παραγωγής του ηχητικού κόκκου.
dur Το µέγεθος του κόκκου σε δευτερόλεπτα.
carfreq Η συχνότητα φορέα.
modfreq Η συχνότητα διαµόρφωσης
index Ο συντελεστής διαµόρφωσης
pan Η χωρική τοποθέτηση των κόκκων.
envbuf Μια προσωρινή µνήµη (buffer) στην
οποία αποθηκεύονται οι τιµές ενός
περιγράµµατος το οποίο θα εφαρµοστεί
στους κόκκους. Η τιµή -1 χρησιµοποιεί εξ
ορισµού ένα περίγραµµα τύπου Hann.
maxGrains Το µέγιστο πλήθος αναπαραγόµενων
κόκκων ανά δευτερόλεπτο.
mul Πολλαπλασιαστικός συντελεστής επί των
τιµών που παράγονται από το κύκλωµα.
add Αθροιστικός συντελεστής στις τιµές που
παράγονται από το κύκλωµα.

Στον παρακάτω κώδικα η συχνότητα διαµόρφωσης παραµένει σταθερή (200 Hz) ενώ η συχνότητα φορέα
αποκλίνει από µια σταθερή τιµή (400 Hz) µε τη χρήση µιας γεννήτριας παραγωγής τυχαίων τιµών θορύβου
WhiteNoise, το εύρος των τιµών της οποίας ελέγχεται από την κίνηση του ποντικιού στον κατακόρυφο
άξονα Y. Ο συντελεστής διαµόρφωσης αφορά τυχαίες τιµές εύρους 1 έως 10 µε τη χρήση µιας γεννήτριας
παραγωγής τυχαίων τιµών θορύβου LFNoise1:

(
var winenv;
// a custom envelope
winenv = Env([0, 1, 0], [0.5, 0.5], [8, -8]);
z = Buffer.sendCollection(s, winenv.discretize, 1);

SynthDef(\fm_grain_test, {arg gate = 1, amp = 1, envbuf;


var pan, env, freqdev; // use mouse x to control panning
pan = MouseX.kr(-1, 1);
// use WhiteNoise and mouse y to control deviation from center pitch
freqdev = WhiteNoise.kr(MouseY.kr(0, 400));
env = EnvGen.kr(Env([0, 1, 0], [1, 1], \sin, 1), gate, levelScale: amp,
doneAction: 2);
Out.ar(0, GrainFM.ar(2, Impulse.kr(10), 0.1, 440 + freqdev, 200,
LFNoise1.kr.range(1, 10),pan, envbuf) * env)
}).send(s); )

// use built-in env


x = Synth(\fm_grain_test, [\envbuf, -1])
// switch to the custom env
x.set(\envbuf, z)
x.set(\envbuf, -1);

x.set(\gate, 0);

143
Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Τ. Διαµαντόπουλος, Προγραµµατισµός και Σύνθεση Ήχου. Αθήνα: Έλλην, 2004.

Ξενόγλωσση Βιβλιογραφία.

Bencina, R. «Implementing Real-Time Granular Synthesis», Audio Anecdotes III, Greenbaum & Barzel, Eds.,
Natick, MA: A.K. Peters, 2006.
Clarke, M., «Composing at the Intersection of Time and Frequency», Organised Sound 1(2), Cambridge
University Press, 1996, σελ. 107-117.
Clarke, M., και X. Rodet, «Real-Time FOF and FOG Synthesis in MSP and its Integration with PSOLA»,
International Computer Music Conference 2003, Singapore, 2003.
Cook , P. Real Sound Synthesis for Interactive Applications. Natick, MA: A K Peters/CRC Press, 2002.
Dodge, C. και T. A Jerse. Computer Music: Synthesis, Composition, and Performance. Ν. Υόρκη: Schirmer,
1997.
Keller, D., και Truax, Β. «Ecologically-Based Granular Synthesis», Organised Sound 7 (1), Cambridge
University Press, April 2002, σελ. 5-14.
Miranda, E. Computer Sound Design: Synthesis Techniques and Programming. Oxford: Focal Press, 2003.
Puckette, M. The Theory and Technique of Electronic Music. Singapore: World Scientific Publishing
Company, 2007.
Roads, C. The Computer Music Tutorial. Cambridge, MA: The MIT Press, 1996.
Roads, C. Microsound. Cambridge, MA: The MIT Press, 2004.
Roads, C., S. T. Pope, A. Piccialli και G. De Poli (επιµέλεια). Musical Signal Processing (Studies on New
Music Research). Ν. Υόρκη: Routledge, 1997.

144
Κεφάλαιο 5
Ολοκληρωµένα Ψηφιακά Περιβάλλοντα Ηχητικού Σχεδιασµού και
Ηχητικής Επεξεργασίας.
Σύνοψη
Το παρόν Κεφάλαιο εξετάζει συνοπτικά τις λειτουργίες ενός στούντιο. Παρουσιάζεται ο εξοπλισµός του, µε
έµφαση κυρίως στον εξοπλισµό ενός προσωπικού (home) στούντιο. Η περιήγηση ξεκινά µε τα είδη µικροφώνων,
τα χαρακτηριστικά και τις ιδιότητές τους. Στη συνέχεια, παρουσιάζεται η κονσόλα ήχου µε την αρθρωτή διάταξή
της και ο κοµβικός ρόλος της στη λειτουργία του στούντιο. Παρουσιάζονται τα Ψηφιακά Περιβάλλοντα
Ηχητικής Επεξεργασίας και Ηχογράφησης (Digital Audio Workstation-DAW), η αρχιτεκτονική τους και οι
λειτουργίες τους. Αναλύονται οι βασικές επεξεργασίες του ηχητικού σήµατος και οι βασικές τεχνικές µίξης των
ηχητικών αρχείων. Επανέρχεται η έννοια της περιβάλλουσας και εξετάζονται οι τρόποι αυτοµατισµού της σε
περιβάλλον DAW. Τέλος, παρουσιάζονται ορισµένες βασικές µονάδες επεξεργασίας ήχου.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

5.1. Το Στούντιο.
Η πρώτη συνειδητή καταγραφή ήχου πραγµατοποιήθηκε το 1860 σε µια µηχανή που ονοµάστηκε
phonautograph και κατασκευάστηκε από τον εφευρέτη Édouard Léon Scott de Martinville. Ήταν µια
γυναικεία φωνή που τραγούδησε το γαλλικό παιδικό τραγούδι «Au Clair de la Lune» και της οποίας τα
ηχητικά κύµατα αποτυπώθηκαν πάνω σε χαρτί. Το phonautograph όµως ήταν σχεδιασµένο για την
καταγραφή του ήχου και όχι για τη µετέπειτα αναπαραγωγή του. Η τελευταία πραγµατοποιήθηκε to 1877 µε
το phonograph (του οποίου µετέπειτα εκδοχή είναι το γνωστό gramophone65) του Thomas Alva Edison,
πυροδοτώντας ταυτόχρονα µια τεράστια τεχνολογική εξέλιξη η οποία φτάνει µέχρι τις µέρες µας µε τα
σύγχρονα µηχανήµατα καταγραφής και αναπαραγωγής του ήχου, αλλά και µια εξελικτική πορεία στον τρόπο
πρόσληψης και κατανόησης του ήχου και της µουσικής.
Η παραδοσιακή κτιριακή δοµή ενός στούντιο περιλαµβάνει ξεχωριστά δωµάτια ηχοληψίας (recording
room) και ελέγχου (control room). Αντίθετα, σε ένα προσωπικό στούντιο (home studio), τα στάδια της
ηχογράφησης, της επεξεργασίας και της παραγωγής ενός µουσικού έργου πραγµατοποιούνται όλο και
συχνότερα σε έναν και µοναδικό χώρο εργασίας. Ξεκινώντας µακροσκοπικά την εξέταση ενός τέτοιου χώρου,
ας παρατηρήσουµε την πορεία ενός ήχου από την πηγή που τον παράγει ως τα ηχεία που τον αναπαράγουν
(Σχήµα 5.1):

Σχήµα 5.1 Ροή σήµατος από το µικρόφωνο µέχρι τα ηχεία.

1. Από το µικρόφωνο ο ήχος πηγαίνει αρχικά σε έναν προενισχυτή, ο οποίος ενισχύει το


αδύναµο σήµα του µικροφώνου (line level).
2. Το ενισχυµένο σήµα πηγαίνει στη συνέχεια σε αναλογικούς επεξεργαστές (φίλτρα, EQ,
συµπιεστές ηχητικού σήµατος κ.λπ). Αυτό το στάδιο τείνει να εκλείψει σήµερα καθώς οι
αναλογικοί επεξεργαστές σήµατος έχουν αντικατασταθεί από αντίστοιχους ψηφιακούς και
κατά συνέπεια, οι επεξεργασίες γίνονται αργότερα στο ψηφιακό περιβάλλον του υπολογιστή.

145
3. Το αναλογικό σήµα περνά στη συνέχεια από έναν µετατροπέα αναλογικού σήµατος σε
ψηφιακό (Analog to Digital Converter-ADC), ώστε να εισέλθει στο ψηφιακό περιβάλλον του
υπολογιστή. Το αναλογικό σήµα αποδίδεται ως σειρά ψηφίων του δυαδικού συστήµατος.
4. Στη συνέχεια, το σήµα περνά από το Audio Interface.
5. Το Audio Interface επικοινωνεί µε τον υπολογιστή και στέλνει το σήµα στο λογισµικό
ηχητικού σχεδιασµού και επεξεργασίας (Digital Audio Workstation-DAW), στο οποίο
γίνονται οι επεξεργασίες του ηχητικού σήµατος.
6. Το σήµα, µετά από τις επεξεργασίες και την τελική µίξη, επιστρέφει από το DAW στο Audio
Interface.
7. Στη συνέχεια, περνά από έναν µετατροπέα ψηφιακού σήµατος σε αναλογικό (Digital to
Analog Converter-DAC), ώστε να επανακτήσει αναλογική µορφή. Ακολουθεί δηλαδή την
αντίστροφη πορεία από το στάδιο 3. Φυσικά, δεν πρόκειται για το ίδιο σήµα καθώς, στην
πορεία που προηγήθηκε έχει υποστεί επεξεργασίες.
8. Τέλος, το σήµα φτάνει στα ηχεία µέσω των οποίων το ακούµε.

Κάποια από τα παραπάνω στάδια δεν απαιτούν ξεχωριστές µονάδες. Για παράδειγµα, τα στάδια 1 και 2
συµβαίνουν συνήθως µέσα στο Audio Interface.
Aς δούµε την τεχνολογία που πραγµατοποιεί κάποια από τα παραπάνω στάδια της πορείας του
ηχητικού σήµατος από την πηγή του µέχρι τη µετάδοσή του από τα ηχεία.

5.2. Το Μικρόφωνο.
Τα µικρόφωνα µετατρέπουν τις µεταβολές της πίεσης του αέρα σε αντίστοιχες µεταβολές τάσης ηλεκτρικού
σήµατος, την ακουστική δηλαδή ενέργεια σε ηλεκτρική. Στη συνέχεια, αυτή η ενέργεια µεταφέρεται µέσω
καλωδίων σε ενισχυτές, κονσόλες ήχου ή άλλες µονάδες ηχητικής επεξεργασίας. Φυσικά, ο ακριβής τρόπος
αυτής της µετατροπής, αλλά και οι πιθανές αλλοιώσεις τις οποίες θα υποστεί το σήµα εξαιτίας της,
εξαρτώνται σε µεγάλο βαθµό από τον τύπο του µικροφώνου. Σκοπός των µικροφώνων είναι να συλλέξουν και
να προωθήσουν τους ήχους µε τη µεγαλύτερη δυνατή ακρίβεια, παραστατικότητα και λεπτοµέρεια. Το
µικρόφωνο παρατηρεί, καταγράφει, µετατρέπει και διακινεί τον ήχο. Αποτελεί όχι µόνο µια επέκταση του
αυτιού του ηχολήπτη που, σε πολλές περιπτώσεις, «ακούει» µε µεγαλύτερη ακρίβεια το ηχητικό περιβάλλον,
αλλά και µια αποτύπωση του τρόπου µε τον οποίο ο ηχολήπτης προσλαµβάνει την ηχητική πηγή.
Η ευαισθησία (sensitivity) ενός µικρόφωνου εκφράζεται µε το λόγο της τάσης εξόδου του προς την
ηχητική πίεση και αποδίδεται σε dB.
Τα µικρόφωνα ταξινοµούνται σύµφωνα µε την κατευθυντικότητα και τον τρόπο λειτουργίας τους.
Ανάλογα µε τον τρόπο λειτουργίας, διακρίνονται στις εξής βασικές κατηγορίες: δυναµικά (dynamic),
πυκνωτικά (condenser), ταινίας (ribbon), κρυστάλλων ή πιεζοηλεκτρικά (crystal, piezoelectric) και άνθρακα
(carbon). Οι δύο τύποι που συναντούµε συχνότερα σε ένα στούντιο είναι τα δυναµικά και τα πυκνωτικά
µικρόφωνα.

5.2.1. Καµπύλη Απόκρισης Συχνοτήτων (Frequency Response Curve).

Όπως έχουµε ήδη αναφέρει, το ανθρώπινο αυτί µπορεί, στην καλύτερη περίπτωση, να ακούσει από 20 Hz έως
20.000 Hz. Θεωρητικά λοιπόν, ένα εξαιρετικό µικρόφωνο θα πρέπει να µπορεί να ανταποκριθεί στη λήψη
όλων αυτών των συχνοτήτων µε απόκλιση όχι µεγαλύτερη από ±1dB. Εάν για παράδειγµα, ηχογραφήσουµε
την οµιλία ενός ανθρώπου µε ένα µικρόφωνο το οποίο δεν είναι ικανό να ανταποκριθεί σε συχνότητες πάνω
από 10.000 Hz, τότε, παρότι η οµιλία του ανθρώπου και το νοηµατικό της περιεχόµενο θα έχουν καταγραφεί,
δεν θα έχει αποδοθεί πιστά το ηχόχρωµα της φωνής του. Η λάµψη και η φωτεινότητα του ηχοχρώµατος που
εξαρτώνται από την παρουσία των υψηλών περιοχών του φάσµατος θα απουσιάζουν. Ως αποτέλεσµα, θα
έχουµε έναν «µουντό» ήχο. Το συγκεκριµένο παράδειγµα είναι σηµαντικό γιατί αποδεικνύει ότι ένα
µικρόφωνο δεν καταγράφει µόνο την απολύτως απαραίτητη πληροφορία (οµιλία ενός ανθρώπου) αλλά και τις
λεπτές ηχοχρωµατικές διαφοροποιήσεις, τις ανεπαίσθητες εναλλαγές των αποχρώσεων ενός ήχου.
Η απόκριση συχνοτήτων αναφέρεται στο εύρος που µπορεί να καταγράψει ένα µικρόφωνο αλλά και
στην ευαισθησία µε την οποία ανταποκρίνεται το µικρόφωνο µέσα σε αυτό το εύρος. Θεωρητικά, ένα

146
µικρόφωνο µε επίπεδη απόκριση (flat response) διαθέτει την ίδια ευαισθησία σε όλες τις συχνότητες και σε
όλες τις περιοχές του ηχητικού φάσµατος και κατά συνέπεια, αποδίδει τον ήχο που λαµβάνει µε απόλυτη
ακρίβεια και πιστότητα. Πολλά µικρόφωνα όµως δεν ανταποκρίνονται µε την ίδια ευαισθησία σε όλο το
φασµατικό εύρος. Τα µικρόφωνα µε ελαττωµένη ευαισθησία – µε πτώση δηλαδή της καµπύλης απόκρισης σε
κάποια συχνοτική ζώνη – είναι σχεδιασµένα έτσι ώστε να ανταποκρίνονται περισσότερο σε συγκεκριµένες
περιοχές του φάσµατος και λιγότερο σε άλλες. Για παράδειγµα, ένα τυπικό δυναµικό µικρόφωνο που
ανταποκρίνεται καλύτερα στη µεσαία φασµατική περιοχή είναι κατάλληλο για τη λήψη φωνής, η οποία, έτσι
κι αλλιώς, δεν εκτείνεται σε πολύ χαµηλές συχνότητες. Ένα τέτοιο µικρόφωνο έχει συχνά µειωµένη απόκριση
σε χαµηλές περιοχές έτσι ώστε να αποφεύγει την καταγραφή περιβαλλοντικού θορύβου, αλλά και τη λήψη
βόµβου και όλων των πολύ χαµηλών συχνοτήτων (χαµηλότερων των 100 Hz) που προκύπτουν από την
εγγύτητα της ηχητικής πηγής (pop noise, φαινόµενο εγγύτητας κ.ά.). Παρότι το φαινόµενο εγγύτητας (proximity
effect) χρησιµεύει σε αρκετές περιπτώσεις – οι ραδιοφωνικοί παραγωγοί το χρησιµοποιούν για να ακούγεται η
φωνή τους πιο «ζεστή» – µπορεί να προσθέσει ανεπιθύµητες χαµηλές συχνότητες στην ηχογράφησή µας.
Το γράφηµα της Εικόνας 5.1 αποδίδει συγκριτικά τις καµπύλες απόκρισης συχνοτήτων δύο
µικροφώνων.

Εικόνα 5.1 Συγκριτικό γράφηµα της απόκρισης συχνοτήτων των µικροφώνων Oktava 319 και Shure SM58 (πηγή:
https://commons.wikimedia.org/wiki/File:Oktava319vsshuresm58.png).

Ένα επιπλέον χαρακτηριστικό του µικροφώνου είναι η απόκρισή του σε απότοµες µεταβολές (transient
response), η ευαισθησία του δηλαδή στην καταγραφή των απότοµων µεταβολών της πίεσης του αέρα. Για
παράδειγµα, η κρούση ενός hi-hat προξενεί πολλές τέτοιες µεταβολές στην έναρξη της ανάκρουσης. Σε µια
τέτοια περίπτωση, η επιλογή του µικροφώνου είναι σηµαντική και συµβάλλει στην πιστή καταγραφή του
ήχου. Τα πυκνωτικά µικρόφωνα, τα οποία έχουν µεγαλύτερη µάζα διαφράγµατος από τα δυναµικά, αντιδρούν
καλύτερα στις απότοµες µεταβολές.

5.2.2. Δυναµικά Μικρόφωνα (Dynamic Microphones).

Ένα δυναµικό µικρόφωνο (Εικόνα 5.2 και 5.3) λαµβάνει τα ηχητικά κύµατα σε µια λεπτή µεµβράνη
(διάφραγµα) η οποία δονείται ανάλογα. Η δόνηση περνάει σε ένα κινούµενο πηνίο το οποίο βρίσκεται µέσα
στο µαγνητικό πεδίο ενός µαγνήτη, ο οποίος παράγει εναλλασσόµενο ηλεκτρικό ρεύµα ανάλογο του
ακουστικού σήµατος που έχει αρχικά ληφθεί από τη µεµβράνη του µικροφώνου. Έτσι, το εναλλασσόµενο

147
ηλεκτρικό ρεύµα αντιστοιχεί στις αυξοµειώσεις πύκνωσης των µορίων του αέρα της αρχικής ακουστικής
ενέργειας.

Εικόνα 5.2 Δυναµικά µικρόφωνα (πηγή:


https://commons.wikimedia.org/wiki/File:SM57%26Beta57.JPG#/media/File:SM57%26Beta57.JPG).

Εικόνα 5.3 Εγκάρσια τοµή ενός δυναµικού µικροφώνου (πηγή: https://commons.wikimedia.org/wiki/File:Mic-


dynamic.PNG#/media/File:Mic-dynamic.PNG).

Τα δυναµικά µικρόφωνα χρησιµοποιούνται κυρίως σε περιβάλλοντα στα οποία δεν απαιτείται η λεπτοµερής
ηχητική καταγραφή. Είναι συνήθως ανθεκτικότερα στην κατασκευή τους από τα πυκνωτικά και, για αυτόν το
λόγο, χρησιµοποιούνται συχνότερα σε συναυλίες όπου η καταπόνηση του µικροφώνου είναι αρκετά µεγάλη.

5.2.3. Πυκνωτικά Μικρόφωνα (Condenser Microphones).

Τα πυκνωτικά µικρόφωνα (Εικόνα 5.4 και 5.6) διαθέτουν έναν πυκνωτή ο οποίος αποτελείται από δύο λεπτές
πλάκες (συχνά κατασκευασµένες από πλατίνα ή χρυσό). Η εξωτερική πλάκα (διάφραγµα) η οποία δέχεται το
ακουστικό σήµα είναι φορτισµένη θετικά. Η δεύτερη εσωτερική πλάκα είναι σταθερή και είναι φορτισµένη
αρνητικά. Καθώς η ακουστική ενέργεια µετακινεί το διάφραγµα, αυτό πλησιάζει και αποµακρύνεται
διαδοχικά από τη δεύτερη σταθερή πλάκα δηµιουργώντας έτσι διαφοροποιήσεις στη χωρητικότητα του

148
πυκνωτή. Στη συνέχεια, αυτές οι διαφοροποιήσεις στέλνονται προς το καλώδιο του µικροφώνου ως
εναλλασσόµενο ηλεκτρικό ρεύµα. Ο πυκνωτής απαιτεί µια σταθερή φόρτιση για να λειτουργήσει. Αυτή η
φόρτιση παρέχεται συνήθως από την κονσόλα ήχου µέσω του καλωδίου του µικροφώνου και ονοµάζεται
phantom power66 (ή +48 Volts).

Εικόνα 5.4 Εγκάρσια τοµή ενός πυκνωτικού µικροφώνου.

Σε σχέση µε τα δυναµικά, τα πυκνωτικά µικρόφωνα είναι περισσότερο ευαίσθητα, µε µεγαλύτερο διάφραγµα


και άρα αποτελούν καλύτερη επιλογή για ηχογράφηση ηχητικών πηγών στο στούντιο. Καταγράφουν
περισσότερες λεπτοµέρειες τόσο σε κοντινές όσο και σε µακρινές ηχογραφήσεις. Θα πρέπει να αποφεύγουµε
την τοποθέτηση πυκνωτικών µικροφώνων πολύ κοντά σε ηχητικές πηγές µεγάλης έντασης γιατί µπορεί να
προκληθεί ζηµιά στις λεπτές πλάκες του πυκνωτή.

5.2.4. Κατευθυντικότητα και Πολικά Διαγράµµατα.

Η κατευθυντικότητα αποτελεί σηµαντικό χαρακτηριστικό του µικροφώνου και δηλώνει την ευαισθησία του
στις κατευθύνσεις προέλευσης του ήχου. Σε συνθήκες ηχογράφησης σε εσωτερικό χώρο, όπου παίζουν
περισσότερα του ενός όργανα ή στη διάρκεια µιας ηχογράφησης σε ανοικτό χώρο όπου συνυπάρχουν πολλοί
διαφορετικοί ήχοι, η κατευθυντικότητα θα παίξει καίριο ρόλο στο ποιοι ήχοι θα καταγραφούν και πως. Το
πολικό διάγραµµα περιγράφει τον τρόπο αντίδρασης του µικροφώνου σε ήχους που προέρχονται από
διαφορετικές πλευρές και γωνίες του χώρου.

5.2.4.1. Είδη Μικροφώνων σε Σχέση µε την Κατευθυντικότητά τους.

Το πολικό διάγραµµα περιγράφει τη µεταβολή της ευαισθησίας ενός µικροφώνου για όλες τις γωνίες
πρόσπτωσης των ηχητικών κυµάτων, τον τρόπο δηλαδή µε τον οποίον το µικρόφωνο «ακούει» το χώρο. Οι
παρακάτω κατηγορίες αντιστοιχούν στα χαρακτηριστικά κατευθυντικότητας των µικροφώνων. Τα πολικά
τους διαγράµµατα αναπαριστώνται στην Εικόνα 5.5.

149
Εικόνα 5.5 Πολικά διαγράµµατα (πηγή:
https://commons.wikimedia.org/wiki/File:Polar_pattern_cardioid.png#/media/File:Polar_pattern_cardioid.png).

Καρδιοειδές (Cardioid). Αυτά τα µικρόφωνα εστιάζουν στην ακουστική ενέργεια που βρίσκεται στην περιοχή
µπροστά και πλάγια από το διάφραγµα τους και για αυτόν το λόγο ονοµάζονται και µονοκατευθυντικά (uni-
directional). Σηµαντική είναι η γωνία από την οποία το ακουστικό σήµα φτάνει στη µεµβράνη ενός
καρδιοειδούς µικροφώνου. Αυτή η γωνία µπορεί να «χωρέσει» περισσότερες από µια ηχητικές πηγές, για
παράδειγµα, τρεις τραγουδιστές που τραγουδούν µπροστά, αριστερά και δεξιά του µικροφώνου. Εκτός από το
απλό καρδιοειδές πολικό διάγραµµα, συναντούµε το σούπερ-καρδιοειδές και το υπέρ-καρδιοειδές. Τα δύο
τελευταία επιτρέπουν στο µικρόφωνο να λαµβάνει ήχους από την πίσω πλευρά του. Χρησιµοποιούµε αυτά τα
πολικά διαγράµµατα όταν θέλουµε ένα µονοκατευθυντικό µικρόφωνο το οποίο µπορεί να λαµβάνει τµήµα της
ακουστικής του χώρου και κάποιες ανακλάσεις του ήχου που έρχονται από την πίσω πλευρά του µικροφώνου.
Πανκατευθυντικό (Omni-directional). Λαµβάνει τον ήχο µε την ίδια ευαισθησία από όλες τις
κατευθύνσεις (360°). Χρησιµοποιείται για ηχογραφήσεις µεγάλων χώρων όπως εξωτερικά ηχοτοπία. Με αυτό
το µικρόφωνο δεν θα µπορέσουµε να αποµονώσουµε κάποιον ήχο εστιάζοντας σε αυτόν. Αντίθετα, θα
λάβουµε όλους τους ήχους ανεξάρτητα από τη κατεύθυνση από την οποία πλησιάζουν το µικρόφωνο.
Δικατευθυντικό (Bi-directional ή Figure of 8). Διπλό καρδιοειδές. Λαµβάνει εξίσου την ακουστική
ενέργεια από το µπροστινό και το πίσω µέρος του ενώ απορρίπτει τα ακουστικά σήµατα που έρχονται από
περιοχές αριστερά και δεξιά του (90° και 270°).

150
Κατευθυντικό µεγάλης εστίασης (Ultra-directional ή shotgun). Το πολικό τους διάγραµµα είναι πολύ
στενό καρδιοειδές. Εστιάζουν στα ακουστικά σήµατα που βρίσκονται ακριβώς µπροστά τους.
Χρησιµοποιούνται στον κινηµατογράφο και στην τηλεόραση όπου, παρότι το µικρόφωνο πρέπει να βρίσκεται
µακριά από την ηχητική πηγή έτσι ώστε να µη φαίνεται στο πλάνο, πρέπει να λαµβάνει µόνο τον ήχο από τη
συγκεκριµένη πηγή την οποία σηµαδεύει (shotgun). Ένα παράδειγµα χρήσης τέτοιου µικροφώνου είναι η
ηχητική µετάδοση ενός αγώνα ποδοσφαίρου. Ένα µικρόφωνο shotgun σηµαδεύει συνεχώς ένα σηµείο του
γηπέδου µεταδίδοντας τον ήχο που παράγεται εκεί.
Πολλά από τα µικρόφωνα που θα συναντήσουµε σε ένα στούντιο προσφέρουν περισσότερα από ένα
πολικά διαγράµµατα. Η εναλλαγή των διαγραµµάτων γίνεται µέσω ενός διακόπτη που βρίσκεται πάνω στο
µικρόφωνο (Εικόνα 5.6).

Εικόνα 5.6 Πυκνωτικό µικρόφωνο µε περισσότερα του ενός πολικά διαγράµµατα (πηγή:
https://commons.wikimedia.org/wiki/File:AKG-C414-front.jpg).

Επίσης, πολλά µικρόφωνα έχουν επιπλέον ενσωµατωµένους διακόπτες οι οποίοι ελέγχουν το βαθµό
ευαισθησίας και τη φασµατική περιοχή στην οποία αυτή εφαρµόζεται. Αυτοί οι διακόπτες µας επιτρέπουν να
ελαττώσουµε την ευαισθησία του µικροφώνου κατά 10 dB, 20 dB κ.λπ., σε περιοχές κάτω από 75 Hz, 100 Hz
κ.λπ. (Εικόνα 5.7). Με αυτόν τον τρόπο, αποφεύγουµε την καταγραφή πολύ χαµηλών συχνοτήτων που
παράγονται από το pop noise, από κάποιο κλιµατιστικό ή από τα ρούχα ή τις κινήσεις των µουσικών.
Ταυτόχρονα όµως απορρίπτουµε και τις όποιες χαµηλές συχνότητες του ήχου που ηχογραφούµε µε
αποτέλεσµα να αλλοιώσουµε το ηχόχρωµά του.

Εικόνα 5.7 Ενσωµατωµένα φίλτρα για την αποφυγή καταγραφής χαµηλών συχνοτήτων και θορύβου.

151
5.2.5. Η Τοποθέτηση του Μικροφώνου.

Η καταγραφή ενός ήχου ο οποίος θα χρησιµοποιηθεί ως πρωτογενές υλικό σε µια σύνθεση απαιτεί από τον
ηχολήπτη µια σειρά επιλογών και αποφάσεων που βασίζονται τόσο σε αντικειµενικές παραµέτρους όσο και
σε υποκειµενικά κριτήρια. Το µικρόφωνο που θα επιλεγεί κάθε φορά θα πρέπει να είναι το κατάλληλο για την
καταγραφή τόσο του φασµατικού εύρους όσο και των δυναµικών που παράγει η συγκεκριµένη ηχητική πηγή
που θα καταγραφεί. Στην τελική απόφαση για το πώς θα καταγραφεί ο ήχος το σηµαντικότερο ρόλο θα
παίξουν τα υποκειµενικά κριτήρια, ακόµη και αν αντιτίθενται στις αντικειµενικές παραµέτρους και στις
παγιωµένες αρχές που διέπουν τη διαδικασία της ηχογράφησης. Τελικά, όποιο µικρόφωνο και να επιλέξουµε,
η τοποθέτησή του ή η κίνησή του σε σχέση µε την ηχητική πηγή δηλώνει την πρόθεση ή τη µη πρόθεσή µας,
τις προσδοκίες µας από τον ήχο που θέλουµε να καταγράψουµε και την αισθητική µας στάση απέναντι στο
ηχητικό περιβάλλον. Μπορούµε να εξειδικεύσουµε αυτήν τη στάση στις παρακάτω κατηγορίες ή
συµπεριφορές ηχογράφησης:

1. Σταθερή ηχητική πηγή – σταθερό µικρόφωνο. Τυπική περίπτωση ηχογράφησης ενός οργάνου
το οποίο παίζεται µπροστά από ένα µικρόφωνο. Καταγράφουµε τον άµεσο και κοντινό χώρο
και τις λεπτοµέρειες της ατάκας. Εξαιτίας της µικρής απόστασης, µαζί µε το ηχητικό σήµα
καταγράφουµε και την ποιότητα του υλικού από το οποίο είναι κατασκευασµένη η ηχητική
πηγή καθώς και την κινητική συµπεριφορά του οργανοπαίκτη. Η τεχνική close miking
αποτελεί ένα τυπικό παράδειγµα αυτής της κατηγορίας.
2. Κινούµενη ηχητική πηγή – σταθερό µικρόφωνο. Μια ηχητική πηγή, για παράδειγµα ένα
αυτοκίνητο ή µια οµάδα ανθρώπων η οποία περνά µπροστά από ένα σταθερό µικρόφωνο.
Καταγράφουµε την απόσταση και την κίνηση, δίνουµε έµφαση στη διάρκεια, συχνά
καταγράφουµε το Doppler effect.
3. Σταθερή ηχητική πηγή – κινούµενο µικρόφωνο. Αυτή η περίπτωση χαρακτηρίζεται από την
πρόθεση του ηχολήπτη και απαιτεί ιδιαίτερη εγρήγορση καθώς η απόφαση για το πώς και
προς ποια κατεύθυνση θα κινείται το µικρόφωνο εξαρτάται από την εξέλιξη του ίδιου του
ήχου. Ο ηχολήπτης δηµιουργεί διαδροµές, εντάσεις και αλλαγές στην κατεύθυνση της
κίνησης ανεξάρτητες από την ηχητική πηγή. Συχνά, βασίζεται σε αυτοσχεδιαστικές κινήσεις.
Χρειάζεται προσοχή ώστε να µην καταγραφούν η κίνηση του χεριού που κρατάει το
µικρόφωνο, οι τριβές του καλωδίου και των ρούχων του ηχολήπτη. Ένα παράδειγµα
εφαρµογής αυτής της τεχνικής αποτελεί το έργο «Pendulum Music» του Steve Reich.
4. Κινούµενη ηχητική πηγή – κινούµενο µικρόφωνο. Ισχύουν τα ίδια χαρακτηριστικά µε την
περίπτωση 3. Η σηµαντική διαφορά εδώ είναι ότι ο χρόνος που έχει στη διάθεσή του ο
ηχολήπτης για την καταγραφή της ηχητικής πηγής δεν εξαρτάται από τον ίδιο αλλά από τη
διάρκεια εµφάνισης και αποµάκρυνσης της πηγής.

Τοποθετούµε το µικρόφωνο στην περιοχή στην οποία πιστεύουµε ότι ηχεί καλύτερα ο ήχος. Υπάρχουν
πολλές τεχνικές ηχογράφησης και τρόποι τοποθέτησης µικροφώνων, ανάλογα µε την ηχητική πηγή ή το
όργανο που θέλουµε να ηχογραφήσουµε. Η λεπτοµερής περιγραφή όλων των πιθανών τοποθετήσεων ενός
µικροφώνου ή µιας µικροφωνικής συστοιχίας υπερβαίνει τους στόχους αυτού του κεφαλαίου. Ο αναγνώστης
µπορεί να βρει τις σχετικές πληροφορίες σε εξειδικευµένη βιβλιογραφία. Ως γενική αρχή µπορούµε να
αναφέρουµε το εξής: η τοποθέτηση του µικροφώνου εξαρτάται από το πώς σκοπεύουµε να
χρησιµοποιήσουµε τον ηχογραφηµένο ήχο στη σύνθεση και από τον τρόπο µε τον οποίο θέλουµε να
προσεγγίσουµε το συγκεκριµένο ήχο. Ηχογραφούµε τον ίδιο τον ήχο, το χώρο γύρω του, την πρόθεση και τις
χειρονοµίες που την αρθρώνουν, την εγγενή χειρονοµία του ήχου, τη φασµατοµορφολογική και
χωροµορφολογική του ανάπτυξη.

5.3. Η Κονσόλα Ήχου.


Η κονσόλα ήχου (Εικόνα 5.8) είναι ένα κεντρικό σηµείο του στούντιο στο οποίο συναντώνται όλοι οι ήχοι
που θα χρησιµοποιήσουµε στη µίξη µας. Η κονσόλα συνδυάζει όλα τα διαφορετικά ηχητικά σήµατα που
εισέρχονται στις εισόδους της (inputs) και τα κατευθύνει προς µια στερεοφωνική έξοδο (output).

152
Εικόνα 5.8 Κονσόλα ήχου Focusrite µε 72 εισόδους, 48 εξόδους και δυνατότητες αυτοµατισµού (πηγή:
https://commons.wikimedia.org/wiki/File:Focusrite_Console_02.jpg).

Ας δούµε τα βασικά αρθρωτά τµήµατα µιας κονσόλας ήχου:


Κανάλια (channels). Μια σπονδυλωτή κονσόλα αποτελείται από πανοµοιότυπα κανάλια ήχου. Ο
αριθµός των καναλιών καθορίζει το µέγεθος της κονσόλας αλλά και τον αριθµό των οργάνων που µπορούµε
να στείλουµε ταυτόχρονα σε αυτήν. Το σήµα εισέρχεται σε ένα κανάλι µέσω του καλωδίου που συνδέει το
µικρόφωνο µε την κονσόλα. Το σήµα φτάνει στην είσοδο (input) του καναλιού η οποία βρίσκεται στο επάνω
τµήµα της κονσόλας και στη συνέχεια κατευθύνεται προς το ποτενσιόµετρο (fader) που βρίσκεται στο κάτω
τµήµα της.
Είσοδοι (inputs). Βρίσκονται στο άνω µέρος της κονσόλας και µπορούν να δεχθούν µικρόφωνα
(καλώδιo XLR), ηλεκτρικά όργανα (συνήθως µε καλώδια jack balanced ή unbalanced), συνθετητές και
συσκευές αναπαραγωγής ήχου όπως MP3 players (συνήθως µε καλώδια RCA).
Προενίσχυση (Gain ή Trim). Το ηλεκτρικό σήµα που έρχεται από ένα µικρόφωνο σε µια είσοδο της
κονσόλας, είναι πολύ χαµηλής ενέργειας και χρειάζεται ενίσχυση. Η προενίσχυση σήµατος απαιτεί προσοχή
καθώς µπορεί να προσθέσει θόρυβο στο σήµα. Μια καλή τακτική είναι να ενισχύσουµε το σήµα
αποφεύγοντας ωστόσο την παραγωγή θορύβου και παραµόρφωσης.
Φίλτρα (EQ). Με τα φίλτρα ενισχύουµε ή/και αποδυναµώνουµε επιλεγµένες περιοχές του φάσµατος.
Τα χρησιµοποιούµε για να επέµβουµε στο αρχικό ηχόχρωµα. Αν για παράδειγµα επιδιώκουµε έναν ήχο ζεστό
και επιβλητικό ενισχύουµε την περιοχή των χαµηλών συχνοτήτων του φάσµατος. Μια άλλη χρήση τους είναι
η αποφυγή θορύβων και ανατροφοδότησης (feedback). Στις κονσόλες συναντούµε συχνότερα παραµετρικά
φίλτρα. Σε ένα παραµετρικό φίλτρο µπορούµε να ελέγξουµε τη συχνότητα αποκοπής, το εύρος γύρω από τη
συχνότητα αποκοπής (Q) και το ποσοστό ενίσχυσης ή αποδυνάµωσης. Οι µεγάλες κονσόλες διαθέτουν
παραµετρικά φίλτρα για όλες τις συχνοτικές περιοχές, ενώ οι µικρότερες για κάποιες από αυτές (χαµηλή,
χαµηλή-µεσαία, µεσαία-υψηλή, υψηλή).
Send. Διαχωρίζει το ηχητικό σήµα και το στέλνει σε διάφορες κατευθύνσεις, συνήθως µέσω ενός bus.
Bus. Το bus µας επιτρέπει να επεξεργαστούµε και να δροµολογήσουµε ταυτόχρονα έναν αριθµό
διαφορετικών ηχητικών σηµάτων. Παράδειγµα 1: µπορούµε να συγκεντρώσουµε σε ένα bus όλα τα ηχητικά
σήµατα από τα µικρόφωνα ενός drum set για να τα επεξεργαστούµε οµαδικά πριν τα στείλουµε στην τελική
έξοδο. Ας εξετάσουµε την εξής περίπτωση: έχουµε ένα drum set µε οκτώ διαφορετικά όργανα. Στο DAW,
ρυθµίζουµε τις εξόδους των οκτώ tracks στα bus 1 και 2. Με αυτόν τον τρόπο, συγκεντρώνουµε όλα τα
όργανα του drum set σε ένα στερεοφωνικό κανάλι και ελέγχουµε τη συνολική τους ένταση µε ένα µόνο
ποτενσιόµετρο. Παράδειγµα 2: όλα ή κάποια από τα ηχητικά δείγµατα σε ένα DAW αποστέλλονται σε ένα
bus για να υποστούν συµπίεση (compression) πριν να οδηγηθούν στην τελική έξοδο (master output).

153
Βοηθητική έξοδος (auxiliary output). Πρόκειται για την έξοδο ενός bus. Στέλνει το σήµα σε διάφορες
κατευθύνσεις. Μπορεί να ρυθµιστεί ως pre-fader ή post-fader. Στην πρώτη περίπτωση, η στάθµη ελέγχεται
από το ίδιο το auxiliary, ενώ στη δεύτερη, εξαρτάται και από τη θέση του ποτενσιόµετρου που ελέγχει τη
στάθµη του καναλιού. Παράδειγµα χρήσης βοηθητικής εξόδου: στο κανάλι 1 έχουµε µια φωνή µε το monitor
στο aux 1 και στο κανάλι 2 ένα πιάνο µε το monitor στο aux 2. Αν ο τραγουδιστής θέλει να ακούει το πιάνο
στο δικό του monitor τότε θα χρησιµοποιήσουµε το aux 1 που βρίσκεται στο κανάλι 2 για να στείλουµε το
σήµα του πιάνου στο monitor του τραγουδιστή.
Οι βοηθητικές έξοδοι χρησιµοποιούνται επίσης για να διοχετεύσουµε το σήµα σε µονάδες effect.
Όταν, µέσω ενός auxiliary bus, τροφοδοτούµε µια µονάδα επεξεργασίας, αναφερόµαστε σε αυτό ως send, ενώ
το κανάλι που δέχεται το επεξεργασµένο σήµα από την έξοδο της µονάδας, ονοµάζεται return.
Πανοραµικό (Pan). Τοποθετεί τον ήχο σε συγκεκριµένο σηµείο του στερεοφωνικού πεδίου.
Κυλιόµενα Ποτενσιόµετρα (faders). Ρυθµίζουν την τελική στάθµη του σήµατος για κάθε κανάλι.
Κύριος έλεγχος (Master control). Το master control output ελέγχει την ένταση του σήµατος που
διοχετεύεται στα master outputs της κονσόλας. Το auxiliary master ελέγχει συνολικά τα auxiliaries του κάθε
καναλιού.

5.4. Ψηφιακά Συστήµατα Ηχητικής Επεξεργασίας (DAW-Digital Audio Workstation).


Τα ψηφιακά συστήµατα ηχητικής επεξεργασίας (Digital Audio Workstation-DAW) αποτελούν
ολοκληρωµένους σταθµούς ηχογράφησης, επεξεργασίας και παραγωγής ηχητικών αρχείων. Από τις
απλούστερες µορφές τους ως πιο περίπλοκους συνδυασµούς (διαφορετικές µονάδες ηχητικής επεξεργασίας
ελεγχόµενες από έναν κεντρικό υπολογιστή) τα DAWs είναι ο δηµοφιλέστερος τρόπος ηχογράφησης και
παραγωγής µουσικής σήµερα.
Το Σχήµα 5.2 περιγράφει την πορεία του ηχητικού σήµατος από την ηχητική πηγή που το παράγει
µέχρι τον υπολογιστή στον οποίο είναι εγκατεστηµένο το DAW.

Σχήµα 5.2 Η πορεία του ηχητικού σήµατος από την ηχητική πηγή µέχρι το DAW και από το DAW στον ακροατή.

5.4.1. Tracks.

Συχνά, η έννοια του track συγχέεται λανθασµένα µε αυτήν του καναλιού. Ένα track (audio ή MIDI µπορεί να
ρυθµιστεί ώστε να επικοινωνεί και να δέχεται πληροφορίες από διαφορετικά κανάλια). Το track είναι µια
διαµήκης λωρίδα στο περιβάλλον DAW, στην οποία εµφανίζεται η κυµατοµορφή του ήχου και η οποία
παραπέµπει οπτικά στη µαγνητοταινία, το βασικότερο µέσο ηχογράφησης των περασµένων δεκαετιών. Σε
αυτήν τη λωρίδα πραγµατοποιούνται οι ρυθµίσεις αυτοµατισµού έντασης, του πανοραµικού και άλλων
παραµέτρων που αφορούν στη λειτουργία των effects. Σε ένα DAW συναντούµε τις εξής επιλογές για τη
δηµιουργία ενός νέου track:

• Audio track. Μπορεί να είναι µονοφωνικό (mono), στερεοφωνικό (stereo) ή πολυκαναλικό


(surround). Το µονοφωνικό track µπορεί να αποδοθεί από ένα ή δύο ηχεία και το
στερεοφωνικό από δύο ηχεία αποδίδοντας µια µετωπική ακρόαση η οποία µιµείται τον τρόπο
που ακούµε σε ένα τυπικό θέατρο ιταλικής σκηνής. Στην περίπτωση του πολυκαναλικού

154
track κάποιες από τις πιθανές επιλογές είναι οι εξής: τετραφωνικό 4.0 (quadraphonic),
surround 5.1, 6.1, και 7.1 και οκταφωνικό 8.0 (octaphonic).
• Software instrument. Είναι συνδεδεµένο µε ψηφιακά MIDI όργανα. Δέχεται MIDI δεδοµένα
(input) και εξάγει ψηφιακά αρχεία ήχου (output).
• MIDI track. Διαχειρίζεται MIDI δεδοµένα τα οποία λαµβάνει από εξωτερικά MIDI όργανα
και ελεγκτές, ψηφιακούς συνθετητές και άλλα software instruments.
• Auxiliary track. Είναι βοηθητικά tracks τα οποία δροµολογούν το σήµα σε διάφορες
κατευθύνσεις, όπως σε µονάδες effect.
• Global track. Διαχειρίζεται δεδοµένα που σχετίζονται µε τη γενικότερη λειτουργία και δοµή
ενός project σε ένα DAW, όπως οι αλλαγές σε metro, tempo, markers κ.λπ.

5.4.2. Ηχογράφηση Ήχου σε Audio Track του DAW.

Πριν την ηχογράφηση ενός ήχου πρέπει να ρυθµίσουµε τα παρακάτω:

• Τη συχνότητα δειγµατοληψίας και το bit depth.


• Την κάρτα ήχου σε περίπτωση που έχουµε περισσότερες από µια συνδεδεµένες µε το
σύστηµά µας.
• Το µέγεθος της προσωρινής µνήµης (buffer size).
• Τον τύπο του track (mono, stereo κ.λπ.).
• Την επιλογή στο track της εισόδου (input) του µικροφώνου, η οποία συµπίπτει µε την είσοδο
του µικροφώνου στην κάρτα ήχου.
• Την ενεργοποίηση του phantom power, αν χρησιµοποιούµε πυκνωτικό µικρόφωνο.
• Την ενεργοποίηση του κουµπιού ηχογράφησης του track (record enable).
• Την ενεργοποίηση του κουµπιού ακρόασης του track (monitoring).
• Τη ρύθµιση των επιπέδων της στάθµης στον προενισχυτή του µικροφώνου, στην κονσόλα
ήχου και στο DAW.
• Την ενεργοποίηση του µετρονόµου στο DAW, σε περίπτωση που το κρίνουµε απαραίτητο.
• Την ενεργοποίηση του κουµπιού ηχογράφησης (record button).

5.4.3. Αλλαγή της Συχνότητας Δειγµατοληψίας.

Σε περίπτωση που αλλάξουµε τη δειγµατοληψία ενός ηχητικού αρχείου (χρησιµοποιώντας την εντολή set rate
ή change sample rate ή παρόµοια), τότε αλλάζουµε το τονικό του ύψος και τη διάρκειά του. Για παράδειγµα,
αν έχουµε έναν ηχογραφηµένο ήχο µε συχνότητα δειγµατοληψίας 48.000 Hz και αλλάξουµε τη συχνότητα
δειγµατοληψίας της αναπαραγωγής του σε 96.000 Hz, τότε θα συµβούν τα εξής δύο: α) Το τονικό ύψος του
θα διπλασιαστεί (µια οκτάβα ψηλότερα) και β) η διάρκειά του θα µειωθεί στο µισό της αρχικής του. Αν
µετατρέψουµε τη συχνότητα δειγµατοληψίας από 48.000 Hz σε 24.000 Hz, τότε α) το τονικό ύψος του θα
πέσει µια οκτάβα και β) η διάρκειά του θα διπλασιαστεί.

5.4.4. Μέγεθος Προσωρινής Μνήµης (Buffer Size).

Το buffer είναι ένας χώρος προσωρινής αποθήκευσης δεδοµένων ή µια προσωρινή ή ενδιάµεση µνήµη στην
οποία αποθηκεύει ο υπολογιστής προσωρινά ηχητικά δείγµατα (samples), δεδοµένα ηχητικής επεξεργασίας
κ.ά. Το buffer size είναι ο χρόνος που χρειάζεται ο υπολογιστής για να επεξεργαστεί τα οποιαδήποτε
εισερχόµενα ή εξερχόµενα δεδοµένα (input/output data) που σχετίζονται µε τον ήχο (ηχογράφηση,
επεξεργασία ήχου, effects κ.ά.). Κάθε φορά που ηχογραφούµε έναν ήχο ή δοκιµάζουµε ένα effect στο DAW,
ο υπολογιστής χρειάζεται να αποθηκεύσει προσωρινά τα εισερχόµενα και εξερχόµενα δεδοµένα ώστε να τα
επεξεργαστεί. Το µέγεθος αυτής της αποθήκευσης εξαρτάται από πολλούς παράγοντες, µεταξύ των οποίων η
συχνότητα δειγµατοληψίας, η ισχύς της κεντρικής µονάδας επεξεργασίας (Central Processing Unit-CPU), το
audio driver που χρησιµοποιούµε κ.ά., και η διαµόρφωσή του απαιτεί κάποιους συµβιβασµούς. Ένα µη
επαρκές µέγεθος της προσωρινής µνήµης µπορεί να προκαλέσει αρκετά µεγάλη καθυστέρηση στην
αναπαραγωγή του ήχου (monitoring latency). Τέτοιες καθυστερήσεις παρουσιάζονται στην αναπαραγωγή

155
ηχητικών αρχείων και στη λειτουργία ψηφιακών συνθετητών και µονάδων ηχητικής επεξεργασίας, και
µετριούνται σε λίγα χιλιοστά του δευτερολέπτου.
Όσο µικρότερο είναι το µέγεθος της προσωρινής µνήµης τόσο µικρότερη είναι και η καθυστέρηση
αναπαραγωγής. Επίσης, όσο µεγαλύτερη είναι η προσωρινή µνήµη, τόσο οµαλότερη είναι η λειτουργία του
CPU. Όταν ηχογραφούµε έναν ήχο, διαδικασία κατά την οποία δεν απαιτείται µεγάλη υπολογιστική ισχύς,
µπορούµε να ορίσουµε ένα χαµηλό µέγεθος προσωρινής µνήµης (128). Όταν βρισκόµαστε στη διαδικασία της
µίξης και χρησιµοποιούµε πολλά effects, χρειαζόµαστε όλη την υπολογιστική ισχύ που µπορεί να προσφέρει
ο υπολογιστής µας. Σε αυτήν την περίπτωση, αυξάνουµε το µέγεθος της προσωρινής µνήµης (Εικόνα 5.9).

Εικόνα 5.9 Ορισµός του µεγέθους προσωρινής µνήµης (buffer size) στο παράθυρο Preferences του Logic Pro X.

5.4.5. Μορφότυπα Ηχητικών Αρχείων (Audio File Formats).

Όσο µεγαλύτερη είναι η συχνότητα δειγµατοληψίας και οι τιµές µέτρησης του πλάτους (bit depth) του
ηχητικού σήµατος που ηχογραφούµε και το οποίο µετατρέπεται σε ψηφιακό αρχείο, τόσο αυξάνεται η
απαίτηση για µεγαλύτερο αποθηκευτικό χώρο. Ένα από τα πλεονεκτήµατα των ψηφιακών αρχείων ήχου είναι
η δυνατότητα πολλών αντιγράφων, η µεταφορά τους σε διαφορετικούς σταθµούς εργασίας ή υπολογιστές και
η µετάδοσή τους µέσω δικτύων. Για τον σκοπό αυτό υπάρχουν διαθέσιµα πολλά διαφορετικά µορφότυπα. Η
επιλογή καθενός από αυτά εξαρτάται από πολλούς παράγοντες: την πιστότητα, το µέγεθος του
αποθηκευµένου αρχείου, τον διαθέσιµο αποθηκευτικό χώρο και την ευκολία µετάδοσής του µέσω δικτύου ή
ανάρτησής του στο διαδίκτυο.
Βασική αρχή για την αποθήκευση ενός ήχου είναι η, κατά το δυνατό, δηµιουργία µικρών σε µέγεθος
αρχείων µέσω διαφορετικών συστηµάτων κωδικοποίησης. Η διαδικασία αυτή ονοµάζεται codec από τη
σύντµηση των αγγλικών λέξεων encoding (κωδικοποίηση) και decoding (αποκωδικοποίηση) ή compression
(συµπίεση) και decompression (αποσυµπίεση). H συµπίεση, η οποία µειώνει το µέγεθος ενός αρχείου, µπορεί
να αφορά σε δεδοµένα (data compression) ή σε ήχο (audio compression). Μπορεί να είναι απωλεστική
(lossy), περίπτωση κατά την οποία το αποθηκευµένο αρχείο περιέχει µόνο τα δεδοµένα που θεωρούνται
απαραίτητα για την ανάκτησή του, ή µη απωλεστική (lossless). Στη µη απωλεστική συµπίεση, τα δεδοµένα
µετά τις διαδικασίες συµπίεσης και αποσυµπίεσης ενός αρχείου ταυτίζονται απόλυτα καθώς οι αλγόριθµοι
συµπίεσης και αποσυµπίεσης είναι ακριβώς αντίστροφοι. Η αποσυµπίεση είναι η τεχνική που επαναφέρει ένα

156
συµπιεσµένο αρχείο στο αρχικό του µέγεθος. Χαρακτηριστικό παράδειγµα συµπιεσµένου ηχητικού αρχείου
αποτελεί το µορφότυπο .mp3, το οποίο παρέχει αναλογία συµπίεσης 10:1. Χρησιµοποιείται κυρίως για την
ανάρτηση ηχητικών αρχείων στο διαδίκτυο γιατί προσφέρει κατά 10% µικρότερο χρόνο λήψης ή ανάρτησης
σε σχέση µε ένα µη συµπιεσµένο αρχείο. Στον Πίνακα 5.1 δίνονται κάποια από τα δηµοφιλέστερα µορφότυπα
ηχητικών αρχείων.

Μορφότυπο Περιγραφή
.aiff (µη απωλεστικό) Audio Interchange File Format (Apple 1989).
.wav (µη απωλεστικό) Wave (αρχικά σε περιβάλλον Windows από το 1991,
παρόµοιο µε το .aiff).
.wav (bwf) Wave (Broadcast Wave Format, 1997). Αποθηκεύει
µεταδεδοµένα, όπως διάφορα στοιχεία που προκύπτουν
από την ηχητική επεξεργασία. Χρήσιµη επιλογή για την
ανάκτηση δεδοµένων σε περίπτωση που αποτύχει η
εκτέλεση (κρασάρισµα) του λογισµικού.
.flac (µη απωλεστικό) Free Lossless Audio Codec.
.au .snd (µη απωλεστικά) Sun Microsystems.
.alac (µη απωλεστικό) Apple Lossless Audio Codec (iTunes).
.caf (µη απωλεστικό) Core Audio Format. Χρησιµοποιείται συχνά σε
προγράµµατα surround sound της Apple.
.dsd (µη απωλεστικό) Direct Stream Digital. Υψηλής ανάλυσης,
χρησιµοποιήθηκε στα super audio CDs (SACD).
.wma (µη απωλεστικό) Windows Media Audio. WMA lossless.
.mp3 (απωλεστικό) MPEG 1 (Motion Picture Experts Group 1).
.wma (απωλεστικό) Windows Media Audio.
.ogg .oga (απωλεστικό) Λογισµικό ανοικτού κώδικα Vorbis. Υψηλότερη
πιστότητα σε σχέση µε άλλα απωλεστικά µορφότυπα.
.aac (απωλεστικό) Advanced Audio Codec. Apple iTunes.

Πίνακας 5.1 Μορφότυπα ηχητικών αρχείων.

Στην επιλογή του µορφότυπου για την αποθήκευση ενός ηχητικού αρχείου, µπορούµε να ορίσουµε αν η
αποθήκευση θα γίνει µε τη µέθοδο interleaved ή deinterleaved. Η µέθοδος interleaved δηµιουργεί ένα
µοναδικό αρχείο το οποίο περιλαµβάνει το αριστερό και δεξί κανάλι ενός στερεοφωνικού αρχείου. Η µέθοδος
deinterleaved δηµιουργεί δύο αρχεία, ένα για το αριστερό και ένα για το δεξί κανάλι του ήχου που
ηχογραφείται.

5.5. Βασικές Επεξεργασίες Ηχητικών Αρχείων (Editing).


Οι βασικές επεξεργασίες αµέσως µετά την ηχογράφηση ενός ήχου σε ένα DAW αφορούν α) στην απόρριψη
µη επιθυµητών τµηµάτων του ηχητικού αρχείου, β) στην επιλογή και αποκοπή µικρότερων τµηµάτων του, γ)
στη διαµόρφωση της σταδιακής έναρξης (fade in) και απόσβεσης (fade out) της στάθµης τους και δ) στη
διαµόρφωση, αν κριθεί απαραίτητο, της τελικής στάθµης µέσω των επεξεργασιών gain ή/και normalize.

5.5.1. Ενίσχυση (Trim) και Μη Καταστροφική Επεξεργασία (Non Destructive Editing).

Όταν ηχογραφούµε έναν ήχο, το DAW δηµιουργεί δύο τύπου αρχεία: το ηχητικό αρχείο το οποίο
αποθηκεύεται στο φάκελο των ηχητικών αρχείων (Audio Files) του Project και ένα αρχείο αναφοράς στο
ηχητικό αρχείο, το οποίο εµφανίζεται ως κυµατοµορφή στο παράθυρο Edit Window του DAW. Από αυτό το
αρχείο µπορούµε να αποκόψουµε τµήµατα και να αλλάξουµε τη διάρκειά του χρησιµοποιώντας είτε τη
µέθοδο cut και την επιλογή του ψαλιδιού (scissors tool) είτε τη µέθοδο trimming. Σε περίπτωση που έχουµε
ηχογραφήσει ένα µεγάλο σε διάρκεια αρχείο, θα χρειαστεί ίσως να επιλέξουµε µικρότερα τµήµατά του τα

157
οποία θα αποθηκεύσουµε ως ξεχωριστά αρχεία του αρχικού µας αρχείου (regions). Η µέθοδος trimming,
όπως και η εργασία µε το ψαλίδι, µας παρέχει τη δυνατότητα να επεξεργαστούµε το αρχείο µας χωρίς να
αλλοιώσουµε την αρχική του µορφή και κατάσταση γιατί εφαρµόζονται στο αρχείο αναφοράς και όχι στο
αρχικό. Αυτή η επεξεργασία ονοµάζεται µη καταστροφική (non-destructive editing) σε αντίθεση µε την
καταστροφική (destructive editing) η οποία τροποποιεί το αρχικό αρχείο. Σε καθένα από αυτά τα αρχεία
αναφοράς µπορούµε στη συνέχεια να εφαρµόσουµε τεχνικές fade in και fade out.

5.6. Μίξη.
Η µίξη ήχων, είτε αφορά σε συνήχηση παραδοσιακών οργάνων, είτε σε συνύπαρξη περιβαλλοντικών ή άλλων
ήχων, αποτελεί µια από τις σηµαντικότερες εργασίες στη σύνθεση του µουσικού έργου. Σε τεχνικό επίπεδο,
πρόκειται για το συνεχή έλεγχο ή στάθµιση των ηχητικών σηµάτων µέσω πολλαπλασιαστών. Το πόσο ισχυρή
ή ασθενής θα είναι η ένταση ενός ήχου στο track ενός DAW σε κάθε στιγµή της συνολικής του διάρκειας,
ρυθµίζεται από ένα συντελεστή ο οποίος το πολλαπλασιάζει (στην πραγµατικότητα το διαιρεί εφόσον το
πλάτος (amplitude) του ηχητικού σήµατος στο ψηφιακό περιβάλλον είναι 0.0-1.0). Τυπικά, σε µια µίξη δε θα
πρέπει να ξεπερνούµε το µέγιστο επιτρεπόµενο όριο των 0 dB καθώς η περαιτέρω ενίσχυση του σήµατος
προκαλεί παραµόρφωσή του. Η µίξη όµως αποτελεί µια τέχνη και, όπως σε κάθε τέχνη, κάθε τυπικός κανόνας
έχει τις εξαιρέσεις του. Αν κρίνουµε ότι η ενίσχυση ενός ασθενούς σήµατος µπορεί να ξεπεράσει το όριο των
0 dB, χωρίς να προκληθεί παραµόρφωση, αντιληπτή τουλάχιστον από το αυτί µας, µπορούµε να την
επιχειρήσουµε. Άλλωστε, κάθε τελική απόφαση σε αυτήν τη διαδικασία έχει ως τελικό κριτή το αυτί µας και
την αισθητική µας προτίµηση.

5.6.1. Περιβάλλουσα ADSR. Αυτοµατισµοί Περιβάλλουσας, Έντασης και Πανοραµικού.

Η περιβάλλουσα εξετάστηκε ήδη στο Κεφάλαιο 2. Πριν εξετάσουµε όµως τις µεθόδους αυτοµατισµού σε ένα
DAW, ας ξαναθυµηθούµε ορισµένα χαρακτηριστικά της. Η έννοια της περιβάλλουσας (envelope) παραπέµπει
στον εξωτερικό σχηµατισµό ενός αντικειµένου ή/και στη µέγιστη διαµόρφωση ενός συνόλου τιµών. Για
παράδειγµα, το γράφηµα του δείκτη των τιµών του χρηµατιστήριου, αποτελεί µια περιβάλλουσα η οποία
αποτυπώνει τη συνεχή κίνηση των τιµών. Η περιβάλλουσα ενός ήχου αναφέρεται πρώτιστα στην εξέλιξη της
έντασής του στο χρόνο. Θα µπορούσε παρόλα αυτά να περιγράψει κάθε άλλη παράµετρο του ήχου και τη
σχηµατοποίηση ή εξέλιξή της στο χρόνο. Η περιβάλλουσα είναι µια αφηρηµένη έννοια και δηλώνει το φυσικό
περιοριστικό όριο κάποιου πράγµατος. Οι κορυφογραµµές που απλώνονται στον ορίζοντα είναι η
περιβάλλουσα και το περιοριστικό όριο του όγκου των βουνών ενώ οι κυµατισµοί της θάλασσας οριοθετούν ή
περιβάλλουν τον όγκο των νερών. Στατική ή συνεχώς µεταλλασσόµενη, η περιβάλλουσα διαµορφώνει και
την αντίληψή µας για τα όρια του κόσµου που µας περιβάλλει.
Κάθε ήχος διαµορφώνει την έντασή του ανάλογα µε το πλάτος της κυµατοµορφής του. Η έντασή του
σε κάθε στιγµή της διάρκειάς του ελέγχεται από τη χρονικά µεταβαλλόµενη κίνηση του ποτενσιόµετρου στο
track στο οποίο βρίσκεται ο ήχος. Στην ουσία, πρόκειται για µια δυναµική και συνεχή διαµόρφωση του
πλάτους (amplitude modulation) του ηχητικού σήµατος η οποία µεταφράζεται σε συνεχή αλλαγή της
προσλαµβάνουσας έντασης. Τα βασικά µοντέλα για αυτήν τη διαµόρφωση παρέχονται από τις περιβάλλουσες
ASR (Attack-Sustain-Release envelope) και ADSR (Attack-Decay-Sustain-Release envelope), µοντέλα τα
οποία χρησιµοποιούνται συχνά και στη διαµόρφωση της έντασης των συνθετητών (Σχήµα 5.3). Πρόκειται για
δύο µοντέλα τα οποία περιγράφουν µε συµβατικό τρόπο τα βασικά στάδια εξέλιξης της έντασης ενός ήχου.

158
Σχήµα 5.3. Μοντέλο περιβάλλουσας ADSR.

Οι δύο παράµετροι της περιβάλλουσας έντασης ενός ηχητικού σήµατος είναι α) η τιµή πλάτους που έχει σε
κάθε σηµείο του το σήµα και β) ο χρόνος µετάβασης σε αυτήν (transition time). Ο πιο εύχρηστος τρόπος για
να δηµιουργήσουµε και να αναπαραστήσουµε µια περιβάλλουσα είναι να χρησιµοποιήσουµε ζεύγη τιµών
(breakpoints) τα οποία ορίζουν τις τιµές πλάτους και των χρόνων µετάβασης σε αυτά. Στο Σχήµα 5.4 η
περιβάλλουσα Α είναι ένα τυπικό δείγµα µοντέλου ADSR. Η περιβάλλουσα Β είναι περισσότερο σύνθετη. Η
συνολική διάρκεια της κάθε µιας είναι ένα δευτερόλεπτο (setdomain 1000 ms) ενώ το πλάτος κυµαίνεται
µεταξύ 0.0 και 1.0. Διακρίνονται τα σηµεία τιµών πλάτους ως κουκίδες. Οι ενδιάµεσοι χρόνοι µετάβασης
αναπαρίστανται ως γραµµές.

Σχήµα 5.4. Περιβάλλουσες στο πρόγραµµα Max.

Στο Σχήµα 5.5 η περιβάλλουσα ορίζεται µε µια λίστα η οποία περιέχει τα ζεύγη τιµών για τα σηµεία πλάτους
και τους χρόνους µετάβασης σε αυτά. Ξεκινώντας από το αρχικό σηµείο ισορροπίας πλάτους 0, η
περιβάλλουσα ανεβαίνει στη µέγιστη τιµή πλάτους 1. σε χρόνο 300 χιλιοστά του δευτερολέπτου. Στη
συνέχεια, µεταβαίνει στις τιµές πλάτους 0.5 σε 1 δευτερόλεπτο, 1. σε 2 δευτερόλεπτα και επανέρχεται στο 0.
σε ένα δευτερόλεπτο.

159
Σχήµα 5.5 Διαµόρφωση περιβάλλουσας στο πρόγραµµα Max.

Στο Σχήµα 5.6 δίνονται τα γραφήµατα (plots) δύο περιβαλλουσών οι οποίες σχηµατίζονται από τις παρακάτω
δύο γραµµές κώδικα στο πρόγραµµα SuperCollider. Η γεννήτρια Env στο συγκεκριµένο παράδειγµα,
χρησιµοποιεί δύο διατάξεις τιµών (πίνακες, arrays) για να αποδώσει την περιβάλλουσα. Η πρώτη διάταξη
περιέχει πέντε τιµές πλάτους και η δεύτερη περιέχει τέσσερις χρόνους µετάβασης. Η πρώτη γεννήτρια
αποδίδει την περιβάλλουσα γραµµικά (linear) ενώ η δεύτερη εκθετικά (exponential). Στην εκθετική απόδοση,
η αρχική τιµή πλάτους δεν πρέπει να είναι µηδενική.

Env.new([0, 1.0, 0.2, 0.5, 0], [1, 2, 0.5, 5],'linear').test.plot;


Env.new([0.0001, 1.0, 0.2, 0.5, 0.0001], [1, 2, 0.5, 5],'exponential').test.plot;

Σχήµα 5.6. Η ίδια περιβάλλουσα αποδιδόµενη γραµµικά και εκθετικά σε περιβάλλον SuperCollider.

Το ίδιο µοντέλο περιβάλλουσας, µε διαφορετική διάρκεια, µπορεί να εφαρµοστεί σε ένα ηχητικό δείγµα
αρκετών δευτερολέπτων αλλά και στη σύνθεση ήχου ελέγχοντας διαφορετικές παραµέτρους. Για παράδειγµα,
στη κοκκιώδη ή µικροδοµική σύνθεση (granular synthesis) εφαρµόζεται σε κάθε ηχητικό κόκκο µια
περιβάλλουσα µε fade in και fade out.
Κατά τη διάρκεια της µίξης σε περιβάλλον DAW, οι περιβάλλουσες των εντάσεων (volume) µπορούν
να αυτοµατοποιηθούν και να αποθηκευτούν ως ξεχωριστά αρχεία δεδοµένων της µίξης. Αυτοί οι
αυτοµατισµοί χρησιµοποιούνται για δύο βασικούς σκοπούς: α) την απλή ρύθµιση της συνολικής έντασης του
ήχου και β) τον ανασχεδιασµό και την τροποποίηση της αρχικής περιβάλλουσας έντασης του ήχου. Στη
δεύτερη περίπτωση, οι περιβάλλουσες ακολουθούν συνήθως την εξέλιξη της κυµατοµορφής και η
διαµόρφωσή τους εξαρτάται σε µεγάλο βαθµό από το είδος της συνήχησης µε τους υπόλοιπους ήχους της
µίξης που θέλουµε να πετύχουµε. Δεν υπάρχουν απαράβατοι κανόνες για το πώς θα πρέπει να διαµορφωθεί
το σχήµα της περιβάλλουσας. Ο έλεγχος της έντασης (ακόµη και οι ανεπαίσθητες µεταβολές της στις
µικρότερες χρονικές διάρκειες), αποδεικνύεται καθοριστικής σηµασίας για το συνολικό φασµατικό ηχόχρωµα
που θα προκύψει από τη µίξη. Άλλωστε, οι µεγάλοι ενορχηστρωτές στην ιστορία της µουσικής έχουν δείξει

160
ότι όλες οι φασµατικές αποχρώσεις είναι δυνατό να επιτευχθούν µε σχολαστικό έλεγχο των επιµέρους
ηχητικών εντάσεων µιας ορχήστρας. Παρότι οι εντάσεις των ηχητικών αρχείων στη µίξη αποτελούν µια µόνο
παράµετρο του συνολικού ηχοχρώµατος, είναι εξαιρετικά σηµαντική και πρέπει να της δοθεί η µέγιστη
προσοχή. Κριτήριο και οδηγός της προσοχής είναι το αυτί και η αισθητική µας προσέγγιση. Στην Εικόνα 5.10
δίνεται µια περιβάλλουσα έντασης η οποία ακολουθεί, ως γενικό κανόνα, την αντίθετη πορεία από αυτήν των
κορυφών και των κοιλάδων της κυµατοµορφής. Στην αρχή και στο τέλος της κυµατοµορφής φαίνονται οι
καµπύλες (γραµµικές) των fade in και fade out.

Εικόνα 5.10 Αυτοµατισµός περιβάλλουσας έντασης.

Η περιβάλλουσα του πανοραµικού (pan) µας παρέχει δύο δυνατότητες:

• Να τοποθετήσουµε χωρικά τους ήχους της µίξης στο στερεοφωνικό πεδίο δηµιουργώντας
έτσι τη στερεοφωνική εικόνα της µίξης.
• Να κινήσουµε έναν ή περισσότερους ήχους προσδίδοντας χειρονοµιακή δραστηριότητα στη
µίξη.

Οι αυτοµατισµοί περιβάλλουσας µπορούν να δηµιουργηθούν µε δύο τρόπους:

• Χρησιµοποιώντας το ποντίκι και το εργαλείο µολυβιού που παρέχει το DAW για να τις
σχεδιάσουµε.
• Χρησιµοποιώντας εξωτερικούς ψηφιακούς ελεγκτές (controllers), ποτενσιόµετρα ή
οποιοδήποτε εργαλείο ή όργανο µπορεί να επικοινωνήσει µέσω του πρωτοκόλλου MIDI µε
το DAW. Ο σχηµατισµός της περιβάλλουσας µέσω της κίνησης του ψηφιακού
ποτενσιόµετρου καταγράφεται σε ένα αρχείο δεδοµένων µέσω της µεθόδου write στο track
της κυµατοµορφής. Μπορούµε να κάνουµε διορθωτικές κινήσεις ανασχηµατίζοντας την
εξέλιξη της περιβάλλουσας µέσω των µεθόδων touch και latch (Εικόνα 5.11). Με τις
µεθόδους touch και latch µπορούµε να επέµβουµε σε συγκεκριµένα και επιλεγµένα σηµεία
της περιβάλλουσας τροποποιώντας την. Πρόκειται για µεθόδους προσθήκης (overdubbing). Η
µέθοδος touch ανασχηµατίζει την περιβάλλουσα για όσο χρόνο κινούµε το ποτενσιόµετρο
ενώ µόλις το αφήσουµε αυτή επανέρχεται στην προηγούµενη κατάστασή της από εκείνο το
σηµείο και µετά. Με τη µέθοδο latch η περιβάλλουσα κλειδώνει και παραµένει στο τελευταίο
σηµείο στο οποίο αφήσαµε το ποτενσιόµετρο.

161
Εικόνα 5.11 Οι µέθοδοι write, touch και latch για τον αυτοµατισµό της περιβάλλουσας όπως φαίνονται στο DAW Logic
Pro X.

Οι δυνατότητες αυτοµατισµού των εντάσεων και των πανοραµικών αποτελούν εκφραστικά µέσα για µια
διαυγή και ολοκληρωµένη µίξη.
Είναι σηµαντικό να σηµειωθεί ότι οι αυτοµατισµοί των περιβαλλουσών έντασης και πανοραµικού θα
πρέπει να δουλεύονται ταυτόχρονα και όχι η µια µετά την άλλη. Οποιαδήποτε αλλαγή στο πανοραµικό σε ένα
σηµείο του ηχητικού αρχείου θα επηρεάσει την αντίληψη της έντασης εκείνου του σηµείου. Συνεπώς, η
εργασία στην περιβάλλουσα του πανοραµικού θα πρέπει να γίνεται σε συνάρτηση µε την εργασία στην
περιβάλλουσα της έντασης και αντίστροφα.

Εικόνα 5.12 Αυτοµατισµός περιβάλλουσας πανοραµικού. Με αχνή γραµµή φαίνεται η περιβάλλουσα της έντασης.

5.6.2. Διασταυρούµενη Κίνηση (Crossfade).

Στην αρχή και στο τέλος της κυµατοµορφής ενός ήχου εφαρµόζουµε fades για την οµαλή έναρξη και
απόσβεσή του. Η ευκολία που µας παρέχει το ψηφιακό περιβάλλον ενός DAW στην επεξεργασία ήχου µας
οδηγεί πολλές φορές σε λανθασµένες επιλογές. Συχνά, χρησιµοποιώντας τη µέθοδο trimming ή το εργαλείο
ψαλιδιού για να αλλάξουµε τη διάρκεια ενός ηχητικού αρχείου ή να αποκόψουµε τµήµα του, προκαλούµε µια
ασυνέχεια στο πλάτος του σήµατος. Αποκόπτουµε δηλαδή το αρχείο σε σηµείο στο οποίο επέρχεται απότοµη
µεταβολή της τιµής πλάτους. Το αποτέλεσµα αυτής της απότοµης µεταβολής είναι συνήθως ένα ανεπιθύµητο
«κλικ» (artifact). Παρότι κάποιες φορές αυτά τα artifacts ενδέχεται να είναι αισθητικά επιθυµητά, όπως στη
µουσική glitch, αν θελήσουµε να τα αποφύγουµε δηµιουργούµε πολύ σύντοµα σε χρονική διάρκεια fades
(λίγα χιλιοστά του δευτερολέπτου) στην αρχή και στο τέλος του τµήµατος που έχουµε αποκόψει. Ένα DAW

162
προσφέρει διάφορους τύπους και καµπύλες fades. Στο Σχήµα 5.7 δίνονται τέσσερις τύπου καµπυλών fade in.
Οι αντίστοιχες καµπύλες fade out ακολουθούν την αντίθετη πορεία. Η στήλη Α περιέχει τις καµπύλες
µεταβολής στην ένταση (gain σε dB) και η στήλη Β περιγράφει τον τρόπο µε τον οποίο αυτή η µεταβολή
γίνεται αντιληπτή. Η γραµµική καµπύλη δηλώνει ίσο ποσοστό µεταβολής της έντασης σε όλη τη διάρκεια του
fade. Η λογαριθµική καµπύλη, η οποία χρησιµοποιείται συχνά τόσο για το fade in όσο και για το fade out,
προκαλεί έναν γραµµικό τρόπο αντίληψης της µεταβολής της έντασης. Η εκθετική καµπύλη προκαλεί αρχικά
µια αργή µεταβολή της έντασης η οποία αυξάνεται απότοµα προς το τέλος της διάρκειας του fade in. Με
αυτόν τον τρόπο δίνεται η αίσθηση ότι ο ήχος εµφανίζεται απότοµα στο ακουστικό µας πεδίο. Αντίθετα, η
λογαριθµική καµπύλη σε ένα fade out, προκαλεί µια σχετικά απότοµη απόσβεση του ήχου. Η καµπύλη S
συνδυάζει στοιχεία των προηγούµενων τριών καµπυλών και δηµιουργεί την αίσθηση απότοµων και µη
κανονικών µεταβολών της έντασης.

Σχήµα 5.7 Βασικές καµπύλες fade in.

163
Όταν ενώσουµε δύο τµήµατα τα οποία προέκυψαν από trimming, εφαρµόζουµε την τεχνική του crossfade για
να πετύχουµε συµβατές τιµές πλάτους στο σηµείο της ένωσής τους και, συνεπώς, οµαλή και συνεχή
µετάβαση από το ένα στο άλλο. Στην Εικόνα 5.13 φαίνεται το παράθυρο επικάλυψης στο οποίο ενώνονται
οµαλά τα δύο κυµατοµορφές µε καµπύλες λογαριθµικού τύπου.

Εικόνα 5.13 Εφαρµογή crossfade µεταξύ µιας µελωδίας σαξοφώνου (αριστερά) και ενός ήχου από περιστροφή σβούρας
(δεξιά).

5.7. Μονάδες Επεξεργασίες Ήχου.

5.7.1. Ψηφιακή Επεξεργασία Σήµατος (Digital Signal Processing-DSP).

Όλες οι εργασίες οι οποίες συντελούνται µε τη χρήση ηλεκτρονικών υπολογιστών απαιτούν την ανάπτυξη
µεθόδων για την επεξεργασία ψηφιακών σηµάτων. Η Ψηφιακή Επεξεργασία Σήµατος (Digital Signal
Processing-DSP) είναι η διαδικασία κατά την οποία ένα οποιοδήποτε αναλογικό σήµα (ήχος, εικόνα,
θερµοκρασία, υγρασία, σεισµική ακολουθία κ.ά.), αφού έχει πρώτα µετατραπεί σε ψηφιακά δεδοµένα,
υπόκειται σε κάθε είδους επεξεργασία, διόρθωση και βελτίωση. Το DSP χρησιµοποιεί τη µέθοδο της
δειγµατοληψίας για να συµπιέσει το συνεχές αναλογικό σήµα και έναν µετατροπέα αναλογικού σήµατος σε
ψηφιακό (ADC) για να το µετατρέψει σε ψηφιακές τιµές. Μετά την επεξεργασία στην ψηφιακή του µορφή, το
σήµα µετατρέπεται και πάλι σε αναλογικό µέσω του µετατροπέα ψηφιακού σήµατος σε αναλογικό (DAC).
Την επεξεργασία αναλαµβάνει ο Επεξεργαστής Ψηφιακού Σήµατος (Digital Signal Processor). Οι
λειτουργικές µονάδες οι οποίες απαρτίζουν ένα DSP βρίσκονται ενσωµατωµένες σε ολοκληρωµένα
κυκλώµατα (chips) για τη σύνθεση και επεξεργασία ήχου. Οι οδηγίες οι οποίες βρίσκονται στη µνήµη του και
µε τις οποίες έχει ρυθµιστεί καθορίζουν τη λειτουργία του. Το DSP επαναλαµβάνει αυτές τις οδηγίες µέχρι να
λάβει εντολή από το πρόγραµµα ελέγχου να σταµατήσει. Ένα σύστηµα DSP αποτελείται από:

• Input/output: είσοδος και έξοδος του σήµατος.


• Data memory: περιέχει τα δεδοµένα που αναπαριστούν το αρχικό αναλογικό σήµα και τα
οποία θα υποστούν επεξεργασία.
• Program memory: περιέχει τα προγράµµατα µε τα οποία θα γίνει η επεξεργασία των
δεδοµένων.
• Compute engine: εκτελεί τις µαθηµατικές διεργασίες χρησιµοποιώντας τα προγράµµατα από
το program memory και τα δεδοµένα από το data memory.

Το γεγονός ότι το DSP επεξεργάζεται σειρές τιµών από τις οποίες αποτελείται το ψηφιακό σήµα το καθιστά
εύχρηστο και σταθερό. Κάποιες από τις επεξεργασίες που µπορούµε να εφαρµόσουµε στο ηχητικό σήµα
περιλαµβάνουν την εξαγωγή ή αποκοπή πληροφοριών (αποκοπή θορύβου ή επιλεγµένων συχνοτικών
περιοχών) και την ανασύνθεση ηχητικών σηµάτων.
Στο διάγραµµα του Σχήµατος 5.8 φαίνεται ο τρόπος λειτουργίας του DSP. Αρχικά, το αναλογικό
σήµα περνάει από ένα χαµηλοπερατό φίλτρο (Low Pass Filter). Αυτό συµβαίνει γιατί πριν από τη
δειγµατοληψία και την ψηφιοποίησή του, το αναλογικό σήµα πρέπει να φιλτράρεται κατάλληλα προκειµένου
να αποφευχθούν σφάλµατα ψηφιακής παραµόρφωσης (aliasing). Η παραµόρφωση ή παραποίηση προκύπτει
όταν από την είσοδο του φίλτρου περάσουν αρµονικές του αναλογικού σήµατος οι οποίες υπερβαίνουν τη

164
συχνότητα Nyquist (το µισό της συχνότητας δειγµατοληψίας). Το χαµηλοπερατό φίλτρο αποκόπτει αυτές τις
συχνότητες και για αυτόν το λόγο ονοµάζεται φίλτρο εξοµάλυνσης (antialiasing filter). Στη συνέχεια, το
φιλτραρισµένο αναλογικό σήµα εισέρχεται στο µετατροπέα αναλογικού σε ψηφιακό και, ως ψηφιοποιηµένο
σήµα, στο DSP. Αφού υποστεί επεξεργασία, η οποία συντελείται κατά κύριο λόγο µε µαθηµατικές πράξεις
πρόσθεσης και πολλαπλασιασµού, το ψηφιοποιηµένο σήµα µετατρέπεται από το DAC σε αναλογικό σήµα.
Τέλος, το σήµα περνά εκ νέου από ένα χαµηλοπερατό φίλτρο που αποµακρύνει τις συχνότητες που
υπερβαίνουν τη συχνότητα Nyquist και το οποίο ονοµάζεται φίλτρο αναδόµησης (reconstruction filter).

Σχήµα 5.8 Σύστηµα DSP.

5.7.2. Επεξεργασίες Δυναµικού Εύρους (Dynamics Processing).

Πρόκειται για τεχνικές επεξεργασίας και διαµόρφωσης του πλάτους (amplitude) ενός ηχητικού σήµατος. Αν
και απευθύνονται κυρίως στον έλεγχο της έντασης (volume) των ήχων µέσα στο DAW, καθορίζουν σε
µεγάλο βαθµό την ποιότητα και την πιστότητα της µίξης. Η αυξοµείωση της έντασης, όταν παράγεται ένας
ήχος, δεν ορίζει µόνο το πόσο δυνατά ή ανεπαίσθητα ακούγεται αλλά και τη συνολική κατανοµή του
φάσµατός του, τη διάχυση δηλαδή της ενέργειας των αρµονικών του µέσα στο φασµατικό του πεδίο. Για
παράδειγµα, όσο δυνατότερα χτυπήσουµε τη µεµβράνη ενός κρουστού οργάνου ή όσο περισσότερο
αυξήσουµε την πίεση του δοξαριού σε µια χορδή, τόσο περισσότερο θα αυξήσουµε και τον αριθµό των
αρµονικών και µη αρµονικών συχνοτήτων της νότας που παράγουµε. Η ενέργεια της φυσικής µας
χειρονοµίας µετατρέπεται σε ακουστική ενέργεια. Κατά συνέπεια, ο έλεγχος της έντασης συµβάλλει και στον
έλεγχο του ηχοχρώµατος.
Η διάχυση αυτής της ενέργειας συµβαίνει µέσα στα όρια του δυναµικού εύρους (dynamic range), το
οποίο είναι η περιοχή µεταξύ της ελάχιστης και της µέγιστης στάθµης ενός ηχητικού σήµατος. Οποιαδήποτε
πράξη ή κατάσταση µπορεί να αποδοθεί µέσα σε ένα δυναµικό εύρος. Για παράδειγµα, το πέταγµα µιας
πεταλούδας συµβαίνει µέσα στο δυναµικό εύρος του ανοίγµατος των φτερών της και η κίνηση των δεικτών
του χρηµατιστήριου κυµαίνεται µέσα στα όρια του δυναµικού εύρους που ορίζεται από µια ελάχιστη και µια
µέγιστη τιµή. Είναι προφανές ότι το δυναµικό εύρος µιας συµφωνίας του Beethoven µε συχνές εναλλαγές
µεταξύ piano και forte είναι πολύ µεγαλύτερο από το δυναµικό εύρος µιας χορευτικής µουσικής η οποία
πρέπει να ακούγεται συνεχώς στην ίδια ένταση. Το δυναµικό εύρος µπορεί να µετατοπίζεται και να αλλάζει
τα όριά του. Το εύρος της ανθρώπινης ακοής συνήθως συρρικνώνεται µε το πέρασµα του χρόνου.
Κατά τη διαδικασία της µίξης αναζητούµε το βέλτιστο σηµείο έντασης του κάθε ήχου ξεχωριστά
µέσα στο δυναµικό του εύρος. Ταυτόχρονα, φροντίζουµε ώστε το συνολικό δυναµικό εύρος της µίξης να είναι
ισορροπηµένο και να απαντά στις εκφραστικές µας αναζητήσεις.
Η έννοια της έντασης εκφράζει την αντίληψή µας για το πλάτος της κυµατοµορφής ενός ηχητικού
σήµατος το οποίο µετριέται σε decibel (dB). Όπως η αντίληψη της συχνότητας (frequency) εκφράζεται µε την
έννοια του τονικού ύψους (νότα), έτσι και η αντίληψη του πλάτους αποτυπώνεται στη µουσική όχι µε τη
λογαριθµική κλίµακα των dB αλλά µε συµβατικούς κώδικες (pppp-ffff, crescento κ.λπ.). Όταν δονείται µια
ηχητική πηγή παράγεται ένα ηχητικό κύµα το οποίο διαταράσσει την ισορροπία της ατµοσφαιρικής πίεσης.
Το αυτί µας λαµβάνει και διερµηνεύει αυτές τις διαταραχές µέσω της δόνησης της τυµπανικής µεµβράνης του
έξω ακουστικού πόρου. Η αντίληψη του ήχου µέσω του αυτιού ξεκινά από την πρόσληψη των περιοδικών
δονήσεων της ακουστικής πίεσης. Φυσικά, η µέτρηση των dB που παράγονται από µια ηχητική πηγή δεν
αρκεί από µόνη της για να σχηµατίσουµε ολοκληρωµένη αντίληψη για την ένταση ενός ήχου. Σηµαντικός
παράγοντας είναι και η απόσταση του παρατηρητή ή καταγραφέα (αυτί ή µικρόφωνο) από την ηχητική πηγή.
Για την ολιστική αντίληψη ενός δυνατού ήχου ο οποίος µας πλησιάζει από µακρυά, είναι απαραίτητο να
λάβουµε υπόψη µας και την απόσταση που µας χωρίζει από την πηγή του. Το ζήτηµα έθεσε γλαφυρά ο

165
Leonardo da Vinci αναρωτώµενος ποιος είναι περισσότερο σηµαντικός ήχος: ένας δυνατός ήχος που µας
πλησιάζει από πολύ µακρυά, ή ένας ανεπαίσθητος ήχος που ακούγεται ακριβώς µπροστά µας; Πρόκειται για
ένα απόλυτα υποκειµενικό δίληµµα. Ένα ακόµη κριτήριο της υποκειµενικότητας στην αντίληψη της έντασης
είναι και η διάρκεια µε την οποία την αντιλαµβανόµαστε. Φανταστείτε για παράδειγµα, το µόνιµα παρόν και
δυνατό βουητό της πόλης. Μετά από αρκετή ώρα ακρόασης, το βουητό χάνει τη σηµασία του παρότι δεν
αυξοµειώνονται ιδιαίτερα τα dB του. Αν ξαφνικά περάσει µια µύγα µπροστά από το πρόσωπό µας, ο ήχος της
θα τραβήξει άµεσα την προσοχή µας, αν και τα dB που παράγει είναι λιγότερα από αυτά του βουητού της
πόλης. Διατάραξη της ατµοσφαιρικής πίεσης, ένταση, απόσταση από την πηγή, διάρκεια της πρόσληψης του
ήχου και πολλοί άλλοι παράµετροι και κριτήρια συµβάλλουν στην ολιστική αντίληψη της δυναµικής ενός
ήχου.
Η µέτρηση του πλάτους κύµατος ενός ήχου ο οποίος µεταδίδεται µέσω του αέρα εκφράζεται σε dB
SPL (dB Sound Pressure Level). Στη λογαριθµική κλίµακα µέτρησης dB SPL, η οριακή τιµή της στάθµης της
ηχητικής πίεσης, ή το κατώτερο όριο (κατώφλι) ακουστότητας ορίζεται ως 0 dB SPL ενώ το ανώτερο µπορεί
να φτάσει τα 194 dB SPL. Το δυναµικό εύρος της ακουστότητας εξαρτάται επίσης από το δυναµικό εύρος
των συχνοτικών περιοχών τις οποίες µπορεί το αυτί να αντιληφθεί. Παρότι οι υπόηχοι κάτω των 20 Hz και οι
υπέρηχοι άνω των 20.000 Hz δεν προσλαµβάνονται ως ακουστικά φαινόµενα, οι διαταράξεις που προκαλούν
στην ατµοσφαιρική πίεση γίνονται αισθητές από το ανθρώπινο σώµα.
Στον Πίνακα 5.2 παρουσιάζονται κάποιες ηχητικές πηγές και η καταγραφή τους σε dB SPL από
κοντινή απόσταση.

Ηχητικές πηγές dB SPL


Μηχανή αεροσκάφους 140
Κατώφλι πόνου 120-130
Club χορού 100
Συζήτηση. Πάρκο σε αστικό τοπίο 60
Κατοικία σε ήρεµη περιοχή και κατάσταση 50
Ήσυχο δωµάτιο 30
Πρόσκρουση φτερού σε έδαφος 0.5-1
Κατώφλι ακουστότητας (ισορροπία ατµοσφαιρικής πίεσης) 0

Πίνακας 5.2 Ηχητικές πηγές και καταγραφή σε dB SPL.

Κάθε φορά που ηχογραφούµε έναν ήχο, ηχογραφούµε, ανάµεσα σε άλλα, και το χώρο στον οποίο αυτός
παράγεται, τις ακουστικές του ιδιότητες και ποιότητες. Ηχογραφούµε, κατά συνέπεια, και τον όποιο θόρυβο
παράγεται σε αυτόν τον χώρο ή αποτελεί ποιοτικό χαρακτηριστικό της ακουστικής του. Ο λόγος σήµατος προς
θόρυβο (signal-to-noise ratio) είναι µια πρόκληση που οφείλουµε να αντιµετωπίσουµε, ιδιαίτερα όταν
ηχογραφούµε έναν ήχο χαµηλής στάθµης, κοντά στο κατώφλι ακουστότητας. Ο θόρυβος που παράγεται σε
έναν χώρο ανήκει σε δύο κατηγορίες:

1. Θόρυβοι του περιβάλλοντος (ανθρώπινες παρεµβάσεις, αέρας, τριβή ρούχων, ενδογενής


θόρυβος µηχανών όπως κλιµατιστικά, οικιακές συσκευές κ.ά.). Στην πραγµατικότητα δεν
υπάρχει απόλυτα ήσυχο περιβάλλον: ακόµη και αν φορέσουµε ωτοασπίδες για να
αποµονωθούµε από τους εξωτερικούς θορύβους, θα ακούσουµε τους εσωτερικούς
θορύβους του σώµατος µας.
2. Ηλεκτρικοί θόρυβοι (εξοπλισµός στούντιο, µικρόφωνα, καλώδια κ.ά.). Το
εναλλασσόµενο ρεύµα (AC) προκαλεί για παράδειγµα έναν µόνιµο θόρυβο (hum) στα
50-60 Hz. Ακόµη και ένα µικρόφωνο και η προενίσχυσή του παράγει θόρυβο τον οποίο
θα πρέπει να αποµονώσουµε κατά την ηχογράφηση (σχετικές αναφορές στο
υποκεφάλαιο για τα µικρόφωνα).

Στο άλλο άκρο του δυναµικού εύρους βρίσκεται η παραµόρφωση (distortion) του ηχητικού σήµατος, η οποία
µπορεί να παραχθεί από απρόσεκτη χρήση κάποιου τµήµατος του εξοπλισµού µας. Η παραµόρφωση
προκαλεί ηχοχρωµατικές αλλαγές καθώς προσθέτει συχνότητες αλλάζοντας την κυµατοµορφή του σήµατος.

166
Η πολύ κοντινή απόσταση από το µικρόφωνο, όταν ηχογραφούµε φωνή, µπορεί να προκαλέσει
παραµόρφωση pop noise ή popping εξαιτίας της πολύ γρήγορης ταχύτητας µε την οποία ο αέρας της
στοµατικής κοιλότητας χτυπά τη µεµβράνη του µικροφώνου.
Επίσης, όταν η ενίσχυση ενός σήµατος υπερβαίνει τα όρια της διαθέσιµης δυναµικής (υπερβαίνει
δηλαδή τον αριθµό των bits που διατίθενται για την ενίσχυσή του), προκαλείται το φαινόµενο της περικοπής
ή ψαλιδισµού (clipping) (Εικόνα 2.2). Ο ψαλιδισµός προκαλεί µετατροπή της κυµατοµορφής. Για παράδειγµα,
µια ηµιτονοειδής κυµατοµορφή µετατρέπεται σε τετράγωνη καθώς το πλάτος της σταµατά να ανεβαίνει όταν
συναντά το όριο της δυναµικής του (Εικόνα 5.14).

Εικόνα 5.14 Παραµόρφωση clipping (πηγή: https://commons.wikimedia.org/wiki/File:Clipping.svg).

Οι επεξεργασίες δυναµικού εύρος χρησιµοποιούνται σε πληθώρα εφαρµογών µεταξύ των οποίων, η αποκοπή
του θορύβου από ένα ηχητικό σήµα, η αλλαγή της δυναµικής του και η ανάπλαση της περιβάλλουσάς του.

5.7.2.1. Συµπιεστής (Compressor).

Ένας συµπιεστής (compressor) είναι στην ουσία ένας ενισχυτής του οποίου η ενίσχυση (gain) ελέγχεται από
το σήµα που δέχεται στην είσοδό του (Εικόνα 5.15).

Εικόνα 5.15 Plug in συµπίεσης στο πρόγραµµα DAW Logic Pro.

Η βασικότερη χρήση του (αν και όχι η πιο ενδιαφέρουσα) είναι να συµπιέσει το δυναµικό εύρος του ηχητικού
σήµατος, ενισχύοντας την ένταση στα σηµεία µε χαµηλή στάθµη (upward compression) και µειώνοντάς τη σε
εκείνα µε υψηλή στάθµη (downward compression). Έτσι, για κάθε τιµή στάθµης της εισόδου (x) αντιστοιχεί
µια δεύτερη τιµή εξόδου (y). Αυτή η διαδικασία περιγράφεται στις συναρτήσεις µεταφοράς (transfer

167
functions) του Σχήµατος 5.9. Ως αποτέλεσµα, επιτυγχάνεται, στις περισσότερες περιπτώσεις, ένα σταθερό
εύρος στάθµης στην έξοδό του.

Σχήµα 5.9 Συναρτήσεις µεταφοράς µε διαφορετικούς λόγους συµπίεσης.

Η διαδικασία της συµπίεσης λαµβάνει χώρα σε δύο στάδια. Αρχικά, ο συµπιεστής αναλύει το εισερχόµενο
σήµα και την περιβάλλουσά του έτσι ώστε να υπολογίσει τη στάθµη του σήµατος για κάθε δεδοµένη στιγµή
της διάρκειάς του. Στη συνέχεια, λειτουργεί ως αυτόµατος ελεγκτής στάθµης, ανεβοκατεβάζοντας την ένταση
ανάλογα µε την εξέλιξη της περιβάλλουσας του εισερχόµενου σήµατος και τις ρυθµίσεις µε τις οποίες έχει
προγραµµατιστεί. Κάθε φορά που η περιβάλλουσα υπερβαίνει µια δοσµένη τιµή ή κατώφλι (threshold),
επεµβαίνει ο συµπιεστής. Η Εικόνα 5.10 (αυτοµατισµός περιβάλλουσας έντασης) περιγράφει αυτήν ακριβώς
τη διαδικασία µε τη χρήση του ποντικιού και του εργαλείου του µολυβιού σε περιβάλλον DAW. Όπου
παρατηρούνται κοιλάδες στην κυµατοµορφή η ένταση αυξάνεται ενώ όπου υπάρχουν κορυφές η ένταση
µειώνεται. Ας εξετάσουµε τις παραµέτρους του συµπιεστή (οι οποίες στην πλειοψηφία τους συναντώνται και
στους υπόλοιπους επεξεργαστές δυναµικού εύρους).
Κατώφλι (Threshold). Είναι το σηµείο από το οποίο ξεκινάει η εφαρµογή του συµπιεστή. Κάθε φορά
που το πλάτος του εισερχόµενου σήµατος υπερβαίνει το κατώφλι, ένας ενισχυτής µειώνει τη στάθµη του. Όσο
µικρότερη είναι η τιµή του σε dB, τόσο µεγαλύτερο το τµήµα του σήµατος που θα επηρεαστεί από τον
συµπιεστή.
Λόγος (Ratio (input to output)). Ελέγχει την ποσότητα µείωσης του πλάτους του σήµατος (gain
reduction), µόλις αυτό υπερβεί το κατώφλι. Αν για παράδειγµα η ρύθµιση του λόγου είναι 5:1 και το
εισερχόµενο σήµα υπερβεί κατά 5 dB το κατώφλι, τότε το εξερχόµενο σήµα µετά τη συµπίεση θα υπερβεί το
κατώφλι κατά µόνο κατά 1 dB. Αν το εισερχόµενο σήµα υπερβεί κατά 10 dB το κατώφλι, τότε το εξερχόµενο
σήµα µετά τη συµπίεση θα υπερβεί το κατώφλι κατά 2 dB. Ο λόγος 1:1 δηλώνει ότι η έξοδος y είναι ίση µε
την είσοδο x (y = x) και άρα, ο συµπιεστής είναι ανενεργός. Ο λόγος 2:1 σηµαίνει ότι, πάνω από το κατώφλι,
η τιµή στάθµης της εξόδου θα ισούται µε το µισό της τιµής στάθµης της εισόδου. Ο λόγος 10:1 δηλώνει
αντίστοιχα ότι η στάθµη εξόδου θα ισούται µε το 1/10 της στάθµης εισόδου. Όταν ο αριθµητής έχει µεγάλη
τιµή (> 10:1), η συµπίεση µετατρέπεται σε αναστολή (limiting). Αν η ρύθµιση του λόγου είναι ∞:1, η στάθµη
του σήµατος υπερβαίνει κατά µόνο 1 dB το κατώφλι.
Στην Εικόνα 5.16 δίνεται αριστερά µια κυµατοµορφή πριν τη συµπίεση και δεξιά, η ίδια
κυµατοµορφή µετά από συµπίεση µε λόγο 4:1. Διακρίνουµε ότι µετά τη συµπίεση οι αποστάσεις µεταξύ
κορυφών και κοιλάδων της κυµατοµορφής έχουν µειωθεί καθώς οι ψηλές στάθµες έχουν υποστεί συµπίεση.
Ως αποτέλεσµα, ο µέσος όρος της συνολικής έντασης είναι περισσότερο οµοιόµορφος.

168
Εικόνα 5.16 Κυµατοµορφή πριν και µετά από συµπίεση µε λόγο 4:1.

Χρόνος εκκίνησης (Attack time). Ορίζει, σε ms, την ταχύτητα µε την οποία αντιδρά ο συµπιεστής µόλις η
στάθµη του εισερχόµενου σήµατος πλησιάσει στο κατώφλι. Πρόκειται δηλαδή για τη χρονική περίοδο κατά
την οποία ο συµπιεστής µειώνει τη στάθµη του σήµατος (σε dB), ανάλογα µε την τιµή του ratio. Όσο
χαµηλότερη είναι η τιµή του (λίγα χιλιοστά του δευτερολέπτου) τόσο αµεσότερα θα αντιδράσει ο συµπιεστής.
Αυτό σηµαίνει ότι όταν έχουµε έναν ήχο µε ισχυρή και απότοµη ατάκα, ο συµπιεστής µε χαµηλό attack time
θα µειώσει την ένταση της ατάκας του ήχου άµεσα, µε αποτέλεσµα αυτή να απολέσει µέρος της ισχύος της.
Ειδικότερα, ο συµπιεστής µε πολύ χαµηλό attack time εφαρµόζεται σε ατάκες κρουστών για να ελαττώσει την
ένταση των transients, των πολύ απότοµων και µικρών σε διάρκεια µεταβολών που δηµιουργούνται στην
έναρξη της ατάκας από την επαφή της µπαγκέτας µε την επιφάνεια του κρουστού. Επίσης, χαµηλό attack time
χρησιµοποιείται για να ελαττώσει το φαινόµενο της συριστικότητας, των συριγµών δηλαδή που εµφανίζονται
στις ατάκες της φωνής µε τα συριστικά σύµφωνα (δες De-esser). Αντίθετα, αν το attack time είναι µεγάλο
(περίπου πάνω από 100 χιλιοστά του δευτερολέπτου), η εκκίνηση θα είναι αργή µε αποτέλεσµα να περάσουν
τα transients της ατάκας προτού επέµβει ο συµπιεστής. Μεγάλο attack time λοιπόν σηµαίνει έµφαση στην
ατάκα του ήχου.
Χρόνος απελευθέρωσης ή επαναφοράς (Release time). Ορίζει, σε ms, την ταχύτητα µε την οποία
απελευθερώνεται ο συµπιεστής µόλις η στάθµη του εισερχόµενου σήµατος επανέλθει κάτω από το κατώφλι.
Πρόκειται δηλαδή για τη χρονική περίοδο µετά την οποία ο συµπιεστής σταµατάει να επιδρά. Αν ορίσουµε
πολύ σύντοµο χρόνο απελευθέρωσης, τότε υπάρχει ο κίνδυνος η αλλαγή στη στάθµη να είναι απότοµη, µε
συνέπεια την εµφάνιση pumping. Ένας γενικός κανόνας, εάν ο συµπιεστής µας δεν παρέχει δυνατότητα
αυτόµατης ανίχνευσης, είναι ότι ορίζουµε µεγάλο χρόνο απελευθέρωσης σε ήχους µακράς διάρκειας όπως
δρόνους (drones), τενούτες κ.ά., έτσι ώστε η µετάβαση στην αρχική στάθµη εισόδου να γίνει µε ήπιο τρόπο.
Αντίθετα, σε κρουστούς ήχους, εφαρµόζουµε συνήθως µικρό χρόνο απελευθέρωσης. Οι χρόνοι εκκίνησης και
απελευθέρωσης συµβαίνουν στο µικροδοµικό επίπεδο των δυναµικών ενός ήχου.
Πρόβλεψη συµπίεσης (look ahead). Πρόκειται για µια καθυστέρηση λίγων χιλιοστών του
δευτερολέπτου στο εισερχόµενο σήµα. Η περιβάλλουσα του σήµατος προηγείται έτσι ώστε η εφαρµογή της
συµπίεσης να προηγηθεί πριν από την είσοδο του σήµατος. Αυτό συµβαίνει για να προλάβει ο συµπιεστής να
αποκόψει τα transients που βρίσκονται στην αρχή του σήµατος, ανεξάρτητα από τον χρόνο απελευθέρωσης
της συµπίεσης.
Γωνία µετάβασης (Soft-hard knee). Καθορίζει την καµπύλη απόκρισης στο σηµείο του κατωφλίου
(Σχήµα 5.10). Η ρύθµιση soft knee αυξάνει µε οµαλό τρόπο το λόγο συµπίεσης. Έτσι, για ψηλό λόγο
συµπίεσης, προτιµάται η ρύθµιση soft knee ώστε να µην προκαλείται µεγάλη αντίθεση µεταξύ του
συµπιεσµένου και του µη συµπιεσµένου σήµατος. Με τη ρύθµιση hard knee η µετάβαση από το µη
συµπιεσµένο στο συµπιεσµένο σήµα γίνεται άµεσα και απότοµα.

169
Σχήµα 5.10 Ρυθµίσεις soft knee και hard knee.

Ανίχνευση κορυφών-RMS (Peak sensing-RMS). Ένας συµπιεστής µε τη ρύθµιση Peak αντιδρά άµεσα στη
στάθµη του εισερχόµενου σήµατος κάθε φορά που ανιχνεύει µια κορυφή σε αυτό. Η ανίχνευση RMS (Root
Mean Square) χρησιµοποιεί το µέσο όρο στάθµης του σήµατος αφού µετρά το συνολικό πλάτος του. Η
µέτρηση αναφέρεται στον ορισµό της τετραγωνικής ρίζας του µέσου όρου των τετραγώνων ενός δείγµατος
(sample). Συνήθως εφαρµόζεται η ρύθµιση RMS, ενώ η ρύθµιση Peak χρησιµοποιείται κυρίως σε εφαρµογές
αναστολής (limiting), εξαιτίας της άµεσης και ισχυρής επίδρασής της στη µείωση των transients.
Σύνδεση (link). Αναφέρεται στην οµοιόµορφη εφαρµογή της συµπίεσης στα δύο κανάλια ενός
στερεοφωνικού ήχου ώστε να διατηρηθεί αναλλοίωτη η στερεοφωνική του εικόνα. Ο συµπιεστής υπολογίζει
και εφαρµόζει ξεχωριστά την απαιτούµενη µείωση στάθµης στα δύο κανάλια του στερεοφωνικού σήµατος. Σε
περίπτωση που υπάρχουν δύο συµπιεστές σε µια συσκευή ή plug in, επιλέγεται ο ένας (συνήθως ο αριστερός)
ως master, ο οποίος στη συνέχεια αποστέλλει τις ρυθµίσεις του στον δεύτερο. Έτσι, προκύπτει το ίδιο
ποσοστό συµπίεσης και για τα δύο κανάλια.
Μετρητής (VU meter ή LED meter). Με κίνηση από δεξιά προς τα αριστερά ο µετρητής δείχνει την
ποσότητα συµπίεσης σε dB.
Ενίσχυση εξόδου (Makeup gain ή output level). Είναι η τελική ενίσχυση του συµπιεσµένου σήµατος
πριν την έξοδό του. Καθώς η στάθµη του σήµατος έχει µειωθεί εξαιτίας της συµπίεσης, η ενίσχυση εξόδου
µας προσφέρει τη δυνατότητα να το επαναφέρουµε σε µια ικανοποιητική στάθµη.
Πλευρική συµπίεση (side chaining). Η εφαρµογή side chaining επιτρέπει στον συµπιεστή να
αντιδράσει σε ένα εξωτερικό σήµα, διαφορετικό από αυτό της εισόδου του. Χρησιµοποιείται συχνά από τους
ραδιοφωνικούς παραγωγούς. Κάθε φορά που µιλάει στο µικρόφωνο ο παραγωγός, η εφαρµογή side chaining
ενεργοποιεί άµεσα τη µείωση στάθµης του συµπιεστή ώστε να χαµηλώσει η ένταση του σήµατος που
επεξεργάζεται (ducking). Με αυτόν τον τρόπο, η µουσική του ραδιοφώνου µειώνεται µόλις ξεκινά την οµιλία
του ο παραγωγός.
Η χρήση του συµπιεστή και του τύπου συµπίεσης, εξαρτάται από τον ήχο ή γενικότερα τη µουσική
στην οποία εφαρµόζεται. Σε αυτό που εννοούµε ως µουσική βιοµηχανία και ηλεκτρονική χορευτική µουσική,
η συµπίεση αποτελεί αναπόσπαστο και ουσιαστικό τµήµα της παραγωγής της. Αυτή η µουσική παράγεται για
να ακούγεται σε χώρους όπως αυτοκίνητα, εστιατόρια, αγορές και clubs και άρα είναι κρίσιµο να εξοπλιστεί
µε ισχυρή και, κυρίως, σταθερή δυναµική σε όλη τη διάρκειά της. Αντίθετα, στη µουσική για ορχήστρα ή
στην ακουσµατική µουσική, στις οποίες ακόµη και οι απειροελάχιστες αποχρώσεις της δυναµικής θεωρούνται
σηµαντικές, οι τεχνικές συµπίεσης χρησιµοποιούνται ελάχιστα έως καθόλου. Ακόµη και αν δεν
χρησιµοποιήσουµε κάποιο ειδικό plugin συµπίεσης, θεωρείται δεδοµένο ότι το ηχητικό σήµα θα υποστεί
συµπίεση σε ένα ή περισσότερα στάδια της διαδροµής του από το µικρόφωνο ως το µεγάφωνο. Η επίδραση
του συµπιεστή στο φυσικό δυναµικό εύρος του µεγαλύτερου ποσοστού της µουσικής που ακούµε, αλλά και
οποιασδήποτε δραστηριότητας η οποία περιλαµβάνει ενίσχυση του ακουστικού σήµατος, αποτελεί ένα νέο

170
πολιτισµικό φαινόµενο. Διαµορφώνει την ακουστική εµπειρία, την πρόσληψη του ηχογραφηµένου µουσικού
έργου και τη σηµασία της απόλαυσης κατά την ακρόασή του. Η απρόσεκτη χρήση του συµπιεστή µπορεί να
αναιρέσει τις διαφοροποιήσεις των δυναµικών ενός ήχου ή ενός µουσικού έργου, ισοπεδώνοντας έτσι ένα από
τα βασικότερα χαρακτηριστικά του. Μπορεί όµως να χρησιµοποιηθεί και δηµιουργικά, σχηµατοποιώντας τα
διαφορετικά στάδια της εξέλιξης ενός ήχου στο χρόνου, δίνοντας έµφαση σε κάποια σηµεία του και
ελαχιστοποιώντας κάποια άλλα. Πρόκειται για ένα χρήσιµο εργαλείο µικροδοµικής γλυπτικής το οποίο αξίζει
να διερευνηθεί πέρα και έξω από την προφανή χρήση του στη µουσική βιοµηχανία.

5.7.2.2. Πύλη Θορύβου (Noise Gate).

Ο θόρυβος που παράγεται από τα ηλεκτρικά καλώδια και τα ενισχυτικά κυκλώµατα (hiss, hum) συνήθως
εντοπίζεται σε συχνοτικές περιοχές χαµηλότερες του ηχητικού σήµατος που ηχογραφούµε. Όταν η στάθµη
του ηχητικού σήµατος µειωθεί αρκετά τότε η παρουσία του θορύβου γίνεται αντιληπτή. Σε αυτές τις
περιπτώσεις, όπου ο θόρυβος δεν συµπίπτει συχνοτικά µε το ηχητικό σήµα, χρησιµοποιούµε την πύλη
θορύβου για την αποκοπή του (Εικόνα 5.17).

Εικόνα 5.17 Plugin πύλης θορύβου στο πρόγραµµα DAW Reaper (πηγή: www.reaper.fm).

Η πύλη θορύβου αποκόπτει το θόρυβο κάθε φορά που το ηχητικό σήµα πέφτει κάτω από µια ορισµένη
στάθµη (κατώφλι). Η τιµή σε dB του κατωφλίου ορίζεται πάνω από τη στάθµη του θορύβου και κάτω από
αυτήν του σήµατος. Η πύλη θορύβου ανοίγει (on) για να περάσει το σήµα και κλείνει (off) όταν η στάθµη του
µειωθεί. Με αυτόν τον τρόπο αποκόπτεται ο θόρυβος αλλά και κάθε παράπλευρος ήχος – όπως αυτός των
δαχτύλων που ακουµπούν στις χορδές ενός οργάνου – ο οποίος βρίσκεται ανάµεσα στους ήχους που
ηχογραφούµε. Σε περίπτωση βέβαια που ο ήχος έχει µεγάλο χρόνο απόσβεσης (fade out), αυτή η διαδικασία
µπορεί να είναι προβληµατική καθώς η πύλη θορύβου θα αποκόψει και µέρος του σήµατος.
Ενώ ο συµπιεστής µειώνει τη στάθµη του σήµατος η οποία υπερβαίνει ένα κατώφλι, η πύλη θορύβου
µειώνει τη στάθµη του σήµατος η οποία βρίσκεται κάτω από το κατώφλι.
Λόγος (Ratio). Ελέγχει την ποσότητα εφαρµογής της πύλης θορύβου µόλις η στάθµη του σήµατος
φτάσει στο κατώφλι. Ο λόγος 1:1 δηλώνει ότι η πύλη είναι ανενεργή.
Χρόνος εκκίνησης (Attack time). Ορίζει την ταχύτητα µε την οποία η πύλη θορύβου ανοίγει στην αρχή
του σήµατος και µόλις η στάθµη του φτάσει στο κατώφλι. Ένα µεγάλος χρόνος εκκίνησης κρατά την πύλη
κλειστή στην αρχή του ήχου µειώνοντας την έµφαση της ατάκας του και δηµιουργώντας έτσι το εφέ του
δοξαριού, την σταδιακή δηλαδή άνοδο της στάθµης.

171
Διατήρηση (Hold). Ορίζεται σε ms για να διατηρήσει ανοικτή την πύλη ακόµη και όταν η στάθµη του
σήµατος πέφτει κάτω από το κατώφλι. Με αυτόν τον τρόπο διατηρείται η σταδιακή απόσβεση (fade out) του
σήµατος.
Χρόνος απελευθέρωσης ή επαναφοράς (Release time). Ορίζει την ταχύτητα µε την οποία η πύλη
θορύβου κλείνει στο τέλος του σήµατος και µόλις η στάθµη του κατέβει κάτω από το κατώφλι.

5.7.2.3. Αναστολέας (Limiter).

Η βασική ιδέα στη λειτουργία τόσο του συµπιεστή όσο και του αναστολέα είναι η επιµέρους µείωση της
στάθµης του σήµατος (gain reduction) µε σκοπό τον έλεγχο των κορυφών του πλάτους του, των transients και
γενικότερα της πορείας της δυναµικής του. Μπορούµε να σκεφτούµε τον αναστολέα ως έναν ακραίο (µε
υψηλό ratio) συµπιεστή. Άλλωστε, συχνά οι δύο αυτοί επεξεργαστές συνυπάρχουν στο ίδιο plugin. Η βασική
διαφορά µεταξύ των δύο εντοπίζεται στη ρύθµιση του λόγου (ratio). Πάνω από 10:1 έχουµε αναστολή. Αυτή
η λειτουργία µε υψηλό λόγο ονοµάζεται brick wall limiting καθώς δεν επιτρέπει τη στάθµη του σήµατος να
υπερβεί αυτήν που ορίζεται από το κατώφλι. Μια τέτοια χρήση του αναστολέα συναντούµε συχνά σε
ζωντανές συναυλίες και ηχογραφήσεις. Επειδή οποιαδήποτε υπέρβαση της στάθµης δηµιουργεί
παραµόρφωση, ένας αναστολέας τοποθετείται πριν την είσοδο του σήµατος στον ψηφιακό εγγραφέα,
φροντίζοντας να κρατήσει την στάθµη στα επιτρεπτά όρια.
Όπως και στον συµπιεστή, ορίζουµε µια τιµή κατωφλίου για την έναρξη λειτουργίας του αναστολέα.
Το σήµα µε στάθµη χαµηλότερη της τιµής του κατωφλίου παραµένει αναλλοίωτο. Κάθε φορά που η στάθµη
εισόδου υπερβαίνει αυτήν την τιµή, η στάθµη εξόδου παραµένει σταθερή και ανεπηρέαστη από τις
αυξοµειώσεις (πάνω από το κατώφλι) της στάθµης εισόδου. Στην ουσία, ορίζουµε ένα όριο για το πού µπορεί
να φτάσει η στάθµη του ηχητικού σήµατος.
Μια τυπική εφαρµογή του αναστολέα είναι η τοποθέτησή του στο τέλος της αλυσίδας των
επεξεργαστών σε ένα track, έτσι ώστε να αποκόψει τυχόν υπερβάσεις που προκύπτουν από τις συνεχόµενες
επεξεργασίες. Με το ίδιο σκεπτικό και µε τον ίδιο τρόπο χρησιµοποιείται στο mastering. Σε µια περισσότερο
δηµιουργική προσέγγιση, χρησιµοποιούµε τον αναστολέα ως καλέµι ηχητικής γλυπτικής, σχηµατοποιώντας
και διαµορφώνοντας τις ατάκες και τα transients.
Συναντούµε και στον αναστολέα τις υπόλοιπες ρυθµίσεις τις οποίες είδαµε στον συµπιεστή, όπως ο
χρόνος εκκίνησης και απελευθέρωσης.

5.7.2.4. Πολυζωνικοί Συµπιεστές-Αναστολείς (Multiband Compressors-Limiters).

Ένας πολυζωνικός συµπιεστής (ή αναστολέας) διαιρεί το ηχητικό σήµα σε συχνοτικές ζώνες


χρησιµοποιώντας συνήθως φίλτρα διέλευσης ζωνών (band pass filters). Στη συνέχεια ο συµπιεστής ή
πολλαπλοί συµπιεστές επεξεργάζονται τις συχνοτικές ζώνες που προκύπτουν, εφαρµόζοντας για κάθε µια από
αυτές ξεχωριστές ρυθµίσεις λόγου, κατωφλίου, χρόνου εκκίνησης και απελευθέρωσης κ.λπ. Τέλος, το σήµα
ανασυντίθεται στην έξοδο. Καθώς κάθε συχνοτική ζώνη έχει τα ιδιαίτερα ποιοτικά και ποσοτικά
χαρακτηριστικά της, απαιτεί διαφορετικές ρυθµίσεις συµπίεσης ή αναστολής, ειδικά διαµορφωµένες για
αυτήν. Η πολυζωνικότητα προσφέρει την απαιτούµενη προσαρµοστικότητα και τη δυνατότητα εστίασης στα
χαρακτηριστικά της κάθε συχνοτικής ζώνης, σε αντίθεση µε την εφαρµογή του ίδιου ποσοστού συµπίεσης ή
αναστολής σε όλο το συχνοτικό εύρος του ήχου.

5.7.2.5. Διαστολέας (Expander).

Ο διαστολέας έχει την αντίθετη λειτουργία από αυτήν του συµπιεστή. Οµοιάζει όµως µε τη λειτουργία της
πύλης θορύβου. Ονοµάζεται διαστολέας γιατί σκοπός του είναι η διεύρυνση του δυναµικού εύρους του
ηχητικού σήµατος. Διαστέλλει δηλαδή, αντί να συµπιέζει, τις διαφορές πλάτους µεταξύ κορυφών και
καµπυλών. Αυτό το πετυχαίνει είτε ενισχύοντας τα ήδη δυνατά σηµεία του σήµατος που υπερβαίνουν την
τιµή κατωφλίου (upward expansion), είτε µειώνοντας περαιτέρω τα ασθενέστερα που βρίσκονται κάτω από
την τιµή κατωφλίου (downward expansion).
Ενώ η συµπίεση και η αναστολή εφαρµόζονται σε στάθµες οι οποίες υπερβαίνουν µια ορισµένη τιµή
κατωφλίου, ο διαστολέας επεµβαίνει σε στάθµες χαµηλότερες από την τιµή κατωφλίου.

172
Το µέγεθος της διεύρυνσης ορίζεται από τη ρύθµιση του λόγου (ratio). Για το λόγο 2:1 και στάθµη
σήµατος 3 dB κάτω από το κατώφλι, θα προκύψει εξασθένιση της στάθµης κατά 6 dB. Ο λόγος 10:1 µπορεί
να θεωρηθεί ότι µετατρέπει το διαστολέα σε πύλη θορύβου καθώς εκµηδενίζει τη στάθµη.
Συναντούµε και εδώ τις υπόλοιπες ρυθµίσεις που είδαµε πιο πάνω: χρόνο εκκίνησης (attack time),
χρόνο απελευθέρωσης (release time), ενίσχυση εξόδου (makeup gain) και γωνία µετάβασης (knee).

5.7.2.6. De-esser.

Ο De-esser έχει ως βασική λειτουργία την αφαίρεση υψηλών συχνοτήτων, οι οποίες προκύπτουν από την
άρθρωση κυρίως των συριστικών ή διπλοδοντικών συµφώνων σ, τς, ζ και τζ, αλλά και άλλων συµφώνων
µεταξύ των οποίων το κ και το τ. Καθώς στροβιλίζεται ο αέρας στην στοµατική κοιλότητα και ανάµεσα στα
δόντια, δηµιουργείται το φαινόµενο της συριστικότητας. Οι συριγµοί µεγεθύνονται κατά την ηχογράφηση αν
το µικρόφωνο είναι σε κοντινή απόσταση από την πηγή της φωνής. Ειδικότερα, τα πυκνωτικά µικρόφωνα µε
µεγάλο διάφραγµα µπορεί να µεγεθύνουν το φαινόµενο.
Το µεγαλύτερο ποσοστό ενέργειας του συριστικού θορύβου βρίσκεται σε µια µεγάλη περιοχή µεταξύ
4.000 Hz και 10.000 Hz, ανάλογα µε το φύλο και τη µορφολογία της στοµατικής κοιλότητας. Αν και οι
συριστικοί ήχοι µπορούν να αντιµετωπιστούν µε τη χρήση του ποντικιού και του αυτοµατισµού της έντασης
(volume automation), όπως φαίνεται στην Εικόνα 5.10, η εφαρµογή ενός εξειδικευµένου plug in είναι
λιγότερο χρονοβόρα και περισσότερο αποτελεσµατική. Οι συριγµοί µπορούν να αντιµετωπιστούν είτε µε
φίλτρο αποκοπής αυτών των ψηλών συχνοτικών περιοχών, είτε µε συµπίεση της στάθµης στην ίδια συχνοτική
περιοχή. Ο De-esser ενεργοποιείται όταν, µέσα στην καθορισµένη περιοχή του συριστικού θορύβου, η
στάθµη του σήµατος υπερβεί την τιµή κατωφλίου. Ένας συµπιεστής µπορεί επίσης να αντιµετωπίσει το
πρόβληµα έχοντας πολύ µικρό χρόνο ατάκας (< 5 ms) και απελευθέρωσης και εφαρµόζοντας τη ρύθµιση look
ahead ώστε να προλάβει τα transients που αναδύονται στην αρχή της εκφοράς των συµφώνων.

5.7.2.7. Λίγες Σκέψεις για τους Επεξεργαστές Δυναµικού Εύρους.

Η χρήση των επεξεργαστών δυναµικού εύρους εξαρτάται πάντα από το είδος του ήχου ή της µουσικής για την
οποία τους χρησιµοποιούµε. Όπως επισηµάναµε πιο πάνω στην αναφορά για τη συµπίεση, µια χρήση µε
µοναδικό γνώµονα την τελική συµπίεση του δυναµικού εύρους οδηγεί σε προκρούστειες διαδικασίες οι
οποίες είναι µακρυά από τη φυσιολογία και την πολυπλοκότητα του ηχητικού φαινοµένου. Ειδικότερα, η
συµπίεση του εύρους της ατάκας ενός ήχου, η οποία αποτελεί το βασικότερο συστατικό για τη διαµόρφωση
του φασµατικού του περιεχοµένου, µπορεί να αλλοιώσει σε µεγάλο ποσοστό τη χροιά του. Οι επεξεργαστές
δυναµικού εύρους έχουν κατακλύσει τη µουσική βιοµηχανία σηµατοδοτώντας την οµοιογένεια έναντι της
ποικιλοµορφίας, την σταθερή σε ένταση έναντι της διαφοροποιηµένης ακρόασης και την, πάση θυσία και µε
κάθε κόστος, επιβολή των ηχητικών διαφηµίσεων και ανακοινώσεων στο συλλογικό αυτί. Όλα αυτά απαιτούν
ένα στενό, σταθερό και συµπαγές δυναµικό εύρος, επικυρίαρχο του ευρύτερου δυναµικού εύρους της
καθηµερινής ατοµικής µας ακρόασης. Παρότι η βιβλιογραφία και το διαδίκτυο προσφέρουν αρκετές
συνταγές χρήσης (ή και κατάχρησης), είναι σηµαντικό να καθοδηγούµαστε από το αυτί µας, την ακουστική
µας αντίληψη και το αισθητικό αποτέλεσµα που θέλουµε να πετύχουµε. Όπως συνήθιζε να συµβουλεύει τους
µαθητές του ο Pierre Schaeffer: «Primauté à l’oreille!» (προτεραιότητα στο αυτί!).

5.7.3. Επεξεργασίες Καθυστέρησης (Delays).

Παρότι η έννοια και οι αρχές της καθυστέρησης ενός σήµατος εξετάζονται σε άλλο µέρος του βιβλίου, θα
επανέλθουµε σε αυτό το σηµείο σε κάποιες από αυτές ώστε να κατανοήσουµε τη λειτουργία της µονάδας
αντήχησης (reverb) που θα εξετάσουµε πιο κάτω.
Καθυστέρηση σηµαίνει αργοπορία ενός αναµενόµενου συµβάντος. Συχνά, οι αργοπορίες στη
µετάδοση ενός ηχητικού σήµατος είναι πολύ µικρής διάρκειας και µετρώνται σε χιλιοστά του δευτερολέπτου.
Όταν ηχογραφούµε για παράδειγµα ένα όργανο, ο ήχος του δεν φτάνει στο µικρόφωνο µόνο απευθείας από
την πηγή αλλά και µέσω πολλών ανακλάσεων, κάθε µια από τις οποίες έχει διαφορετική χρονική διάρκεια.
Παρότι η ακοή µας αδυνατεί να επεξεργαστεί χρονικές διάρκειες µικρότερες των 30 περίπου χιλιοστών του
δευτερολέπτου, οι καθυστερήσεις αυτές επηρεάζουν τη χροιά του ήχου και µας βοηθούν να αποκτήσουµε µια

173
ολοκληρωµένη αντίληψη για το µέγεθος του χώρου που µας περιβάλλει. Παρά την πληθώρα των ανακλάσεων
που παράγουν οι προσκρούσεις του ήχου σε επιφάνειες, το άµεσο κύµα το οποίο φτάνει πρώτο στον δέκτη
ακολουθώντας τη συντοµότερη διαδροµή, καθορίζει σε µεγάλο βαθµό την αντίληψη της κατεύθυνσης άφιξης
του ήχου, βοηθώντας µας έτσι στον εντοπισµό της πηγής του. Αυτή η αντίληψη περιγράφεται από το Νόµο
του Πρώτου Μετώπου Κύµατος (Law of the First Wavefront) του Lothar Cremer ή Precedence Effect,
σύµφωνα µε τον οποίο, όταν δύο ηχητικά σήµατα έχουν ελάχιστη χρονική διαφορά µεταξύ τους, θα γίνουν
αντιληπτά ως ένα συγχωνευµένο σήµα. Η διαδικασία εντοπισµού της πηγής και της κατεύθυνσης του
σήµατος ολοκληρώνεται σε διάστηµα κλάσµατος του χιλιοστού του δευτερολέπτου και υπήρξε εξαιρετικά
σηµαντική για την επιβίωση και την εξελικτική πορεία του ανθρώπινου είδους. Ας µην ξεχνάµε ότι ακόµη και
σήµερα η καθηµερινή µας ασφάλεια εξαρτάται σε µεγάλο βαθµό από αυτήν την ικανότητα.
Όπως είδαµε, ένας ήχος ξεκινά από την πηγή που τον παράγει, προσκρούει σε διάφορες επιφάνειες τις
οποίες συναντά στην πορεία µετάδοσής του και στη συνέχεια ανακλάται πριν φτάσει στο αυτί µε χρονική
καθυστέρηση (Εικόνα 5.18). Ο µέσος όρος της απόστασης που διανύουν οι ανακλάσεις ονοµάζεται Μέση
Ελεύθερη Διαδροµή.

Εικόνα 5.18 Ανακλάσεις του ηχητικού σήµατος σε κλειστό χώρο. Διακρίνεται η κατεύθυνση του άµεσου κύµατος (µαύρο
βέλος) το οποίο διαµορφώνει την αντίληψη του δέκτη για τη θέση της πηγής και την κατεύθυνση άφιξης του ήχου. Οι
µεταγενέστερες ανακλάσεις ολοκληρώνουν την ολιστική αντίληψη για το χώρο.

Όλες αυτές οι προσκρούσεις και ανακλάσεις προσθέτουν διαφορετικούς χρόνους καθυστέρησης βοηθώντας
µας έτσι να προσδιορίσουµε το µέγεθος του χώρου και τις ηχοχρωµατικές ποιότητες του ήχου. Ας
υποθέσουµε τώρα ότι ακούµε έναν ήχο από µπροστά και δεξιά, όπως αναπαριστά η Εικόνα 5.19. Το άµεσο
κύµα θα φτάσει χωρίς να συναντήσει κάποιο εµπόδιο στο δεξί µας αυτί ταξιδεύοντας µε ταχύτητα περίπου
343 µέτρων το δευτερόλεπτο, λαµβάνοντας φυσικά υπόψη ότι η ταχύτητά του εξαρτάται πάντα από συνθήκες
όπως η θερµοκρασία, η υγρασία κ.ά. Για να φτάσει στο αριστερό αυτί, ο ήχος θα πρέπει να διασχίσει το
κεφάλι µας. Αυτό θα έχει ως συνέπεια µια πολύ µικρή χρονική καθυστέρηση στην άφιξή του στο αριστερό
αυτί. Η καθυστέρηση αυτή, η οποία υπολογιζόµενη από τον εγκέφαλο µας βοηθά επίσης στον υπολογισµό της
θέσης και της κατεύθυνσης της ηχητικής πηγής, ονοµάζεται Διαωτική Χρονική Καθυστέρηση (Interaural Time
Difference-ITD). Φυσικά, ο ήχος θα υποστεί και φασµατική διαφοροποίηση καθώς, κατά την πορεία του µέσα
από το κρανίο, θα εξασθενήσουν αρκετές ψηλές συχνότητες, γεγονός που επίσης µας βοηθά στον εντοπισµό
της πηγής.

174
Εικόνα 5.19 Διαωτική Χρονική Καθυστέρηση (Interaural Time Difference).

Η µονάδα καθυστέρησης (delay unit) µιµείται το φυσικό τρόπο µετάδοσης του ήχου. Αυτή η απλή διάταξη
αποτελεί τη βασική δοµική µονάδα (building block) στην κατασκευή πολλών µονάδων επεξεργασίας ήχου
(effects) µεταξύ των οποίων τα reverb, chorus, echo, flanger, phaser κ.ά.
Ας εξετάσουµε κάποιες από τις παραµέτρους τις οποίες συναντούµε σε µια µονάδα καθυστέρησης
(Σχήµα 5.11 και 4.31).

Σχήµα 5.11 Διάγραµµα κυκλώµατος καθυστέρησης.

Χρόνος καθυστέρησης (Delay time). Καθυστερεί το σήµα για ένα ορισµένο χρονικό διάστηµα. Τα ηχητικά
δείγµατα, αφού εισέλθουν στη µονάδα, αποθηκεύονται για το χρονικό διάστηµα που ορίζει ο χρόνος
καθυστέρησης και στη συνέχεια προωθούνται στην έξοδο.
Ταχύτητα (Rate). Αναφέρεται στην ταχύτητα ενός LFO (Low Frequency Oscillator) η οποία µπορεί να
αλλάξει το χρόνο καθυστέρησης.
Ανατροφοδότηση (Feedback). Τµήµα της εξόδου (output) ανατροφοδοτείται στην είσοδο (input). Η
ανατροφοδότηση ορίζει πόσο από το καθυστερηµένο σήµα (wet) επιστρέφει πίσω στην είσοδο αυξάνοντάς
τη. Στην περίπτωση αυτή ονοµάζεται θετική ανατροφοδότηση.
Ποσοστό επεξεργασµένου και µη επεξεργασµένου σήµατος (Mix, Wet/Dry). Ορίζει το ποσοστό του
καθυστερηµένου (wet) και του µη καθυστερηµένου (dry) σήµατος στην έξοδο της µονάδας.
Συγχρονισµός (Tempo Sync ή Beat Sync ή Sync). Συντονίζει τις επαναλήψεις της καθυστέρησης µε το
τέµπο του µουσικού κοµµατιού. Χρησιµοποιείται συχνά στη χορευτική ηλεκτρονική µουσική. Μπορούµε για
παράδειγµα να ορίσουµε τις καθυστερήσεις σε κάθε 1/4, 1/8, 1/16, 1/32 κ.λπ. ώστε να συµπίπτουν µε το
τέµπο δηµιουργώντας έτσι σταθερά ρυθµικά µοτίβα.
Tap tempo. Ο έλεγχος της ταχύτητας των επαναλήψεων της καθυστέρησης µέσω ενός κουµπιού ή
ενός pad.
Φίλτρο (Filter). Πρόκειται για χαµηλοπερατό (High Cut) ή/και υψιπερατό (Low Cut) φίλτρο το οποίο
εφαρµόζεται σταδιακά έτσι ώστε κάθε επανάληψη της καθυστέρησης να περιέχει λιγότερες ψηλές ή χαµηλές

175
συχνότητες αλλάζοντας τη φασµατική χροιά του ήχου και διαφοροποιώντας τη από τον αρχικό µη
επεξεργασµένο ήχο (dry). Χρησιµοποιείται επίσης στη χορευτική ηλεκτρονική µουσική.
Στην Εικόνα 5.20 βλέπουµε ένα plugin στερεοφωνικού Delay. Η λειτουργία Beat Sync έχει
ενεργοποιηθεί έτσι ώστε οι επαναλήψεις που προκαλούνται λόγω των καθυστερήσεων να είναι
συγχρονισµένες σε κάθε 1/4 του µέτρου µε το τέµπο του κοµµατιού. Αν στο αριστερό delay ο συγχρονισµός
παρέµενε στο 1/4 ενώ στο δεξί άλλαξε σε 1/8 ή 1/16, τότε οι επαναλήψεις θα συνέβαιναν σε διαφορετικές
χρονικές στιγµές για το αριστερό και δεξί κανάλι και, κατά συνέπεια, θα γίνονταν αντιληπτές ως µια διαδοχή
από το ένα κανάλι στο άλλο. Αυτή η λειτουργία ονοµάζεται ping pong delay. Η ανατροφοδότηση (Feedback)
έχει οριστεί σε 25% για τα δύο κανάλια ενώ εφαρµόζουµε ένα φίλτρο Low Cut για την αποκοπή συχνοτήτων
κάτω από 100 Hz και ένα High Cut για την αποκοπή συχνοτήτων πάνω από 500 Hz. Η ισορροπία µεταξύ
καθυστερηµένου και µη καθυστερηµένου σήµατος (Output Mix) είναι περίπου 1 προς 3.

Εικόνα 5.20 Στερεοφωνικό Delay σε περιβάλλον Logic Pro.

Η Εικόνα 5.21 περιέχει το ReaDelay, ένα VST plugin το οποίο συναντούµε στο DAW Reaper. Το
συγκεκριµένο plugin µας επιτρέπει να χρησιµοποιούµε ταυτόχρονα περισσότερα του ενός delays (taps) µε
διαφορετικές ρυθµίσεις για το καθένα.

Εικόνα 5.21 Στερεοφωνικό Delay σε περιβάλλον Reaper (πηγή: www.reaper.fm).

176
Εκτός από τη χρονική καθυστέρηση ενός ηχητικού σήµατος, το delay µπορεί να χρησιµοποιηθεί και για την
καθυστέρηση τιµών και παραµέτρων που αφορούν στο ηχητικό σήµα. Στην Εικόνα 5.22 η ενεργοποίηση του
αντικειµένου sfplay~ καθυστερεί 2 δευτερόλεπτα (2000 ms).

Εικόνα 5.22 Χρονική καθυστέρηση µιας τιµής σε περιβάλλον Max.

Κάποιες συµβουλές:

• Πολύ µικροί χρόνοι καθυστέρησης (< 20 ms) επιδρούν στη χροιά του ήχου αλλά και στην
αντίληψη του τονικού του ύψους.
• Χρόνοι καθυστέρησης µεγαλύτεροι των 20 ms σε κρουστούς ήχους, µας επιτρέπουν να
αντιλαµβανόµαστε διαδοχικά γεγονότα. Σε αυτήν την περίπτωση, ο χρόνος καθυστέρησης
µπορεί να δηµιουργήσει ρυθµικά µοτίβα.
• Σε ένα DAW, αν επαναλάβουµε έναν ήχο σε ένα δεύτερο track µε ελάχιστη καθυστέρηση
στην έναρξή του (5-10 ms) θα δηµιουργήσουµε την αίσθηση µιας ευρύτερης στερεοφωνικής
εικόνας. Γενικότερα, οι µικροί χρόνοι καθυστέρησης χρησιµοποιούνται για τη διαµόρφωση ή
τη µίµηση ενός χώρου και το «άπλωµα» του ήχου στο στερεοφωνικό πεδίο.
• Χρόνοι καθυστέρησης µεταξύ 30-100 ms (slapback delay) µας επιτρέπουν επίσης να
µιµηθούµε χώρους και να διαµορφώσουµε τη χωρική υπόσταση του ήχου µας.
• Αν έχουµε έναν πολύ µικρό χρόνο καθυστέρησης (< 10 ms) και αυξήσουµε την
ανατροφοδότηση (feedback), θα αντιληφθούµε αλλαγή στο τονικό ύψος καθώς η αίσθηση
του τονικού ύψους προκύπτει από την αντίληψη εξαιρετικά γρήγορα επαναλαµβανόµενων
ηχητικών συµβάντων.

5.7.3.1. Αντήχηση (Reverb).

Η µονάδα αντήχησης είναι ένα από τα δηµοφιλέστερα plugins που συναντούµε σε ένα περιβάλλον DAW. Ως
αντήχηση θεωρείται η διατήρηση και η σταδιακή απόσβεση του ήχου µετά την έναρξή του. Δηµιουργείται
εξαιτίας των ανακλάσεων του ήχου κατά την πρόσκρουσή του σε διάφορες επιφάνειες. Μετά την εµφάνιση
του ήχου, η αντήχηση ακολουθεί τα εξής στάδια (τα οποία αποτελούνται από καθυστερηµένα και ελαφρώς
τροποποιηµένα αντίγραφα του αρχικού ή άµεσου ήχου) (Σχήµα 5.12):

1. Xρονική καθυστέρηση (Initial Time Delay) η οποία παρεµβάλλεται µεταξύ του ήχου και της
πρώτης ανάκλασης.
2. Πρώτη ανάκλαση (First Reflection).
3. Πρώιµες ανακλάσεις (Early Reflections) οι οποίες ακολουθούν την πρώτη ανάκλαση.

177
Σχήµα 5.12 Γραφική αναπαράσταση της αντήχησης ενός ήχου στο πεδίο του χρόνου.

Ως µονάδα ηχητικής επεξεργασίας, η αντήχηση χρησιµοποιείται για να προσδώσει την αίσθηση του χώρου
και στην ουσία αποτελείται από µια σειρά µονάδων καθυστέρησης. Ανάλογα µε το σκοπό για τον οποίο τη
χρησιµοποιούµε µπορεί να προσοµοιάσει πραγµατικούς χώρους ή να τροποποιήσει τον ήχο σε τέτοιο βαθµό
ώστε η αίσθηση του χώρου να είναι µη ρεαλιστική.
Διακρίνουµε τους παρακάτω τύπους αντήχησης:
Με στερεοφωνικό µικρόφωνο ή ζεύγος µικροφώνων. Ηχογραφούµε τον ήχο µέσα σε έναν
επιλεγµένο χώρο ώστε να αποτυπωθεί µε τη φυσική αντήχηση του χώρου. Πολλοί εκτελεστές µουσικών
οργάνων επιλέγουν αυτήν την τακτική ηχογράφησης για να αποφύγουν την τεχνητή προσθήκη αντήχησης
αλλά και για να αποδώσουν τη µουσικότητα και την πιστότητα του έργου στο φυσικό του περιβάλλον
(εκκλησιαστική µουσική σε καθεδρικό ναό, µουσική µπαρόκ σε αίθουσα ανακτόρων κ.λπ.). Τα
µειονεκτήµατα αυτής της µεθόδου είναι λίγα αλλά σηµαντικά. Η αντήχηση γίνεται αναπόσπαστο τµήµα του
ηχογραφηµένου ήχου και ως τέτοιο, δεν µπορεί να αφαιρεθεί στη συνέχεια. Επίσης, η ηχογράφηση σε
κλειστό αλλά µη ελεγχόµενο χώρο µπορεί να επιτρέψει να παρεισφρήσουν τυχαίοι ήχοι στην ηχογράφηση.
Για παράδειγµα, κατά την ηχογράφηση ενός έργου για φλάουτο από τον Βέλγο φλαουτίστα Marc Grawels σε
έναν καθεδρικό ναό στις Βρυξέλλες, ηχογραφήθηκε ακούσια ο ήχος µιας καµπάνας, ο οποίος τελικά
παρέµεινε και στο CD.
Αλγοριθµική αντήχηση (algorithmic reverb). Χρησιµοποιεί αλγόριθµο προσοµοίωσης του χώρου.
Πρόκειται για ψηφιακό εξοµοιωτή ο οποίος, συνήθως, διαχειρίζεται δύο βασικά συστατικά του χώρου
προσοµοίωσης: α) τις πρώτες ανακλάσεις (Early Reflections-ER) οι οποίες προσοµοιάζουν τις πρώτες
ανακλάσεις του σήµατος καθώς αυτό προσκρούει στις επιφάνειες που συναντά και β) τις παραµέτρους της
αντήχησης. Αν και οι πρώτες έρευνες για την παραγωγή τέτοιων εξοµοιωτών χρονολογούνται από τις αρχές
της δεκαετίας του 1960 µε τον Manfred Schroeder αρχικά στην Γερµανία και στη συνέχεια στα εργαστήρια
Bell, η πρώτη ολοκληρωµένη ψηφιακή ηλεκτρονική µονάδα αντήχησης παρουσιάστηκε το 1976 µε την
ονοµασία EMT 250.
Η Εικόνα 5.23 περιέχει µια µονάδα αντήχησης αλγοριθµικού τύπου. Διακρίνεται στο πάνω αριστερό
µέρος το τµήµα χειρισµού των πρώτων ανακλάσεων και στο κάτω αριστερό το τµήµα των παραµέτρων της
αντήχησης.

178
Εικόνα 5.23 Αντήχηση αλγοριθµικού τύπου PlatinumVerb σε περιβάλλον DAW Logic Pro.

Οι βασικές παράµετροι µιας µονάδας αλγοριθµικής αντήχησης είναι οι εξής:


Predelay. Καθορίζει το χρόνο που παρεµβάλλεται µεταξύ του άµεσου ήχου και των πρώτων
ανακλάσεων. Η τιµή του είναι ανάλογη του µεγέθους του χώρου. Έτσι, όσο πιο µεγάλος είναι ο χώρος τόσο
µεγαλύτερος ο χρόνος του Predelay. Οι πολύ µικροί χρόνοι στο predelay δε βοηθούν στην προσοµοίωση
εντοπισµού της ηχητικής πηγής αλλά µπορούν να χρησιµοποιηθούν για να χρωµατίσουν τον ήχο. Από την
άλλη, οι πολύ µεγάλοι χρόνοι δηµιουργούν το φαινόµενο της ηχούς διαχωρίζοντας τον άµεσο ήχο από τις
ανακλάσεις του οι οποίες έπονται.
Μέγεθος δωµατίου (Room size). Καθορίζει τις διαστάσεις του χώρου. Ο αριθµός δίπλα στο
ποτενσιόµετρο ορίζει, συνήθως, το µήκος των επιφανειών. Η παράµετρος αυτή είναι άµεσα συνδεδεµένη µε
τη διάρκεια των πρώτων ανακλάσεων και τη χρονική καθυστέρηση άφιξης. Όσο µεγαλύτερο είναι το µέγεθος
του δωµατίου τόσο µεγαλύτερος γίνεται ο χρόνος του Predelay.
Σχήµα χώρου (Room shape). Καθορίζει το γεωµετρικό σχήµα του χώρου. Ο αριθµός δίπλα στο
ποτενσιόµετρο ορίζει, συνήθως, τον αριθµό των γωνιών στο χώρο.
Βάση στερεοφωνίας (Stereo base). Προσοµοιάζει την απόσταση µεταξύ των εικονικών µικροφώνων
που ηχογραφούν το χώρο. Μια εικονική απόσταση 25-30 εκατοστών είναι συνήθως ιδανική.
Initial delay. Προσδιορίζει το χρόνο που παρεµβάλλεται µεταξύ του άµεσου ήχου και της αντήχησης.
Διάδοση (Spread). Αναφέρεται στο εύρος της στερεοφωνικής εικόνας της αντήχησης. Με µηδενική
διάδοση, η εικόνα που προκύπτει είναι µονοφωνική.
Διαχωριστής συχνοτήτων (Crossover). Ορίζει µια συχνότητα στην οποία το ηχητικό σήµα
διαχωρίζεται στην είσοδο σε δύο ζώνες, οι οποίες στη συνέχεια υπόκεινται σε διαφορετική επεξεργασία.
Αναλογία (Low ratio). Καθορίζει τους χρόνους αντήχησης των δύο ζωνών του crossover. Με ποσοστό
100%, ο χρόνος αντήχησης είναι ισόποσος για τις δύο ζώνες. Με ποσοστό < 100% ο χρόνος αντήχησης για τη
ζώνη που βρίσκεται κάτω από τη συχνότητα διαχωρισµού είναι µικρότερος, ενώ µε ποσοστό > 100%, ο
χρόνος αντήχησης για τη ζώνη που βρίσκεται πάνω από τη συχνότητα διαχωρισµού είναι µεγαλύτερος.

179
Στάθµη χαµηλών συχνοτήτων (Low frequency level). Ρυθµίζει τη στάθµη των χαµηλών συχνοτήτων
της αντήχησης. Με στάθµη 0 dB, η ένταση των δύο ζωνών είναι ισόποση.
Φίλτρο αποκοπής υψηλών συχνοτήτων (High Cut Filter). Αφαιρεί από την αντήχηση τις συχνότητες
που υπερβαίνουν τη συχνότητα αποκοπής. Με αυτόν τον τρόπο προσοµοιάζει την απορροφητικότητα των
υλικών.
Πυκνότητα (Density). Επηρεάζει την υφή της αντήχησης. Ένα µικρό ποσοστό πυκνότητας προκαλεί
συχνά κοκκιώδη υφή στην αντήχηση, ενώ ένα πολύ ψηλό ποσοστό χρωµατίζει τον ήχο.
Διάχυση (Diffusion). Επηρεάζει το ποσοστό διάχυσης της αντήχησης. Ένα χαµηλό ποσοστό µπορεί να
προκαλέσει κοκκιώδη υφή και ανισορροπίες στην απόσβεση της συχνότητας.
Χρόνος αντήχησης (Reverb Time-RT). Είναι ο χρόνος που απαιτείται ώστε ένα σήµα να εξασθενίσει
κατά 60 dB µέσα σε έναν κλειστό χώρο. Όπως είναι φυσικό, ο χρόνος αντήχησης είναι συνυφασµένος µε το
µέγεθος του χώρου. Σε µικρούς χώρους όπου δεν υπάρχουν πολλές ανακλάσεις και κατευθύνσεις διάδοσης
του σήµατος, χρησιµοποιούµε τον όρο ταχύτητα εξασθένισης (decay rate). Για παράδειγµα, ένας χρόνος
αντήχησης 0.3 του δευτερολέπτου ισοδυναµεί µε ταχύτητα εξασθένισης 60 dB / 0.3 = 200 dB ανά
δευτερόλεπτο67. Στο συγκεκριµένο plugin της Εικόνας 5.23, ο χρόνος αντήχησης αναφέρεται στο χρόνο
απόσβεσης της ζώνης υψηλών συχνοτήτων.
Ποσοστό επεξεργασµένου και µη επεξεργασµένου σήµατος (Mix ή Wet/Dry). Ορίζει το ποσοστό του
καθυστερηµένου (wet) και µη καθυστερηµένου (dry) σήµατος στην έξοδο της µονάδας.
Μια ενδιαφέρουσα παραλλαγή αλγοριθµικής αντήχησης αποτελεί το plugin EnVerb της Εικόνας
5.24, το οποίο µας επιτρέπει να επεξεργαστούµε και να σχηµατοποιήσουµε την περιβάλλουσα της αντήχησης
καθορίζοντας τους χρόνους Attack, Decay, Sustain, Hold και Release .

Εικόνα 5.24 Αντήχηση αλγοριθµικού τύπου EnVerb σε περιβάλλον DAW Logic Pro.

5.7.3.2. Αντήχηση Συνέλιξης (Convolution Reverb).

Στην επεξεργασία σήµατος, η συνέλιξη (convolution) είναι µια πράξη πολλαπλασιασµού που εφαρµόζεται σε
δύο συναρτήσεις. Μπορεί να πραγµατοποιηθεί στο πεδίο του χρόνου (time domain) και στο πεδίο των
συχνοτήτων (spectral domain). Ας δούµε τη διαδικασία εφαρµογής της στον ήχο.
Η αντήχηση συνέλιξης χρησιµοποιεί δειγµατοληψίες αντηχήσεων πραγµατικών χώρων, οι οποίες
εφαρµόζονται στη συνέχεια στον ήχο. Η διαδικασία βασίζεται στη µέθοδο impulse response (κρουστική
απόκριση) (Σχήµα 5.13) µε την οποία καταγράφονται οι ακουστικές ιδιότητες ενός χώρου. Η µέθοδος είναι η
εξής:

• Επιλέγουµε έναν χώρο.


• Με µια µικροφωνική διάταξη µέσα στο χώρο, ηχογραφούµε έναν στιγµιαίο κρότο (impulse),
όπως για παράδειγµα το σκάσιµο ενός µπαλονιού.
• Στη συνέχεια, ο στιγµιαίος κρότος αφαιρείται και η απόκριση του χώρου (response)
αποθηκεύεται σε ένα αρχείο.

180
• Μια µονάδα αντήχησης συνέλιξης χρησιµοποιεί βιβλιοθήκες µε παρόµοια αρχεία, από την
ανάλυση των οποίων παράγει µαθηµατικά µοντέλα τα οποία εφαρµόζει στον ήχο. Με αυτόν
τον τρόπο, ο ήχος αποκτά τα ακουστικά χαρακτηριστικά ενός υπαρκτού χώρου.

Σχήµα 5.13 Impulse Response.

Εικόνα 5.25 Το plugin Altiverb (αντήχηση συνέλιξης).

Η αντήχηση συνέλιξης είναι µια πολύπλοκη και επεξεργαστικά δαπανηρή διαδικασία κατά την οποία κάθε
ηχητικό δείγµα του αρχείου impulse response πολλαπλασιάζεται µε τα δείγµατα του ηχητικού αρχείου στο
οποίο εφαρµόζουµε την αντήχηση. Για την επίτευξη της συνέλιξης στο πεδίο των συχνοτήτων
χρησιµοποιείται µια µέθοδος βασισµένη σε πολλαπλά φίλτρα και στην ανάλυση FFT.

5.7.3.3. Αντήχηση Μεταλλικής Επιφάνειας (Plate Reverb).

Η αντήχηση µεταλλικής επιφάνειας πρωτοπαρουσιάστηκε το 1957 µε το µοντέλο ΕΜΤ 140. Η αρχική


αναλογική µέθοδος περιελάµβανε µια µεγάλη µεταλλική πλάκα στηριγµένη σε ένα πλαίσιο. Ένας
µετατροπέας εισόδου µετέφερε έναν ήχο στην πλάκα προκαλώντας δονήσεις τις οποίες κατέγραφαν ένα ή δύο
µικρόφωνα ως ηχητικό σήµα (Εικόνα 5.26).

181
Εικόνα 5.26 Παραγωγή αντήχησης µε µεταλλική επιφάνεια (πηγή: http://www2.ph.ed.ac.uk/~sbilbao/platerevpage.htm).

5.7.3.4. Αντήχηση Ελατηρίου (Spring Reverb).

Οι πρώτες αντηχήσεις ελατηρίου εµφανίστηκαν στα τέλη της δεκαετίας του 1930 ενώ στη δεκαετία του 1960
τοποθετήθηκαν στα όργανα Hammond. Οι παλαιότερες αναλογικές κατασκευές περιελάµβαναν µετατροπείς
που προκαλούσαν δονήσεις σε ελατήρια µε τα οποία ήταν συνδεδεµένοι. Οι δονήσεις µε τη σειρά τους
καταγράφονταν από µικρόφωνα (Εικόνα 5.27).

Εικόνα 5.27 Σύστηµα αντήχησης ελατηρίου (πηγή: https://commons.wikimedia.org/wiki/File:Reverb-


3.jpg#/media/File:Reverb-3.jpg).

5.7.3.5. Presets.

Κάθε ψηφιακή µονάδα αντήχησης περιλαµβάνει εκατοντάδες προγράµµατα προσοµοίωσης χώρων (presets)
τα οποία εντάσσονται σε κάποιες βασικές κατηγορίες:

• Plates. Προσοµοίωση µεταλλικών ελασµάτων για παραγωγή αντήχησης µεταλλικής


επιφάνειας.
• Rooms. Προσοµοίωση διάφορων µεγεθών δωµατίων µε µικρό ως µεσαίο χρόνο αντήχησης.

182
• Halls. Προσοµοίωση αιθουσών διαφόρων µεγεθών µε αρκετά µεγάλο χρόνο αντήχησης.
• Cathedral, Church. Προσοµοίωση εκκλησιαστικών χώρων µε µεγάλους χρόνους αντήχησης.
• Ambiance. Προσοµοίωση ανοικτών χώρων µε εφαρµογή στη δηµιουργία ηχοτοπίων και στη
µίµηση της ατµόσφαιρας εξωτερικών χώρων.

Ακολουθούν κάποιες συµβουλές για τη χρήση µονάδων αντήχησης:

• Ένας µεγάλος χρόνος αντήχησης σε αργή µουσική µε τενούτες, όπως η δυτική εκκλησιαστική
µουσική, αναδεικνύει και εµπλουτίζει το φασµατικό της περιεχόµενο. Αντίθετα, σε γρήγορη
και ρυθµική µουσική εφαρµόζουµε µικρούς χρόνους αντήχησης.
• Ένας µεγάλος χρόνος αντήχησης σε χαµηλές συχνότητες επαυξάνει την αίσθηση διάχυσης
και φασµατικού όγκου. Αντίθετα, οι µεγάλοι χρόνοι αντήχησης σε υψηλές συχνότητες
αφαιρούν τη φασµατική τους ενέργεια προκαλώντας ένα µουντό ηχοχρωµατικό αποτέλεσµα.
• Απρόσεκτη ή υπερβολική χρήση της αντήχησης µπορεί να οδηγήσει σε έλλειψη ευκρίνειας,
σε φαινόµενα απόκρυψης και σε παραµόρφωση της στερεοφωνικής εικόνας. Επιπλέον, αν
υπερβολικό ποσοστό αντήχησης εφαρµοστεί στο master track ενός project, θα προκαλέσει
ηχοχρωµατική οµογενοποίηση και «θολούρα».

Τέλος, ο Πίνακας 5.3 περιέχει ορισµένες µονάδες ηχητικής επεξεργασίας που συναντούµε συχνά σε ένα
περιβάλλον DAW.

Μονάδα Effect Περιγραφή


Παραµόρφωση (Distortion) Παραµόρφωση ονοµάζεται οποιαδήποτε µεταβολή του
περιεχοµένου ενός σήµατος. Για παράδειγµα, παραµόρφωση
µπορεί να προκληθεί από την προσθήκη στο σήµα νέων
αρµονικών ή από µετατροπή των σχετικών εντάσεών τους.
Vibrato Περιοδική ταλάντωση γύρω από τη συχνότητα ενός σήµατος
(Frequency Modulation µε εύρος ταλάντωσης 1-10 Hz).
Tremolo Διακύµανση της στάθµης του πλάτους ενός σήµατος
(Amplitude Modulation). Το MIDI CC 92 ελέγχει το βάθος
(depth) του Tremolo.
Chorus Υπέρθεση καθυστερηµένων αντιγράφων ενός σήµατος (µε
εφαρµογή στο σήµα µεταβαλλόµενων delays µεταβλητής
διάρκειας, µε χρόνο καθυστέρησης 1-40 ms). Το MIDI CC 93
ελέγχει το βάθος (depth) του Chorus.
Phaser Χρησιµοποιεί delays µεταβλητής διάρκειας για να παράγει
διαφοροποιήσεις στη φάση ενός ηχητικού σήµατος. Το MIDI
CC 95 ελέγχει το βάθος (depth) του Phaser.
Flanger Χρησιµοποιεί delays µεταβλητής διάρκειας (µε έλεγχο LFO)
για να καθυστερήσει τµήµα του σήµατος κατά ελάχιστα
χιλιοστά του δευτερολέπτου. Καθώς το σήµα συνηχεί µε το
καθυστερηµένο αντίγραφό του, προκαλούνται µετατοπίσεις
της φάσης (phase shifts).
Ηχώ, φθίνουσα επανάληψη (Echo) Επανάληψη του ηχητικού σήµατος. Προσοµοίωση του
φαινοµένου της ηχούς. Διακριτή ηχώ παράγεται από µονάδα
καθυστέρησης µε χρόνο καθυστέρησης > 30 ms.
Pitch Shifter. Harmonizer Το Pitch Shifter µετατοπίζει το τονικό ύψος ενός ηχητικού
σήµατος. Το Harmonizer µιξάρει το µετατοπισµένο σήµα µε το
αρχικό παράγοντας αρµονικές δοµές.
Wah-Wah Παράγεται µε την περιοδική εµφάνιση και αποκοπή υψηλών
περιοχών ενός σήµατος (για παράδειγµα µιας νότας) µέσω
φίλτρου Band Pass. Η ονοµασία Wah-Wah µιµείται φωνητικά
τον ήχο που περιγράφει και είναι αποτέλεσµα ονοµατοποιίας.

183
Vocoder VOice enCODER. Έχει 2 εισόδους (inputs). Στην πρώτη
εισέρχεται το ηχητικό σήµα (carrier) και στη δεύτερη ο
διαµορφωτής (modulator) που συνήθως είναι φωνή. Η µονάδα
Vocoder συνδυάζει χαρακτηριστικά της φωνής µε φασµατικά
χαρακτηριστικά του ηχητικού σήµατος. Με αυτόν τον τρόπο,
προσδίδει χαρακτήρα τραγουδιστής φωνής στον ήχο που
επεξεργάζεται. Αναπτύχθηκε στα εργαστήρια Bell στο τέλος
της δεκαετίας του 1930, µε σκοπό την αύξηση των καναλιών
των τηλεφωνικών γραµµών.
Μορφική µετατροπή (Morphing) Χρησιµοποιεί τη µέθοδο ανάλυσης-ανασύνθεσης (analysis-
resynthesis) για την παρεµβολή χαρακτηριστικών ενός ήχου σε
έναν άλλο.
Αποθορυβοποιητής (Denoiser) Εφαρµογή φίλτρων στο ηχητικό σήµα για την αποκοπή
ανεπιθύµητου θορύβου.

Πίνακας 5.3 Μονάδες επεξεργασίας ήχου σε περιβάλλον DAW.

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Αδάµ, Δ. Προγραµµατίζοντας σε MIDI. Αθήνα: Σύγχρονη Μουσική, 2002.


Παπανικολάου, Γ. Τεχνολογία Ηχογραφήσεων. Θεσσαλονίκη: University Studio Press, 1991.
Eargle, J. M. Μουσική Ακουστική Τεχνολογία. Αθήνα: Ίων, 1999.
Everest, F. A. Εγχειρίδιο Ακουστικής. Αθήνα: Εκδόσεις Τζιόλα, 2003.

Ξενόγλωσση Βιβλιογραφία.

Eleanor, S. F. (επιµέλεια). Beyond MIDI. The Handbook of Musical Codes. Cambridge MΑ: The MIT Press,
1997.
Gibson, B. Compressors, Limiters, Expanders and Gates. Vallejo CA.: ProAudio Press, 2002.
Izhaki, R. Mixing Audio, Concepts, Practices and Tools. Oxford: Focal Press, 2007.
Quinet, J-J. «Le Système MIDI. I-Technique de Base», ACME. Βρυξέλλες: Les Dossiers de l’ACME, 1993,
σελ. 5-49.
Roads, C. The Computer Music Tutorial. Cambridge MΑ: The MIT Press, 1996, σελ. 387-448.

184
Κεφάλαιο 6
Τα Πρωτόκολλα Μουσικής Επικοινωνίας MIDI
και Open Sound Control (OSC).
Σύνοψη
Το Κεφάλαιο 6 εξετάζει τα πρωτόκολλα επικοινωνίας Musical Instrument Digital Interface (MIDI) και Open
Sound Control (OSC) µέσω των οποίων πραγµατοποιείται η διακίνηση µηνυµάτων από και προς τον
υπολογιστή. Παρουσιάζεται η αρχιτεκτονική των πρωτοκόλλων και οι τύποι των µηνυµάτων που διακινούν.

Προαπαιτούµενη γνώση
Απαιτείται γνώση των Κεφαλαίων 1, 2 και 5.

6.1. Tο Πρωτόκολλο Musical Instrument Digital Interface (MIDI).


Εκτός από την καταγραφή του ηχητικού σήµατος υπάρχει η δυνατότητα να καταγράψουµε και να
αποθηκεύσουµε πληροφορίες που σχετίζονται µε τον παραµετρικό έλεγχο και τις ποσοτικές τιµές του. Για
παράδειγµα, µπορούµε να καταγράψουµε, να αποθηκεύσουµε και να τροποποιήσουµε µε ψηφιακό τρόπο
πληροφορίες που θα µας επιτρέψουν να ελέγξουµε το τονικό ύψος, την ένταση και το ηχόχρωµα µιας νότας
χρησιµοποιώντας το πρωτόκολλο MIDI (Musical Instrument Digital Interface). Αυτή η µέθοδος απαιτεί
µικρότερο αποθηκευτικό χώρο σε σχέση µε την αποθήκευση του ήχου, γεγονός ιδιαίτερα σηµαντικό στη
δεκαετία του 1980 κατά την οποία οι υπολογιστές είχαν περιορισµένο αποθηκευτικό χώρο και µνήµη.
Στην αλλαγή των δεκαετιών του 1970 και 1980, τα µέλη της National Association of Music
Merchants (NAMM) συναντιόνταν τακτικά για να συζητήσουν εµπορικές συµφωνίες. Το 1982, οι
εκπρόσωποι εταιριών που κατασκεύαζαν συνθετητές συναντήθηκαν µετά από αίτηµα του Dave Smith,
εκπροσώπου της Sequential Circuits. Σε αυτήν τη συνάντηση συµφώνησαν να συντάξουν ένα πρωτόκολλο
για την ψηφιακή µεταφορά µουσικών δεδοµένων από όλους τους τύπους ηλεκτρονικών οργάνων που
υπήρχαν εκείνη την εποχή. Η αρχική µορφή αυτού του πρωτοκόλλου ονοµάστηκε USI (Universal Synthesizer
Interface). Βασικός σκοπός του ήταν η δηµιουργία µιας πλατφόρµας επικοινωνίας µεταξύ συνθετητών
διαφορετικών εταιριών. Μετά από κάποιες παραλλαγές, η τελική ονοµασία που δόθηκε στο πρωτόκολλο ήταν
Musical Instrument Digital Interface (MIDI). Το MIDI ανακοινώθηκε επίσηµα την ίδια χρονιά. Το 1983, η
Roland και η Sequential Circuits µε το το Prophet 600, παρουσίασαν τα πρώτα MIDI πληκτροφόρα µε
δυνατότητα επικοινωνίας µέσω του πρωτοκόλλου MIDI.
Μια πολύ απλή αλλά βασική αρχή για την κατανόηση του πρωτοκόλλου είναι η εξής: το MIDI δεν
παίζει ήχους. Απλά ελέγχει τους ήχους που παράγουν κάποια µηχανήµατα.
Οι υπολογιστές, όπως και τα τηλέφωνα, επικοινωνούν µεταξύ τους µέσα καλωδίων (ακόµα!), αλλά µε
έναν κάπως διαφορετικό τρόπο. Με όποιον τρόπο και αν δείχνει ένας υπολογιστής µια πληροφορία στην
οθόνη του (λέξεις, κυµατοµορφές κ.λπ.), εσωτερικά µπορεί να καταλάβει αυτήν την πληροφορία µόνο µέσω
µιας σειράς αριθµών στη µνήµη του. Για παράδειγµα, η λέξη «HELLO» στο Σχήµα 6.1 (το σύνηθες
παράδειγµα που χρησιµοποιείται στη βιβλιογραφία) δεν είναι τίποτα άλλο για τον υπολογιστή από µια σειρά
δυαδικών ψηφίων τα οποία αντιστοιχούν στα γράµµατα της λέξης. Κάθε γράµµα αντιπροσωπεύεται επίσης
από έναν κωδικό αριθµό ASCII.

185
Σχήµα 6.1 Μετατροπή της λέξης «HELLO» σε κωδικό ASCII και σε δυαδικά ψηφία.

6.1.1. Πώς µια Μηχανή Αποθηκεύει Έναν Αριθµό;

Ο υπολογιστής χρησιµοποιεί πολύ µικρές ποσότητες ηλεκτρικού ρεύµατος για να αποθηκεύσει τις τιµές οι
οποίες αντιστοιχούν σε κάποια πληροφορία. Αυτές οι µικρές ποσότητες ηλεκτρικού ρεύµατος, οι οποίες
διακινούνται µέσω των ηλεκτρονικών κυκλωµάτων του υπολογιστή, ονοµάζονται bits (δυαδικά ψηφία ή
δυφία). Τα bits αναπαρίστανται στο δυαδικό σύστηµα από τους αριθµούς 0 και 1. Αυτός ο τρόπος
αναπαράστασης έχει τις ρίζες του στους πρώτους υπολογιστές που χρησιµοποιούσαν διακόπτες οι οποίοι
αντιπροσώπευαν αριθµητικές τιµές (Εικόνα 1.7).
Ένας διακόπτης βρίσκεται σε δύο µόνο καταστάσεις: ανοικτός ή κλειστός (on-off). Το ίδιο ισχύει και
για το bit: 1=on ή 0=off). Τα bits οργανώνονται σε οµάδες ή λέξεις (bytes) ώστε να αναπαριστούν
µεγαλύτερες αξίες. Κάθε µια τέτοια οµάδα, ή byte, αποτελείται από 8 bits68.
Ένα τυπικό µήνυµα MIDI, όπως το µήνυµα noteon που εξετάζεται πιο κάτω, αποτελείται από:

• Ένα αρχικό byte το οποίο ονοµάζεται status byte και έχει σαν πρώτο bit το 1.
• Δύο data bytes που ακολουθούν και έχουν σαν πρώτο bit το 0.

Το status byte περιέχει πληροφορίες για το είδος του µηνύµατος ενώ τα data bytes παρέχουν ποσοτικές
πληροφορίες για το µήνυµα.
Ένας υπολογιστής λοιπόν, µπορεί να επικοινωνήσει µε έναν άλλο υπολογιστή στέλνοντας bits µέσω
καλωδίων. Ο υπολογιστής-δέκτης θα αποθηκεύσει τα bits στη µνήµη του. Αυτό όµως αποτελεί ένα µόνο
τµήµα της διαδικασίας επικοινωνίας. Για να καταλάβει ο υπολογιστής-δέκτης τα µηνύµατα που λαµβάνει θα
πρέπει να «µιλάει» την ίδια γλώσσα µε τον υπολογιστή που τα έστειλε. Όπως και οι διαφορετικές συσκευές
τηλεφώνων χρησιµοποιούν κοινούς τύπους καλωδίων µικροφώνων, ηχείων και κλήσεων, έτσι και οι
υπολογιστές επικοινωνούν µεταξύ τους µέσα από ένα κοινό σύστηµα ανταλλαγής δεδοµένων και
πληροφοριών. Σύµφωνα µε τις προδιαγραφές του, ένα όργανο MIDI µπορεί να διακινήσει µέχρι 31.250 bits
ανά δευτερόλεπτο (bits per second ή bps).

6.1.2. Λίγα Λόγια για την Κατανόηση του Δυαδικού Συστήµατος.

Το δεκαδικό σύστηµα µέτρησης αποτελείται από δέκα ψηφία (0-9), ενώ κάθε αριθµός (στήλη) που
προστίθεται στα αριστερά ενός αριθµού που ήδη υπάρχει, έχει αξία δέκα φορές µεγαλύτερη.
Για παράδειγµα, ο αριθµός 8.582:

8 5 8 2
Χιλιάδα (1000) Εκατοντάδα (100) Δεκάδα (10) Μονάδα (1)

186
Το δυαδικό σύστηµα που χρησιµοποιούν οι υπολογιστές έχει µόνο δύο ψηφία (0 και 1), ενώ κάθε αριθµός
(στήλη) που προστίθεται στα αριστερά ενός αριθµού που ήδη υπάρχει έχει αξία δύο φορές µεγαλύτερη.

6.1.3. Παράλληλος και Σειραϊκός Τρόπος Μετάδοσης (Parallel-Serial Transmition).

Όπως φαίνεται στο παράδειγµα του Σχήµατος 6.1 χρειάζονται αρκετά bits για να µεταδοθεί µια απλή
πληροφορία. Οι δύο τρόποι που χρησιµοποιούν οι υπολογιστές για να ανταλλάξουν πληροφορίες είναι ο
παράλληλος και ο σειραϊκός.

6.1.3.1. Παράλληλη Μεταφορά Δεδοµένων.

Στην παράλληλη µεταφορά δεδοµένων πολλά bits µετατοπίζονται µέσω µιας σειράς πολλαπλών καλωδίων,
όπως φαίνεται στο Σχήµα 6.2.

Σχήµα 6.2 Παράλληλη µεταφορά δεδοµένων.

6.1.3.2. Σειραϊκή Μεταφορά Δεδοµένων.

Σε αυτήν την περίπτωση, τα bits στέλνονται από τον υπολογιστή σε µια µόνο σειρά µέσω ενός καλωδίου
(Σχήµα 6.3).

Σχήµα 6.3 Σειραϊκή µεταφορά δεδοµένων.

Υπάρχουν σηµαντικές διαφορές µεταξύ των δύο τρόπων µεταφοράς δεδοµένων. Με την παράλληλη
µεταφορά οι πληροφορίες διακινούνται πιο γρήγορα αλλά το κόστος των περιφερειακών µηχανηµάτων και
των καλωδίων ήταν αρχικά υψηλό. Επίσης, τα καλώδια παράλληλης µεταφοράς δεν πρέπει να έχουν µεγάλο
µήκος και συχνά λειτουργούν ως αντένες που µεταδίδουν παρεµβολές.
Από την άλλη, ο σειραϊκός τρόπος µεταφοράς είναι πιο αργός αλλά µε χαµηλότερο κόστος, ενώ το
µήκος των καλωδίων δεν επηρεάζει αρνητικά τη µεταφορά των δεδοµένων. Τελικά, οι κατασκευαστές
υπολογιστών, αφού εξέτασαν το συνολικό κόστος και τα θετικά και αρνητικά στοιχεία των δύο τρόπων
µεταφοράς δεδοµένων, επέλεξαν τον σειραϊκό τρόπο.

187
6.1.4. Πώς Μεταφέρονται τα Δεδοµένα MIDI;

Το MIDI χρησιµοποιεί τον σειραϊκό τρόπο µετάδοσης πληροφοριών και bytes των 8 bits (χωρίς να
υπολογίσουµε τα bits έναρξης και λήξης). Οι κατασκευαστές MIDI περιφερειακών, για να κρατήσουν το
κόστος παραγωγής και πώλησης χαµηλό, υιοθέτησαν ένα βύσµα πέντε ακροδεκτών (DIN plug) το οποίο
συνδέει µεταξύ τους τα περιφερειακά. Αυτό το βύσµα χρησιµοποιείτο ήδη σε διάφορες εφαρµογές ήχου και
video.
Όµως, όπως έχουµε ήδη επισηµάνει, ο σειραϊκός τρόπος µεταφοράς δεδοµένων χρειάζεται ένα µόνο
καλώδιο. Οι υπόλοιποι τέσσερις ακροδέκτες έχουν άλλες λειτουργίες ή µένουν αχρησιµοποίητοι (Εικόνα 6.1).

Εικόνα 6.1 Καλώδια και ακροδέκτες καλωδίου MIDI.

Η λειτουργία των 5 ακροδεκτών σε ένα MIDI output καλώδιο είναι η εξής:

• Ακροδέκτης 5: αποστολέας των MIDI µηνυµάτων.


• Ακροδέκτης 2: αποτρέπει την αποστολή και λήψη παρεµβολών που µπορούν να
επηρεάσουν τις πληροφορίες που διακινούνται σε ένα καλώδιο (shield).
• Ακροδέκτης 4: λούπα 5 Volts που εγγυάται τη συνεχόµενη ροή του ηλεκτρισµού προς τη
σωστή κατεύθυνση.
• Ακροδέκτες 1 και 3: αχρησιµοποίητοι.

6.1.5. MIDI Θύρες: In-Out-Thru.

Τα δεδοµένα MIDI που αποστέλλονται µεταξύ των ηλεκτρονικών οργάνων αποκωδικοποιούνται από µια
ηλεκτρονική συσκευή αποκωδικοποίησης η οποία ονοµάζεται διασυνδετής MIDI (MIDI Interface). Από τη
στιγµή που τα δεδοµένα διακινούνται µέσω ενός µόνο καλωδίου, αυτές ταξιδεύουν προς µια µόνο
κατεύθυνση. Το σύστηµα MIDI όµως, πρέπει να επιτρέπει την ταυτόχρονη επικοινωνία από και προς άλλα
µηχανήµατα ή όργανα. Αν, για παράδειγµα, κάποιος µουσικός έχει περισσότερα από ένα περιφερειακά
όργανα (συνθετητές, δειγµατολήπτες κ.ά), αυτά θα πρέπει να επικοινωνούν µεταξύ τους µε κάποιον τρόπο.
Για να επιτευχθεί αυτό, υιοθετήθηκαν τρεις διαφορετικοί υποδοχείς βυσµάτων σε κάθε όργανο ή διασυνδετή
MIDI: ένας για να στέλνει (data out), ένας για να δέχεται (data in) και ένας για να µεταβιβάζει (data thru)
εισερχόµενα δεδοµένα σε ένα επόµενο όργανο (Σχήµα 6.4). Τα περισσότερα MIDI όργανα έχουν και τους
τρεις υποδοχείς. Eξαιρέσεις αποτελούν κάποιοι ελεγκτές MIDI οι οποίοι στέλνουν µόνο data out.

188
Σχήµα 6.4 Συνδέσεις µέσω των θυρών In, Out και Thru (daisy chain).

6.1.5.1. MIDI Out.

Όπως είδαµε, το πρωτόκολλο MIDI δεν διακινεί ήχους µέσω των καλωδίων. Στέλνει ψηφιακούς κώδικες οι
οποίοι αντιπροσωπεύουν τη νότα που παίχθηκε, ή µια κίνηση που εκτελέστηκε σε κάποιο όργανο. Τη στιγµή
που εκτελούνται κάποιες νότες σε έναν συνθετητή, ένας επεξεργαστής µέσα στο συνθετητή αποκωδικοποιεί
τις παραµέτρους της εκτέλεσης. Οτιδήποτε συµβαίνει πάνω στο πλήκτρο ή/και στα κουµπιά του συνθετητή,
µετατρέπεται σε κώδικα MIDI, ο οποίος στη συνέχεια εξέρχεται από τη θύρα MIDI OUT.

6.1.5.2. MIDI In.

Η πληροφορία από τη θύρα MIDI Out ενός οργάνου, φτάνει στη θύρα MIDI In ενός άλλου οργάνου, το οποίο
τη διαχειρίζεται στη συνέχεια. Πολυφωνικοί συνθετητές, δειγµατολήπτες (samplers), drum machines και
άλλα περιφερειακά όργανα επικοινωνούν µε µικροεπεξεργαστές οι οποίοι βρίσκονται στο εσωτερικό τους
εκτελώντας διάφορες λειτουργίες. Για παράδειγµα, σε πληκτροφόρους συνθετητές υπάρχει ένα
µικροκύκλωµα το οποίο παρατηρεί συνεχώς τη σειρά των πλήκτρων και ενεργοποιείται κάθε φορά που ένα
πλήκτρο πατιέται ή αφήνεται. Στη συνέχεια, στέλνει αυτήν την πληροφορία στα υπόλοιπα µικροκυκλώµατα
του συνθετητή για να παραχθεί ο ήχος. Οµοίως, ένας µικροεπεξεργαστής µέσα στο συνθετητή, επιβλέπει τη
θύρα MIDI In και στέλνει τις κατάλληλες εντολές στις γεννήτριες ήχου για να παραχθεί η νότα.

6.1.5.3. MIDI Thru.

Για να σταλούν δεδοµένα από ένα MIDI όργανο σε άλλα MIDI όργανα, η θύρα Thru επαναλαµβάνει
οτιδήποτε εισέρχεται στη θύρα MIDI In. Πρέπει όµως να επισηµανθεί ότι οποιεσδήποτε εκτελέσεις γίνονται
σε ένα συγκεκριµένο όργανο, εξέρχονται µέσω της θύρας Out και όχι µέσω της θύρας Thru. Η τελευταία,
µεταβιβάζει µόνο όσα δεδοµένα εισέρχονται µέσω της θύρας In. Έτσι, όπως φαίνεται στο Σχήµα 6.4, οι νότες
που εξέρχονται από το πρώτο όργανο (master) µέσω της θύρας Out, εισέρχονται στη θύρα In του δεύτερου
οργάνου (slave 1) και από εκεί µεταβιβάζονται στο τρίτο όργανο (slave 2) µέσω της θύρας Thru.
Σήµερα, µεγάλος αριθµός MIDI οργάνων είναι εφοδιασµένα µε θύρες Universal Serial Bus (USB)
µέσω των οποίων γίνεται η διακίνηση των MIDI δεδοµένων και, κατά συνέπεια, οι θύρες και τα καλώδια
MIDI τείνουν να εκλείψουν.

6.1.6. Διακίνηση Μέσω MIDI.

Όπως έχουµε ήδη αναφέρει, σε κάθε πληκτροφόρο MIDI όργανο υπάρχουν µικροεπεξεργαστές οι οποίοι
µετατρέπουν σε MIDI πληροφορίες τις παραµέτρους και τις δράσεις µιας εκτέλεσης (π.χ. το πάτηµα ενός
πλήκτρου).
Μόλις πατηθεί ένα πλήκτρο σε ένα πληκτροφόρο MIDI όργανο, ο υπολογιστής στέλνει ένα µήνυµα
note on το οποίο περιλαµβάνει τρία είδη πληροφοριών: το ότι κάποιο πλήκτρο πατήθηκε, τη νότα ή key
number, και το πόσο γρήγορα πατήθηκε το πλήκτρο (velocity). Η τελευταία πληροφορία, στην ουσία,

189
ενηµερώνει τα άλλα όργανα που δέχονται το µήνυµα για τη δυναµική της νότας που εκτελέστηκε69. Πρέπει
εδώ να επισηµανθεί ότι το MIDI αντιλαµβάνεται το πάτηµα και την αποδέσµευση ενός πλήκτρου σαν δύο
διαφορετικές πληροφορίες. Αυτό σηµαίνει ότι µόλις ένα πλήκτρο πατηθεί, στέλνεται ένας κώδικας που
δηλώνει αυτή την πράξη, ενώ µόλις το πλήκτρο αποδεσµευτεί, στέλνεται ένας δεύτερος κώδικας.
Πολλά MIDI πληκτροφόρα όργανα µπορούν να διαχειριστούν πληροφορίες που αφορούν στο πόση
πίεση ασκείται από το δάχτυλο πάνω σε ένα πλήκτρο που έχει ήδη πατηθεί. Αυτή η ενέργεια ονοµάζεται
aftertouch ή pressure sensitivity και χρησιµοποιείται σαν ένα εκφραστικό µέσο για την παραγωγή vibrato.
Πρόκειται δηλαδή για τη διαµόρφωση της κυµατοµορφής που παράγει τη νότα, η οποία εξαρτάται από τον
βαθµό πίεσης που ασκείται στο πλήκτρο του συνθετητή. Υπάρχουν δύο είδη aftertouch: α) το channel
aftertouch ή channel pressure, που ασκεί τη διαµόρφωση ανάλογα µε τον µέσο όρο πίεσης σε όλα τα
πλήκτρα, ανεξάρτητα από το ποιο ή πόσα πλήκτρα έχουν πατηθεί και, β) το polyphonic aftertouch ή key
pressure που ασκεί τη διαµόρφωση ξεχωριστά για κάθε πλήκτρο, ανάλογα µε την πίεση που ασκείται σε
αυτό.

6.1.7. Ελεγκτές Συνεχούς Ροής (Continuous Controllers).

Οι Continuous Controllers είναι κουµπιά, µοχλοί, τροχοί, πεντάλ κ.ά. που ελέγχουν διάφορες εκφραστικές
παραµέτρους όπως το modulation και το pitch bending. Καθένας από αυτούς τους ελεγκτές (controllers) έχει
τον δικό του κώδικα για να στείλει το µήνυµά του. Για παράδειγµα, όταν ο τροχός του Pitch Bend κινείται,
παράγει έναν κώδικα, ο οποίος δε δίνει πληροφορίες για το τονικό ύψος αλλά για τη θέση του τροχού.
Περισσότερες πληροφορίες για τους Ελεγκτές Συνεχούς Ροής δίνονται στο Κεφάλαιο 7.

6.1.8. Bits και Bytes.

Είδαµε ότι ένα bit µπορεί να έχει δύο µόνο τιµές: την τιµή 1 ή την τιµή 0. Για να επιλυθεί το πρόβληµα
απόδοσης µεγαλύτερων τιµών, τα bits συνδυάζονται σε οµάδες που ονοµάζονται bytes. Ένα «8-µπιτο» byte
αποτελεί µια οµάδα των 8 bits. Στην ουσία, µπορούµε να σκεφτούµε τα bits σαν τα γράµµατα µιας γλώσσας
και τα bytes σαν τις λέξεις. Αυτά τα δύο είναι τα βασικά στοιχεία της επικοινωνίας µέσω του πρωτοκόλλου
MIDI.
Στο δεκαδικό σύστηµα, µε τα δέκα διαφορετικά ψηφία (0-9), κάθε αριθµητική στήλη είναι 10 φορές
µεγαλύτερη από την προηγούµενη, όπως φαίνεται στο παράδειγµα του 6.1.2, ενώ στο δυαδικό σύστηµα που
χρησιµοποιούν οι υπολογιστές, κάθε στήλη είναι 2 φορές µεγαλύτερη από την προηγούµενη. Δηλαδή:

Byte x x x x x x x x
128 64 32 16 8 4 2 1

Μια οµάδα των 8 bits µπορεί να αντιπροσωπεύσει τιµές από 0 έως 255 στο δεκαδικό σύστηµα. Ένας τρόπος
µετατροπής ενός byte σε δεκαδικό αριθµό είναι η άθροιση όλων των στηλών του
(1+2+4+8+16+32+64+128=255), ή:

x*20 = x*1
x*21 = x*2
x*22 = x*4
x*23 = x*8
x*24= x*16
x*25 = x*32
x*26 = x*64
x*27 = x*128

190
Ας πάρουµε για παράδειγµα το byte:

10010110

0*20 = 0*1 = 0
1*21 = 1*2 = 2
1*22 = 1*4 = 4
0*23 = 0*8 = 0
1*24 = 1*16 = 16
0*25 = 0*32 = 0
0*26 = 0*64 = 0
1*27 = 1*128 = 128

Δηλαδή:

0+2+4+0+16+0+0+128 = 150

Αν και ένα byte δεν είναι τίποτε άλλο από µια διαδοχή ψηφίων 0 και 1, ο υπολογιστής µετατρέπει αυτήν τη
διαδοχή σε πληροφορίες κάθε είδους, όπως γραφικά, λέξεις, ήχους κ.λπ.

6.1.9. Status Bytes και Data Bytes.

Τα MIDI bytes χωρίζονται σε δύο κατηγορίες: τα status bytes και τα data bytes.
Το status byte περιγράφει το είδος της πληροφορίας που διακινείται µέσω ενός καλωδίου MIDI.
Τέτοιου είδους πληροφορία είναι το πάτηµα ενός πλήκτρου, η µετακίνηση ενός τροχού ή ενός
ποτενσιόµετρου κ.ά. Το status byte είναι το πρώτο byte που διακινείται από ένα MIDI όργανο. Τα data bytes
ακολουθούν το status byte και περιέχουν τις τιµές για την πληροφορία που διακινεί το status byte. Για
παράδειγµα, αν ένα status byte περιέχει την πληροφορία ότι πατήθηκε ένα πλήκτρο (note on), τότε τα data
bytes που ακολουθούν περιέχουν πληροφορίες για το ποιο πλήκτρο πατήθηκε και µε ποια ένταση (velocity).
Ένα status byte µπορεί να ακολουθείται από ένα ή δύο data bytes. Τα status και data bytes ξεχωρίζουν από
την τιµή του πρώτου ψηφίου τους (1 για τα status και 0 για τα data bytes):

Status Byte 1 0110110


Data Byte 0 1110010

Έχουµε δει ότι το πρώτο bit σε ένα byte χρησιµοποιείται για να δηλώσει το είδος του. Κατά συνέπεια,
αποµένουν 7 bits για τη διακίνηση της όποιας τιµής διακινεί το συγκεκριµένο byte. Έτσι προκύπτει το εύρος
τιµών MIDI από 0 έως 127 (128 τιµές):

0000 0000 0
0000 0001 1
0000 0010 2
0000 0011 3
0000 0100 4
0000 0101 5
0000 0110 6
... ...
0 1111111 127

191
6.1.10. Κανάλια MIDI (MIDI Channels).

Το MIDI χρησιµοποιεί 16 κανάλια για να κατευθύνει κάθε όργανο ξεχωριστά όταν επικοινωνεί µε έναν
συνθετητή, µε µια κάρτα ήχου ή µε µια µονάδα παραγωγής ήχου. Η λειτουργία των καναλιών είναι γνωστή
και κατανοητή από την τηλεόραση. Αντί όµως να χρησιµοποιηθούν συχνότητες, όπως στην τηλεόραση, το
MIDI χρησιµοποιεί το δεύτερο µισό ενός status byte (τα τέσσερα δηλαδή τελευταία ψηφία του) για να
γνωστοποιήσει το κανάλι από το οποίο θα διακινηθούν οι πληροφορίες (data bytes) που το ακολουθούν.

Status Byte Data Byte(s)


1001 0010 (κανάλι MIDI) 0xxx xxxx

Τα τέσσερα bits του status byte που περιέχουν την πληροφορία για τον αριθµό του καναλιού, έχουν δεκαέξι
πιθανές τιµές (0-15) και άρα το σύνολο των καναλιών είναι 16 (Πίνακας 6.1):

Δυαδικό Δεκαδικό Κανάλι MIDI


0000 0 1
0001 1 2
0010 2 3
0011 3 4
0100 4 5
0101 5 6
0110 6 7
0111 7 8
1000 8 9
1001 9 10
1010 10 11
1011 11 12
1100 12 13
1101 13 14
1110 14 15
1111 15 16

Πίνακας 6.1 Τα 16 κανάλια MIDI.

Σε όλα τα MIDI όργανα υπάρχει η δυνατότητα να προσδιοριστεί ο αριθµός του καναλιού από το οποίο θα
στείλουν (transmit channel) και στο οποίο θα δεχτούν πληροφορίες (receive channel). Για παράδειγµα, το
µήνυµα note on µπορεί να πάρει την εξής µορφή (Πίνακας 6.2):

1 001 0000 0 011 1100 0 100 0001


Το πρώτο bit (1) δηλώνει ότι Το πρώτο bit (0) δηλώνει ότι Το πρώτο bit (0) δηλώνει ότι
πρόκειται για status byte. Τα bits πρόκειται για data byte. πρόκειται για data byte.
που ακολουθούν (001) δηλώνουν Το πρώτο data byte δηλώνει τον Το δεύτερο data byte προσδιορίζει
το είδος του µηνύµατος και τη αριθµό του πλήκτρου που έχει το velocity ή την ένταση της
λειτουργία του (note on). Τα πατηθεί (pitch). Στη συγκεκριµένη νότας. Στη συγκεκριµένη
τέσσερα bits που έπονται (0000) περίπτωση, πρόκειται για το MIDI περίπτωση έχουµε velocity 65.
καθορίζουν το MIDI κανάλι από note number 60 (στο δεκαδικό
το οποίο στέλνεται το µήνυµα σύστηµα) που αντιστοιχεί στη
(transmit channel), σε αυτήν την νότα Ντο (C3). Η νότα θα παιχτεί
περίπτωση το κανάλι 1. από το κανάλι 12.

Πίνακας 6.2 Παράδειγµα ενός µηνύµατος note on.

192
Τα κανάλια είναι αυτά που προσφέρουν ευελιξία και ευκολία χρήσης στο σύστηµα MIDI. Χωρίς τη
δυνατότητα της προεπιλογής για το ποιο όργανο θα παίξει και σε ποιο κανάλι, τα όργανα θα έπαιζαν όλα µαζί
καθιστώντας τη δηµιουργία της µουσικής µέσω ηλεκτρονικών οργάνων αδύνατη.

6.1.11. Δεκαεξαδικό Σύστηµα.

Το δεκαεξαδικό σύστηµα απαντάται συχνά τόσο στη λειτουργία των υπολογιστών όσο και στο MIDI. Όπως
υπάρχουν δέκα ψηφία στο δεκαδικό σύστηµα και δύο στο δυαδικό, έτσι υπάρχουν δεκαέξι στο δεκαεξαδικό
(από το 0 ως το 9 χρησιµοποιούνται οι αριθµοί του δεκαδικού και από το 10 ως το 15 τα γράµµατα Α ως F)
(Πίνακας 6.3):

Δεκαδικό Δεκαεξαδικό
0 00
1 01
2 02
3 03
4 04
5 05
6 06
7 07
8 08
9 09
10 0A
11 0B
12 0C
13 0D
14 0E
15 0F

Πίνακας 6.3 Τιµές στο δεκαδικό και στο δεκαεξαδικό σύστηµα.

Αν και δεν είναι απαραίτητο, συχνά τοποθετείται το ψηφίο 0 µπροστά από τον δεκαεξαδικό αριθµό. Συχνά
επίσης, συναντούµε το γράµµα H στο τέλος ενός δεκαεξαδικού αριθµού, το οποίο δηλώνει ακριβώς το
δεκαεξαδικό σύστηµα (Hexadecimal). Για παράδειγµα, ο αριθµός 127 στο δεκαδικό σύστηµα, µετατρέπεται
σε 7F H στο δεκαεξαδικό (7x16 + 15x1=112+15 = 127).
Μερικές λειτουργίες των MIDI µηνυµάτων αποδίδονται ευκολότερα από το δεκαεξαδικό σύστηµα.
Μια τέτοια λειτουργία είναι η απόδοση του αριθµού των καναλιών. Με έναν και µόνο δεκαεξαδικό αριθµό
µπορούµε να αποδώσουµε το κανάλι MIDI, καθώς το δεκαεξαδικό σύστηµα έχει 16 πιθανές τιµές (Πίνακας
6.4).

Δεκαεξαδικό Κανάλι MIDI


00 1
01 2
02 3
03 4
04 5
05 6
06 7
07 8
08 9
09 10
0A 11

193
0B 12
0C 13
0D 14
0E 15
0F 16

Πίνακας 6.4 Απόδοση αριθµού καναλιών στο δεκαεξαδικό σύστηµα.

Όταν αποδίδουµε ένα µήνυµα note on σε δεκαεξαδική τιµή, µπορούµε να βρούµε τον αριθµό καναλιού
κοιτώντας το τελευταίο ψηφίο. Στο παρακάτω παράδειγµα, ο δεκαεξαδικός 90 H αναλύεται ως εξής: 9 = note
on (1001), 0 = κανάλι 1.

90 H note on στο MIDI κανάλι 1 (1001 0000)


91 H note on στο MIDI κανάλι 2 (1001 0001)
92 H note on στο MIDI κανάλι 3 (1001 0010)
... ...

Συνεπώς, ένα MIDI status byte στο δεκαεξαδικό σύστηµα, µπορεί να χωριστεί σε δύο µέρη: στον τύπο του
µηνύµατος ο οποίος αποδίδεται από το πρώτο ψηφίο και στον αριθµό καναλιού που αποδίδεται από το
δεύτερο ψηφίο.
Συχνά, όταν δεν είναι απαραίτητο να αναφέρουµε τον αριθµό καναλιού, συναντούµε το γράµµα n
(number) στη θέση του. Για παράδειγµα, στο 9n, το n είναι ένας οποιοσδήποτε αριθµός και άρα, το 9n
αποδίδει την εντολή «Note On on any MIDI channel».

6.1.12. MIDI Μηνύµατα.

Ας εξετάσουµε συνοπτικά κάποιους πίνακες µε τους διάφορους τύπους των MIDI µηνυµάτων, µε την
υπενθύµιση ότι το πρωτόκολλο MIDI χρησιµοποιείται όχι µόνο για να περιγράψει το είδος της πληροφορίας
που αποστέλλεται από µηχανή σε µηχανή, αλλά και τον τρόπο µε τον οποίο αυτή η πληροφορία ταξιδεύει.
Κάθε παράµετρος µιας µουσικής πράξης αντιπροσωπεύεται και αποδίδεται από τους δικούς της κώδικες (οι
οποίοι βέβαια είναι προαποφασισµένοι από τη βιοµηχανία µουσικών οργάνων).
Στον παρακάτω πίνακα παρατίθενται οι ορισµοί και οι τύποι των MIDI µηνυµάτων. Τα status και data
bytes δίνονται σε δυαδική µορφή.

6.1.12.1. Channel Voice Messages.

Τα Channel Voice Messages αποτελούν τη ραχοκοκαλιά του πρωτοκόλλου MIDI και στέλνουν, από ένα
όργανο σε άλλο, όλα τα συµβάντα που σχετίζονται µε την εκτέλεση µιας µουσικής πράξης, χρησιµοποιώντας
οποιοδήποτε από τα 16 υπάρχοντα κανάλια. Μεταδίδουν τον αριθµό του καναλιού (MIDI channel)
χρησιµοποιώντας το δεύτερο µισό του status byte, καθώς και πληροφορίες που αφορούν στα µουσικά
συµβάντα. Στον Πίνακα 6.5, παρατίθενται οι ορισµοί και οι τύποι τέτοιων µηνυµάτων. Τα status και data
bytes δίνονται σε δυαδική µορφή. Όπου n = channel number (1-16), k = key number (0-127), v = velocity (0-
127), p = pressure (0-127), x = controller value (0-127), y = preset number (0-127), z = coarse, f = fine.

194
Status Byte Data Byte 1 Data Byte 2 Περιγραφή
1000 nnnn 0kkkkkkk 0vvvvvvv Note Off
1001 nnnn 0kkkkkkk 0vvvvvvv Note On
1010 nnnn 0kkkkkkk 0ppppppp Polyphonic Key Pressure (Aftertouch)
1011 nnnn 0ccccccc 0xxxxxxx Control Change
1100 nnnn 0yyyyyyy - Program Change
1101 nnnn 0ppppppp - Channel Pressure (Aftertouch)
1110 nnnn 0zzzzzzz 0fffffff Pitch Bend

Πίνακας 6.5 MIDI Channel Voice Messages.

Παρακάτω δίνεται ένα παράδειγµα ενός µηνύµατος Channel Voice :

10010000 00111100 01000001

Η ανάλυσή του:

• Status byte (10010000). Το πρώτο bit (1) δηλώνει ότι πρόκειται για status byte και τα
επόµενα τρία (001) ότι είναι µια εντολή note on. Τα τελευταία τέσσερα bits καθορίζουν το
MIDI κανάλι (0000 = κανάλι 1).
• Data byte 1 (00111100). Το πρώτο data byte πληροφορεί για το ποιο πλήκτρο πατήθηκε (key
number: 60 = C3).
• Data byte 2 (01000001). Το δεύτερο data byte καθορίζει το velocity (ένταση = 65).

Ας δούµε τα Channel Voice Messages αναλυτικά.

6.1.12.1.1. Note On.

Κάθε φορά που πατούµε ένα πλήκτρο σε ένα MIDI πληκτροφόρο όργανο, αποστέλλεται ένα µήνυµα note on.
Το MIDI χρησιµοποιεί δύο ξεχωριστά µηνύµατα όταν παίζουµε µια νότα: το note on και το note off. Αυτό
σηµαίνει ότι ένα MIDI όργανο θα στείλει τα µηνύµατα note on και note off σε ένα άλλο όργανο ή σε έναν
ψηφιακό συνθετητή ο οποίος θα παίξει τη νότα. Αυτά τα µηνύµατα στέλνονται σε ένα από τα 16 κανάλια.
Άρα, τα Note Messages ανήκουν στην κατηγορία των Channel Messages. Οποιοδήποτε όργανο βρίσκεται στο
ίδιο κανάλι µε αυτό του οργάνου-αποστολέα, θα παίξει τις ίδιες νότες. Όπως είδαµε, ένα µήνυµα note on
αποτελείται από ένα status byte και δύο data bytes. Το status byte χρησιµοποιεί τρία bits για να δηλώσει ότι
πρόκειται για µήνυµα note on (1 001) και τα τέσσερα τελευταία bits για να ορίσει τον αριθµό καναλιού. Το
πρώτο data byte δηλώνει το key number και το δεύτερο το velocity. Και τα δύο µπορούν να πάρουν τιµές από
το 0 ως το 127. Θυµίζουµε ότι το πρώτο ψηφίο του status (1) και των data bytes (0) χρησιµοποιούνται για να
δηλώσουν το είδος τους και άρα τα διαθέσιµα ψηφία για τη µεταφορά των πληροφοριών είναι επτά.

Key Number.

Το πρωτόκολλο MIDI αντιστοιχεί σε κάθε πλήκτρο (νότα) ενός πληκτροφόρου οργάνου ένα ξεχωριστό key
number. Σε κάθε MIDI όργανο υπάρχουν 128 πιθανές τιµές, υπεραρκετές αν αναλογιστούµε ότι ένα
συνηθισµένο πληκτροφόρο όργανο δεν έχει περισσότερα από 88 πλήκτρα. Το χαµηλότερο key number είναι
το 0 που αντιστοιχεί στη νότα Ντο, πέντε οκτάβες χαµηλότερα του µεσαίου Ντο (οκτάβα -2). Η χαµηλότερη
νότα του πιάνου βρίσκεται 2 οκτάβες ψηλότερα (key number 24 στην οκτάβα 0). Μετά το key number 0,
ακολουθεί το key number 1 (Ντο#), το key number 2 (Ρε) κ.λπ. Το ψηλότερο key number είναι το 127 και
αντιστοιχεί στο Σολ, πέντε οκτάβες ψηλότερα του µεσαίου Ντο (οκτάβα 8).
Στο σηµείο αυτό είναι σηµαντικό να υπενθυµίσουµε ότι το MIDI δε στέλνει ούτε δέχεται τονικά ύψη
(νότες), αλλά key numbers. Ανάλογα µε το πώς είναι διαµορφωµένος ο συνθετητής, το key number θα
διερµηνευθεί σε νότα, effect ή κάτι άλλο.

195
Στον Πίνακα 6.6 παρουσιάζονται τα τονικά ύψη ή MIDI note numbers (0-127) που ορίζονται από το
πρώτο data byte ενός µηνύµατος note on. Στη µέση περίπου του εύρους βρίσκεται το µεσαίο ντο (C3) το
οποίο αντιστοιχεί στο MIDI note number 60.

Πίνακας Αντιστοιχιών Νοτών σε MIDI Note Numbers.

MIDI Note Numbers (δεκαδικό σύστηµα)


8va C C# D D# E F F# G G# A A# B
-2 0 1 2 3 4 5 6 7 8 9 10 11
-1 12 13 14 15 16 17 18 19 20 21 22 23
0 24 25 26 27 28 29 30 31 32 33 34 35
1 36 37 38 39 40 41 42 43 44 45 46 47
2 48 49 50 51 52 53 54 55 56 57 58 59
3 60 61 62 63 64 65 66 67 68 69 70 71
4 72 73 74 75 76 77 78 79 80 81 82 83
5 84 85 86 87 88 89 90 91 92 93 94 95
6 96 97 98 99 100 101 102 103 104 105 106 107
7 108 109 110 111 112 113 114 115 116 117 118 119
8 120 121 122 123 124 125 126 127

Πίνακας 6.6 MIDI note numbers.

Πίνακας Αντιστοίχησης των MIDI Note Numbers σε Hertz.

Στον Πίνακα 6.7 αντιστοιχίζονται τα MIDI note numbers σε συχνότητες (Hertz).

Note MIDI note Hertz MIDI note Hertz MIDI note Hertz
C 0 8.175 12 16.351 24 32.703
C# 1 8.661 13 17.323 25 34.647
D 2 9.177 14 18.354 26 36.708
D# 3 9.722 15 19.445 27 38.890
E 4 10.300 16 20.601 28 41.203
F 5 10.913 17 21.826 29 43.653
F# 6 11.562 18 23.124 30 46.249
G 7 12.249 19 24.499 31 48.999
G# 8 12.978 20 25.956 32 51.913
A 9 13.750 21 27.500 33 55.000
A# 10 14.567 22 29.135 34 58.270
B 11 15.433 23 30.867 35 61.735
C 36 65.406 48 130.812 60 261.625
C# 37 69.295 49 138.591 61 277.182
D 38 73.416 50 146.832 62 293.664
D# 39 77.781 51 155.563 63 311.126
E 40 82.406 52 164.813 64 329.627
F 41 87.307 53 174.614 65 349.228
F# 42 92.498 54 184.997 66 369.994
G 43 97.998 55 195.997 67 391.995

196
G# 44 103.826 56 207.652 68 415.304
A 45 110.000 57 220.000 69 440.000
A# 46 116.540 58 233.081 70 466.163
B 47 123.470 59 246.941 71 493.883
C 72 523.251 84 1046.502 96 2093.004
C# 73 554.365 85 1108.730 97 2217.461
D 74 587.329 86 1174.659 98 2349.318
D# 75 622.253 87 1244.507 99 2489.015
E 76 659.255 88 1317.510 100 2637.020
F 77 698.456 89 1396.912 101 2793.826
F# 78 739.988 90 1479.977 102 2959.955
G 79 783.990 91 1567.981 103 3135.963
G# 80 830.609 92 1661.218 104 3322.4375
A 81 880.000 93 1760.000 105 3520.000
A# 82 932.327 94 1864.655 106 3729.310
B 83 987.766 95 1975.533 107 3951.066
C 108 4186.009 120 8372.018
C# 109 4434.922 121 8869.844
D 110 4698.636 122 9397.272
D# 111 4978.031 123 9956.063
E 112 5274.041 124 10548.082
F 113 5587.651 125 11175.303
F# 114 5919.910 126 11839.821
G 115 6271.926 127 12543.853
G# 116 6644.875
A 117 7040.000
A# 118 7458.620
B 119 7902.132

Πίνακας 6.7 MIDI note numbers σε Hertz.

6.1.12.1.2. Note Off.

Μόλις απελευθερώσουµε το πλήκτρο σε ένα MIDI πληκτροφόρο όργανο, ακολουθεί το µήνυµα note off ώστε
να σταµατήσει η παραγόµενη νότα. Ένα µήνυµα note off αποτελείται από ένα status byte και δύο data bytes.
Το status byte χρησιµοποιεί τα πρώτα τέσσερα bits για να δηλώσει ότι πρόκειται για µήνυµα note on (1 001)
και τα τέσσερα τελευταία για να ορίσει τον αριθµό καναλιού (nnnn). Το πρώτο data byte δηλώνει το key
number και το δεύτερο το velocity. Και τα δύο µπορούν να πάρουν τιµές από το 0 ως το 127. Αν και το
πρωτόκολλο MIDI προβλέπει ξεχωριστή εντολή για το µήνυµα note off, αυτό σπάνια χρησιµοποιείται. Αντί
αυτού, τη στιγµή που απελευθερώνουµε το πλήκτρο ή τη νότα, στέλνεται συνήθως ένα δεύτερο µήνυµα note
on µε το ίδιο key number (τονικό ύψος) αλλά µε velocity 0 (µηδενική ένταση). Το µήνυµα note off στέλνεται
σε συνθετητές που µπορούν να προσδιορίσουν το release velocity, πόσο γρήγορα δηλαδή απελευθερώνεται
ένα πλήκτρο, υπολογίζοντας την ταχύτητα της περιβάλλουσας απελευθέρωσης του πλήκτρου (release
envelope).

Velocity.

Αφού το µήνυµα note on στείλει το key number µε το πρώτο data byte, ακολουθεί ένα δεύτερο data byte που
δηλώνει πόσο γρήγορα (velocity) πατήθηκε το συγκεκριµένο πλήκτρο. Το velocity αντιστοιχεί στην ένταση
µε την οποία ακούµε τη συγκεκριµένη νότα που παίχτηκε. Η µικρότερη πιθανή τιµή του velocity είναι το 1
(που ίσως αντιστοιχεί σε pppp) και η µεγαλύτερη το 127 (ffff). Η τιµή 0 στο velocity αντιστοιχεί στην
απελευθέρωση του πλήκτρου.

197
vel. 1 vel. 127
pppp ppp pp p mp mf f ff fff ffff

Σε συνθετητές που χρησιµοποιούν τεχνικές σύνθεσης ήχου, το velocity χρησιµοποιείται συχνά για να ελέγξει
και άλλες παραµέτρους εκτός της έντασης, όπως η µετατροπή του τονικού ύψους, η φασµατική πυκνότητα
κ.ά. Αυτός είναι ένας από τους λόγους για τους οποίους αναφέρεται σαν velocity και όχι σαν ένταση
(volume).
To velocity δεν αποτελεί ξεχωριστή εντολή του MIDI. Είναι πάντα συνδεδεµένο µε τα µηνύµατα note
on και note off.

6.1.12.1.3. Polyphonic Key Pressure (Aftertouch).

Κάποιοι συνθετητές είναι εφοδιασµένοι µε έναν αισθητήρα κάτω από κάθε πλήκτρο τους έτσι ώστε να
µπορούν να αντιλαµβάνονται τις αλλαγές πίεσης του δαχτύλου σε κάθε ένα από αυτά. Για αυτόν τον λόγο η
συγκεκριµένη εντολή ονοµάζεται polyphonic key pressure ή keys aftertouch. To keys aftertouch
χρησιµοποιείται συχνά για την παραγωγή vibrato και συνεπώς παίζει σηµαντικό ρόλο στην εκφραστικότητα
της εκτέλεσης. Η εντολή keys aftertouch χρησιµοποιεί ένα status byte και δύο data bytes µε την εξής µορφή:

1010nnnn 0kkkkkkk 0ppppppp

Το status byte δηλώνει ότι πρόκειται για keys aftertouch (1 010) στο κανάλι nnnn. Το πρώτο data byte
(kkkkkkk = 0-127) δηλώνει το key number (πλήκτρο) ενώ το δεύτερο (ppppppp = 0-127) ορίζει τις συνεχείς
αλλαγές πίεσης (pressure) που εφαρµόζουµε στο συγκεκριµένο πλήκτρο.

6.1.12.1.4. Control Change.

Αυτά τα µηνύµατα ελέγχουν διάφορες παραµέτρους του ήχου (ανάλογα µε τον αριθµό του ελεγκτή που
χρησιµοποιείται κάθε φορά) σε πραγµατικό χρόνο. Ένα µήνυµα control change αποστέλλεται κάθε φορά που
αλλάζει µια τιµή του ελεγκτή, όπως για παράδειγµα όταν πατηθεί το sustain pedal ή όταν µετακινηθεί ο
τροχός modulation. Χρησιµοποιεί ένα status byte και δύο data bytes µε την εξής µορφή:

1011nnnn 0ccccccc 0xxxxxxx

Το status byte δηλώνει ότι πρόκειται για την εντολή control change (1 011) στο κανάλι nnnn. Το πρώτο data
byte (ccccccc = 0-119) δηλώνει τον αριθµό του ελεγκτή (controller number ή cc#) ενώ το δεύτερο (xxxxxxx
= 0-127) ορίζει τις τιµές που παίρνει ο ελεγκτής (controller value). Οι ελεγκτές cc# 120-127 ανήκουν στα
µηνύµατα Channel Mode και ελέγχουν τον τρόπο µε τον οποίο τα όργανα λαµβάνουν και χειρίζονται τα
µηνύµατα Channel Voice.

Πίνακας των Μηνυµάτων Control Change (cc#).

MIDI CC Λειτουργία
number
0 bank select
1 modulation wheel
2 breath controller
3 µη προκαθορισµένο
4 foot controller
5 portamento time
6 data entry MSB (Most Significant Bit)
7 main volume
8 balance

198
9 µη προκαθορισµένο
10 pan
11 expression
12 effect control 1
13 effect control 2
14 µη προκαθορισµένο
15 µη προκαθορισµένο
16-19 γενικής χρήσης 1-4
20-31 µη προκαθορισµένο
32-63 Least Significant Beat (LSB) για τους cc# 0-31
64 damper/sustain pedal
65 portamento
66 sostenuto
67 soft pedal
68 legato footswitch
69 hold 2
70 sound variation/exciter
71 harmonic content/compressor
72 release time/distortion
73 attack time/equalizer
74 brightness – VCFs cutoff frequency/expander-gate
75 µη προκαθορισµένο/reverb
76 µη προκαθορισµένο/delay
77 µη προκαθορισµένο/pitch transpose
78 µη προκαθορισµένο/flange-chorus
79 µη προκαθορισµένο/special effect
80-83 γενικής χρήσης 5-8
84 portamento control
85-90 µη προκαθορισµένο
91 reverb depth (effect 1)
92 tremolo depth (effect 2)
93 chorus depth (effect 3)
94 detune depth (effect 4)
95 phaser depth (effect 5)
96 data increment
97 data decrement
98 non-registered parameter number LSB
99 non-registered parameter number MSB
100 registered parameter number LSB
101 registered parameter number MSB
102-119 µη προκαθορισµένο
120 all sound off
121 reset all controllers
122 local on/off control
123 all notes off
124 omni mode off
125 omni mode on
126 mono mode on
127 poly mode on

Πίνακας 6.8 Λίστα MIDI cc#.

199
6.1.12.1.5. Program και Program Change.

Όλα τα µηχανήµατα MIDI είναι εφοδιασµένα µε θέσεις µνήµης (patch memories) στις οποίες αποθηκεύουν
µε τη µορφή πληροφοριών οµάδες ήχων, παραµέτρων, ρυθµικών µοτίβων κ.λπ. Αυτές οι οµάδες
πληροφοριών λέγονται programs. Για παράδειγµα, οι παράµετροι που ελέγχουν τη γεννήτρια ήχου που
παράγει το ηχόχρωµα του πιάνου είναι ένα program. Υπάρχουν συνεπώς programs που ονοµάζονται electric
piano, celesta, όργανο Hammond, strings, synth pad1 κ.ά. Ένας κωδικός που ονοµάζεται program change
δίνει την εντολή σε ένα όργανο να αλλάξει πρόγραµµα. Κάθε program αντιστοιχεί σε έναν συγκεκριµένο
αριθµό από το 1 ως το 127.
Όταν πατούµε το κουµπί patch πάνω σε ένα όργανο συµβαίνουν δύο πράγµατα: α) το όργανο επιλέγει
τον ήχο που ζητήσαµε και ετοιµάζεται να τον παίξει, και β) αποστέλλει µέσω MIDI τον αριθµό του
επιλεγµένου patch στα άλλα όργανα που βρίσκονται στο ίδιο κανάλι, ώστε αυτά να συντονιστούν. Πρέπει
βέβαια να σηµειώσουµε ότι αυτό που αποστέλλεται είναι µόνο ο αριθµός του patch και όχι οι παράµετροι του
ήχου.
Τα programs, εκτός από τις παραµέτρους για την παραγωγή ήχου, µπορούν να περιέχουν ρυθµίσεις
και για την επεξεργασία του µέσω ενός effect (filter, delay, reverb κ.ά.)
Η εντολή program change αποτελείται από ένα status byte και ένα data byte µε τη µορφή:

1100nnnn 0yyyyyyy

Το status byte δηλώνει ότι πρόκειται για την εντολή program change (1 100) στο κανάλι nnnn ενώ το data
byte (yyyyyyy = 0-127) ορίζει το program που επιλέγουµε.

6.1.12.1.6. Channel Pressure (Aftertouch).

Πολλοί συνθετητές είναι εφοδιασµένοι µε έναν αισθητήρα κάτω από τα πλήκτρα, ο οποίος αντιλαµβάνεται τις
αλλαγές πίεσης του δαχτύλου πάνω σε αυτά. Θα πρέπει να σηµειωθεί ότι ο αισθητήρας των οργάνων που
είναι εφοδιασµένα µε channel pressure, αντιλαµβάνεται τις τροποποιήσεις στην πίεση µε τον ίδιο τρόπο για
όλα τα πλήκτρα του πληκτρολογίου και όχι για το καθένα ξεχωριστά. Πρόκειται για µια δεύτερη περίπτωση
aftertouch η οποία διαφοροποιείται από το Polyphonic Key Pressure. Μια άλλη ονοµασία της είναι Channel
Key Pressure ή Overall Key Pressure. To aftertouch χρησιµοποιείται συχνά για την παραγωγή vibrato και
συνεπώς, παίζει σηµαντικό ρόλο στην εκφραστικότητα της εκτέλεσης. Η εντολή channel aftertouch
χρησιµοποιεί ένα status byte και ένα data byte µε την εξής µορφή:

1101nnnn 0ppppppp

Το status byte δηλώνει ότι πρόκειται για channel aftertouch (1 101) στο κανάλι nnnn ενώ το data byte
(ppppppp = 0-127) περιγράφει τις συνεχείς αλλαγές πίεσης (pressure value) που εφαρµόζουµε στα πλήκτρα.

6.1.12.1.7. Pitch Bend.

Κάθε φορά που µετακινείται ο τροχός pitch bend (Εικόνα 6.2), αποστέλλεται µια εντολή η οποία µεταβάλλει
δυναµικά το τονικό ύψος της νότας. Το εύρος αυτής της µεταβολής ταυτίζεται µε το εύρος κίνησης του
τροχού pitch bend (bend range) ο οποίος βρίσκεται σχεδόν σε όλα τα MIDI όργανα. Μπορούµε να ορίσουµε
ότι ο τροχός pitch bend θα έχει εύρος από ένα ηµιτόνιο έως και αρκετές οκτάβες.

200
Εικόνα 6.2 Οι τροχοί pitch bend και modulation σε ένα MIDI όργανο.

Η εντολή pitch bend χρησιµοποιεί ένα status byte και δύο data bytes µε την εξής µορφή:

1110nnnn 0zzzzzzz 0fffffff

Το status byte δηλώνει ότι πρόκειται για εντολή pitch bend (1 110) στο κανάλι nnnn. Τα δύο data bytes
χρησιµοποιούνται για να δώσουν περισσότερες από 128 τιµές στην κίνηση του τροχού pitch bend. Έτσι, τα 14
ψηφία των δύο data bytes µπορούν να προσφέρουν έως και 16.384 τιµές που αντιστοιχούν σε θέσεις του
τροχού.

MSB (Most Significant Byte)-LSB (Least Significant Byte).

Μερικές φορές χρειαζόµαστε περισσότερες από τις 128 τιµές ενός byte για να περιγράψουµε τις διαβαθµίσεις
µιας παραµέτρου, όπως αυτής του pitch bend. Αυτό θα µας επιτρέψει να αποδώσουµε την κίνηση του τροχού
µε µεγαλύτερη ανάλυση έτσι ώστε να αντιληφθούµε την αλλαγή του τονικού ύψους της νότας συνεχόµενα
και όχι µε διακριτά βήµατα. Για αυτόν τον σκοπό χρησιµοποιούµε δύο bytes (14 bits) και άρα 16.384 (214)
τιµές. Σε αυτήν την περίπτωση, το πρώτο data byte ονοµάζεται Most Significant Byte-MSB (cc#0-31) και το
δεύτερο ονοµάζεται Least Significant Byte-LSB (cc#32-63).

6.1.12.2. Channel Mode Messages.

Τα µηνύµατα αυτού του τύπου χρησιµοποιούν τους ελεγκτές cc#120 έως cc#127 και ορίζουν τον τρόπο µε
τον οποίο ένα όργανο θα δεχθεί τις πληροφορίες των µηνυµάτων Channel Voice. Για παράδειγµα, µηνύµατα
Channel Mode µπορούν να δώσουν εντολή σε έναν συνθετητή να στείλει ή να λάβει πληροφορίες µε έναν
συγκεκριµένο τρόπο (mode). Όλα χρησιµοποιούν το Control Change status byte (1 011). Το πρώτο data byte
προσδιορίζει τον συγκεκριµένο τρόπο. Υπάρχουν οι εξής τύποι µηνυµάτων Channel Mode: all sound off,
reset all controllers, local control, all notes off, omni off, omni on, mono on και poly on (cc#120-cc#127).

6.1.12.2.1. All Sound Off (cc# 120).

Όταν ληφθεί αυτή η εντολή, θα διακοπεί η λειτουργία όλων των ενεργών ταλαντωτών που παράγουν τη νότα
σε ένα όργανο στο κανάλι MIDI που δηλώνεται από το status byte της εντολής. Για να συµβεί αυτό, το
δεύτερο data byte θα πρέπει να ισούται µε 0.

201
6.1.12.2.2. Reset All Controllers (cc# 121).

Όταν ληφθεί αυτή η εντολή, όλες οι τιµές των ελεγκτών επανέρχονται στις αρχικές ρυθµίσεις τους. Για να
συµβεί αυτό, το δεύτερο data byte θα πρέπει να ισούται µε 0.

6.1.12.2.3. Local Control (cc# 122).

Διαχωρίζει τις λειτουργίες των χειριστηρίων και των ελεγκτών ενός συνθετητή από τις ηλεκτρονικές του
µονάδες παραγωγής ήχου. Για παράδειγµα το local control (cc# 122: on = 127 / off = 0) ενεργοποιεί ή
διακόπτει την επικοινωνία από το πληκτρολόγιο ενός συνθετητή προς την ηλεκτρονική µονάδα του
συνθετητή που θα παράξει τον ήχο. Έτσι, αν σε έναν συνθετητή, θέλουµε ο ήχος να παράγεται από τις
εντολές που έρχονται από τον υπολογιστή και όχι από τα πλήκτρα του, θα πρέπει να χρησιµοποιήσουµε αυτήν
την εντολή για να απενεργοποιήσουµε τον τοπικό έλεγχο του συνθετητή. Με αυτόν τον τρόπο αποφεύγουµε
να ακουστεί η ίδια νότα δύο φορές. Ανεξάρτητα από το αν ένα όργανο βρίσκεται σε local control on ή local
control off, οι νότες και άλλες MIDI πληροφορίες εξακολουθούν να κατευθύνονται προς την έξοδο MIDI Out
του οργάνου.

6.1.12.2.4. All Notes Off (cc# 123).

Συχνά, µετά την αποστολή µηνυµάτων note on, κάποια από τα αντίστοιχα µηνύµατα note off που πρέπει να
ακολουθήσουν χάνονται, µε αποτέλεσµα οι νότες στις οποίες απευθύνονταν να συνεχίσουν να ηχούν
ακατάπαυστα. Το µήνυµα all notes off στέλνει µια εντολή παύσης αυτών των νοτών χρησιµοποιώντας το
δεύτερο data byte που ισούται µε 0.

6.1.12.2.5. Omni Off (cc# 124).

Το όργανο που δέχεται αυτήν την εντολή, ανταποκρίνεται µόνο στα µηνύµατα που το κανάλι αποστολής τους
(send channel) είναι το ίδιο µε το κανάλι υποδοχής του οργάνου (receive channel). Στην ουσία, η εντολή
Omni Off (µε δεύτερο data byte που ισούται µε 0) έχει την ίδια επίδραση µε την εντολή All Notes Off.

6.1.12.2.6. Omni On (cc# 125).

Το όργανο που δέχεται την εντολή Omni On (cc#125) ανταποκρίνεται σε όλα τα µηνύµατα Channel Voice
ανεξάρτητα από το κανάλι από το οποίο αυτά στέλνονται.

6.1.12.2.7. Mono On (cc# 126).

Το όργανο που δέχεται την εντολή Mono On (cc#126) µετατρέπεται σε µονοφωνικό. Σε αυτήν την περίπτωση
και ανάλογα µε τις ρυθµίσεις του, όταν το όργανο στείλει ένα πολυφωνικό µήνυµα (περισσότερα του ενός
note on µηνύµατα), θέτει συγκεκριµένες προτεραιότητες για το ποια νότα θα παιχτεί πρώτη. Αυτές οι
προτεραιότητες είναι:

• First Note Priority: όταν παίζονται πολλές νότες µαζί (συνήχηση), δίνεται προτεραιότητα στη
νότα που προηγείται χρονικά έστω και κατ’ ελάχιστο.
• Last Note Priority: όταν παίζονται πολλές νότες µαζί, δίνεται προτεραιότητα στη νότα που
έπεται χρονικά.
• Hi Priority: όταν παίζονται πολλές νότες µαζί, δίνεται προτεραιότητα στη νότα µε τον
υψηλότερο τόνο (high note number).
• Low Priority: όταν παίζονται πολλές νότες µαζί, δίνεται προτεραιότητα στη νότα µε τον
χαµηλότερο τόνο (low note number).

202
6.1.12.2.8. Poly On (cc# 127).

Το όργανο που δέχεται το µήνυµα Poly On (cc#127) µετατρέπεται σε πολυφωνικό, µπορεί να παίξει δηλαδή
περισσότερες από µια νότες σε κάθε κανάλι. Ο αριθµός των νοτών οι οποίες µπορούν να παιχτούν
ταυτόχρονα εξαρτάται από το ίδιο το όργανο. Για παράδειγµα, ένα όργανο µε πολυφωνία 128 νοτών µπορεί
να αναπαράξει ταυτόχρονα 128 νότες ή να θέσει σε λειτουργία 128 ταλαντωτές (oscillators). Σε περίπτωση
που ο αριθµός των νοτών υπερβαίνει τη διαθέσιµη πολυφωνία, οι υπεράριθµες νότες αντιµετωπίζονται
σύµφωνα µε τις προτεραιότητες που είδαµε στην περίπτωση Mono On.
Υπάρχουν τέσσερις τρόποι (modes) συνδυασµού Omni και Mono/Poly, όπως φαίνεται στον Πίνακα
6.9:

mode 1 omni on και poly on Το όργανο δέχεται MIDI µηνύµατα από όλα τα κανάλια και
λειτουργεί πολυφωνικά.
mode 2 omni on και mono on Το όργανο δέχεται MIDI µηνύµατα από όλα τα κανάλια και
λειτουργεί µονοφωνικά.
mode 3 omni off και poly on Το όργανο δέχεται MIDI µηνύµατα από ένα προκαθορισµένο
κανάλι και λειτουργεί πολυφωνικά.
mode 4 omni off και mono on Το όργανο δέχεται MIDI µηνύµατα από ένα προκαθορισµένο
κανάλι, τα οποία µοιράζονται σε προκαθορισµένο αριθµό
φωνών.

Πίνακας 6.9 Συνδυασµοί Omni-Mono/Poly.

Ένα µήνυµα Channel Mode έχει την εξής µορφή:

1011nnnn 0ccccccc 0fffffff

όπου n = κανάλι MIDI, c = controller number (cc#120-127) και f = λειτουργία (mode’s function).

Στον Πίνακα 6.10 δίνονται τα µηνύµατα Channel Mode.

Status Byte Data Byte 1 Data Byte 2 Data Byte 3 Περιγραφή


1011nnnn 01111010 (cc#122) 00000000 [0 = off] 01111111 [127 = on] Local Control
1011nnnn 01111011 (cc#123) 00000000 [0] All Notes Off
1011nnnn 01111100 (cc#124) 00000000 [0] Omni Off
1011nnnn 01111101 (cc#125) 00000000 [0] Omni On
1011nnnn 01111110 (cc#126) 0mmmmmmm (m = Mono On
αριθµός καναλιών)
1011nnnn 01111111 (cc#127) 00000000 [0] Poly Off

Πίνακας 6.10 Μηνύµατα Channel Mode.

6.1.12.3. System Messages.

Τα µηνύµατα τύπου System δεν περιέχουν αριθµό MIDI καναλιού στο δεύτερο µισό του status byte και
απευθύνονται σε όλα τα όργανα ενός δικτύου MIDI. To status byte ενός µηνύµατος τύπου System έχει τη
µορφή 1111xxxx, όπου το πρώτο ψηφίο (1) δηλώνει ότι πρόκειται για status byte, τα επόµενα τρία ψηφία
(111) ότι πρόκειται για System Message ενώ τα τέσσερα τελευταία (xxxx) αναφέρονται στη λειτουργία του
µηνύµατος.

203
6.1.12.4. System Real Time Messages.

Τα MIDI όργανα είναι εφοδιασµένα µε εσωτερικούς ωρολογιακούς µηχανισµούς (MIDI clocks) µε τους
οποίους ελέγχουν διάφορες χρονικές λειτουργίες όπως το tempo ενός sequencer, η ταχύτητα ανάγνωσης ενός
αρχείου κ.ά. Όταν αυτά τα όργανα πρέπει να συνδεθούν και να επικοινωνήσουν µεταξύ τους στο ίδιο MIDI
δίκτυο τότε απαιτείται οι λειτουργίες τους να είναι συγχρονισµένες. Για αυτόν τον σκοπό ένα από τα όργανα
του δικτύου ρυθµίζεται ώστε να ελέγχει όλα τα υπόλοιπα. Σε αυτήν την περίπτωση, όταν δηλαδή ένα όργανο
ελέγχει τα υπόλοιπα µε το δικό του εσωτερικό ρολόι, βρίσκεται σε λειτουργία master mode ή internal sync.
Τα άλλα όργανα που δέχονται τον χρονικό έλεγχο είναι ρυθµισµένα σε slave mode ή external sync. Ο
συγχρονισµός που προσφέρει το MIDI clock είναι σχετικός γιατί εξαρτάται από τις ρυθµίσεις του tempo.
Τα System Real Time Messages αποτελούνται µόνο από status bytes, χρησιµοποιούνται για να
συγχρονίσουν τα µέρη ενός MIDI συστήµατος και δεν περιέχουν αριθµό καναλιού. Περιφερειακά
µηχανήµατα, αλλά και προγράµµατα σε µορφή λογισµικού µπορούν να επικοινωνήσουν και να
συγχρονιστούν µεταξύ τους µέσω του συστήµατος που ονοµάζεται System Real Time. Μηνύµατα Real Time
επιτρέπουν σε ένα όργανο να επικοινωνήσει µε κάποιο άλλο και να στείλει εντολές για το πότε να ξεκινήσει
(start) και να σταµατήσει (stop) µια νότα, πόσο γρήγορα να παιχτεί, πότε να αλλαχτεί το tempo, ποια θα είναι
η συχνότητα ενός LFO (Low Frequency Oscillator) κ.λπ. Για τέτοιες ανάγκες συγχρονισµού, πολλά MIDI
όργανα είναι εφοδιασµένα µε ένα εσωτερικό ρολόι το οποίο στέλνει 24 παλµούς ανά νότα αξίας ενός
τετάρτου (24 PPQN-Pulses Per Quartet Note).

6.1.12.5. System Common Messages.

Τα µηνύµατα System Common και System Real Time ανήκουν στην κατηγορία System Messages. Τα
µηνύµατα System Common επαυξάνουν τις λειτουργίες κάποιων MIDI εντολών. Επειδή είναι «κοινά»
(common) δεν έχουν συγκεκριµένο αριθµό καναλιού. Τα System Common Messages αποτελούνται από ένα
αρχικό status byte µε τη µορφή 1111xxxx και ένα ή περισσότερα data bytes. Στον Πίνακα 6.11
παρουσιάζονται κάποια µηνύµατα System Common.

MIDI Time Code.

Όπως είδαµε πιο πάνω, το MIDI clock προσφέρει σχετικό συγχρονισµό, καθώς εξαρτάται από τις ρυθµίσεις
του tempo του κοµµατιού. Για τη χρονική λειτουργία όµως του MIDI µε την εικόνα (video, κινηµατογράφος,
τηλεόραση) απαιτείται απόλυτος συγχρονισµός. Για αυτόν το σκοπό δηµιουργήθηκε το MIDI Time Code
(MTC). Πρόκειται για ένα πρωτόκολλο µέσα στο πρωτόκολλο MIDI το οποίο συγχρονίζει MIDI µηχανήµατα
που λειτουργούν µε βάση τον χρόνο. Χρησιµοποιείται για τον συγχρονισµό MIDI µηνυµάτων στην παραγωγή
video, ταινιών και τηλεοπτικών προγραµµάτων. Επειδή η βιοµηχανία κινηµατογράφου είχε ήδη αναπτύξει
τον δικό της κώδικα συγχρονισµού µε την ονοµασία (SMPTE-Society of Motion Picture and Television
Engineers), το MTC λειτουργεί ως ένας ενδιάµεσος κώδικας επικοινωνίας µεταξύ του MIDI και του SMPTE.
Έτσι, διαφορετικά ηλεκτρονικά όργανα µπορούν να συγχρονιστούν µεταξύ τους καθοδηγούµενα από το MTC
και το SMPTE. Για παράδειγµα, ένα DAW µπορεί να συγχρονιστεί µε ένα video για την παραγωγή µουσικής
για την εικόνα. Στο παράθυρο του DAW θα εµφανιστεί ένα άλλο παράθυρο µε την ακριβή ένδειξη του
χρόνου και τις υποδιαιρέσεις ώρας, λεπτών, δευτερολέπτων και frames (Εικόνα 6.3). Η ακριβής χρονική θέση
ορίζεται από ένα µήνυµα τύπου System Common το οποίο ονοµάζεται MIDI Time Code Quarter Frame
(11110001).

Εικόνα 6.3 Εµφάνιση MIDI Time Code σε περιβάλλον DAW.

204
Τα frames ή καρέ αποτελούν χρονικές υποδιαιρέσεις του δευτερολέπτου. Ο αριθµός τους ανά δευτερόλεπτο
(Frames Per Second-FPS) ονοµάζεται frame rate ή frame frequency και δηλώνει τον αριθµό των
συνεχόµενων εικόνων που εµφανίζονται σε ένα δευτερόλεπτο σε µια κινηµατογραφική ταινία, σε ένα video,
σε γραφικά υπολογιστών κ.λπ. Η βιοµηχανία κινηµατογράφου χρησιµοποιεί τη συχνότητα των 24 FPR ενώ
στην τηλεόραση και στο ψηφιακό βίντεο χρησιµοποιούνται τα 24, 25 και 30 FPS. Η παλαιότερη ταινία φιλµ
Super 8 χρησιµοποιούσε συχνότητα 18 FPS.
Ο Πίνακας 6.11 περιγράφει τα µηνύµατα System Real Time και System Common. Το δεύτερο µισό
των status bytes ορίζει τη λειτουργία του µηνύµατος.

Status Byte Περιγραφή


11110000 System Exclusive
11110001 MIDI Time Code Quarter Frame
11110010 Song Position Pointer
11110011 Song Select
11110110 Tune Request
11110111 End of System Exclusive
11111000 Timing Clock
11111010 Start (song)
11111011 Continue
11111100 Stop
11111110 Active Sensing
11111111 System Reset

Πίνακας 6.11 Περιγραφή µηνυµάτων System Real Time και System Common.

6.1.12.6. System Exclusive Messages (SysEx).

Κάθε εταιρία παραγωγής ηλεκτρονικών µουσικών οργάνων παράγει και εφαρµόζει τη δική της τεχνολογία για
τα όργανά της. Για παράδειγµα, τα programs τα οποία καθορίζουν τον τρόπο παραγωγής ενός ήχου διαφέρουν
από εταιρία σε εταιρία αλλά και από όργανο σε όργανο της ίδιας εταιρίας. Τα µηνύµατα System Exclusive
µεταφέρουν τις πληροφορίες που αφορούν στις ιδιαιτερότητες των διαφορετικών οργάνων. Μεταφέρουν για
παράδειγµα τη µνήµη ενός συνθετητή που σχετίζεται µε τα ηχοχρώµατα που παράγει σε ένα άλλο συµβατό
όργανο. Αυτή η διαδικασία ονοµάζεται dump.
Κάθε όργανο διαθέτει τον δικό του ιδιαίτερο αριθµό (exclusive number ή SysEx ID) ο οποίος του
επιτρέπει να επικοινωνεί µε όργανα άλλων εταιριών και να µεταφέρει σε αυτά πληροφορίες σχετικές µε τα
programs που διαθέτει.
Ένα µήνυµα System Exclusive ξεκινά µε ένα status byte 11110000 (όπου το πρώτο ψηφίο 1 δηλώνει
ότι πρόκειται για status byte, τα επόµενα τρία ψηφία 111 ότι είναι µια εντολή τύπου system και τα τέσσερα
τελευταία ψηφία ότι το µήνυµα είναι System Exclusive). Μετά το status byte ακολουθεί µια σειρά από data
bytes που ενηµερώνουν για την ταυτότητα της κατασκευάστριας εταιρίας και του συγκεκριµένου οργάνου
(manufacturer ID#, instrument model ID#, device ID#). Στη συνέχεια, ακολουθεί µια δεύτερη οµάδα από data
bytes τα οποία µεταφέρουν πληροφορίες για τα programs και το όργανο. Τελευταίο τµήµα της εντολής είναι
το status byte 11110111 το οποίο δηλώνει το τέλος του µηνύµατος System Exclusive (End of SysEx).

6.1.13. General MIDI (GM).

Το πρωτόκολλο MIDI προσέφερε τη δυνατότητα σε µουσικούς που χρησιµοποιούν ηλεκτρονικά όργανα και
υπολογιστές να δηµιουργούν και να µοιράζονται κοινά αρχεία µε τις παραµέτρους της µουσική τους
(Standard MIDI files). Τα διάφορα όργανα όµως που διάβαζαν αυτά τα αρχεία δεν τα έπαιζαν πάντα µε τους
ίδιους ήχους. Διαφορετικά όργανα χρησιµοποιούσαν συχνά διαφορετικά ηχοχρώµατα για να αναπαράξουν το
ίδιο αρχείο, ανάλογα µε τις ρυθµίσεις που είχε το καθένα. Το 1991, οι εκπρόσωποι των MIDI Manufacturers
Association και Japan MIDI Standards Committee κλήθηκαν να λύσουν αυτό το ζήτηµα ασυµβατότητας.

205
Δηµιούργησαν ένα νέο πρωτόκολλο µε την ονοµασία General MIDI System Level 1, το οποίο έγινε γνωστό
ως General MIDI ή GM. Το 1999 η MIDI Manufacturers Association προχώρησε σε µια σηµαντική επέκταση
εισάγοντας το General MIDI Level 2 ή GM2 για να συµπεριλάβει περισσότερους ελεγκτές, programs κ.ά.
Το General MIDI ορίζει τις παρακάτω προδιαγραφές συµβατότητας που πρέπει να διαθέτει ένα
όργανο MIDI (πληκτροφόρα όργανα, κάρτες ήχου, plugins κ.λπ.).

• 16 κανάλια τα οποία µπορούν να παίζουν ταυτόχρονα διαφορετικές νότες και ηχοχρώµατα.


• Στο κανάλι 10 ανατίθενται τα ηχοχρώµατα των κρουστών οργάνων (drum set).
• Ένα GM MIDI όργανο πρέπει να είναι multitimbral, να µπορεί δηλαδή να αναπαράξει
ταυτόχρονα περισσότερα του ενός όργανα.
• Πολυφωνία τουλάχιστον 24 νοτών.
• Μνήµη µε τουλάχιστον 128 διαφορετικά programs (Πίνακας 6.12).
• Υποστήριξη και υποδοχή µηνυµάτων από τους ελεγκτές cc# 1, 7, 10, 64, 121 και 123.
• Υποστήριξη των µηνυµάτων velocity, pitch bend και channel pressure (aftertouch).
• Αναπαραγωγή όλων των κρουστών ηχοχρωµάτων από ξεχωριστά πλήκτρα των
πληκτροφόρων οργάνων (percussion mapping) (Πίνακας 6.13).

Ένα General MIDI όργανο διαθέτει 16 αποθηκευτικές µονάδες (banks) οι οποίες περιέχουν τουλάχιστον 8
ηχοχρώµατα (programs) η καθεµία. Στον Πίνακα 6.12 δίνεται η χαρτογράφηση των οργάνων (programs) σε
µια τυπική GM MIDI συσκευή.

PIANO CHROMATIC ORGAN GUITAR


PERCUSSION
1. Acoustic grand 9. Celesta 17. Hammond organ 25. Guitar (nylon
(Drawbar) strings)
2. Bright acoustic 10. Glockenspiel 18. Percussive organ 26. Guitar (steel strings)
3. Electric grand 11. Music box 19. Rock organ 27. Electric jazz guitar
4. Honky-tonk 12. Vibraphone 20. Church organ 28. Electric clean guitar
5. Electric piano 1 13. Marimba 21. Reed organ 29. Electric muted
guitar
6. Electric piano 2 14. Xylophone 22. Accordion 30. Overdriven guitar
7. Harpsichord 15. Tubular bell 23. Harmonica 31. Distortion guitar
8. Clavinet 16. Dulcimer 24. Tango accordion 32. Guitar harmonics
BASS SOLO STRINGS ENSEMBLE BRASS
33. Acoustic bass 41. Violin 49. String ensemble 1 57. Trumpet
34. Electric bass (finger) 42. Viola 50. String ensemble 2 58. Trombone
35. Electric bass (pick) 43. Cello 51. Synthstrings 1 59. Tuba
36. Fretless bass 44. Contrabass 52. Synthstrings 2 60. Muted trumpet
37. Slap bass 1 45. Tremolo strings 53. Choir Aahs 61. French Horn
38. Slap bass 2 46. Pizzicato strings 54. Voice Oohs 62. Brass section
39. Synth bass 1 47. Orchestral strings 55. Synth voice 63. Synthbrass 1
40. Synth bass 2 48. Timpani 56. Orchestra hit 64. Synthbrass 2
REED PIPE SYNTH LEAD SYNTH PAD
65. Soprano sax 73. Piccolo 81. Lead 1 (square) 89. Pad 1 (new age)
66. Alto sax 74. Flute 82. Lead 2 (sawtooth) 90. Pad 2 (warm)
67. Tenor sax 75. Recorder 83. Lead 3 (calliope) 91. Pad 3 (polysynth)
68. Baritone sax 76. Pan flute 84. Lead 4 (chiff) 92. Pad 4 (choir)
69. Oboe 77. Blown bottle 85. Lead 5 (charang) 93. Pad 5 (bowed)
70. English horn 78. Shakuhachi 86. Lead 6 (voice) 94. Pad 6 (metallic)
71. Bassoon 79. Whistle 87. Lead 7 (fifths) 95. Pad 7 (halo)
72. Clarinet 80. Ocarina 88. Lead 8 (bass+lead) 96. Pad 8 (sweep)
SYNTH EFFECTS ETHNIC PERCUSSIVE SOUND EFFECTS
97. FX 1 (rain) 105. Sitar 113. Tinkle bell 121. Guitar fret noise

206
98. FX 2 (soundtrack) 106. Banjo 114. Agogo 122. Breath noise
99. FX 3 (crystal) 107. Shamisen 115. Steel drum 123. Seashore
100. FX 4 (atmosphere) 108. Koto 116. Woodblock 124. Bird tweet
101. FX 5 (brightness) 109. Kalimba 117. Taiko drum 125. Telephone ring
102. FX 6 (goblins) 110. Bagpipe 118. Melodic tom 126. Helicopter
103. FX 7 (echoes) 111. Fiddle 119. Synth drums 127. Applause
104. FX 8 (sci-fi) 112. Shanai 120. Reverse cymbal 128. Gunshot

Πίνακας 6.12 Χαρτογράφηση οργάνων στο General MIDI.

Στον Πίνακα 6.13 δίνονται τα ηχοχρώµατα κρουστών οργάνων στο κανάλι 10 και τα αντίστοιχα πλήκτρα τους
που υποστηρίζονται από ένα General MIDI Level 1 όργανο.

Πλήκτρο Νότα Κρουστό Πλήκτρο Νότα Κρουστό


35 B0 Acoustic Bass Drum 59 B2 Ride Cymbal 2
36 C1 Bass Drum 1 60 C3 Hi Bongo
37 C#1 Side Stick 61 C#3 Low Bongo
38 D1 Acoustic Snare 62 D3 Mute Hi Conga
39 D#1 Hand Clap 63 D#3 Open Hi Conga
40 E1 Electric Snare 64 E3 Low Conga
41 F1 Low Floor Tom 65 F3 High Timbale
42 F#1 Closed Hi Hat 66 F#3 Low Timbale
43 G1 High Floor Tom 67 G3 High Agogo
44 G#1 Pedal Hi Hat 68 G#3 Low Agogo
45 A1 Low Tom 69 A3 Cabasa
46 A#1 Open Hi Hat 70 A#3 Maracas
47 B1 Low-Mid Tom 71 B3 Short Whistle
48 C2 Hi Mid Tom 72 C4 Long Whistle
49 C#2 Crash Cymbal 1 73 C#4 Short Guiro
50 D2 High Tom 74 D4 Long Guiro
51 D#2 Ride Cymbal 1 75 D#4 Claves
52 E2 Chinese Cymbal 76 E4 Hi Wood Block
53 F2 Ride Bell 77 F4 Low Wood Block
54 F#2 Tambourine 78 F#4 Mute Cuica
55 G2 Splash Cymbal 79 G4 Open Cuica
56 G#2 Cowbell 80 G#4 Mute Triangle
57 A2 Crash Cymbal 2 81 A4 Open Triangle
58 A#2 Vibraslap

Πίνακας 6.13 Χαρτογράφηση κρουστών οργάνων στο General MIDI.

Για περισσότερες πληροφορίες σχετικά µε το πρωτόκολλο MIDI ο αναγνώστης µπορεί να ανατρέξει στην
ιστοσελίδα http://www.midi.org/ και σε επιπλέον συµπληρωµατικές πηγές.

6.1.14. Ψηφιακά Όργανα και Συνθετητές.

Τα ψηφιακά όργανα (software synthesizers, digital instruments) χειρίζονται δεδοµένα MIDI και αποδίδουν
ψηφιακό ήχο. Μπορεί να είναι αυτόνοµα προγράµµατα (stand-alone applications) ή να εφαρµόζονται ως
εµφυτεύµατα (plugins, inserts) στα tracks του DAW, το οποίο σε αυτήν την περίπτωση λειτουργεί ως
περιβάλλον υποδοχής (host application). Πολλές πλατφόρµες έχουν αναπτυχθεί για να υποστηρίξουν την
εµφύτευση ενός plugin σε διαφορετικά περιβάλλοντα υποδοχής. Οι σηµαντικότερες από αυτές είναι οι VST

207
(Virtual Studio Technology της Steinberg), RTAS (Real Time Audio Suite της Avid Technology), DirectX
plugin και AU (Audio Units της Apple). Διατίθεται πληθώρα ψηφιακών οργάνων (όργανα ορχήστρας,
παραδοσιακά όργανα, συνθετητές κ.λπ.) και η επιλογή τους εξαρτάται από την εργασία την οποία θέλουµε να
εκτελέσουµε. Πολλοί αναλογικοί συνθετητές περασµένων ετών έχουν επανέλθει σε ψηφιακή µορφή
διατηρώντας, σε µεγάλο βαθµό, τις παλιές τους ρυθµίσεις.

6.1.15. Κβαντισµός MIDI Δεδοµένων (Quantization).

Ας υποθέσουµε ότι εκτελούµε µια µελωδία χρησιµοποιώντας ένα ψηφιακό όργανο το οποίο είναι
εµφυτευµένο σε ένα περιβάλλον DAW. Για να παίξουµε τη µελωδία χρησιµοποιούµε ένα MIDI πληκτροφόρο
όργανο. Οι MIDI νότες εισέρχονται σε ένα πλέγµα (grid) η ανάλυση του οποίου διαµορφώνεται από το είδος
του µέτρου που έχουµε προεπιλέξει (2/4, 4/4, 6/8 κ.λπ.) και τις υποδιαιρέσεις του. Σε περίπτωση που η
εκτέλεση της µελωδίας δεν είναι σωστή σε tempo και ρυθµό, οι MIDI νότες δεν εισέρχονται στο MIDI track
στη σωστή τους θέση πάνω στο πλέγµα. Σε αυτήν την περίπτωση, θα πρέπει να επιλέξουµε τις νότες MIDI
και να εφαρµόσουµε σε αυτές την τεχνική κβαντισµού. Σηµαντικό είναι να επιλέξουµε πριν την εκτέλεση της
µελωδίας το είδος του κβαντισµού, την ανάλυση δηλαδή του πλέγµατος χρησιµοποιώντας ως αναφορά τη
νότα της µελωδίας µε τη µικρότερη αξία. Αν, για παράδειγµα, η µικρότερη αξία νότας στη µελωδία µας είναι
το 1/16, τότε επιλέγουµε κβαντισµό ενός δεκάτου έκτου ώστε να δηµιουργηθεί το πλέγµα µε υποδιαιρέσεις
δεκάτων έκτων. Μια σηµαντική παράµετρος του κβαντισµού είναι η ισχύς του (quantization strength). Σε
περίπτωση που επιλέξουµε ισχύ κβαντισµού 100%, τότε οι αξίες των νοτών µας θα συµπίπτουν απόλυτα µε
τις αντίστοιχες υποδιαιρέσεις του πλέγµατος, οδηγώντας όµως έτσι σε µια µηχανιστική εκτέλεση της
µελωδίας. Μικρότερο ποσοστό ισχύος κβαντισµού, θα τοποθετήσει τις νότες κοντά ή δίπλα στις αντίστοιχες
υποδιαιρέσεις του πλέγµατος προκαλώντας έτσι µια πιο ελεύθερη απόδοση της µελωδίας. Τα µικρά ποσοστά
ισχύς κβαντισµού εµφανίζονται και µε ονοµασίες όπως «swing» και «groove», οι οποίες παραπέµπουν σε
περισσότερο εκφραστικές εκτελέσεις της µελωδίας. Στο πάνω τµήµα της Εικόνας 6.4 απεικονίζεται το MIDI
track µε τις MIDI νότες παιγµένες από ένα ψηφιακό όργανο κιθάρας στο περιβάλλον Logic Pro. Στο
κατώτερο τµήµα της εικόνας βλέπουµε το πλέγµα κβαντισµού 1/16 και τις MIDI νότες τοποθετηµένες σε
αυτό. Οι διαφοροποιήσεις στο χρώµα σχετίζονται µε τις διαφορετικές τιµές velocity. Στο δεξί τµήµα
εµφανίζεται η λίστα των MIDI events.

Εικόνα 6.4 Κβαντισµός MIDI νοτών στο περιβάλλον Logic Pro.

208
6.1.16. Sequencers.

Το Sequencer είναι ένα σύστηµα καταγραφής και αναπαραγωγής δεδοµένων µε προγραµµατιζόµενη µνήµη.
Δεν αποθηκεύει ήχο αλλά σειρές (sequences) δεδοµένων και παραµέτρων της εκτέλεσης (performance και
control data). Για παράδειγµα, οι πιέσεις των πλήκτρων σε έναν συνθετητή κατά την εκτέλεση ενός έργου ή η
µετακίνηση του τροχού modulation, αποδίδουν σειρές τιµών οι οποίες καταγράφονται στη µνήµη του
Sequencer ως δεδοµένα εκτέλεσης (performance data) και δεδοµένα ελέγχου (control data). Στη συνέχεια,
αυτά τα δεδοµένα µπορούν να υποστούν επεξεργασία και να αποσταλούν στον ίδιο ή σε άλλο συνθετητή
ώστε να αναπαραχθεί η εκτέλεση.

6.1.16.1. Step Sequencing.

Στις πρώτες προσπάθειες για την κατασκευή µηχανισµών στους οποίους θα αποτυπώνονταν σειρές µουσικών
συµβάντων µε σκοπό την αναπαραγωγή τους, χρησιµοποιήθηκε η µέθοδος step sequencing. Οι µηχανισµοί
αποτελούνταν από έναν περιστρεφόµενο κύλινδρο µε σειρές από τρύπες, ο οποίος ενεργοποιούσε µια σειρά
από καµπάνες για την εκτέλεση της µελωδίας. Κάθε τρύπα αντιστοιχούσε σε απουσία νότας. Η κάλυψη µιας
τρύπας µε µια ξύλινη ή µεταλλική γλωττίδα, αντιστοιχούσε σε συγκεκριµένη νότα (Εικόνα 6.5). Τέτοιους
µηχανισµούς συναντούµε συχνά και σήµερα σε ναούς της κεντρικής Ευρώπης. Επιγόνους αυτού του
συστήµατος αποτελούν τα µουσικά κουτιά τα οποία λειτουργούν µε παρόµοιο µηχανισµό.

Εικόνα 6.5 O περιστρεφόµενος κύλινδρος που ελέγχει τις καµπάνες σε κωδωνοστάσιο της πόλης Ghent στο Βέλγιο (πηγή:
https://commons.wikimedia.org/wiki/File:The_Belfry_Ghent.jpg#/media/File:The_Belfry_Ghent.jpg).

Ένα αναλογικό sequencer χρησιµοποιεί την ίδια λογική προγραµµατισµού. Το Moog 960 της Εικόνας 6.6
διέθετε 24 steps κατανεµηµένα σε τρεις σειρές. Μικροί λαµπτήρες πάνω από τις σειρές υπεδείκνυαν ποια από
τα steps ήταν ενεργά, ενώ ένα ρολόι ήλεγχε την ταχύτητα αναπαραγωγής των νοτών. Το συγκεκριµένο
µοντέλο της Moog µπορούσε να παράξει οκτώ νότες, µε έλεγχο του τονικού ύψους, του πλάτους της
κυµατοµορφής και της διάρκειάς τους.

Εικόνα 6.6 Το αναλογικό sequencer Moog 960 (πηγή:


https://commons.wikimedia.org/wiki/File:Synthesizers.com_Q960_Sequential_Controller_module.jpg).

209
Ας εξετάσουµε δύο εφαρµογές της µεθόδου step sequencing µε δύο patches σε περιβάλλον Max. Δηµιουργός
των patches είναι ο Peter Batchelor. To step sequencer στο patch της Εικόνας 6.7 αποδίδει 16 νότες. Το
αντικείµενο counter ενεργοποιεί τις 16 νότες σύµφωνα µε την ταχύτητα αναπαραγωγής που ορίζει το
αντικείµενο metro (αντίστοιχα µε το ρολόι στο Moog 960). Το αντικείµενο makenote ελέγχει το velocity
(127) και τη διάρκεια των νοτών (1000 ms). Το αντικείµενο pgmout λαµβάνει την τιµή 1 η οποία αντιστοιχεί
στο πρόγραµµα Acoustic Grand Piano σύµφωνα µε το πρωτόκολλο General MIDI (Πίνακας 6.12).

Εικόνα 6.7 Step sequencing σε περιβάλλον Max (Peter Batchelor).

To patch της Εικόνας 6.8 αποτελείται από τέσσερα step sequencers, κάθε ένα από τα οποία χρησιµοποιεί
πίνακες 16 νοτών, όπως φαίνεται στο υποπαράθυρο «tune1». Στο patch υπάρχουν 12 τέτοιοι πίνακες στους
οποίους αποθηκεύουµε και από τους οποίους ανακαλούµε σειρές τιµών. Στο συγκεκριµένο patch, οι τιµές
διερµηνεύονται ως MIDI νότες. Με τα αντικείµενα pgmout έχουµε τη δυνατότητα να επιλέξουµε διαφορετικά
όργανα για την ανάγνωση των πινάκων.

210
Εικόνα 6.8 Poly tune sequencing σε περιβάλλον Max (Peter Batchelor).

6.2. Το Πρωτόκολλο Open Sound Control.


Το πρωτόκολλο Open Sound Control είναι ένα πρωτόκολλο επικοινωνίας µεταξύ υπολογιστών,
προγραµµατιστικών εφαρµογών καθώς και εξειδικευµένων ηλεκτρονικών συσκευών µε κύρια εφαρµογή τον
ψηφιακό ήχο και τις πολυµεσικές εφαρµογές εν γένει, όπως συνθετητές, ελεγκτές σηµάτων, αισθητήρες κ.λπ.
Αναπτύχθηκε από τους Adrian Freed και Matt Wright στα τέλη της δεκαετίας του 1990, στο ερευνητικό
κέντρο CNMAT (The Center for New Music and Audio Technologies), του Μουσικού Τµήµατος στο
University of California, Berkeley.
Σε αντίθεση µε άλλα προγενέστερα πρωτόκολλα επικοινωνίας για αντίστοιχες εφαρµογές, όπως το
MIDI, τα οποία παρέχουν ένα αυστηρά προκαθορισµένο σύνολο εντολών για την επικοινωνία µεταξύ των
συσκευών, το OSC είναι ένα ανοικτό πρωτόκολλο καθορίζοντας µόνο τη γενική δοµή οργάνωσης αποστολής
και λήψης δεδοµένων. Από αυτήν την άποψη το συγκεκριµένο πρωτόκολλο αφορά περισσότερο έναν φορέα
δεδοµένων (format content). Επιπρόσθετα, το OSC δεν περιορίζεται από κάποιο συγκεκριµένο τύπο
µετάδοσης δεδοµένων (transport independent), ούτε απαιτεί ειδικό hardware για τη µετάδοσή τους.

6.2.1 Το Μοντέλο Client-Server.

Γιατί χρειάζεται ένα πρωτόκολλο επικοινωνίας µεταξύ δύο πλευρών; Η επικοινωνία αυτή πραγµατοποιείται
προκειµένου να ικανοποιηθεί ένα αίτηµα της µιας πλευράς από την άλλη. Η πλευρά η οποία αιτείται, καλείται
client. Η πλευρά η οποία δέχεται και εξυπηρετεί το αίτηµα, καλείται server. Οι έννοιες client και server
µπορεί να είναι πολύ γενικές. Στην περίπτωση για παράδειγµα, που ένας αισθητήρας στέλνει δεδοµένα σε µια
προγραµµατιστική εφαρµογή, ο αισθητήρας αποτελεί την πλευρά του client και η εφαρµογή την πλευρά του
server. Αντίστοιχα όταν µια εφαρµογή στέλνει δεδοµένα σε µια συσκευή ενεργοποιητή (actuator), η
εφαρµογή αφορά τον client και ο ενεργοποιητής τον server. Υπάρχουν κατ’αυτόν τον τρόπο πολυάριθµοι
συνδυασµοί επικοινωνίας µεταξύ εφαρµογών, συσκευών και ειδικών κυκλωµάτων, στα οποία οι ρόλοι ενός
server και ενός client εναλλάσσονται διαρκώς.
Τι αφορούν τα αιτήµατα ενός client απέναντι σε έναν server; Τα αιτήµατα αυτά αφορούν µια σειρά
από ενέργειες πάνω σε συγκεκριµένα δεδοµένα, αν και δε χρειάζεται πάντοτε οι ενέργειες να επενεργούν σε
δεδοµένα (π.χ. «ξεκίνησε ένα συγκεκριµένο πρόγραµµα»). Σε ένα ψηφιακό υπολογιστικό περιβάλλον, είτε

211
αυτό αφορά µια προγραµµατιστική εφαρµογή σε έναν υπολογιστή είτε µια εξειδικευµένη συσκευή, οι
ενέργειες αυτές κωδικοποιούνται µε τη µορφή µιας σειράς εντολών που πρέπει να εκτελεστούν από το
περιβάλλον του server. Αφορούν δηλαδή µια προγραµµατιστική συνάρτηση ή µια µέθοδο.

6.2.2. Πακέτα OSC.

Η βασική δοµή µε την οποία µεταφέρονται δεδοµένα στο πρωτόκολλο OSC είναι το πακέτο OSC (OSC
package). Μια εφαρµογή η οποία στέλνει πακέτα OSC ονοµάζεται OSC client, ενώ µια εφαρµογή η οποία
δέχεται OSC πακέτα ονοµάζεται OSC server:

Εικόνα 6.9 Oι εφαρµογές client και server στην OSC επικοινωνία.

Σε γενικές γραµµές, κάθε πακέτο OSC περιέχει:

• Τα δεδοµένα του πακέτου, δηλαδή ένα block από διαδοχικούς δυαδικούς αριθµούς.
• Το µέγεθος του πακέτου, το πλήθος δηλαδή των bytes που αντιστοιχεί στα δεδοµένα που
περιέχονται στο συγκεκριµένο πακέτο.

Τα δεδοµένα ενός πακέτου αφορούν τα αιτήµατα του client προς τον server, µπορεί δηλαδή να αφορούν
κλήσεις µεθόδων, εντολές, αριθµητικές τιµές, προγραµµατιστικές µεταβλητές, µηνύµατα ή οποιαδήποτε άλλη
µορφή πληροφορίας υποστηρίζει το περιβάλλον του server. Κατ’αυτόν τον τρόπο το πρωτόκολλο OSC δεν
ελέγχει τo περιεχόµενο ενός πακέτου.
Κάθε πακέτο µπορεί να ποικίλλει σε µέγεθος. Σε κάθε περίπτωση το µέγεθος ενός πακέτου OSC
πρέπει να είναι πάντοτε πολλαπλάσιο των 4 bytes. Προκειµένου να συµβαίνει αυτό, κάθε OSC πακέτο
συµπληρώνεται αναλόγως από 0 έως 3 bytes µηδενικού περιεχοµένου.
Κάθε πακέτο το οποίο στέλνεται από τον OSC client προς τον OSC server, ακολουθεί υποχρεωτικά
έναν από τους παρακάτω δύο τύπους δοµής:

• Τη δοµή ενός Μήνυµατος OSC (OSC Message).


• Τη δοµή µιας Δέσµης OSC (OSC Bundle).

6.2.3. Δοµή Μηνύµατος OSC (OSC Message).

Ένα µήνυµα OSC αποτελείται, µε τη συγκεκριµένη σειρά, από τα εξής πεδία:

• Ένα OSC address pattern, µια δηλαδή OSC διεύθυνση στην οποία θα παραλειφθεί το πακέτο.
• Ένα OSC type tag string, το πλήθος και το είδος των δεδοµένων που περιέχονται στο πακέτο.

212
• (Προαιρετικά) ένα πλήθος από τιµές ορισµάτων ή OSC arguments, οι τιµές δηλαδή των
δεδοµένων του πακέτου.

Εικόνα 6.10 Η δοµή ενός µηνύµατος OSC.

Με βάση την παραπάνω δοµή, κάθε φορά που ένας OSC server δέχεται ένα µήνυµα OSC πρέπει να καλέσει
την αντίστοιχη µέθοδο, η διεύθυνση της οποίας περιγράφεται στο OSC Address Pattern του µηνύµατος µαζί
µε τα αντίστοιχα ορίσµατα (arguments) – εφόσον κάτι τέτοιο είναι απαραίτητο – τα οποία περιγράφονται στο
OSC type tag string του µηνύµατος και τις τιµές τους που ακολουθούν σε αντίστοιχες συνεχόµενες 32-bit
λέξεις.

6.2.3.1. Δοµή OSC Διεύθυνσης-OSC Address Pattern.

Το πεδίο OSC address pattern αποτελείται από µια ακολουθία χαρακτήρων η οποία ξεκινάει µε τον
χαρακτήρα «/» (forward slash) και η οποία περιγράφει µια διεύθυνση OSC. Τί ακριβώς όµως αφορά αυτή η
διεύθυνση; Όπως διατυπώθηκε πριν ένας OSC server αποτελεί την εφαρµογή η οποία δέχεται πακέτα OSC.
Έτσι, κάθε πακέτο το οποίο στέλνεται στον OSC server απευθύνεται σε κάποια συγκεκριµένη µέθοδο της
εφαρµογής του OSC server η οποία θα αναλάβει να εξυπηρετήσει το συγκεκριµένο αίτηµα. Από µιαν άλλη
λοιπόν οπτική ένας OSC server αποτελείται από ένα πλήθος µεθόδων OSC. Κάθε τέτοια µέθοδος είναι
σχεδιασµένη να δέχεται συγκεκριµένου τύπου µηνύµατα και να τα εξυπηρετεί, ακριβώς όπως οι κλήσεις
συναρτήσεων σε µια εφαρµογή (procedure calling). Στην ουσία λοιπόν κάθε φορά που στέλνεται ένα OSC
µήνυµα καλείται και µια αντίστοιχη µέθοδος στον server, µε τα κατάλληλα ορίσµατα.
Οι µέθοδοι OSC σε έναν OSC server είναι διατεταγµένοι σε δοµή δένδρου. Κάθε κλαδί του δένδρου
καλείται και OSC container, ενώ κάθε φύλλο του δένδρου αντιστοιχεί σε µια OSC µέθοδο. Με αυτήν τη
λογική ένα OSC container µπορεί να περιέχει µεθόδους OSC ή/και άλλα container. Η δοµή αυτή καλείται
OSC Address Space.

213
Εικόνα 6.11 Παράδειγµα δοµής δένδρου OSC Address Space.

Όταν καλείται µια µέθοδος OSC αυτή καλείται µε βάση την διεύθυνση της στη δοµή του δένδρου. Η
αντιστοιχία αυτής της δοµής στη δοµή διεύθυνσης του µηνύµατος γίνεται χαρακτήρα προς χαρακτήρα. Μια
τέτοια διεύθυνση OSC (OSC address) ξεκινάει από τη ρίζα του δένδρου η οποία συµβολίζεται µε τον
χαρακτήρα «/» (forward slash), ακολουθούµενη από τα ονόµατα όλων των container καθένα από τα οποία
διαχωρίζεται από τον χαρακτήρα «/» (forward slash), µέχρι τελικά το όνοµα της µεθόδου. Ο συγκεκριµένος
τρόπος διευθυνσιοδότησης ακολουθεί στην ουσία τη δοµή µιας URL διεύθυνσης.
Εκτός από τη ρίζα της δοµής δένδρου, το όνοµα µιας µεθόδου ή ενός container σε µια δοµή OSC
διεύθυνσης µπορεί να αποτελείται από οποιονδήποτε συνδυασµό εκτυπώσιµων ASCII χαρακτήρων.
Εξαιρούνται οι παρακάτω χαρακτήρες:

Χαρακτήρας Όνοµα ASCII Code (decimal)


‘’ κενό 32
‘#’ number sign 35
‘*’ αστερίσκος 42
‘,’ κόµµα 44
‘/’ forward slash 47
‘?’ ερωτηµατικό 63
‘[’ άνοιγµα αγκύλης 91
‘]’ κλείσιµο αγκύλης 93
‘{’ ανοικτό άγκιστρο 123
‘}’ κλειστό άγκιστρο 125

Πίνακας 6.14 Μη επιτρεπτοί χαρακτήρες σε µια OSC διεύθυνση.

Μια επιπλέον δυνατότητα κατά την κλήση µιας διεύθυνσης είναι η χρήση κάποιων ειδικών χαρακτήρων οι
οποίοι λειτουργούν ως χαρακτήρες οµαδικής διαχείρισης ενεργειών (wild cards). Τέτοιοι ειδικοί χαρακτήρες
είναι οι ακόλουθοι:

214
Ειδικός
Χαρακτήρας Ενέργεια
‘?’ Οποιοσδήποτε χαρακτήρας.
‘*’ Οποιαδήποτε ακολουθία µηδέν ή παραπάνω χαρακτήρων.
“[ ]” Οποιοσδήποτε από τους χαρακτήρες εντός των αγκύλων. Γράφοντας, για
παράδειγµα, [string] : είτε ‘s’, είτε ‘t’, είτε ‘r’, είτε ‘i’, είτε ‘n’, είτε ‘g’.
Ο χαρακτήρας πλην (‘-’) µπορεί να προσδώσει εύρος χαρακτήρων
κατ’αύξουσα ASCII σειρά (π.χ. [a-z]), ενώ το θαυµαστικό (‘!’) πριν από
τις αγκύλες λειτουργεί σαν άρνηση (οποιοσδήποτε δηλαδή χαρακτήρας
εκτός αυτών εντός των αγκύλων).
“{ , }” Οποιοδήποτε από τα string που περιγράφονται, π.χ. {foo, bar}.

Πίνακας 6.15 Επεξήγηση χαρακτήρων οµαδικής επεξεργασίας.

Μια επιπλέον χρησιµότητα των χαρακτήρων αυτών είναι η δυνατότητα κλήσης περισσότερων της µιας
µεθόδων από ένα µοναδικό address pattern.
Η παραπάνω διαδικασία, κατά την οποία ο server αντιστοιχεί µεθόδους µε βάση το πεδίο διεύθυνσης
του µηνύµατος, και ορίσµατα µε βάση τα επόµενα πεδία OSC type tag και arguments, καλείται message
dispatching/pattern matching.

6.2.3.2. Τύποι Δεδοµένων-OSC Type Tag String.

Το πεδίο OSC type tag string περιγράφει τους τύπους δεδοµένων οι οποίοι περιλαµβάνονται σε ένα OSC
µήνυµα. Αποτελείται από µια ακολουθία χαρακτήρων η οποία ξεκινάει µε τον χαρακτήρα ‘,’ (comma),
ακολουθούµενο από έναν ή περισσότερους ειδικούς χαρακτήρες (type tags) οι οποίοι σηµατοδοτούν το
αντίστοιχο πλήθος καθώς και το είδος των ορισµάτων που ακολουθούν. Τα επιτρεπτά type tags, καθώς και η
σηµασία τους έχει ως εξής:

OSC Type Tag Τύπος Δεδοµένων


‘i’ int32
‘f’ float32
‘s’ OSC-string
‘b’ OSC-blob

Πίνακας 6.16 Επεξήγηση ειδικών χαρακτήρων δεδοµένων.

Πιο αναλυτικά:

• int32
Προσηµασµένος Ακέραιος µήκους 32-bit (32-bit big-endian two's complement integer).

• float32
Προσηµασµένος Αριθµός Κινητής Υποδιαστολής µήκους 32-bit (32-bit big-endian IEEE 754 floating
point number).

• OSC-string
Ακολουθία µη-µηδενικών ASCII χαρακτήρων, µε επιπλέον τελικό έναν µηδενικό χαρακτήρα (\0). Η
ακολουθία αυτή συµπληρώνεται από 0 έως 3 επιπλέον µηδενικούς χαρακτήρες προκειµένου το συνολικό
πλήθος των bit του OSC-string τελικά να ισούται µε ένα πολλαπλάσιο του 32.

• OSC-blob
Ένα OSC-blob (binary large object) αποτελείται από δύο µέρη: έναν αριθµό int32, ο οποίος δηλώνει
το πλήθος των δεδοµένων που περιέχει το συγκεκριµένο OSC-blob, και αντίστοιχο πλήθος byte τα οποία

215
αφορούν στα δεδοµένα του OSC-blob. Σε κάθε περίπτωση ένα OSC-blob πρέπει να τερµατίζει µε 0 έως 3
επιπλέον µηδενικά byte προκειµένου το τελικό πλήθος byte του blob να ισούται µε κάποιο πολλαπλάσιο του
4.

• OSC-timetag
Ένας Σταθερής Υποδιαστολής Αριθµός µήκους 64-bit (64-bit big-endian fixed-point), ο οποίος
καθορίζεται ως εξής:

Εικόνα 6.12 Δοµή µιας χρονικής σήµανσης OSC.

Τα πρώτα 32-bit αφορούν έναν αριθµό ο οποίος αντιστοιχεί στα δευτερόλεπτα από τις 00:00 της 1ης
Ιανουαρίου του 1900, ενώ τα επόµενα 32-bit αφορούν έναν αριθµό ο οποίος αντιστοιχεί σε υποδιαίρεση του
δευτερολέπτου, δίνοντας έτσι µια ακρίβεια των περίπου 200 picoseconds. Η συγκεκριµένη δοµή είναι η ίδια
που ακολουθείται από τα time-stamps του πρωτοκόλλου NTP (Network Time Protocol, http://www.ntp.org/).
Σε περίπτωση τέλος, που ένα time tag περιέχει 63 µηδενικά bit ακολουθούµενα από τη µονάδα, σηµαίνει
«άµεση εκτέλεση».
Κάθε µια από τις παραπάνω σηµάνσεις δεδοµένων µπορεί να επαναλαµβάνεται για όσες φορές
χρειαστεί να περιγραφεί το πλήθος των ορισµάτων που θα ακολουθήσουν στο µήνυµα. Έτσι, αν για
παράδειγµα έχουµε ένα type tag string <,f>, σηµαίνει πως το συγκεκριµένο µήνυµα περιέχει ένα όρισµα
τύπου float, ενώ ένα type tag string <,iibsf>, σηµαίνει πως στο µήνυµα περιλαµβάνονται πέντε ορίσµατα:
έναν int32 ακολουθούµενο από έναν int32, ακολουθούµενο από ένα OSC-blob, ακολουθούµενο από ένα
OSC-string, ακολουθούµενο από έναν float-32. Αντίστοιχα, ένα type tag string “,” σηµατοδοτεί πως το
συγκεκριµένο µήνυµα δεν περιέχει ορίσµατα.
Οι παραπάνω τύποι ορισµάτων αφορούν µόνο OSC εφαρµογές. Σε περίπτωση που µια OSC
εφαρµογή επικοινωνήσει µε µια άλλου τύπου εφαρµογή, το πρωτόκολλο OSC παρέχει σηµάνσεις και για
άλλους µη καθορισµένους τύπους δεδοµένων από το πρωτόκολλο OSC (non-standard OSC types). Αυτοί
φαίνονται στον Πίνακα 6.17:

OSC Type Tag Τύπος Δεδοµένων


‘h’ 64 bit big-endian two's complement integer
‘t’ OSC-timetag
‘d’ 64 bit ("double") IEEE 754 floating point number
‘S’ Εναλλακτικός τύπος αντιστοίχισης OSC-string
‘c’ 32 bit ASCII χαρακτήρας
‘r’ 32 bit RGBA color
‘m’ 4 byte MIDI message. Ξεκινώντας από το MSB προς το LSB τα bytes
αυτά αντιστοιχούν σε: port id, status byte, data1, data2
‘T’ True. Δε χρησιµοποιούνται επιπλέον bytes για τιµές ορισµάτων.
‘F’ False. Δε χρησιµοποιούνται επιπλέον bytes για τιµές ορισµάτων.
‘N’ Nil. Δε χρησιµοποιούνται επιπλέον bytes για τιµές ορισµάτων.
‘I’ Infinitum. Δε χρησιµοποιούνται επιπλέον bytes για τιµές ορισµάτων.

216
‘[’ Σηµατοδοτεί την αρχή ενός πίνακα. Τα tags που ακολουθούν αφορούν
τα περιεχόµενα του πίνακα, έως ότου σταλεί ένα tag κλεισίµατος
παρένθεσης <]>.
‘]’ Σηµατοδοτεί το τέλος ενός πίνακα.

Πίνακας 6.17 Επεξήγηση σηµάνσεων µη OSC δεδοµένων.

6.2.4. Δοµή Δέσµης OSC (OSC Bundle).

Εκτός από τα απλά OSC µηνύµατα το πρωτόκολλο OSC παρέχει και µια επιπλέον δοµή οµαδοποίησης
δεδοµένων, το OSC Bundle ή αλλιώς OSC Δέσµη. Μια OSC Δέσµη αποτελείται από ένα OSC-string µε
περιεχόµενο “#bundle”, ακολουθούµενο από ένα OSC Time Tag και από κανένα ή περισσότερα OSC Bundle
Elements:

Εικόνα 6.13 Δοµή δέσµης OSC.

Κάθε OSC Bundle Element αποτελείται από δύο µέρη: το µέγεθος του και τα περιεχόµενά του. Στα πρώτα 4
byte υπάρχει ένας αριθµός τύπου int32 ο οποίος προσδιορίζει το µέγεθος του αντίστοιχου Bundle Element,
ακολουθούµενος από όσα bytes προσδιορίζει το µέγεθος αυτό, το πλήθος των οποίων πρέπει να είναι πάντοτε
πολλαπλάσιο του 4. Τι ακριβώς περιέχει ένα OSC Bundle Element; Είτε ένα OSC Message, είτε ένα άλλο
OSC Bundle. Με τη δοµή δηλαδή αυτή, ένα Bundle µπορεί να περιέχει άλλα Bundles.
Καθώς µια δοµή Δέσµης συνοδεύεται από µια ενιαία χρονική σήµανση (OSC time tag), η δοµή αυτού
του τύπου χρησιµοποιείται στις περιπτώσεις που θέλουµε να στείλουµε πολλαπλά πακέτα µηνυµάτων τα
οποία πρόκειται να ενεργοποιηθούν ταυτόχρονα.

6.2.5. Χρονισµοί Εκτέλεσης OSC Μηνυµάτων.

Όταν ένα πακέτο OSC ληφθεί από έναν OSC server αυτός αναλαµβάνει να εκτελέσει τα περιεχόµενα του
µηνύµατος αµέσως. Το πρωτόκολλο OSC δεν παρέχει κάποιον µηχανισµό για συγχρονισµό. Σε περιπτώσεις
που απαιτείται κάτι τέτοιο, πρέπει να σταλούν µηνύµατα Δέσµης (OSC bundles) καθένα από τα οποία
περιέχει τη δική του χρονική σήµανση (time-tag). Εάν η χρονική σήµανση ενός bundle αφορά κάποιον χρόνο
ίσο ή περασµένο από τον τρέχοντα χρόνο της εφαρµογής του server, τότε ο server αναλαµβάνει να εκτελέσει
τα περιεχόµενά του άµεσα, εκτός και άν ο server έχει προγραµµατιστεί να µην εκτελεί χρονικά περασµένα
time tags. Εάν ο χρόνος του time tag είναι µελλοντικός τότε ο server αποθηκεύει το bundle και εκτελεί τα
περιεχόµενά του την κατάλληλη στιγµή.
Εάν ένα OSC bundle περιέχει περισσότερα του ενός µηνύµατα, οι αντίστοιχοι µέθοδοι των
µηνυµάτων καλούνται διαδοχικά, η µια µετά την άλλη, χωρίς να υπάρξει κάποια παρεµβολή ανάµεσά τους.

217
Επίσης, όταν ένα OSC address pattern αναφέρεται σε περισσότερες της µιας OSC διεύθυνσης, µε τη χρήση
των ειδικών χαρακτήρων οµαδικής επεξεργασίας, η σειρά εκτέλεσης των αντίστοιχων µεθόδων είναι
απροσδιόριστη.
Στην περίπτωση, τέλος, που ένα OSC bundle περιέχει άλλα OSC bundles, τότε ο χρόνος του time tag
του εσωτερικού bundle πρέπει να είναι µεγαλύτερος ή ίσος από αυτόν του εξωτερικού.

6.2.6. Παραδείγµατα Εκτέλεσης OSC Κώδικα: Το περιβάλλον του SuperCollider.

6.2.6.1 Η Αρχιτεκτονική του SC: το Μοντέλο Client-Server.

Το περιβάλλον του SuperCollider αποτελεί εξ ολοκλήρου ένα παράδειγµα εκτέλεσης OSC κώδικα καθώς
είναι δοµηµένο µε µια λογική βασισµένη στο πρωτόκολλο OSC. Το ίδιο το περιβάλλον αποτελείται από δύο
εφαρµογές:

• Την εφαρµογή της γλώσσας sclang.


• Την εφαρµογή του server scsynth.

Η εφαρµογή της γλώσσας επικοινωνεί µε την εφαρµογή του Server στέλνοντας πακέτα OSC. Τα πακέτα αυτά
αποτελούν ουσιαστικά αιτήµατα της sclang προς την scsynth. Κατ’ αυτόν τον τρόπο η εφαρµογή sclang
αποτελεί µια εφαρµογή client και η εφαρµογή scsynth µια εφαρµογή server.:

Εικόνα 6.14 Δοµή εκτέλεσης του SuperCollider.

Η επικοινωνία από πλευράς κώδικα γίνεται µε την µέθοδο sendMsg της κλάσης Server, η οποία
αναλαµβάνει τη δροµολόγηση των πακέτων ανάµεσα στις δύο εφαρµογές. Η γενική σύνταξη της µεθόδου
είναι:

s.sendMsg (“/όνοµα µεθόδου”, ορίσµατα µεθόδου, …)

όπου s η εφαρµογή του Server η οποία λαµβάνει τα µηνύµατα. Γράφουµε για παράδειγµα:

s = Server.local;
s.boot;

s.sendMsg("/s_new", "aSynthDef", 1001, 1, 0, 0);


s.sendMsg("/n_set", 1001, "param1", 440);
s.sendMsg("/n_free", 1001, "param1", 440);

Για την αποστολή δέσµης µηνυµάτων (OSC bundles) υπάρχει η µέθοδος sendBundle της κλάσης Server:

218
s.sendBundle (time ... msgs)

όπου s η εφαρµογή του Server η οποία λαµβάνει τη δέσµη µηνυµάτων. Γράφουµε για παράδειγµα:

s.sendBundle(0.2, ["/s_new", "default", x = s.nextNodeID, 0, 1], ["/n_set", x,


"freq", 500]);

6.2.6.2. Το SC ως Εφαρµογή Client.

Με τον ίδιο τρόπο που η εφαρµογή της γλώσσας sclang στέλνει OSC µηνύµατα στην εφαρµογή scsynth του
server, OSC µηνύµατα µπορούν να σταλούν από το περιβάλλον της γλώσσας του SC και σε οποιαδήποτε
άλλη εφαρµογή που υποστηρίζει το πρωτόκολλο OSC. Στην περίπτωση λοιπόν αυτή, η εφαρµογή γλώσσας
sclang ζητάει από µιαν άλλη εφαρµογή να εξυπηρετήσει αιτήµατά της. Η δεύτερη αυτή εφαρµογή θα
αποτελεί πλέον την εφαρµογή που θα έχει τον ρόλο του server.
Εδώ θα πρέπει να τονιστεί πως η δεύτερη αυτή εφαρµογή µπορεί να βρίσκεται είτε στον ίδιο
υπολογιστή είτε σε οποιοδήποτε άλλο δικτυωµένο µηχάνηµα. Στην περίπτωση λοιπόν αυτή χρειάζεται ένα ip-
address το οποίο θα αντιστοιχεί στο µηχάνηµα το οποίο φιλοξενεί την εφαρµογή αυτή. Επιπλέον, χρειάζεται
και µια ακόµη παράµετρος η οποία αντιστοιχεί στην ίδια την εφαρµογή που θα αναλάβει τον ρόλο του server.
Αυτό συµβαίνει διότι στο ίδιο µηχάνηµα µπορεί να φιλοξενούνται περισσότερες της µιας εφαρµογές οι οποίες
χρειάζεται να επικοινωνούν µέσω OSC. Η δεύτερη αυτή παράµετρος καλείται port number και εκτός της OSC
επικοινωνίας χρησιµεύει γενικότερα στην ταυτοποίηση εφαρµογών και υπηρεσιών κατά την επικοινωνία τους
µέσω δικτύου.

Εικόνα 6.15 Σχηµατική αναπαράσταση OSC επικοινωνίας µεταξύ µιας εφαρµογής SClang και διαφορετικών εφαρµογών
µε τα αντίστοιχα port number.

Αν και σε γενικές γραµµές µπορούµε εµείς να προσδιορίσουµε το port number της εφαρµογής που θα
εξυπηρετεί τα OSC µηνύµατα, κάθε εφαρµογή έχει εξ ορισµού το δικό της port number. Διάφορες επίσης
εφαρµογές αποκτούν δυναµικά κατά την εκτέλεσή τους κάποιο διαθέσιµο port number. Παράδειγµα τέτοιας
εφαρµογής αποτελεί το Pd.

Εφαρµογή Port Number


SuperCollider 57110
Pure Data 9001
Max 7400

Πίνακας 6.18 Εξ ορισµού port number για τις εφαρµογές SC, Pd και Max.

Έτσι λοιπόν, στην περίπτωση που η εφαρµογή Sclang χρειάζεται να επικοινωνήσει µε µια άλλη εφαρµογή
προκειµένου αυτή να εξυπηρετήσει τα αιτήµατά της, χρειάζεται να προσδιορίσουµε δύο στοιχεία:

• Το ip-address του µηχανήµατος στο οποίο φιλοξενείται η εφαρµογή server.


• Το port number της εφαρµογής.

219
Η κλάση η οποία δηµιουργεί αντικείµενα αυτού του τύπου, είναι η κλάση NetAddr. Η γενική της σύνταξη
έχει ως εξής:

a = NetAddr(IP-address, port);

όπου για τη συγκεκριµένη επικοινωνία:

IP-address το IP-address του υπολογιστή που


φιλοξενεί την εφαρµογή sever
port το port number της εφαρµογής server

Στη συνέχεια, θα δηµιουργήσουµε ένα αντικείµενο server το οποίο θα αντιστοιχεί στη δεύτερη αυτή
εφαρµογή. Για τον σκοπό αυτόν χρησιµοποιούµε τη µέθοδο new της κλάσης Server:

n = Server.new(name, address)

όπου

name ένα συµβολικό όνοµα για την εφαρµογή


του server
address ένα αντικείµενο της κλάσης NetAddr

Έτσι, αν για παράδειγµα η sclang θέλουµε να στείλει δεδοµένα σε ένα patch της Max, τοπικά στον ίδιο
υπολογιστή, γράφουµε:

a = NetAddr("127.0.0.1", 7400);
n = Server.new('a MaxMSP Server', a);

Ο server n αντιστοιχεί πλέον στην εφαρµογή Max η οποία τρέχει τοπικά στον ίδιο υπολογιστή µε την
εφαρµογή sclang και αναλαµβάνει να δέχεται OSC µηνύµατα από αυτήν. Στην περίπτωση αυτή το όνοµα της
µεθόδου που θα στέλνεται στο µήνυµα θα αφορά κάποιο αναγνωριστικό όνοµα (OSC-tag). Γράφουµε για
παράδειγµα:

n.sendMsg("/amp", 0.8);

Σε µια κατάσταση συνεχούς εκτέλεσης χρησιµοποιούµε µια ρουτίνα η οποία ανά 0.2 δευτερόλεπτα θα στέλνει
δύο OSC µηνύµατα µε OSC-tag amp και pitch:

(
var dur;
dur = 0.2;
~sendOSCvalues = Routine.new({
loop({
n.sendMsg("/amp", rrand(0.08,0.2));
n.sendMsg("/pitch", #[48,52,55,57].choose);
dur.wait;
})
});

~sendOSCvalues.play;
~sendOSCvalues.stop;
)

220
Το αντικείµενο το οποίο αναλαµβάνει την OSC επικοινωνία από πλευράς Max είναι το OSC-route. Για να
προσδιορίσουµε τι είδους µηνύµατα θα ανιχνεύει, το OSC-route συντάσσεται µε το όνοµα του OSC-tag από
το οποίο περιµένει κάποια νέα τιµή:

[OSC-route /amp /pitch]

Για κάθε νέο OSC-tag το αντικείµενο της Max δηµιουργεί ένα νέο outlet µέσω των οποίων µπορούµε να
δροµολογήσουµε patch chords.

6.2.6.3. Το SC ως Εφαρµογή Server.

Στην περίπτωση που το SC λειτουργεί ως εφαρµογή server περιµένει OSC µηνύµατα από κάποια άλλη
εφαρµογή. Το εξ ορισµού port number που πρέπει να δηλωθεί στην εφαρµογή client είναι το 57110. Στη
συνέχεια κάθε µήνυµα που λαµβάνεται από το SC αποτελείται από µια σειρά πεδίων µε την εξής σειρά:

msg[] το OSC µήνυµα


time ο χρόνος λήψης του
replyAddr το ip-address του αποστολέα
recvPort το port number στο οποίο στάλθηκε

Το πρώτο πεδίο ειδικότερα, το οποίο αφορά στο ίδιο το µήνυµα ακολουθεί µια δοµή πίνακα, όπου το πρώτο
στοιχείο msg[0] περιέχει το αναγνωριστικό OSC-tag της µεταβλητής, ενώ το επόµενο msg[1] αφορά στην
τιµή της συγκεκριµένης µεταβλητής.

Εικόνα 6.16 Σχηµατική αναπαράσταση ακολουθίας πεδίων κατά τη λήψη ενός OSC µηνύµατος από το SC. Στο πρώτο
βαγόνι µεταφέρεται το OSC-tag, όπως π.χ. το όνοµα µιας µεταβλητής και στο δεύτερο η τιµή της. Ακολουθούν ο χρόνος
λήψης του µηνύµατος, η διεύθυνση του αποστολέα καθώς και το port number της λήψης (57110).

Σε περίπτωση που η µεταβλητή που λαµβάνεται αφορά µια συλλογή από τιµές, όπως για παράδειγµα στην
περίπτωση ενός Array, οι τιµές αυτές ακολουθούν σε συνεχόµενες θέσεις msg[2], msg[3] κ.ο.κ.

Εικόνα 6.17 Περίπτωση µηνύµατος κατά την οποία η µεταβλητή αφορά κάποια συλλογή τιµών, όπως π.χ. ένα Array. Τα
βαγόνια που ακολουθούν το OSC-tag µεταφέρουν τα περιεχόµενα του Array.

221
Στο SC η µέθοδος addOSCRecvFunc()δέχεται ως όρισµα τη συνάρτηση που ελέγχει τη ροή των OSC
µηνυµάτων. Εάν θέλουµε να παρακολουθούµε τη ροή όλων των OSC µηνυµάτων που λαµβάνει η εφαρµογή
αποκλείοντας τα µηνύµατα κατάστασης της διαδικασίας λήψης τα οποία έχουν σήµανση ‘/status.reply’,
γράφουµε:

(
f = { |msg, time, replyAddr, recvPort|
if(msg[0] != '/status.reply') {
"At time %s received message % from % on port%\n".postf(time, msg, replyAddr,
recvPort)
}
};

thisProcess.addOSCRecvFunc(f);
);

// stop posting.
thisProcess.removeOSCRecvFunc(f);

Εναλλακτικά, η συνάρτηση µπορεί να ελέγχει συγκεκριµένα OSC-tag τις τιµές των οποίων στη συνέχεια
εκχωρούµε σε µεταβλητές του κώδικα. Ο έλεγχος συγκεκριµένων tag γίνεται µε την εντολή switch:

//OSC-listener
(
z = { |msg|
switch(msg[0])
{'/pitch'}{~pitch = msg[1]}
{'/co-ordinates'}{~pos_x = msg[1]; ~pos_y = msg[2]};
};
thisProcess.addOSCRecvFunc(z);
);

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Αδάµ, Δ. Προγραµµατίζοντας σε MIDI. Αθήνα: Σύγχρονη Μουσική, 2002.

Ξενόγλωσση Βιβλιογραφία.

Freed, A. και A. Schmeder, «Features and Future of Open Sound Control version 1.1 for NIME»,
Πρακτικά 2009 NIME Conference, 2009,
http://archive.notam02.no/arkiv/proceedings/NIME2009/nime2009/pdf/author/nm090097.pdf
(πρόσβαση: 20/11/2015).
Gibson, B. Compressors, Limiters, Expanders and Gates. Vallejo CA.: ProAudio Press, 2002.
Guerin, R. MIDI Power!. The Comprehensive Guide. Cengage Learning PTR, 2005.

222
Huber, D. M. The MIDI Manual: A Practical Guide to MIDI in the Project Studio. Waltham: Focal Press,
2007.
Wright, M. OpenSound Control Home Page. Berkeley CNMAT, (πρόσβαση: 21/11/2015).
Wright, M., και A. Freed, «Open Sound Control: A New Protocol for Communicating with Sound
Synthesizers», Πρακτικά International Computer Music Conference 1997, Thessaloniki, Greece,
1997, σελ. 101-4.

On Line

OSC. Berkeley CNMAT, http://opensoundcontrol.org/book/export/html/1 (πρόσβαση: 21/11/2015).

223
Κεφάλαιο 7
Έλεγχος και Ελεγκτές.
Σύνοψη
Στο παρόν Κεφάλαιο εξετάζεται η έννοια του ελέγχου, η σηµασία και ο ρόλος του στη µουσική µε υπολογιστές.
Παρουσιάζονται διαφορετικοί τύποι συσκευών εισόδου (input devices) και περιγράφονται οι δυνατότητες και οι
περιορισµοί τους. Τέλος, αναλύονται µέθοδοι ελέγχου του µουσικού υλικού, τόσο σε µικροδοµικό όσο και σε
µακροδοµικό επίπεδο, σε ένα έργο για φλάουτο µε προηχογραφηµένο υλικό (tape) και ζωντανή ηχητική
επεξεργασία.

Προαπαιτούµενη γνώση
Απαιτείται γνώση των βασικών λειτουργιών του προγραµµατιστικού περιβάλλοντος SuperCollider για την
καλύτερη κατανόηση των παραδειγµάτων που περιλαµβάνουν κώδικα.

7.1. Μουσικός Έλεγχος.


Στο ηµιτελές «Νέα Ατλαντίδα», βιβλίο που εξεδόθη το 1627, ο Francis Bacon έπλασε µια ουτοπική κοινωνία
µε ανθρωπιστικές ηθικές αξίες και µεγάλα τεχνολογικά επιτεύγµατα. Οι κάτοικοι του µυθικού νησιού
Bensalem (δυτικά των ακτών του Περού στον Ειρηνικό Ωκεανό), ζουν σε ένα περιβάλλον διαφωτισµού,
αγνών ιδεών και εξελιγµένων τεχνολογιών και αρέσκονται να καινοτοµούν στις επιστήµες και στις τέχνες. Ο
Bacon περιέγραψε µε γλαφυρό ύφος και πολλές λεπτοµέρειες τα επιτεύγµατα και την τεχνολογία αυτής της
ουτοπικής κοινωνίας. Μεταξύ των παραγράφων για τα πολύτιµα ορυκτά και τις εξαίρετες οσµές και γεύσεις,
ο συγγραφέας περιγράφει τον ηχητικό και µουσικό κόσµο που προσφέρει το νησί (Bacon, 1990):

Έχουµε ακόµα οίκους των ήχων για να ερευνούµε και να


µελετούµε όλους τους ήχους και τα γένη τους. Γνωρίζουµε
αρµονίες που δεν τις χρησιµοποιείτε. Δεν ανακατεύουµε τόσο
εκείνο το βήτα, το οξύ και µαλακό, όπως εσείς, όσο το
τετράγωνο των ήχων και µερικά γλυκύτατα τρέµουλα. Έχουµε
ακόµα πολλά µουσικά όργανα που δεν τα ξέρετε ακόµα. Μερικά
µάλιστα βγάζουν µια γλυκιά µουσική που δε συγκρίνεται µε τη
δική σας. Επίσης, καµπάνες και κουδούνια που χτυπούν
ευχάριστα. Παράγουµε λεπτούς και σύντοµους ήχους ή δυνατούς
και βαρείς. Ακόµη δηµιουργούµε πολλούς ηχητικούς παλµούς από
ήχους που αρχικά ήταν απλοί. Μιµούµαστε όλες τις αρθρωµένες
φωνές και τα γράµµατα καθώς και τις φωνές των ζώων και τη
λαλιά των πουλιών. Έχουµε βοηθητικά µέσα για την ακοή που τα
βάζουµε στ’ αφτιά για να µεγαλώνουν την ίδια την αίσθηση και
να βοηθούν στη µετάδοση των ήχων. Και ακόµη µαγνητόφωνα για
να συγκρατούν τη φωνή (αυτά που ονοµάζετε «ηχώ»). Έτσι, µε
θαυµάσιο τρόπο ξανακούς τη φωνή, αν θέλεις δυνατά ή χαµηλά.
Πολλά από αυτά αναµεταδίδουν την οµιλία πολύ διαφορετικά απ’
ότι ακούστηκε στην αρχή. Τελικά, έχουµε µέσα που µεταδίδουν
τη φωνή µε σωλήνες κι άλλα κοιλώµατα σε µεγάλη απόσταση και
σε πολλές γραµµές.

Αισιόδοξοι µουσικολόγοι και ακραιφνείς µελλοντολόγοι ερµήνευσαν αυτήν την παράγραφο ως λεκτικό
προάγγελο του ηλεκτρονικού στούντιο µουσικής. Παρότι ο Bacon αναφέρθηκε σε ανήκουστους ήχους και
εξωπραγµατικές αρµονίες και µελωδίες, δε µας ενηµέρωσε για τις µεθόδους παραγωγής τους. Δε γνωρίζουµε
τίποτα για την κατασκευή αυτών των ουτοπικών οργάνων ούτε για τις τεχνικές εκµάθησης και παιξίµατος.
Ιστορίες, µύθοι και δοξασίες ανά τους αιώνες περιγράφουν εξαίσιους ήχους και όργανα τα οποία µπορούσαν
να καταστρέψουν πόλεις και να ελέγξουν την ψυχική διάθεση των ανθρώπων. Από τις σάλπιγγες της Ιεριχούς
µέχρι τις Σειρήνες που αποπλάνησαν τον Οδυσσέα µε το γοητευτικό τραγούδι τους, υπερφυσικές ιδιότητες

224
αποδόθηκαν σε όργανα και ήχους. Πρόκειται για λογοτεχνικό οίστρο ή για ανεξερεύνητες πτυχές της δύναµης
του ηχητικού φαινοµένου; Με ποιον τρόπο κατασκευάστηκαν και µε ποιες τεχνικές παιξίµατος παρήγαγαν
αυτά τα όργανα τους άγνωστους και επιβλητικούς ήχους; Με ποιες µεθόδους και τεχνικές µπόρεσαν οι
άνθρωποι να τα ελέγξουν;
Η σχέση του ανθρώπου µε το µουσικό όργανο διέπεται από πολύπλοκες και, συχνά, διαισθητικές
διαδικασίες. Η ιστορία του ελέγχου των οργάνων και της παραγωγής µουσικής από αυτά, υποδεικνύει µια
διαρκή προσπάθεια µε βαθιές ρίζες στον χρόνο. Πρόσφατες ανασκαφές στην περιοχή Jiahu της επαρχίας
Henan στην Κίνα, έφεραν στην επιφάνεια κοκάλινα φλάουτα της Νεολιθικής εποχής µε ηλικία ως και 9000
χρόνια. Τα συγκεκριµένα, θεωρούνται τα πρώτα ολοκληρωµένα όργανα µε δυνατότητα παραγωγής µελωδιών.
Ο έλεγχος προσδίδει δυνατότητες αλλά και περιορισµούς. Όταν ο Theobald Boehm τελειοποίησε το
σύγχρονο µηχανισµό του κυλινδρικού φλάουτου το 1847, προσέδωσε σε αυτό νέες δυνατότητες αλλά και
ανελαστικότητες σε σχέση µε τα φλάουτα του Jiahu. Όλες οι κατασκευαστικές µετατροπές που υφίσταται ένα
όργανο έχουν ως σκοπό την παραγωγή νέων ηχοχρωµάτων και τη διεύρυνση του δεξιοτεχνικού παιξίµατος.
Στη σηµερινή εποχή, αν εξαιρέσουµε ελάσσονες τροποποιήσεις σε µηχανικά τµήµατα, οι ηχοχρωµατικές και
δεξιοτεχνικές δυνατότητες των οργάνων εξελίσσονται µέσω εργαλείων, λογισµικών και µεθόδων που
προσφέρει η επιστήµη της πληροφορικής. Οι διεπαφές που προστίθενται στη φαρέτρα του χρήστη-
οργανοπαίκτη περιλαµβάνουν αισθητήρες και ηλεκτρονικά κυκλώµατα που αποδίδουν αριθµητικές τιµές, οι
οποίες ελέγχουν τις παραµέτρους του ήχου και της µουσικής. Η σύγχρονη οργανολογία µετατοπίζει το
ενδιαφέρον της από τον φυσικό και συγκεκριµένο τρόπο ελέγχου ενός οργάνου (δοξάρι, µπαγκέτα, κλειδιά
κ.λπ.), σε περισσότερο αφηρηµένες µεθόδους αλληλεπίδρασης µεταξύ του οργάνου και του οργανοπαίκτη.
Έτσι, το παραδοσιακό όργανο δεν είναι πλέον ο τελικός στόχος αλλά η αφετηρία της διερεύνησης των
σχέσεων µεταξύ του µουσικού και της ηχητικής φαρέτρας του.
Ποια είναι τα στάδια ελέγχου σε ένα µουσικό όργανο; Ας πάρουµε το παράδειγµα ενός τυµπάνου. Η
µεµβράνη του διεγείρεται από την κρούση µιας µπαγκέτας παράγοντας µια σειρά διαφορετικών
ταλαντώσεων. Ένα ηχείο ενισχύει τις ταλαντώσεις και τις µεταβιβάζει στον αέρα. Η διαδικασία που
περιγράψαµε αποτελεί ένα ολοκληρωµένο σύστηµα χειρονοµιακού ελέγχου µε διακριτά στάδια. Η
πληροφορία εισόδου (η κινητική ενέργεια του οργανοπαίκτη που µετακινεί την µπαγκέτα), καταλήγει µετά
από διαδοχικές µετατροπές στην πληροφορία εξόδου που είναι οι αλλαγές στην πίεση του αέρα οι οποίες
παράγουν το ηχητικό σήµα. Ένα τέτοιο σύστηµα µπορεί να εφαρµοστεί για τον έλεγχο ενός µόνο οργάνου ή
µιας ολόκληρης ορχήστρας. Φυσικά, όσο πιο µακροσκοπικό είναι το επίπεδο ελέγχου τόσο περισσότερες
παραµέτρους περικλείει. Ένας διευθυντής ορχήστρας καλείται να ελέγξει ένα σύνολο παραµέτρων, τµήµα
των οποίων αποτελεί το τύµπανο. Εκτός από τον αριθµό όµως των παραµέτρων, ο µακροσκοπικός έλεγχος
διαφοροποιείται και ποιοτικά: ο διευθυντής ορχήστρας δεν ενδιαφέρεται να ελέγξει τη φυσική παραγωγή του
ήχου µέσω της κρούσης, που άλλωστε είναι δουλειά του τυµπανιστή, αλλά τη σύµπλευσή του µε δεκάδες
άλλα ηχοχρώµατα και δυναµικές που αναβλύζουν από το σύνολο των οργάνων της ορχήστρας. Ο έλεγχος
σχετίζεται και πηγάζει πάντα από το επιδιωκόµενο αποτέλεσµα.
Η παράδοση του χειρονοµιακού ελέγχου των οργάνων συνεχίστηκε στις αρχές του 20 ου αιώνα µε την
κατασκευή υβριδικών οργάνων70. Ένα τέτοιο υβριδικό όργανο υπήρξε το Theremin του Lev Sergeyevich
Termen (Εικόνα 7.1).

225
Εικόνα 7.1 Ο Lev Termen µε το Theremin (πηγή:
https://commons.wikimedia.org/wiki/File:Termen_demonstrating_Termenvox.jpg#/media/File:Termen_demonstrating_T
ermenvox.jpg).

Αναπτύχθηκε κατά τη δεκαετία του 1920 ως τµήµα ενός ερευνητικού προγράµµατος της Σοβιετικής Ένωσης
για τους αισθητήρες εγγύτητας (proximity sensors). Ένας αισθητήρας εγγύτητας µπορεί να αντιληφθεί την
παρουσία ενός κοντινού αντικειµένου και την αυξοµείωση της απόστασης που τον χωρίζει από αυτό. Αυτή
είναι η βασική ιδέα πίσω από την κατασκευή και τον τρόπο παιξίµατος του Theremin. Διαθέτει δύο κεραίες οι
οποίες αντιλαµβάνονται τις αυξοµειώσεις της απόστασης από τα χέρια του εκτελεστή. Η αριστερή κεραία, η
οποία έχει το σχήµα του βρόγχου, ελέγχει την ένταση του ήχου και η δεξιά το τονικό ύψος. Οι ταλαντωτές
που βρίσκονται στο εσωτερικό του οργάνου και οι οποίοι ελέγχονται από τις κεραίες, παράγουν ηλεκτρικό
σήµα το οποίο ενισχύεται και στέλνεται στην έξοδο του οργάνου και από εκεί στα ηχεία. Ο έλεγχος του
ηχοχρώµατος σε ένα σύγχρονο Theremin (Εικόνα 7.2) γίνεται µέσω επιλογής της κυµατοµορφής
(ηµιτονοειδής, τριγωνική, πριονωτή, τετραγωνική) που παράγουν οι ταλαντωτές. Το Theremin
χρησιµοποιήθηκε συχνά σε κινηµατογραφική µουσική λόγω του αιθέριου και µυστηριώδους ηχοχρώµατός
του. Γνωστά παραδείγµατα είναι η ταινία επιστηµονικής φαντασίας «The Day the Earth Stood Still» του
Robert Wise το 1951 µε µουσική του Bernard Herrmann και το ψυχολογικό θρίλερ «Spellbound» του Alfred
Hitchcock το 1945 µε µουσική του Miklos Rozsa. Πολλά σύγχρονα δηµοφιλή συγκροτήµατα, όπως οι
Radiohead, ενσωµατώνουν το Theremin σε παραγωγές τους, επεκτείνοντας µε αυτόν τον τρόπο τη δηµοφιλία
του σε ένα ευρύ κοινό.

Εικόνα 7.2 Σύγχρονο Theremin Moog. Μικρότερο σε µέγεθος και µε περισσότερες της µιας κυµατοµορφές (πηγή:
https://commons.wikimedia.org/wiki/File:Etherwave_Theremin_Kit.jpg#/media/File:Etherwave_Theremin_Kit.jpg).

226
Ένα ποιοτικό χαρακτηριστικό του ελέγχου των οργάνων, το οποίο έχει τις ρίζες του στο Theremin, είναι η
υπέρβαση των καθιερωµένων ορίων στην παραγωγή µουσικής. Κεντρική ιδέα της διαφηµιστικής καµπάνιας
για το Theremin στην Αµερική, υπήρξε η δυνατότητα που προσέφερε σε ανθρώπους να παράξουν µουσική
χωρίς δεξιοτεχνικές ικανότητες. Με την απλή κίνηση των χεριών τους και χωρίς να ακουµπούν χορδές ή να
φυσούν σε σωλήνες, µπορούσαν να γίνουν µουσικοί. Παρότι το παίξιµο του Theremin απαιτεί πολύχρονη
πρακτική, η παραπάνω προσέγγιση συνέδεσε τον έλεγχο µε φανταστικές επιδιώξεις. Η µεταµόρφωση της
πραγµατικότητας σε µια φαντασιακή δυνατότητα άνοιξε νέους ορίζοντες στις τεχνικές και µεθοδολογίες
ελέγχου των οργάνων µέσω ηλεκτρονικών κυκλωµάτων. Σήµερα για παράδειγµα, µπορούµε να πιέσουµε το
πλήκτρο ενός πληκτροφόρου οργάνου για να παίξουµε τη νότα ενός κλαρινέτου, να κρούσουµε την επιφάνεια
ενός τυµπάνου για να ακουστεί το ηχοτοπίο µιας πόλης ή να ακουµπήσουµε µια σειρά λαχανικών και
φρούτων για να παράξουµε ηχητικές υφές και ρυθµικά µοτίβα71. Ο έλεγχος των οργάνων δεν περιορίζεται
πλέον στη διαµόρφωση των παραµέτρων µιας νότας ή µιας συγχορδίας. Αν και αναφέρεται στην εµπειρία του
ως αυτοσχεδιαστής, ο Jordà (2007) επισηµαίνει τις συνέπειες αυτής της µεταµόρφωσης72:

Ο µουσικός εκτελεί στρατηγικές ελέγχου αντί για την εκτέλεση


δεδοµένων και το όργανο οδηγείται σε πιο σύνθετες αντιδράσεις
στα ερεθίσµατα του εκτελεστή. Αυτή η συνθήκη τείνει να
υπερκεράσει τα παραδείγµατα εκτέλεσης νότα-προς-νότα και ‘µια
χειρονοµία-ένα ακουστικό συµβάν’ τα οποία διέπουν όλα τα
παραδοσιακά όργανα, επιτρέποντας έτσι στους µουσικούς να
εργαστούν σε διαφορετικά µουσικά επίπεδα και προτρέποντάς
τους να λαµβάνουν στιγµιαίες αποφάσεις σε υψηλότερα
(συνθετικά) επίπεδα.
Η έννοια της ‘νότας’, της δοµικής λίθου της Δυτικής µουσικής,
καθίσταται µια επιλογή παρά µια αναγκαιότητα, περιβαλλόµενη
τώρα από τη (µακροδοµική) φόρµα και τον (µικροδοµικό) ήχο.
(Μ.τ.Σ.)

7.2. Συσκευές Εισόδου.


Οι συσκευές εισόδου λειτουργούν ως µεταπράτες της φυσικής ενέργειας µιας χειρονοµίας του χρήστη σε
αναλογικό σήµα, το οποίο εισάγεται στη συνέχεια στον υπολογιστή ως ψηφιακή πληροφορία µέσω του ADC.
Οι υπολογιστές µε τη σειρά τους, ιδιαίτερα αυτοί που είναι εφοδιασµένοι µε λογισµικά τεχνητής νοηµοσύνης,
έχουν τη δυνατότητα να επιστρέφουν την πληροφορία στο περιβάλλον προέλευσής της. Έτσι, ο χρήστης και ο
υπολογιστής δηµιουργούν ένα αλληλεπιδραστικό περιβάλλον επικοινωνίας στο οποίο ο χρήστης τροφοδοτεί
τον υπολογιστή και ο υπολογιστής ανατροφοδοτεί τον χρήστη. Πρόκειται για µια εκ φύσεως ερευνητική
διαδικασία, κατά την οποία ο χρήστης διερευνά τις σχέσεις του µε το λογισµικό επεξεργασίας, ενώ
ταυτόχρονα αναζητά νέες µεθόδους τροφοδότησης πληροφοριών σε αυτό. Η χειρονοµιακή δράση του χρήστη
διευρύνεται τόσο τυπολογικά όσο και εκφραστικά (Εικόνα 7.3).

227
Εικόνα 7.3 Δηµόσια ηλεκτρονική τέχνη στο Portland του Oregon, ΗΠΑ. Αισθητήρες εγγύτητας µετρούν την απόσταση του
χεριού του χρήστη (πηγή: https://www.flickr.com/photos/20712950@N00/9832472935).

Ο ηλεκτρονικός ελεγκτής «αισθάνεται» και χαρτογραφεί τις χειρονοµίες του µουσικού, δυναµικές ή
ανεπαίσθητες, ελεγχόµενες ή διαισθητικές. Αναζητά τις κατάλληλες λογικές συνδέσεις για να αντιστοιχίσει τη
χειρονοµία του εκτελεστή σε µεταβολές των παραµέτρων του ήχου. Τα υπερ-όργανα (hyperinstruments) του
Tod Machover ακολουθούν αυτήν ακριβώς την πρακτική. Στο έργο του «Begin Again Again...» για υπερ-
τσέλο (hypercello) µε εκτελεστή τον Yo Yo Ma, αισθητήρες τοποθετηµένοι στο χέρι του τσελίστα, µετρούν
την πίεση του δοξαριού και το βαθµό επαφής µε τις χορδές του οργάνου. Επιπλέον, δείκτες που ανιχνεύουν τη
θέση των δαχτύλων του αριστερού χεριού και του καρπού, παράγουν µετρήσεις οι οποίες αξιολογούνται και
υπόκεινται σε επεξεργασία από τον υπολογιστή για την παραγωγή συνθετικών ήχων που συνοδεύουν το
τσέλο. Η αξιολόγηση του υπολογιστή και η όποια αντίδρασή του στη σύνθεση του ήχου, εξαρτώνται από την
τροφοδότηση που δέχεται από τον τσελίστα, από την χειρονοµιακή του δράση και, σε µεγάλο βαθµό, από την
αντίδρασή του στην ανατροφοδότηση που δέχεται από τον υπολογιστή.
Οι πληροφορίες ελέγχου που προέρχονται από τις συσκευές εισόδου, οδηγούνται µέσω ενός
πρωτοκόλλου επικοινωνίας (MIDI, OSC) σε µονάδες ηχητικής επεξεργασίας ή σε γεννήτριες παραγωγής
ήχου. Αυτές, αποτελούν την ψηφιακή εκδοχή της πηγής που διεγείρεται και ταλαντώνεται, όπως η µεµβράνη
του τυµπάνου που διεγείρεται από την κρούση της µπαγκέτας στο παράδειγµα που παρουσιάσαµε πιο πάνω.
Σήµερα διατίθεται πληθώρα ελεγκτών. Το πληκτρολόγιο του υπολογιστή, το ποντίκι, ένα κουµπί, ένα
ποτενσιόµετρο, ένας τροχός διαµόρφωσης, ένας αισθητήρας ή ένα χειριστήριο οποιασδήποτε µορφής
(joystick κ.ά.) παράγουν δεδοµένα ελέγχου τα οποία µετατρέπονται σε µηνύµατα ελέγχου µέσα στον
υπολογιστή (Εικόνα 7.4). Οποιαδήποτε άρθρωση, αλλαγή ή επιτάχυνση µιας κίνησης ή χειρονοµίας, µια
πίεση στην αφή, η ένταση του φωτός, η µέτρηση της θερµοκρασίας και της υγρασίας του δέρµατος ή ενός
χώρου, οι παλµοί της καρδιάς και τα εγκεφαλικά κύµατα από την ηλεκτρική δραστηριότητα του εγκεφάλου,
µπορούν να χρησιµοποιηθούν από µουσικούς ελεγκτές. Τα δεδοµένα όλων αυτών των µετρήσεων
καταγράφονται στον υπολογιστή, υπόκεινται σε µετατροπές και δροµολογούνται στις µονάδες ηχητικής
επεξεργασίας και σύνθεσης για τον παραµετρικό έλεγχο του ήχου.

228
Εικόνα 7.4 Joystick κατασκευασµένο για την προσοµοίωση πτήσεων σε video games. Μπορεί να στείλει τιµές ελέγχου σε
µια µονάδα ηχητικής επεξεργασίας ή σύνθεσης ήχου µέσω ενός πρωτοκόλλου επικοινωνίας.

Πολλά σύγχρονα λογισµικά, µεταξύ των οποίων δεκάδες συνθετητές προσοµοιάζουν παλαιότερα όργανα.
Υιοθετώντας τεχνικές φυσικής µοντελοποίησης (physical modeling) προσδίδουν στον ηλεκτρονικό ήχο τους
την ηχοχρωµατική πολυπλοκότητα και το εύρος των δυναµικών των προκατόχων τους. Η «software vs
hardware» διαµάχη, όπως έχει γίνει γνωστή, βασίζεται στο επιχείρηµα ότι τα κλωνοποιηµένα σε ψηφιακό
περιβάλλον όργανα δεν µπορούν να ελεγχθούν από τους ίδιους αναλογικούς µηχανισµούς των αυθεντικών
οργάνων και, κατά συνέπεια, δεν µπορούν να αποδώσουν την ίδια ηχοχρωµατική πληρότητα των αυθεντικών
οργάνων. Στο περιοδικό ήχου και µουσικής «Sound On Sound» του Απριλίου 2004, ο Mike Watkinson
εξέθεσε όλες τις πτυχές του προβλήµατος73:

Ένα από τα πρώτα ζητήµατα προς επίλυση στην προσπάθεια


αναπαραγωγής του ήχου του Hammond, ήταν το γεγονός ότι οι
βασικές ηλεκτροµηχανολογικές γεννήτριές του παρήγαγαν τον
ιδιαίτερο ήχος τους. Παρότι ο Laurens Hammond προσπάθησε να
πετύχει έναν «καθαρό» ήχο, δεν τα κατάφερε εξαιτίας
περιορισµών στον σχεδιασµό και στη διαδικασία κατασκευής, µε
αποτέλεσµα αυτά που θεωρούσε «ατέλειες» να παρεισφρήσουν στον
ήχο του οργάνου. Δεύτερον, ο ίδιος ο Hammond προσέθεσε
επεξεργαστές στον ήχο, όπως το περίφηµο Chorus/Vibrato. Και
τρίτον, οι περισσότεροι οργανίστες του Hammond χρησιµοποιούν
το σύστηµα ενίσχυσης Leslie...που προκαλεί µια τεράστια
διαφοροποίηση στον ήχο, γεγονός που κάνει τους περισσότερους
οργανίστες να το θεωρούν αναπόσπαστο κοµµάτι του Hammond.
Συµπερασµατικά, οι «ατέλειες» στον ήχο ενός αυθεντικού
Hammond ευθύνονται σε µεγάλο ποσοστό για τη γοητεία του και
µια αξιοπρεπής προσοµοίωσή του σε λογισµικό οφείλει να
σεβαστεί αυτές τις ιδιαιτερότητες. Μ.τ.Σ.

Το θέµα του ελέγχου είναι σύνθετο και πολυδιάστατο. Πριν την ενσωµάτωση προηχογραφηµένων ηχητικών
δειγµάτων σε συνθετητές και samplers, η προσοµοίωση των εγχόρδων και των πνευστών οργάνων ήταν
άκρως προβληµατική. Οι τεχνικές σύνθεσης αδυνατούσαν να αποδώσουν πειστικά τον ηχοχρωµατικό πλούτο
αυτών των οργάνων γιατί δεν µπορούσαν να προσοµοιάσουν τις «ατέλειές» τους, τον θόρυβο που παράγεται
από την τριβή του δοξαριού στη χορδή, την αυξοµειούµενη πίεση του αέρα στον σωλήνα του πνευστού
οργάνου, τις µικροσκοπικές µεταβολές (transients) πλάτους στην έναρξη της ατάκας κ.λπ. Επιστρέφουµε έτσι
στο βασικό ερώτηµα: πώς µπορεί ένα ανοικτό, θορυβώδες και φαινοµενικά ατελές σύστηµα, όπως το παίξιµο
του βιολιού ή του οργάνου Hammond, να προσοµοιωθεί από ένα κλειστό, άκριτο και φαινοµενικά τέλειο
υπολογιστικό µοντέλο; πώς µπορούν οι απειράριθµες µορφοποιητικές µεταβολές που αποτυπώνονται στο

229
πέρασµα του χρόνου να αποδοθούν από το δυαδικό σύστηµα των υπολογιστών; Παραφράζοντας τον Michel
Houellebecq στο βιβλίο του «Η Δυνατότητα Ενός Νησιού», πώς µπορούµε, απορρίπτοντας το ατελές
παράδειγµα της µορφής, να σµίξουµε µε το σύµπαν των δυαδικών δυνατοτήτων;
Όπως είδαµε, οι ροές µηνυµάτων που στέλνονται από τις ψηφιακές συσκευές εισόδου είναι
δοµηµένες σε τιµές του δυαδικού συστήµατος. Μικροεπεξεργαστές µε ενσωµατωµένα ADC και DAC, πρέπει
αρχικά να αποκωδικοποιήσουν αυτά τα µηνύµατα, ώστε να σταλούν στη συνέχεια στον συνθετητή ή στη
µονάδα ηχητικής επεξεργασίας οι κατάλληλες εντολές για την παραγωγή του ήχου (Σχήµα 7.1).

Σχήµα 7.1 Ροή µηνυµάτων ελέγχου.

Αν και παλαιότερα όλες οι MIDI συσκευές απαιτούσαν για τη σύνδεσή τους τα ειδικά καλώδια MIDI, οι
σύγχρονες εκδοχές τους χρησιµοποιούν µια σύνδεση USB.

7.3. Ελεγκτές On-Off και Ελεγκτές Συνεχούς Ροής.


Όλα τα όργανα που χρησιµοποιούν το πρωτόκολλο MIDI είναι εφοδιασµένα µε ελεγκτές δύο βασικών
κατηγοριών: διακριτών µηνυµάτων (on-off) και συνεχούς ροής (continuous controllers, CC) (Εικόνα 7.5).
Αυτή η κατηγοριοποίηση προκύπτει από τον τύπο του ελέγχου που απαιτείται κάθε φορά. Για παράδειγµα, η
ενεργοποίηση ενός φίλτρου ή η έναρξη αναπαραγωγής ενός ήχου (playback) µπορούν να ρυθµιστούν µε έναν
διακόπτη on-off που ξεκινά ή σταµατά τη διαδικασία. Πολλές παράµετροι όµως αλλάζουν συνεχώς στην
εξέλιξη του χρόνου και, συνεπώς, απαιτούν διαρκή και συνεχόµενο έλεγχο. Έτσι, η ένταση ενός ήχου ή το
ποσοστό αντήχησης που εφαρµόζουµε ελέγχονται καλύτερα από ένα ποτενσιόµετρο παρά από έναν διακόπτη.
Οι ελεγκτές on-off περιλαµβάνουν κουµπιά ή πλήκτρα και λειτουργούν ως διακόπτες που βρίσκονται
σε ανοικτή (1=on) ή κλειστή (0=off) θέση. Σε τιµές MIDI, αυτές οι θέσεις αντιστοιχίζονται συνήθως σε 127
για τη µέγιστη τιµή της θέσης on και 0 για τη θέση off. Οι ελεγκτές on-off στέλνουν διακριτά µηνύµατα όπως
τα note on, note off, program change κ.ά.
Οι ελεγκτές συνεχούς ροής αποστέλλουν µηνύµατα εύρους 128 τιµών. Από αυτόν τον κανόνα
εξαιρείται ο τροχός bitch bend, στον οποίο έχει ανατεθεί ένα εξειδικευµένο µήνυµα MIDI µε µεγαλύτερο
αριθµό διαθέσιµων bits τα οποία µπορούν να αποδώσουν 16.384 τιµές.

Εικόνα 7.5 Ποτενσιόµετρα, κουµπιά και τροχός διαµόρφωσης στο πάνελ ελέγχου του Novation Remote keyboard (πηγή:
https://commons.wikimedia.org/wiki/File:Remote_25.jpg).

230
Περισσότερες πληροφορίες για τα µηνύµατα ελέγχου και η λίστα µε τους ελεγκτές συνεχούς ροής του
πρωτοκόλλου MIDI δίνονται στο κεφάλαιο 6.

7.4. Παραµετρικός Έλεγχος.


Πολλά σύγχρονα ηλεκτρικά όργανα διαθέτουν µηχανισµούς αυτοµατισµού και παραµετρικού ελέγχου. Ένα
παράδειγµα τέτοιου ελέγχου είναι ο µηχανισµός του µεταβαλλόµενου vibrato στο βιµπράφωνο. Ανάλογο
µηχανισµό διαθέτει το Hammond organ που εξετάσαµε πιο πάνω. Η διάταξη Leslie αποτελούµενη από έναν
ενισχυτή και δύο ηχεία υψηλών (treble) και χαµηλών (bass) συχνοτήτων αναπαράγει τον ήχο του οργάνου
ενώ ταυτόχρονα περιστρέφει τα ηχεία παράγοντας vibrato. Ο οργανίστας ελέγχει την ταχύτητα περιστροφής
µέσω ενός διακόπτη ή ενός πεταλιού.
Με έναν απλουστευτικό τρόπο, η παραγωγή ενός µουσικού έργου µπορεί να αναχθεί στη σύζευξη
ενός συνόλου διακριτών παραµέτρων, κάθε µια από τις οποίες µπορεί να µετρηθεί και να υποστεί
επεξεργασία. Τέτοιες παράµετροι είναι το τονικό ύψος, το ηχόχρωµα και η υφή, ο ρυθµός, η µελωδία και η
αρµονία, η δυναµική, το tempo και η άρθρωση. Κάθε µια από αυτές αντιστοιχεί σε µια τιµή για κάθε µονάδα
χρόνου. Η παραδοχή ότι όλα τα συστατικά του ήχου µπορούν να αναχθούν σε σειρές αριθµητικών τιµών µας
οδηγεί στη διαπίστωση πως αυτές οι τιµές µπορούν να παραχθούν και να ελεγχθούν από έναν κατάλληλο
ελεγκτή. Για παράδειγµα, η θέση, η κλίση και το µέγεθος πίεσης ενός δοξαριού πάνω σε µια χορδή µπορούν
να µετρηθούν και να αποδώσουν σειρές τιµών, οι οποίες µε τη σειρά τους µπορούν να τροποποιηθούν και να
χρησιµοποιηθούν για να ελέγξουν άλλες παραµέτρους. Στον ψηφιακό κόσµο, οτιδήποτε µπορεί να αποδώσει
τιµές, οι οποίες µεταφράζονται µέσω ενός πρωτοκόλλου επικοινωνίας σε τιµές που καταλαβαίνει ο
υπολογιστής, µπορεί να αξιοποιηθεί για τον παραµετρικό έλεγχο.
Χρησιµοποιώντας µια γλώσσα µουσικού προγραµµατισµού µπορούµε να ορίσουµε τη συσκευή
εισόδου και να προγραµµατίσουµε τις παραµέτρους του ελέγχου. Στο παρακάτω παράδειγµα σε περιβάλλον
SuperCollider, βλέπουµε σχετικές εφαρµογές.

{ SinOsc.ar(MouseX.kr(100, 1000, 'linear', 2), 0, 0.1) }.play;

{ SinOsc.ar(MouseY.kr(100, 1000, 'exponential', 2), 0, 0.1) }.play;

Οι γεννήτριες (UGens) MouseX και MouseY ελέγχουν το εύρος µεταξύ του αριστερού και του δεξιού
(MouseX) και του κάτω και πάνω (MouseY) άκρου της οθόνης του υπολογιστή. Στις συγκεκριµένες γραµµές
κώδικα χρησιµοποιούνται για να ελέγξουν τη διαµόρφωση της συχνότητας που παράγει η γεννήτρια SinOsc.
Στην πρώτη γραµµή, η γεννήτρια MouseX θα διαµορφώσει τη συχνότητα σε 100 Hz όταν ο κέρσορας βρεθεί
στο αριστερό άκρο της οθόνης και στα 1.000 Hz όταν µετατοπιστεί στο δεξί άκρο. Οι ενδιάµεσες θέσεις του
κέρσορα στην οθόνη θα αντιστοιχηθούν σε ενδιάµεσες συχνότητες. Αντίστοιχα, στη δεύτερη γραµµή κώδικα,
η γεννήτρια MouseY θα διαµορφώσει τη συχνότητα σε 100 Hz όταν ο κέρσορας βρεθεί στο πάνω άκρο της
οθόνης και στα 1.000 Hz όταν µετατοπιστεί στο κάτω άκρο. Η καµπύλη χαρτογράφησης (mapping curve) για
τις συχνότητες µπορεί να είναι γραµµική (linear) ή εκθετική (exponential).
Το ίδιο ακριβώς αποτέλεσµα µπορεί να επιτευχθεί αυτοµατοποιηµένα και χωρίς τη χρήση του
ποντικιού και του κέρσορα.

{ SinOsc.ar(XLine.kr(100, 1000, 10), 0, 0.1) }.play;

Η γεννήτρια XLine παράγει µια εκθετική καµπύλη από µια αρχική (start value) σε µια τελική τιµή (end
value). Στη συγκεκριµένη γραµµή κώδικα, η αρχική τιµή είναι 100 και η τελική 1.000. Αυτές οι τιµές
ελέγχουν τις παραγόµενες συχνότητες της γεννήτριας SinOsc σε διάστηµα 10 δευτερολέπτων (100, 1000,
10).
Στο παρακάτω παράδειγµα δίνεται η ενσωµάτωση αυτού του τρόπου ελέγχου σε ένα patch µε
pitchshifting. Με έντονη γραµµατοσειρά διακρίνονται οι γεννήτριες XLine οι οποίες ελέγχουν το τονικό ύψος
του ηχητικού σήµατος που λαµβάνουν από το µικρόφωνο (SoundIn.ar). Η πρώτη XLine.kr(8.0, 2.0,
60) µετατοπίζει τον ήχο από 8 ως 2 οκτάβες πάνω από το αρχικό τονικό ύψος του σε χρονικό διάστηµα 60
δευτερολέπτων. Οι άλλες δύο γεννήτριες XLine.kr(0.001, 0.01, 60) και XLine.kr(0.1,
grainSize, 60) καθορίζουν το εύρος διασποράς των τονικών υψών και του χρόνου αντίστοιχα.

231
(
SynthDef(\pitchshifter,
{ | out, in = 6, gate = 1 |
var signal, env, grainSize = 0.1;

signal = PitchShift.ar(
SoundIn.ar(in),
grainSize,
XLine.kr(8.0, 2.0, 60),
XLine.kr(0.001, 0.01, 60),
XLine.kr(0.1, grainSize, 60)
)!2;
env = EnvGen.ar(
Env([ 0, 1, 0 ], [ 0.02, 6.0 ], releaseNode: 1),
gate,
doneAction: 2
);
Out.ar(out, signal * env)
}).load(s);
)
z = Synth("pitchshifter");
z.release;

Με αυτόν τον τρόπο αυτοµατοποιούµε παραµέτρους των ηχητικών επεξεργασιών ενώ ταυτόχρονα ορίζουµε
τις χρονικές τους διάρκειες.

7.5. Συστήµατα Ελεγκτών DIY.


Πολλοί µουσικοί επιλέγουν να κατασκευάσουν τους προσωπικούς τους ελεγκτές απαντώντας σε ιδιαίτερες
και εξειδικευµένες ανάγκες ελέγχου του µουσικού υλικού τους. Όλο και περισσότερες εταιρίες προσφέρουν
εξαρτήµατα για το σχεδιασµό και τη συναρµολόγησή τους. Διακόπτες, ποτενσιόµετρα, joysticks, φώτα LED,
επιταχυνσιόµετρα και άλλοι αισθητήρες συνδέονται σε ηλεκτρονικές πλακέτες για την κατασκευή όλο και πιο
ευφάνταστων και περίπλοκων ελεγκτών (Εικόνα 7.6).

Εικόνα 7.6 Η πλακέτα Brain Jr. της εταιρίας Livid (πηγή:


https://commons.wikimedia.org/wiki/File:Livid_Builder_Brain_Jr._board_(2013-02-
08_07.42.23_by_Livid_Instruments).png).

232
Η δηµοφιλέστερη ίσως πλακέτα υποδοχής ελεγκτών και αισθητήρων κατά την περίοδο συγγραφής αυτού του
βιβλίου είναι το Arduino το οποίο παρουσιάστηκε το 2005 (Εικόνα 7.7). Πρόκειται για ένα σύστηµα ανοικτού
κώδικα (open source) που περιλαµβάνει λογισµικό και υλισµικό. Για τον προγραµµατισµό των αισθητήρων,
το Arduino χρησιµοποιεί το περιβάλλον Processing µε υποστήριξη των γλωσσών C, C++ και Java.

Εικόνα 7.7 Το Arduino Uno (πηγή: https://commons.wikimedia.org/wiki/File:ArduinoUnoSMD.jpg).

Η χρήση τέτοιων ιδιοκατασκευών υπερβαίνει τον παραµετρικό έλεγχο της µουσικής. Συστήµατα αισθητήρων
χρησιµοποιούνται σε εγκαταστάσεις (installations), σε παραστάσεις χορού, σε εικαστικά δρώµενα και σε κάθε
µορφή µεικτής τέχνης στην οποία οποιοδήποτε στοιχείο του χρήστη ή του περιβάλλοντος µπορεί να
εντοπιστεί, να µετρηθεί και να αντιστοιχηθεί σε έναν περίπλοκο χάρτη παραµέτρων ελέγχου. Υπάρχει
πληθώρα τέτοιων παραδειγµάτων στη βιβλιογραφία και στο διαδίκτυο τα οποία ο αναγνώστης µπορεί να
αναζητήσει.

7.6. Ελεγκτές Χειρονοµιακού Ελέγχου (Gestural Controllers).


Η φύση της χειρονοµίας είναι απόλυτα συνυφασµένη µε την οργάνωση του ήχου στη µουσική τέχνη. Η
αιτιοκρατική σχέση χειρονοµίας και µουσικού αποτελέσµατος, όπου κάθε παραγόµενος ήχος συνδέεται και
πηγάζει από µια προηγούµενη δράση εκτέλεσης, καταδεικνύει τη σπουδαιότητα του χειρονοµιακού ελέγχου.
Από την κίνηση των δαχτύλων σε ένα όργανο και τις χειρονοµίες ενός διευθυντή ορχήστρας µέχρι την
απτότητα των αισθητήρων αφής και τον εντοπισµό κίνησης από µια κάµερα, η χειρονοµία είναι η µηχανή
στην παραγωγή της µουσικής.
Ένας από τους πρώτους σύγχρονους ελεγκτές για τη χαρτογράφηση των χειρονοµιών του χρήστη
υπήρξε το Radio Baton του Max Mathews (Εικόνα 1.9). Ο χειριστής χρησιµοποιούσε δύο µπαγκέτες µε τις
οποίες µπορούσε να παράξει ορχηστρική συνοδεία για την εκτέλεσή του. Το εύρος των κινήσεων και των
χειρονοµιών που χρησιµοποιούνται σήµερα για τον έλεγχο των ηχητικών παραµέτρων έχει διευρυνθεί σε
µεγάλο βαθµό.

7.6.1. Ανάλυση Χειρονοµίας.

Η πληθώρα και το είδος των συσκευών ελέγχου µας επιτρέπουν να ερευνήσουµε νέους τύπους και πηγές
χειρονοµιών, µεταξύ των οποίων οι κινήσεις ενός χορευτή, ενός ηθοποιού ή µιας οµάδας ανθρώπων που
δρουν ακούσια ή εκούσια. Η τυπολογία των χειρονοµιών περιλαµβάνει το σύνολο των κινήσεων µιας
εκτέλεσης αλλά και το εκτελεστικό ύφος του µουσικού. Η αναγνώριση και η χαρτογράφηση των κινήσεων
βασίζονται στον εντοπισµό χρονικών χαρακτηριστικών τους από µια κάµερα ή από αισθητήρες
τοποθετηµένους στο σώµα του µουσικού.
Η διεπιστηµονική ερευνητική οµάδα Sound Music Movement Interaction µε έδρα το Institut de
Recherche et Coordination Acoustique/Musique (IRCAM) στο Παρίσι, δραστηριοποιείται στην ανάπτυξη
διαδραστικών συστηµάτων για τη δηµιουργία και την εκτέλεση µουσικής. Το εύρος των ερευνών της οµάδας
καλύπτει τοµείς όπως η µηχανική και η φυσιολογία της κίνησης, η βιοµηχανική µέτρηση και η γνωσιακή-
συµπεριφορική ανάλυση, µε σκοπό την ανάπτυξη διεπαφών παρακολούθησης και εντοπισµού (gesture
following) και µέτρησης και χαρτογράφησης της χειρονοµίας.

233
Πολλά από τα συστήµατα αναγνώρισης κινήσεων µε χρήση αλγόριθµων ανάλυσης χειρονοµιών
προέρχονται από τη βιοµηχανία θεάµατος και οικιακής ψυχαγωγίας όπως η κονσόλα Wii και το Wii Remote
της εταιρίας Nintendo, το Kinect της Microsoft και το Leap Motion της Leap Motion Inc.

7.7. Απτικές Διεπαφές Χρήστη (Tangible User Interface-TUI).


Μια απτική διεπαφή περιλαµβάνει φυσικά αντικείµενα τα οποία διαµορφώνουν και ελέγχουν µέσω της
κίνησής τους τα ψηφιακά δεδοµένα που επεξεργάζεται ο υπολογιστής. Ανάµεσα στα πλεονεκτήµατα των
απτικών διεπαφών είναι η αµεσότητα της φυσικής δράσης που καλείται να ασκήσει ο χρήστης. Η όποια
ενέργειά του συσχετίζεται άµεσα µε το αποτέλεσµά της. Για παράδειγµα, η κίνηση του ποντικιού έχει ως
άµεσο αποτέλεσµα τη µετακίνηση του κέρσορα στην οθόνη.
Η δηµοφιλέστερη ίσως απτική διεπαφή κατά την εποχή συγγραφής αυτού του βιβλίου είναι το
Reactable που αναπτύχθηκε στο Universitat Pompeu Fabra της Βαρκελώνης (Εικόνα 7.8). Πρόκειται για ένα
στρογγυλό τραπέζι/οθόνη µε εσωτερικό φωτισµό. Στην επιφάνεια του τραπεζιού τοποθετούνται κύβοι και
άλλα αντικείµενα («tangibles») τα οποία ελέγχουν έναν αρθρωτό συνθετητή µέσω της κίνησής τους. Οι
διαφορετικοί τύποι των αντικειµένων αντιστοιχούν στα διαφορετικά λειτουργικά µέρη του συνθετητή (Low
Frequency Oscillator-LFO, Voltage Controlled Oscillator-VCO, Voltage Controlled Filter-VCF, Voltage
Controlled Amplifier-VCA κ.ά.). Ο τρόπος λειτουργίας της διεπαφής είναι απλός και διαισθητικός. Κάθε
φορά που ένα αντικείµενο τοποθετείται στην οθόνη, εµφανίζονται σύµβολα τα οποία µπορούν να συνδεθούν
µε το αρχικό αντικείµενο για την παραγωγή ήχου.

Εικόνα 7.8 Το Reactable. (πηγή:


https://commons.wikimedia.org/wiki/File:Reactable_Multitouch.jpg#/media/File:Reactable_Multitouch.jpg).

Μια από τις πρώτες διεπαφές που χρησιµοποίησε καταγραφή χειρονοµιών σε οθόνη υπήρξε το Unité
Polyagogique Informatique du CEMAMu (UPIC). Ο Ιάννης Ξενάκης ξεκίνησε την ανάπτυξη του UPIC το
1977 στο Centre d’Etudes de Mathématiques et Automatiques Musicales (CEMAMu). Επρόκειτο για µια
συσκευή εισόδου µε οθόνη συνδεδεµένη σε έναν υπολογιστή Hewlett-Packard. Ο οριζόντιος άξονας της
οθόνης αντιπροσώπευε τον χρόνο και ο κάθετος τα τονικά ύψη. Ο χρήστης µπορούσε να σχεδιάσει στην
οθόνη δοµικές µονάδες όπως κυµατοµορφές και περιβάλλουσες έντασης. Στη συνέχεια, µε βάση αυτές τις
δοµικές µονάδες, ο χρήστης σχεδίαζε στην οθόνη τη σύνθεσή του για την οποία όριζε µια χρονική διάρκεια.
Ο Ξενάκης χρησιµοποίησε το UPIC στη σύνθεση της µουσικής για τα πολύτοπα «La Legende d’Eer» (1977)
και «Mycènes Alpha» (1978).

7.8. Εντοπισµός Τονικού Ύψους (Pitch Tracking).


Η ανάλυση και ο εντοπισµός χαρακτηριστικών και γνωρισµάτων ενός ήχου από τον υπολογιστή εντάσσεται
στη γενικότερη προσπάθεια του ανθρώπου να εκπαιδεύσει τις µηχανές. Ο υπολογιστής πρέπει να µάθει να
ακούει όπως ακούµε, να αναγνωρίζει όπως αναγνωρίζουµε, να εκτιµά όπως εκτιµούµε και να αποφασίζει

234
όπως αποφασίζουµε. Ο Robert Rowe (2004) ονοµάζει αυτήν τη διαδικασία Machine Musicianship και την
αναλύει σε βάθος στο οµώνυµο βιβλίο του. Η ανάλυση του ηχητικού σήµατος αποτελεί µια βασική πηγή
άντλησης πληροφοριών για τη λειτουργία των διαδραστικών συστηµάτων και των ηχητικών επεξεργασιών
που συντελούνται στον υπολογιστή. Για παράδειγµα, ο εντοπισµός τονικού ύψους µπορεί να χρησιµεύσει σε
επεξεργασίες pitch shifting ή στην ηλεκτρονική καταγραφή µιας παρτιτούρας την ώρα που παίζουµε ένα
όργανο. Η ανάλυση του σήµατος αφορά στο συχνοτικό περιεχόµενο, στο πλάτος (amplitude) και στο
φασµατικό περιεχόµενο (spectral content) του ηχητικού σήµατος. Τα δεδοµένα που εξάγουµε από την
ανάλυση µας πληροφορούν για τα τονικά ύψη, τις δυναµικές, τις διάρκειες και τα ρυθµικά µοτίβα της
εκτέλεσης. Σηµαντικό στοιχείο για την ανάλυση του σήµατος αποτελεί ο καθορισµός του είδους της
πληροφορίας που αναζητούµε και η αξιοπιστία στην εξαγωγή της.
Ο Nick Collins (2010) περιγράφει – αναφερόµενος ταυτόχρονα στην εικόνα – τα πλεονεκτήµατα στον
έλεγχο µέσω παρακολούθησης και εντοπισµού του ήχου ως εξής:

Με το µικρόφωνο και την ψηφιακή κάµερα ενσωµατωµένα στους


νέους υπολογιστές...ο ήχος και το video αποτελούν εξαιρετικά
χρήσιµες πηγές για τα δεδοµένα της εκτέλεσης. Και οι δύο
τύποι ροής [πληροφοριών] είναι µη παρεµβατικές πηγές
πληροφοριών, καθώς τα µόρια του αέρα και τα φωτόνια µπορούν
να µεταδώσουν χρήσιµες χειρονοµιακές πληροφορίες από έναν
µουσικό ή χορευτή χωρίς την [ενδιάµεση] παρέµβαση βοηθητικών
αισθητήρων. Παρότι υπάρχουν και άλλες µέθοδοι συλλογής
δεδοµένων που προέρχονται από την ανθρώπινη δράση µέσω
αισθητήρων...ο ήχος και το video προσφέρουν δύο µέσα άµεσης
συλλογής δεδοµένων...74. Μ.τ.Σ.

Εξειδικευµένοι αλγόριθµοι µπορούν να αναγνωρίσουν το τονικό ύψος µιας νότας όταν αυτό παραµένει
σταθερό για ένα ικανό χρονικό διάστηµα. Αποκλείοντας πολλά όργανα της οικογένειας των κρουστών,
ιδιαίτερα των µεταλλικών επιφανειών, οι αλγόριθµοι εντοπισµού τονικού ύψους εφαρµόζονται σε όργανα που
παράγουν τονικούς ήχους. Ακόµη και σε αυτά τα όργανα όµως, ο ανιχνευτής τονικού ύψους θα πρέπει να
παρακάµψει τον θόρυβο που υπάρχει ανάµεσα στις αρµονικές και τις όποιες µικροτονικές διακυµάνσεις της
νότας και να εντοπίσει τη θεµέλιο συχνότητα.
Οι δύο βασικές µέθοδοι εντοπισµού τονικού ύψους συντελούνται µέσω ανίχνευσης της περιόδου της
θεµελίου συχνότητας στο πεδίο του χρόνου (Time Domain Fundamental Period Pitch Detection) ή µέσω
ανάλυσης του φάσµατος της νότας στο πεδίο των συχνοτήτων (Frequency Domain Pitch Detection).
Στην πρώτη περίπτωση, ο αλγόριθµος ανίχνευσης εντοπίζει επαναλαµβανόµενα µοτίβα στην
κυµατοµορφή του σήµατος από τα οποία εξάγει την περίοδο της θεµελίου. Εξετάζει δηλαδή το κυµαινόµενο
πλάτος του ηχητικού σήµατος στο πεδίο του χρόνου. Αρχικά, ο ανιχνευτής εντοπίζει τα µηδενικά σηµεία
διέλευσης (zero crossings) στο πλάτος της κυµατοµορφής (Σχήµα 7.2). Πρόκειται για τα σηµεία στα οποία το
πλάτος είναι µηδενικό. Η απόσταση µεταξύ αυτών των σηµείων δηλώνει την περιοδικότητα της
κυµατοµορφής. Με αυτόν τον τρόπο ο αλγόριθµος εντοπίζει το τονικό ύψος. Ταυτόχρονα όµως, θα πρέπει να
µην προσµετρηθούν τα µηδενικά σηµεία πλάτους των ψηλότερων αρµονικών. Παρόµοια µέθοδος είναι η
ανίχνευση των κορυφών (peaks) του πλάτους, κατά την οποία ο αλγόριθµος υπολογίζει τις σταθερές
αποστάσεις µεταξύ των κορυφών µιας κυµατοµορφής για να εξάγει την περίοδο της θεµελίου. Συχνά, αυτές οι
µέθοδοι αποδεικνύονται αναποτελεσµατικές όταν εξετάζουν σύνθετες κυµατοµορφές καθώς το πλάτος άλλων
αρµονικών, εκτός της θεµελίου, µπορεί να περάσει από τα ίδια µηδενικά σηµεία διέλευσης ή να έχει
ταυτόσηµες κορυφές µε αυτές της θεµελίου. Αυτό το πρόβληµα µπορεί να λυθεί µε την εφαρµογή φίλτρων:
το εισερχόµενο σήµα περνά από τα φίλτρα, διαχωρίζεται σε ζώνες και εξέρχεται από την έξοδο των φίλτρων.
Με αυτόν τον τρόπο, ο αλγόριθµος µπορεί να ξεχωρίσει το τµήµα του σήµατος µε το µεγαλύτερο πλάτος,
δηλαδή της θεµελίου, και να εντοπίσει το τονικό της ύψος.

235
Σχήµα 7.2 Ανίχνευση των κορυφών και των µηδενικών σηµείων διέλευσης του πλάτους µια κυµατοµορφής για τον
εντοπισµό της περιόδου της θεµελίου συχνότητας στο πεδίο του χρόνου.

Ο αλγόριθµος εντοπισµού του τονικού ύψους µέσω ανάλυσης του φάσµατος στο πεδίο των συχνοτήτων
χρησιµοποιεί τη µέθοδο µετασχηµατισµού Fourier µικρής διάρκειας (Short Time Fourier Transform, STFT)
για να αναλύσει το ηχητικό σήµα σε επιµέρους συχνότητες. Η ανάλυση δείχνει την κατανοµή της ενέργειας
όλων των συχνοτήτων στο φάσµα του ηχητικού σήµατος. Με αυτόν τον τρόπο, εντοπίζεται ευκολότερα η
προεξέχουσα κορυφή του πλάτους που ανήκει στη θεµέλιο συχνότητα. Ο Curtis Roads75 (1996) εντοπίζει το
εξής πρόβληµα σε αυτήν τη µέθοδο: η ανάλυση µε τη µέθοδο STFT διαιρεί το φασµατικό εύρος του σήµατος
σε µια σειρά ισοµερών συχνοτικών καναλιών, καθένα από τα οποία απέχει από το γειτονικό του κατά n Hz.
Αν λάβουµε όµως υπόψη τον λογαριθµικό τρόπο µε τον οποίο η ανθρώπινη ακοή αντιλαµβάνεται τα τονικά
ύψη, τότε οι χαµηλότερες νότες γίνονται αντιληπτές µε µικρότερη ακρίβεια από τις ψηλότερες. Κατά
συνέπεια, ο εντοπισµός χαµηλών τονικών υψών απαιτεί το σχηµατισµό περισσότερων συχνοτικών καναλιών
κατά την ανάλυση STFT. Για να γίνει αυτό κατανοητό, ο Roads παραθέτει το εξής παράδειγµα: η µέθοδος
STFT µε ανάλυση συχνοτήτων 20 Hz ανά συχνοτικό κανάλι, αποδίδει µικροτόνους στην περιοχή 10.000 ως
20.000 Hz αλλά, την ίδια στιγµή, προσφέρει ανάλυση µικρότερη από ένα ηµιτόνιο κάτω από τα 261 Hz
(µεσαίο ντο). Τέτοιου είδους προβλήµατα προκύπτουν από το γεγονός ότι οι αλγόριθµοι εντοπισµού του
τονικού ύψους, αλλά και του πλάτους, ενός ηχητικού σήµατος χρησιµοποιούν µοντέλα προσοµοίωσης του
µηχανισµού της ανθρώπινης αντίληψης.
Ο Roads αναφέρεται επίσης και σε άλλα προβλήµατα κατά τον εντοπισµό του τονικού ύψους. Ένα
από αυτά σχετίζεται µε τις απότοµες µεταβολές (transients) που συµβαίνουν κατά την έναρξη της ατάκας. Η
περίοδος της ατάκας χαρακτηρίζεται συνήθως από µη περιοδικές, µη αρµονικές και ασταθείς κυµατοµορφές.
Συνήθως, και ανάλογα µε το όργανο, απαιτούνται αρκετά χιλιοστά του δευτερολέπτου για να σταθεροποιηθεί
η κυµατοµορφή σε ένα συγκεκριµένο τονικό ύψος. Αυτή η αρχική περίοδος αστάθειας δυσχεραίνει τον άµεσο
εντοπισµό του τονικού ύψους. Επίσης, προβλήµατα προκύπτουν και στον εντοπισµό των χαµηλών τόνων σε
πραγµατικό χρόνο. Για να αντιληφθεί την περίοδο της θεµελίου συχνότητας ένας αλγόριθµος, χρειάζεται
τουλάχιστον 3 κύκλους µιας σταθερής κυµατοµορφής. Για µια νότα Λα στα 55 Hz απαιτούνται 54 χιλιοστά
του δευτερολέπτου. Αν σε αυτά προσθέσουµε και την αρχική περίοδο των transients, τότε εύκολα
κατανοούµε την εµφάνιση καθυστέρησης στη λειτουργία του αλγόριθµου. Τέλος, οι ακουστικές ιδιοµορφίες
του χώρου µέσα στον οποίο επιχειρούµε τον εντοπισµό του τονικού ύψους ή του πλάτους, ο µεγάλος χρόνος
αντήχησης, οι θόρυβοι του περιβάλλοντος αλλά και οι θόρυβοι που παράγουν τα ίδια τα όργανα (τριβή
δοξαριού, φύσηµα αέρα κ.ά.) δυσχεραίνουν ακόµη περισσότερο τη διαδικασία.
Στο περιβάλλον Max συναντούµε κάποια από τα δηµοφιλέστερα µοντέλα εντοπισµού του τονικού
ύψους. Το αντικείµενο fiddle~ του Miller Puckette, εντοπίζει µια νότα, την αναλύει στα ηµιτονοειδή
συστατικά της και προβαίνει σε µια εκτίµηση του τονικού ύψους της. Η εξαγωγή του τονικού ύψους από τη
νότα, µπορεί να χρησιµοποιηθεί στη συνέχεια για κάθε είδους επεξεργασία ή για τον έλεγχο των τονικών
υψών ενός συνθετητή. Ένα παρόµοιο αντικείµενο της Max, επίσης του Miller Puckette, για τον εντοπισµό του

236
τονικού ύψους είναι το Sigmund~. Τα ηµιτονοειδή συστατικά που προκύπτουν από την ανάλυσή του
µπορούν να χρησιµοποιηθούν το καθένα ξεχωριστά ή να συνδυαστούν για την εκτίµηση του τονικού ύψους.

7.9. Αναγνώριση Ηχητικών Συµβάντων Μέσω του Εντοπισµού Πλάτους (Amplitude


Following, Amplitude Thresholding).
Οι αλγόριθµοι εντοπισµού πλάτους ανιχνεύουν ηχητικά συµβάντα, όπως η δυναµική στην έναρξη µιας νότας,
χρησιµοποιώντας ένα κατώφλι ακουστότητας (amplitude threshold). Ο αλγόριθµος θα πρέπει να υπολογίσει
την περιβάλλουσα πλάτους ενός ηχητικού σήµατος, τις περιοχές δηλαδή της ατάκας και της εξασθένησής του,
αγνοώντας όσα σήµατα δεν υπερβαίνουν το κατώφλι ακουστότητας, όπως ο θόρυβος του περιβάλλοντος ή
άλλες νότες χαµηλότερης έντασης. Κάθε φορά που ο αλγόριθµος εντοπίζει µια περιβάλλουσα ατάκας η οποία
υπερβαίνει το κατώφλι, αναγνωρίζει την έναρξη του ήχου ή της νότας. Οι απότοµες µεταβολές στην έναρξη
της ατάκας παίζουν σηµαντικό ρόλο σε αυτήν τη διαδικασία. Για να επιτύχει η διαδικασία εντοπισµού ενός
ηχητικού συµβάντος µέσω της περιβάλλουσας πλάτους θα πρέπει η ατάκα του να αρθρωθεί ευκρινώς και µε
την απαιτούµενη δυναµική. Οι τενούτες, οι δεµένες µε legato νότες και οι ήχοι µε µεγάλη αντήχηση, δεν
προσφέρονται για εύκολο εντοπισµό πλάτους.
Το κατώφλι ακουστότητας είναι µια πύλη η οποία ανοίγει κάθε φορά που το πλάτος του ηχητικού
σήµατος το υπερβαίνει. Συχνά, δυναµικές που κυµαίνονται γύρω από την τιµή του κατωφλίου έχουν ως
αποτέλεσµα το ανεπιθύµητο ανοιγοκλείσιµο της πύλης. Αυτό µπορεί να επιλυθεί µε τον ορισµό µεγάλου
χρόνου εκκίνησης και απελευθέρωσης του ανοίγµατος και του κλεισίµατός της.
Στο παράδειγµα της επόµενης ενότητας περιέχεται µια εφαρµογή εντοπισµού πλάτους µε χρήση
κατωφλίου.

7.10. Μικροδοµικός και Μακροδοµικός Έλεγχος. Ένα Παράδειγµα.

Στο παράδειγµα που ακολουθεί θα εξετάσουµε µεθόδους ελέγχου του µουσικού υλικού, τόσο σε µικροδοµικό
όσο και σε µακροδοµικό επίπεδο, σε ένα έργο για φλάουτο µε προηχογραφηµένο υλικό (tape) και ζωντανή
ηχητική επεξεργασία. Το έργο ονοµάζεται «Li Po». Ο κώδικας εκτέλεσης είναι δοµηµένος σε ένα patch στο
περιβάλλον SuperCollider76. Οι παράγραφοι που ακολουθούν δεν αναπτύσσουν µια πλήρη µουσικολογική ή
συνθετική ανάλυση του έργου και όλων των επεξεργασιών που συντελούνται σε αυτό. Παρουσιάζονται µόνο
οι µηχανισµοί οι οποίοι δοµούν το µουσικό υλικό του έργου και ενεργοποιούν τις ηχητικές επεξεργασίες. Τα
σηµεία του κώδικα που εξετάζονται στο κείµενο εµφανίζονται µε έντονα στοιχεία (bold). Για πρακτικούς
λόγους µορφοποίησης του κειµένου, ο κώδικας δεν παρατίθεται στην αρχική µορφή ενσωµάτωσής του
(nesting) στο SuperCollider.
Ο εκτελεστής χρησιµοποιεί ένα πεντάλ ποδιού µε το οποίο ενεργοποιεί τα προηχογραφηµένα ηχητικά
δείγµατα και τις επεξεργασίες, µε τη σειρά που εµφανίζονται στην παρτιτούρα. Παρότι το πεντάλ είναι ένας
ελεγκτής συνεχούς ροής (CC 64: soft pedal), µπορεί να χρησιµοποιηθεί και ως ελεγκτής on-off. Οι τιµές 0-
127 που στέλνει το πεντάλ µέσω µηνυµάτων MIDI, διαχωρίζονται σε δύο καταστάσεις: όταν το πεντάλ είναι
ανενεργό (0) δεν ενεργοποιείται καµία επεξεργασία στο patch. Μόλις πατηθεί και στείλει οποιαδήποτε τιµή
(1-127) ενεργοποιείται η επόµενη επεξεργασία.

237
Σχήµα 7.3 Πλάνο συνδέσεων για το έργο «Li Po».

Η επικοινωνία των µηνυµάτων µέσω του πρωτοκόλλου MIDI ενεργοποιείται από τον παρακάτω κώδικα στον
οποίο ορίζεται και ο αριθµός του MIDI ελεγκτή 64 ο οποίος αντιστοιχεί στο πεντάλ ποδιού.

// MIDI
//c = CCResponder({| src, chan, cc, val |
// if ((cc == 31).and(val > 0)) { updateFunction.value };
// });

c = CCResponder({ updateFunction.value },
nil, // any source
nil, // any channel
64, //NUMBER OF BUTTON
{| val | val > 0 }
);

updateFunction = { index = (index + 1) % array.size;


array[index].value;

// index 0 in the button, corresponds to its second state


{ nextButton.value = index + 1 }.defer;
("--------------index: " ++ index).postln;
};

Ο παρακάτω κώδικας εµφανίζει ένα παράθυρο γραφικής διεπαφής χρήστη (Graphical User Interface-GUI)
(Εικόνα 7.9). Κάθε φορά που ο εκτελεστής πατάει το πεντάλ εµφανίζεται στο GUI ένας αύξοντας αριθµός (0-
4) και ενεργοποιείται η επόµενη επεξεργασία στο patch. Οι αριθµοί 0-4 δηλώνουν τα 5 µέρη του έργου. Η
αρχική ένδειξη στο GUI είναι η «Start» και η τελική η «End», αφού έχουν ολοκληρωθεί όλες οι επεξεργασίες.

// GUI
green = Color(0.6, 0.77, 0.38, 0.7);
window = SCWindow("Li Po Theodoros Lotis", Rect(325, 475, 330, 230));

//load button
loadButton = SCButton(window, Rect(10, 10, 100, 200));
loadButton.font = Font(\Arial, 32);
loadButton.states = [ [ "Load", Color.white, Color.gray(0.5) ]];
loadButton.action = { loadFunction.value };

// next button

238
nextButton = SCButton(window, Rect(120, 10, 200, 200));
nextButton.font = Font(\Arial, 32);
nextButton.states = [
[ "Start", Color.white, green ],
[ "0", Color.white, green ],
[ "1", Color.white, green ],
[ "2", Color.white, green ],
[ "3", Color.white, green ],
[ "4", Color.white, green ],
[ "End", Color.white, green ]
];
nextButton.action = {| button | updateFunction.value };
window.front;

Όλες οι επεξεργασίες παρατίθενται στις διατάξεις array[n] µε αύξοντες αριθµούς 0-5 οι οποίοι
αντιστοιχούν στην έναρξη (starting) και στη λήξη ή απελευθέρωση (releasing) κάθε επεξεργασίας
ξεχωριστά.

array = [
// 0
{ var freqs, durs;

freqs = [ 987.77, 1479.98, 2793.83 ]; //B5, F#6/Gb6, F7.


durs = [ 22, 14, 20 ];

r = Routine({
3.do({| index |
("the current index is: " ++ index).postln;
Synth(\reson, [ \freq, freqs[index] ]);
durs[index].wait;
});
s.sendMsg(\n_set, 1, \gate, 0);
0.wait;
"I am finished".postln;
ampTriggerSynth = Synth(\ampTrigger, [ \in, 0, \bufnum, b ])
}).play;

"array[0]: routine with ampTrigger synth".postln

},
// 1
{ pitchShifter2Synth = Synth(\pitchshifter2, [ \in, 0 ]);
"array[1]: starting pitchshifter2 synth".postln
},

// 2
{ pitchShifter2Synth.release;
"array[2]: releasing pitchshifter2 synth".postln
},

// 3
{ pitchShifterSynth = Synth(\pitchshifter, [ \in, 0 ]);
"array[3]: starting pitchshifter synth" .postln
},

// 4
{ pitchShifterSynth.release;
"array[4]: releasing pitchshifter synth".postln
},

239
// 5
{ ampTriggerSynth.release;
"array[5]: releasing ampTrigger synth".postln
}
];

Ας εξετάσουµε τα επιµέρους τµήµατα του κώδικα που συµβάλλουν στον παραµετρικό έλεγχο και στην
υφολογική ανάπτυξη του «Li Po».
Στην αρχή της παρτιτούρας της Εικόνας 7.10, η δήλωση «Start» δηλώνει την ενεργοποίηση της
σειράς των επεξεργασιών του patch και την αρχική ένδειξη στο παράθυρο GUI (Εικόνα 7.9). Μόλις ο
εκτελεστής πατήσει το πεντάλ ποδιού για πρώτη φορά, ξεκινά η λειτουργία του patch και η εκτέλεση του
έργου.

Εικόνα 7.9 Η αρχική ένδειξη στο παράθυρο GUI.

Εικόνα 7.10 Παρτιτούρα του «Li Po». Έναρξη των επεξεργασιών.

240
Ένα από τα χαρακτηριστικά του ηχοχρώµατος του φλάουτου είναι η ισορροπία µεταξύ θορύβου και τόνου ως
απότοκο της ροής του αέρα στο σωλήνα του οργάνου. Η γεννήτρια Reson (array[0]) δέχεται στην είσοδό
της τη γεννήτρια θορύβου PinkNoise την οποία φιλτράρει επιτρέποντας σε µια πολύ λεπτή συχνοτική ζώνη
να περάσει. Έτσι, προσοµοιάζει τον θορυβώδη χαρακτήρα του φλάουτου.

SynthDef(\reson,
{ | out, freq, gate = 1 |
var signal, env;
env = EnvGen.ar(Env.asr(0.5, 3, 15), gate, doneAction: 2);
signal = Resonz.ar({ PinkNoise.ar(0.9) } ! 2, freq, 0.001, SinOsc.kr(0.01, 0));
Out.ar(out, signal * env)
}).load(s);

Η συνάρτηση Routine στο array[0] ενεργοποιείται τρεις φορές (3.do), παράγοντας τρεις συχνοτικές
ζώνες από τη γεννήτρια Reson. Οι µεταβλητές που ορίζουν αυτές τις ζώνες, τόσο συχνοτικά όσο και χρονικά,
προσδιορίζονται στον κώδικα των array που φαίνεται πιο πάνω. Έτσι, από τις γεννήτριες Reson και
PinkNoise προκύπτουν οι συχνοτικές ζώνες 987.77 Hz, 1479.98 Hz και 2793.83 Hz, οι οποίες αντιστοιχούν
στις νότες του φλάουτου B5, F#6/Gb6 και F7. Οι διάρκειες αυτών είναι 22, 14 και 20 δευτερόλεπτα
αντίστοιχα. Ταυτόχρονα, όπως φαίνεται από την παρτιτούρα της Εικόνας 7.10, το φλάουτο παίζει νότες µε
θόρυβο ενισχύοντας τα φάσµατα που προκύπτουν από το φιλτράρισµα του PinkNoise (0:00, 0:22 και 0:33).
Μετά από 56 δευτερόλεπτα, και µόλις ολοκληρωθεί και η τρίτη συχνοτική ζώνη των 2793.83 Hz, εµφανίζεται
το µήνυµα:

"I am finished".postln;

Με αυτό το µήνυµα, ο εκτελεστής ειδοποιείται για την ολοκλήρωση της λειτουργίας των γεννητριών Reson
και PinkNoise και ετοιµάζεται να ενεργοποιήσει την επόµενη.
Στην Εικόνα 7.11 φαίνεται το σηµείο της παρτιτούρας στο οποίο ενεργοποιείται ο εντοπισµός
πλάτους µέσω amplitude thresholding.

Εικόνα 7.11 Παρτιτούρα του «Li Po». Amplitude thresholding.

Στο 1:10 η νότα Λα ενεργοποιεί ένα προηχογραφηµένο ηχητικό δείγµα χρησιµοποιώντας τη µέθοδο
Amplitude Following. Όπως φαίνεται στον παρακάτω κώδικα, η γεννήτρια Amplitude δέχεται ένα ηχητικό
σήµα στην είσοδό της και εντοπίζει την κορυφή του πλάτους της κυµατοµορφής του. Στη συγκεκριµένη
περίπτωση, η είσοδος είναι το µικρόφωνο που συλλέγει τον ήχο του φλάουτου. Το κατώφλι (thresh) που
πρέπει να υπερβεί το πλάτος της κυµατοµορφής ορίζεται σε -18 dbamp. Μόλις το πλάτος υπερβεί το κατώφλι
(amp > thresh), πυροδοτείται η γεννήτρια Trig (trigger) και ξεκινά η αναπαραγωγή του
προηχογραφηµένου ηχητικού δείγµατος µέσω της γεννήτριας PlayBuf. Ο εκτελεστής θα πρέπει να

241
προσδώσει την κατάλληλη δυναµική στη νότα Λα για να ενεργοποιηθεί η γεννήτρια Amplitude. Ανάλογα µε
τον τύπο µικροφώνου αλλά και τις ακουστικές ιδιοµορφίες της αίθουσας συναυλιών, ενδέχεται να χρειαστεί
τροποποίηση η τιµή του κατωφλίου.

SynthDef(\ampTrigger,
{| out = 0, in = 0, bufnum, gate = 1 |
var input, amp, trig, thresh, signal, env, env2;

input = SoundIn.ar(in);
amp = Amplitude.ar(input);
thresh= -18.dbamp; // 0.25
trig = Trig.kr(amp > thresh, BufDur.kr(bufnum));
signal= PlayBuf.ar(2, bufnum, trigger: trig);
env = EnvGen.ar(
Env(
[ 0, 1, 1, 0 ],
[ 0.01, BufDur.kr(bufnum) - 0.02, 0.01 ]),
trig);
env2 = EnvGen.ar(
Env([ 0, 1, 0 ], [ 0.02, 0.02 ], releaseNode: 1),
gate,
doneAction: 2
);

Out.ar(out, signal * env * env2)


}).load(s);

Το τµήµα της παρτιτούρας που απεικονίζεται στην Εικόνα 7.12 περιέχει την οδηγία προς τον εκτελεστή να
πατήσει το πεντάλ ποδιού για την έναρξη της πρώτης επεξεργασίας τονικής µετατόπισης (pitchshifting). Το
παράθυρο GUI εµφανίζει την ένδειξη 0 και ενεργοποιείται το array[1].

Εικόνα 7.12 Παρτιτούρα του «Li Po». Έναρξη επεξεργασίας pitchshifting.

Η τονική µετατόπιση γίνεται από την PitchShift, µια γεννήτρια µικροδοµικής επεξεργασίας τονικού
ύψους (Time Domain Granular Pitch Shifter), η οποία µετατοπίζει τον ήχο του φλάουτου κατά δύο οκτάβες
ψηλότερα ενώ, ταυτόχρονα, τον διασπά σε ηχητικά κύτταρα πολύ µικρής διάρκειας (grainSize = 0.01),
όπως φαίνεται στον παρακάτω κώδικα:

SynthDef(\pitchshifter2,
{| out = 0, in = 0, gate = 1 |
var signal, env, grainSize;

242
grainSize = 0.01;
signal = PitchShift.ar(
SoundIn.ar(in),
grainSize,
2.0,
0.0001,
grainSize
)!2;
env = EnvGen.ar(
Env([ 0, 1, 0 ], [ 0.02, 4.0 ], releaseNode: 1),
gate,
doneAction: 2
);
Out.ar(out, signal * env)
}).load(s);

Εικόνα 7.13 Παρτιτούρα του «Li Po». Τερµατισµός της πρώτης επεξεργασίας pitchshifting.

Για µια ακόµη φορά, το πάτηµα του πεντάλ ποδιού ενεργοποιεί το array[2] σταµατώντας την
προηγούµενη επεξεργασία pitchshifting (Εικόνα 7.13):

{ pitchShifter2Synth.release;
"array[2]: releasing pitchshifter2 synth".postln

Η δεύτερη επεξεργασία pitchshifting ξεκινά µε την ενεργοποίηση του array[3] στο 5:35 (Εικόνα 7.14) και
την εµφάνιση της ένδειξης 2 στο παράθυρο GUI. Η γεννήτρια PitchShift µετατοπίζει το τονικό ύψος του
φλάουτου σε πραγµατικό χρόνο, προκαλώντας αυτήν τη φορά καθοδικά glissandi.

243
Εικόνα 7.14 Παρτιτούρα του «Li Po». Ενεργοποίηση της δεύτερης επεξεργασίας pitchshifting.

Το φλάουτο σε αυτό το σηµείο παίζει µια σύνθετη συνήχηση αρµονικών (multiphonics). Όπως φαίνεται στον
παρακάτω κώδικα, η γεννήτρια PitchShift δέχεται το σήµα του µικροφώνου στην είσοδό της (SoundIn).
Τα glissandi διαµορφώνονται από την XLine, µια γεννήτρια που παράγει καµπύλες εκθετικής αύξησης. Η
XLine µετατοπίζει τα σταθερά τονικά του multiphonic που παίζει το φλάουτο δηµιουργώντας
αλληλοκαλυπτόµενα φασµατικά glissandi. Η καθοδική µετατόπιση του τονικού ύψους είναι συνεχής και
ξεκινά οκτώ οκτάβες ψηλότερα του ήχου του φλάουτου για να καταλήξει µιάµιση περίπου οκτάβα
χαµηλότερά του, µέσα σε διάστηµα 60 δευτερολέπτων (XLine.kr(8.0, 0.2, 60)). Η επόµενη XLine
ορίζει ένα εύρος απόκλισης από τα τονικά ύψη που παράγει η πρώτη XLine (0.001 έως 0.01 σε 60
δευτερόλεπτα). Η τελευταία γεννήτρια XLine προσθέτει αποκλίσεις στις χρονικές διάρκειες των ηχητικών
κυττάρων, προσδίδοντάς τους ποικολοµορφία.

SynthDef(\pitchshifter,
{ | out, in = 0, gate = 1 |
var signal, env, grainSize = 0.1;

signal = PitchShift.ar(
SoundIn.ar(in),
grainSize,
XLine.kr(8.0, 0.2, 60),
XLine.kr(0.001, 0.01, 60),
XLine.kr(0.1, grainSize, 60)
)!2;
env = EnvGen.ar(
Env([ 0, 1, 0 ], [ 0.02, 6.0 ], releaseNode: 1),
gate,
doneAction: 2
);
Out.ar(out, signal * env)
}).load(s);

Το array[4] σταµατά την τρέχουσα επεξεργασία pitchshifting και εµφανίζει την ένδειξη 3 στο παράθυρο
GUI, ενώ το array[5] τερµατίζει τη λειτουργία του patch και εµφανίζει την ένδειξη 4 στο παράθυρο GUI.

244
{ pitchShifterSynth.release;
"array[4]: releasing pitchshifter synth".postln
},

{ ampTriggerSynth.release;
"array[5]: releasing ampTrigger synth".postln
}

Τέλος, αποστέλλεται ένα µήνυµα για τον τερµατισµό της επικοινωνίας µέσω του πρωτοκόλλου MIDI:

CCResponder.removeAll;

Η ανίχνευση του τονικού ύψους και του πλάτους της κυµατοµορφής ενός ηχητικού σήµατος είναι µια
πολύπλοκη διαδικασία και, ως εκ τούτου, ποτέ δεν είναι απόλυτα ακριβής. Όπως ήδη αναφέραµε, σε κάθε
εκτέλεση του «Li Po» θα πρέπει να λαµβάνεται υπόψη το είδος και η ευαισθησία του µικροφώνου που
χρησιµοποιείται έτσι ώστε να προσαρµόζεται ανάλογα η µεταβλητή του κατωφλίου (thresh). Ανάλογα µε την
ευαισθησία του µικροφώνου, τις ακουστικές ιδιότητες του συναυλιακού χώρου και τις δυναµικές του κάθε
εκτελεστή, η τιµή του thresh µπορεί να κυµανθεί µεταξύ -24 dbamp και -18 dbamp.
Το φλάουτο συµβάλλει στην ανάπτυξη της υφής, στη χειρονοµιακή δράση και στη χωροµορφολογική
άρθρωση του έργου µε την ενεργοποίηση (triggering) προηχογραφηµένου υλικού και ηχητικών επεξεργασιών
σε πραγµατικό χρόνο. Ο κώδικας ελέγχει τη δόµηση των µερών του έργου και τις παραµέτρους των ηχητικών
επεξεργασιών. Ωστόσο, στο µακροσκοπικό επίπεδο της ροής του χρόνου, ο έλεγχος βρίσκεται στην ευθύνη
του εκτελεστή. Ο κατακερµατισµός του κώδικα σε επιµέρους τµήµατα και η χρήση ενός MIDI ελεγκτή, όπως
το πεντάλ ποδιού, του επιτρέπει να ρυθµίσει το γενικότερο tempo του έργου χωρίς να δεσµεύεται από έναν
µετρονόµο ή από την ανελαστική ροή του χρόνου µιας ενιαίας και αδιάσπαστης δοµής.

7.11. Βιο-αισθητήρες.
Υπάρχει µια πληθώρα αισθητήρων από τους οποίους αντλούµε δεδοµένα που σχετίζονται µε διεργασίες της
σωµατικής δράσης αλλά και πληροφορίες για τις συνθήκες του περιβάλλοντος. Ανάµεσά τους συναντούµε
ποτενσιόµετρα και ολισθητές (sliders) κάθε είδους και εύρους, περιστροφικά κουµπιά (rotary knobs), σόναρ,
αισθητήρες πίεσης και υπέρυθρου φωτός για τον υπολογισµό της απόστασης µεταξύ δύο σηµείων και
επιταχυνσιόµετρα που µετρούν την κλίση και την επιτάχυνση της κίνησης. (Εικόνα 7.15). Κάθε συσκευή
εισόδου µπορεί να προµηθεύσει ένα υπολογιστικό σύστηµα µε πληροφορίες και δεδοµένα. Η επιλογή της
εξαρτάται κάθε φορά από τις ανάγκες του χρήστη, την πιστότητα µε την οποία µεταδίδει τα δεδοµένα και το
γενικότερο πλαίσιο µέσα στο οποίο θα χρησιµοποιηθεί.

Eικόνα 7.15 Το Lady’s Glove της Laetitia Sonami. Η Sonami κατασκεύασε το πρώτο γάντι της το 1991 για µια συναυλία
της στο φεστιβάλ Ars Electronica του Linz. Στη σύγχρονη εκδοχή του, το γάντι διαθέτει µικροδιακόπτες, αισθητήρες πίεσης
και φωτός, επιταχυνσιόµετρα, φώτα LED, µικρόφωνο κ.ά. (πηγή: Peter Kirn. Controlling Music with DIY Interactive
Gloves. https://www.flickr.com/photos/caseorganic/3132193223).

245
Στο παρόν υποκεφάλαιο θα επικεντρωθούµε στους αισθητήρες που λαµβάνουν σήµατα από την ανθρώπινη
φυσιολογία και δραστηριότητα και µας πληροφορούν για ένα υπό εξέταση βιολογικό σύστηµα. Ανάλογα µε
την πηγή προέλευσης, τα βιολογικά σήµατα κατηγοριοποιούνται σε:

• Σήµατα µε πηγή προέλευσης τη µηχανική λειτουργία ενός βιολογικού συστήµατος.


• Σήµατα µε πηγή προέλευσης την ηλεκτρική δραστηριότητα µυϊκών και νευρικών κυττάρων.

Τέτοια σήµατα µπορεί να είναι:

• Ηλεκτρικά, όπως για παράδειγµα η εκπόλωση και η επαναπόλωση από την παλµική
µεταβολή του δυναµικού της κυτταρικής µεµβράνης µετά από ένα ερέθισµα.
• Χηµικά, όπως η µερική πίεση του οξυγόνου και άλλων αερίων στο αίµα.
• Μηχανικά, όπως η πίεση αίµατος του κυκλοφορικού συστήµατος.

Τα βιολογικά σήµατα µας πληροφορούν για τη λειτουργία και τη δραστηριότητα ενός βιολογικού
συστήµατος. Για παράδειγµα, τα κύµατα Δέλτα ή Ρυθµός Δέλτα, µε συχνοτικό εύρος 0.5-4 Hz, εκφράζουν
τον βαθύ ύπνο, τα κύµατα Θήτα ή Ρυθµός Θήτα, µε συχνοτικό εύρος 4-8 Hz, παρατηρούνται στην αρχή του
ύπνου, τα κύµατα Άλφα ή Ρυθµός Άλφα, µε συχνοτικό εύρος 8-13 Hz δηλώνουν µια ήρεµη εγκεφαλική
λειτουργία και τα κύµατα Βήτα ή Ρυθµός Βήτα, µε συχνοτικό εύρος 13-30 Hz σχετίζονται µε διάφορα στάδια
εγρήγορσης της συνείδησης.
Όπως µπορούµε να καταλάβουµε, η χρήση βιοαισθητήρων εκτείνεται σε ένα ευρύ πεδίο εφαρµογών
που, ανάµεσα σε άλλες, περιλαµβάνει την επεµβατική χειρουργική και άλλους τοµείς της ιατρικής και της
φυσιοθεραπείας, τα video games, τις εγκαταστάσεις, και φυσικά τη µουσική, προσφέροντας νέα ερευνητικά
πεδία τόσο στη σύνθεση όσο και στην εκτέλεσή της. Οι βιοαισθητήρες συνδέουν τον άνθρωπο µε τον
υπολογιστή µέσω των σηµάτων που εκπέµπει το ανθρώπινο σώµα. Εφόσον το ανθρώπινο σώµα είναι ένα
αγώγιµο ηλεκτρικό σύστηµα, οι δραστηριότητες των επιµέρους λειτουργιών του µπορούν να µετρηθούν µε
σχετική ακρίβεια. Σήµατα από το νευρικό σύστηµα, τους ιστούς και τα όργανα µετριούνται από
ηλεκτροµυογραφήµατα (EMG), ηλεκτροοφθαλµογραφήµατα (EOG) και ηλεκτροεγκεφαλογραφήµατα (EEG).
Η βασική αρχή πίσω από τη χρήση βιοαισθητήρων είναι αρχέγονη: όπως ο ανθρώπινος εγκέφαλος
χρησιµοποιεί αυτά τα σήµατα για να ελέγξει και να ιεραρχήσει τις λειτουργίες του ανθρώπινου σώµατος, έτσι
και ένας υπολογιστής εφοδιασµένος µε το κατάλληλο λογισµικό µπορεί να τα χρησιµοποιήσει για να ελέγξει
ηλεκτρονικές συσκευές σύνθεσης και επεξεργασίας ήχου. Για παράδειγµα, ηλεκτρόδια τοποθετηµένα πάνω
σε έναν µυ συλλέγουν πληροφορίες από τη δραστηριότητά του και τις αποστέλλουν για επεξεργασία στον
υπολογιστή. Καθώς το νευρικό σύστηµα καθοδηγεί τη µυϊκή δραστηριότητα, παράγεται ηλεκτρική τάση η
οποία µετριέται από ένα ηλεκτροµυογράφηµα. Όσο αυξάνεται η δραστηριότητα και η ένταση στον µυ τόσο
αυξάνεται και η ενέργεια που µεταδίδεται από το βιολογικό σήµα µέσω των βιοαισθητήρων. Η µυϊκή ένταση,
ο σπασµός και η χαλάρωση, τα εγκεφαλικά κύµατα, οι κινήσεις των οφθαλµών, η ηλεκτρική δραστηριότητα
του εγκεφάλου και των µυών, µπορούν να µετατραπούν σε µηνύµατα και να αποσταλούν µέσω ενός
πρωτοκόλλου επικοινωνίας (MIDI, OSC) σε έναν επεξεργαστή ήχου όπου θα ελέγξουν τις ηχητικές
παραµέτρους.
Ένα από τα πλεονεκτήµατα των βιοαισθητήρων που τοποθετούνται πάνω στο ανθρώπινο σώµα, είναι
η φυσικότητα που προσφέρουν στις κινήσεις. Φορώντας ένα γάντι ή ένα ολόσωµο κουστούµι µε αισθητήρες,
ο χρήστης µπορεί να ανατρέξει σε φυσιολογικές κινήσεις του σώµατός του χωρίς να χρειαστεί να εφαρµόσει
τις δεξιοτεχνικές ακροβασίες που απαιτεί το παίξιµο ενός οργάνου. Από την άλλη πλευρά, πρέπει να λάβουµε
υπόψη µας ότι ένα σύστηµα βιοαισθητήρων δεν µπορεί να αποδώσει ολιστικά τις εξαιρετικά πολύπλοκες
διεργασίες του ανθρώπινου οργανισµού.
Η χρήση βιολογικών σηµάτων στη µουσική κατέστη εφικτή µε την έλευση των επεξεργαστών
ψηφιακού σήµατος (DSP). Ένας από τους πρωτεργάτες, ήδη από δεκαετία του 1960, υπήρξε ο David
Rosenboom, ο οποίος εξερεύνησε καινοτόµες µεθόδους ελέγχου της µουσικής δηµιουργίας µέσω του
ανθρώπινου νευρικού συστήµατος. Η εργασία του στη βιοανάδραση είχε σηµαντική επίδραση στην ανάπτυξη
διεπαφών και συστηµάτων βιοαισθητήρων (Εικόνα 7.16). Επίσης, πολλά από τα έργα του ενσωµατώνουν
µεθόδους ελέγχου και µορφοποίησης του µουσικού υλικού µέσω βιοαισθητήρων. Στο έργο «Ringing Minds»
του 2014, o Rosenboom, µαζί µε τους Tim Mullen και Alex Khalil, χρησιµοποίησε µια τεχνική γνωστή ως
hyperscanning για την ανάλυση εγκεφαλογραφηµάτων των ακροατών. Σκοπός ήταν η δηµιουργία ενός υπερ-
συλλογικού εγκεφάλου ο οποίος αντιδρούσε στα ερεθίσµατα της µουσικής.

246
Εικόνα 7.16 Σύστηµα αισθητήρων βιοανάδρασης (πηγή:
https://commons.wikimedia.org/wiki/File:Biofeedback_en.svg#/media/File:Biofeedback_en.svg).

7.12. Έλεγχος Χωροθέτησης και Διάχυσης του Ήχου.


Η εξέλιξη της ηλεκτροακουστικής και, ειδικότερα, της ακουσµατικής µουσικής κατά τις δεκαετίες του 1950
και 1960, κατέδειξε την ανάγκη δηµιουργίας µιας ορχήστρας ηχείων ικανής να αποδώσει τις πολύπλοκες
ηχητικές δοµές αυτών των µουσικών ειδών. Έτσι, το 1974, ο Γάλλος συνθέτης Francois Bayle, µέλος του
Groupe de Recherches Musicales, σχεδίασε και υλοποίησε µια διάταξη ηχείων για τη διάχυση (diffusion) – ή
την προβολή (projection), όπως ο ίδιος προτιµά να ονοµάζει αυτή τη διαδικασία – της ακουσµατικής
µουσικής. Το Acousmonium, όπως ονοµάστηκε, αποτελείτο από 80 ηχεία διαφορετικού σχήµατος και
µεγέθους και τοποθετήθηκε σε αίθουσα συναυλιών της Γαλλικής Ραδιοφωνίας (Εικόνα 7.17). Ο έλεγχος των
ηχητικών καναλιών περνούσε µέσα από µια κονσόλα ήχου. Κάθε ποτενσιόµετρο ήλεγχε ένα ηχείο, ενώ
συχνά, και ανάλογα µε τις ανάγκες διάχυσης των έργων, ένα ποτενσιόµετρο µπορούσε να ελέγξει µια οµάδα
ηχείων.

Εικόνα 7.17 Ο Pierre Schaeffer παρουσιάζει το Acousmonium στο µέγαρο της Γαλλικής Ραδιοφωνίας στο Παρίσι (πηγή:
https://commons.wikimedia.org/wiki/File:Psconcer.jpg#/media/File:Psconcer.jpg).

247
Λίγο πριν, στο τέλος της δεκαετίας του 1960, διαµορφώθηκε από τους Stan Shaff και Doug McEachern µια
θεατρική αίθουσα στο San Francisco για την εγκατάσταση µιας ορχήστρας ηχείων µε την ονοµασία Audium.
Στις αρχές της δεκαετίας του 1970 το θέατρο φιλοξένησε εβδοµαδιαίες συναυλίες νέων έργων µουσικής για
µαγνητοταινία, συµβάλλοντας στην εδραίωση και ανάπτυξη του είδους στη βόρεια Καλιφόρνια. Η ηχητική
γλυπτική στο χώρο, η ηχητική κίνηση και η «προβολή» ηχητικών πλάνων υπήρξαν οι βασικές επιδιώξεις του
ηχητικού συστήµατος. Σήµερα, το Audium αποτελείται από 176 ηχεία.
Στις δεκαετίες που ακολούθησαν, δηµιουργήθηκαν πολλές ορχήστρες ηχείων για τη διάχυση έργων
ηλεκτροακουστικής µουσικής στην Ευρώπη και στην Αµερική. Κάποιες από αυτές βασίστηκαν στο πρότυπο
του Acousmonium ενώ άλλες πρότειναν διαφορετικούς τρόπους διάχυσης του µουσικού υλικού και
άρθρωσης των δοµών του στο συναυλιακό χώρο. To 1982 δηµιουργήθηκε το Birmingham ElectroAcoustic
Sound Theatre (BEAST) µε βάση το Πανεπιστήµιο του Birmingham και διευθυντή τον συνθέτη Jonty
Harrison. To Motus Acousmonium στο Παρίσι, το Klangdom στο Ινστιτούτο ZKM της Κολωνίας, το
σύστηµα Gmebaphone στο Institut International de Musique Electroacoustique στην πόλη Bourges της
Γαλλίας, το Sonic Lab στο Πανεπιστήµιο Queen’s στο Μπέλφαστ, το Casa del Suono στην Πάρµα της
Ιταλίας, το Music Circus στην Οσάκα της Ιαπωνίας και το Acousmonium Musiques et Recherches µε
ιδρύτρια την Annette Vande Gorne στο Βέλγιο (Εικόνα 7.18), είναι κάποιες από τις γνωστότερες ορχήστρες
ηχείων που δραστηριοποιούνται τα τελευταία χρόνια.

7.18 Το Acousmonium Musiques et Recherches µε 72 ηχεία στο θέατρο Espace Senghor στις Βρυξέλλες.

Η εξάπλωση αυτών των ορχηστρών οδήγησε στην ανάγκη δηµιουργίας εξειδικευµένων λογισµικών και
υλικού εξοπλισµού για τον έλεγχο των ηχείων. Στις αρχές της δεκαετίας του 1990, ο Βέλγος συνθέτης και
ερευνητής Todor Todoroff κατασκεύασε ένα γάντι µε ενσωµατωµένους αισθητήρες κάµψης. Αν και το
συγκεκριµένο σύστηµα αισθητήρων δεν αναπτύχθηκε περαιτέρω, χρησιµοποιήθηκε αρχικά για τον έλεγχο
παραµέτρων ηχητικής επεξεργασίας µέσω του πρωτοκόλλου MIDI. Το πρόγραµµα που δηµιουργήθηκε για τη
µετατροπή των δεδοµένων από τους αισθητήρες σε µηνύµατα MIDI, έτρεχε σε NeXTSTEP, ένα λειτουργικό
σύστηµα βασισµένο σε UNIX το οποίο αναπτύχθηκε στα τέλη της δεκαετίας του 1980 σε υπολογιστές NeXT.
Το συγκεκριµένο γάντι χρησιµοποιήθηκε επίσης για τον έλεγχο ορχήστρας ηχείων σε συναυλίες
ηλεκτροακουστικής µουσικής. Στο δεξί τµήµα της Εικόνας 7.19 φαίνεται η προσοµοίωση ενός τρισδιάστατου
χώρου και οι ενδείξεις της τροχιάς και της ταχύτητας της κίνησης. Η κάµψη των αισθητήρων, οι οποίοι
εφάπτονταν στα δάχτυλα του γαντιού ήλεγχαν τις παραµέτρους της κίνησης.

248
Εικόνα 7.19 GUI για την εξαγωγή τιµών από τους αισθητήρες κάµψης (αριστερά) και η τρισδιάστατη απεικόνιση της
τροχιάς της κίνησης των δαχτύλων (δεξιά) (Todoroff, Traube 1996).

Η κονσόλα του ήχου παραµένει πάντα το κεντρικό όργανο µε το οποίο ο εκτελεστής της ηλεκτροακουστικής
µουσικής αρθρώνει το µουσικό υλικό κατά τη διάρκεια της συναυλίας. Ωστόσο, οι παράµετροι της ηχητικής
διάχυσης, τόσο για την απόδοση του πολυκαναλικού ήχου (surround) όσο και για την προβολή των ηχητικών
πλάνων σε µια συναυλία ηλεκτροακουστικής µουσικής απαιτούν όλο και πιο σύνθετους και αξιόπιστους
αυτοµατισµούς ελέγχου. Η ανάθεση των καναλιών, οι διαφορετικές ρυθµίσεις για κάθε έργο και οι όποιες
ιδιαίτερες ανάγκες ηχητικής επεξεργασίας προκύψουν κατά τη διάχυση, όπως εφαρµογή φίλτρων,
ισοσταθµιστών, effect αντήχησης κ.ά. πραγµατοποιούνται, όλο και περισσότερο σήµερα, από εξειδικευµένα
λογισµικά διάχυσης.
Ένα από τα γνωστότερα λογισµικά για αυτόν τον σκοπό είναι το Spatialisateur ή Spat του IRCAM.
Με σπονδυλωτή διάρθρωση, το Spat, όπως και πολλά άλλα παρόµοια λογισµικά, προσφέρει τη δυνατότητα
ηχητικής διάχυσης σε πραγµατικό χρόνο και αυτοµατισµού των παραµέτρων της διάχυσης ανεξάρτητα από τη
διάταξη των ηχείων στην αίθουσα.
Το HyperSpace (Εικόνα 7.20) είναι ένα λογισµικό που αναπτύχθηκε σε περιβάλλον Max από τον
Σουηδό συνθέτη Ake Parmerud. Επικοινωνεί µε ένα πρόγραµµα DAW από το οποίο λαµβάνει MIDI
µηνύµατα σχετικά µε τη χωροθέτηση των ηχητικών καναλιών του. Μπορεί να ελέγξει µέχρι 48 κανάλια ήχου
και να δεχθεί µηνύµατα ελέγχου από εξωτερικούς MIDI ελεγκτές. Επίσης, διαθέτει µια διεπαφή πολλαπλής
αφής (multitouch interface) για iPad µέσω της εφαρµογής TouchOSC.

7.20 Το λογισµικό Ηyperspace του Ake Parmerud (πηγή: http://www.parmerud.com/MediaArtist/Hyperspace.html).

249
Το λογισµικό που απεικονίζεται στην Εικόνα 7.21 είναι σχεδιασµένο από τον Φίλιππο Θεοχαρίδη σε
περιβάλλον Max. Χρησιµοποιείται για τη διάχυση στερεοφωνικών και πολυκαναλικών έργων
ηλεκτροακουστικής µουσικής και έργων µε µεικτά µέσα.

7.21 Το λογισµικό ηχητικής διάχυσης του Φίλιππου Θεοχαρίδη σε περιβάλλον Max.

Το λογισµικό διαχειρίζεται την ένταση και την ισοστάθµιση όλων των ηχείων που απαρτίζουν το ηχοσύστηµα
της συναυλίας και προσφέρει τη δυνατότητα δροµολόγησης του ηχητικού σήµατος σε διαφορετικούς
συνδυασµούς ηχείων, ανάλογα µε τις απαιτήσεις κάθε µουσικού έργου. Η χωροθέτηση και η διάχυση του
ήχου µπορούν να αυτοµατοποιηθούν σε προγραµµατισµένες σκηνές ή να ανατεθούν σε MIDI ποτενσιόµετρα
µε αντιστοίχιση του κάθε ποτενσιόµετρου σε ένα ηχείο ή µια δέσµη ηχείων.

7.13. Λίγες Σκέψεις Περί της Φύσης του Ελέγχου.


Ας επιστρέψουµε για λίγο στο παράδειγµα της κρούσης ενός τυµπάνου που χρησιµοποιήσαµε στην αρχή του
κεφαλαίου. Περιγράψαµε τη διαδικασία ως ένα ολοκληρωµένο σύστηµα χειρονοµιακού ελέγχου µε διακριτά
στάδια, απόλυτα κατανοητά σε όλο το εύρος τους από τον ακροατή. Η έµφυτη σχέση µεταξύ της κινητικής
ενέργειας του οργανοπαίκτη που κρούει τη µεµβράνη και του ηχητικού αποτελέσµατος γίνεται άµεσα
κατανοητή. Η ένταση, ο φασµατικός πλούτος και η διάρκεια του ήχου που προκύπτει από την κρούση,
σχετίζονται απόλυτα µε τη φυσική και την κινητική ενέργεια του οργανοπαίκτη. Συνάγουµε, κατά συνέπεια,
µια αιτιότητα, µια αιτιώδη συνάφεια µεταξύ της κρούσης και του ηχητικού αποτελέσµατος, µια βεβαιότητα
ότι το δεύτερο προέκυψε ως φυσικό επακόλουθο της πρώτης.
Η ακατάλληλη χρήση ελεγκτών, διεπαφών και λογισµικών για τον έλεγχο του µουσικού
αποτελέσµατος ενέχει τον κίνδυνο να απολεσθεί η σχέση του αιτίου µε το αιτιατό. Πολύ συχνά, κατά τη
διάρκεια µιας συναυλίας ηλεκτροακουστικής µουσικής, ιδιαίτερα µε σύνολο υπολογιστών, συναντούµε
ακίνητους µουσικούς µε βλέµµα αγκιστρωµένο στην οθόνη του υπολογιστή, ενώ, την ίδια στιγµή, ακούµε
µεγάλες µεταβολές στο ηχητικό φάσµα, απότοµες µεταπτώσεις στη δυναµική του ήχου, σιωπές και εκρήξεις,
λεπτεπίλεπτες ηχητικές µεταµορφώσεις, πολύπλοκους ρυθµούς και πρωτάκουστους ήχους. Το πάτηµα ενός
και µόνο κουµπιού, γεγονός που απαιτεί ελάχιστη ποσότητα ενέργειας, µπορεί να πυροδοτήσει αναντίστοιχα
ηχητικά αποτελέσµατα. Όλες αυτές οι ανεξήγητες για τον ακροατή καταστάσεις, λαµβάνουν χώρα µεταξύ του
µουσικού, µιας διεπαφής, και ενός λογισµικού στον υπολογιστή, µε αποτέλεσµα να απολεσθεί από τον
ακροατή η αιτιώδης συνάφεια µεταξύ της χειρονοµιακής δράσης και του ηχητικού αποτελέσµατος.
Ο Denis Smalley (1986 και 1997) περιέγραψε ευκρινώς το θέµα εισάγοντας την έννοια της
χειρονοµιακής υποκατάστασης (gestural surrogacy). Ο όρος surrogacy αναφέρεται στην παρένθετη
µητρότητα, τη συνθήκη δηλαδή κατά την οποία µια γυναίκα κυοφορεί το παιδί ενός άλλου ζευγαριού,

250
υποκαθιστώντας τη µητέρα του. Ο Smalley διακρίνει τέσσερα στάδια υποκατάστασης77 κατά την ακρόαση
ηλεκτροακουστικής µουσικής:

1. Υποκατάσταση πρώτου βαθµού (first-order surrogacy). Αναφέρεται στην αρχετυπική


πρωτογενή χειρονοµία χωρίς µουσικό περιεχόµενο. Περιέχει τις χειρονοµίες της καθηµερινής
δράσης, της εργασίας ή του παιχνιδιού χωρίς την πρόθεση της µουσικής χρήσης. Η
ηχογράφηση ενός ήχου χωρίς την πρόθεση της δεξιοτεχνίας στην παραγωγή του εντάσσεται
σε αυτήν την κατηγορία.
2. Υποκατάσταση δεύτερου βαθµού (second-order surrogacy). Δηλώνει την άµεση αντίληψη της
αιτιακής σχέσης από τον ακροατή και αναφέρεται κυρίως στις (δεξιοτεχνικές) χειρονοµίες
ελέγχου των οργάνων. Στο παράδειγµα του κρουστού, ο ακροατής συνδέει τη χειρονοµία της
κρούσης µε το ηχητικό αποτέλεσµα εγκαθιδρύοντας µια άµεση σχέση ανάµεσα σε αυτό που
ακούει (ήχος) και στη χειρονοµία που το παρήγαγε κατά τη διάρκεια της ηχογράφησης. Έτσι,
ο ακροατής εξάγει νοητικά, από την ακρόαση ενός ήχου, τη χειρονοµία που τον διαµόρφωσε.
3. Υποκατάσταση τρίτου βαθµού (third-order surrogacy). Σε αυτό το στάδιο, ο ακροατής
συµπεραίνει ή φαντάζεται τη χειρονοµία που παρήγαγε τον ήχο χωρίς να είναι βέβαιος για
την πηγή προέλευσής του και για τη γενεσιουργό χειρονοµία. Σταδιακά, αρχίζει και χάνεται η
αιτιότητα. Οι ήχοι που υπόκεινται σε επεξεργασία, αποµακρύνονται σε κάποιο βαθµό από τα
αρχικά φασµατικά χαρακτηριστικά τους µε αποτέλεσµα να δυσχεραίνεται η αναγνώριση της
χειρονοµίας που τους παρήγαγε.
4. Αποµακρυσµένη υποκατάσταση (remote surrogacy). Η αιτιότητα χάνεται οριστικά, καθώς η
όποια συσχέτιση του ήχου µε τη χειρονοµία παραγωγής του εξαλείφεται εξαιτίας πολλών και
διαδοχικών επεξεργασιών. Σε αυτήν την περίπτωση, ο ακροατής αναζητά αποµεινάρια της
αρχικής χειρονοµίας εµπλέκοντας τη φαντασία και την ψυχολογική διερµήνευση.

Ο χειρισµός αυτών των σταδίων αφαίρεσης της χειρονοµίας διαµορφώνει τη σχέση του ακροατή µε το
µουσικό υλικό. Η επιλογή των ελεγκτών (χειρονοµιακών, απτικών ή άλλων) για την εκτέλεση της
ηλεκτροακουστικής και της αυτοσχεδιαστικής µουσικής µε υπολογιστές (Live Electronics), επηρεάζει
καταλυτικά την πρόσληψή της από τον ακροατή. Συνεπώς, θα πρέπει να γίνεται µε κριτήριο, όχι µόνο την
ευχρηστία αλλά και τον επιδιωκόµενο βαθµό προσκόλλησης ή αποµάκρυνσης από την αιτιακή σχέση του
ελεγκτή µε το ηχητικό αποτέλεσµα που παράγει.

251
Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Houellebecq, M. Η Δυνατότητα ενός Νησιού. Αθήνα: Εστία, 2007.


Bacon, F. Νέα Ατλαντίδα. Αθήνα: Ηριδανός, 1990, σελ. 58-59.

Ξενόγλωσση Βιβλιογραφία.

Cage, J. «The Future of Music: Credo», John Cage, An Anthology, R. Kostelanetz (επιµέλεια), Cambridge
MΑ: Da Capo Press, 1991, σελ. 151-153.
Collins, N. Introduction to Computer Music. UK: John Wiley and Sons, 2010, σελ. 191-230.
Cope, D. New Directions in Music. Illinois: Waveland Press Inc, 2000.
Cross, I. «Music as a Biocultural Phenomenon», The Neurosciences and Music, Annals of the New York
Academy of Sciences, G. Avanzini (επιµέλεια), τ. 999, Ν. Υόρκη: The New York Academy of
Sciences, σελ. 106-111.
Dubost, G. και A. Τanaka. «A Wireless, Network-based Biosensor Interface for Music». Πρακτικά, The
International Computer Music Conference-ICMC 2002, Gothenburg, 2002.
Ishii, H. και B. Ullmer. «Tangible Bits: Towards Seamless Interfaces Between People, Bits and Atoms»,
Πρακτικά ACM SIGCHI Conference on Human Factors in Computing Systems 1997, σελ. 234-241.
Kim, J., S. Mastnik, και E. André. «EMG-based Hand Gesture Recognition for Realtime Biosignal
Interfacing», Πρακτικά 13th International Conference on Intelligent User Interfaces IUI, Ν. Υόρκη,
2008, σελ. 30-39.
Jordà, S. «Interactivity and Live Computer Music», The Cambridge Companion to Electronic Music, Colins
N. και J. d’Escrivàn Julio (επιµέλεια). Cambridge: Cambridge University Press, 2007, σελ. 95.
Jordà, S. «Improvising with Computers: A Personal Survey (1889-2001)», Journal of New Music Research, τ.
31(1). Λονδίνο: Routledge, 2002, σελ. 1-10.
Minciacchi, D. «La Sonification Versus la Composition Biotique des Icônes du Cerveau. La musique: de la
Neuroscience à la Performance», Insistance, τ. 6, 2011-2012, σελ. 73-104.
Minciacchi, D. «Translation from Neurological Data to Music Parameters», The Neurosciences and Music,
Annals of the New York Academy of Sciences, G. Avazini, C. Faienza, and D. Minciacchi (επιµέλεια),
Ν. Υόρκη: The New York Academy of Sciences, 2003, σελ. 282-301.
Miranda E. R. και J. Castet. Guide to Brain-Computer Music Interfacing. Λονδίνο: Springer, 2014.
Miranda E. R. και M. M. Wanderley. New Digital Musical Instruments: Control and Interaction Beyond the
Keyboard. Middleton: A-R Editions Inc., 2006.
Paradiso, J.A. «Electronic Music: New Ways to Play», IEEE Spectrum, τ. 34(12), 1997, σελ. 18-30.
Premaratne, P. Human Computer Interaction Using Hand Gestures. Ν. Υόρκη: Springer, 2014.
Roads, C. The Computer Music Tutorial. Cambridge MΑ: The MIT Press, 1996, σελ. 613-658.
Rosenboom, D. «Interactive Music With Intelligent Instruments - A New, Propositional Music?», New Music
Across America, E. Brooks (επιµέλεια). Valencia, Santa Monica: California Institute of the Arts and
High Performance Books, 1992, σελ. 66-70.

252
Rosenboom, D. «Cognitive Modeling and Musical Composition in the Twentieth Century: a Prolegomenon»,
Perspect. New Music, τ. 25, 1987, σελ. 439-446.
Rosenboom, D. (επιµέλεια). Biofeedback and the Arts, Results of Early Experiments. Βανκούβερ: Aesthetic
Research Centre of Canada Publications, 1976.
Rowe, R. Machine Musicianship. Cambridge MΑ: The MIT Press, 2004.
Salah A. A. και T. Gevers (επιµέλεια). Computer Analysis of Human Behavior. Ν. Υόρκη: Springer, 2011.
Smalley, D. «Spectromorphology: Explaining Sound-Shapes», Organised Sound 2(2). Cambridge: Cambridge
University Press, Αύγουστος 1997, σελ. 107-126.
Smalley, D. «Spectromorphology and Structuring Processes», The Language of Electroacoustic Music, Simon
Emmerson (επιµέλεια). Λονδίνο: Macmillan, 1986.
Todoroff T. και C. Traube, «Graphical NeXTSTEP Objects as FTS Clients to Control Instruments in the New
FTS Client/Server Architecture», Πρακτικά International Computer Music Conference ICMC 1996,
σελ. 28-31.

On Line

Watkinson, M. «Software vs Hardware. Tonewheel Organ Implementations Compared». SounOnSound, τ.


Απρίλιος 2014, (πρόσβαση: 5/12/2015).

253
Κεφάλαιο 8
Αλγοριθµική Σύνθεση.
Σύνοψη
Η εµπλοκή αλγοριθµικών δοµών κατά τη διαδικασία της µουσικής σύνθεσης προέκυψε αρχικά ως ανάγκη
οργάνωσης των πολύπλοκων αριθµητικών µοντέλων του Σειραϊσµού, ιδιαίτερα δε του µεταπολεµικού
Καθολικού Σειραϊσµού και της µετεξέλιξής του σε επιµέρους τάσεις και συνθετικές προσεγγίσεις κατά τη
δεκαετία του 1950. Στην πορεία, η διαδικασία αυτή αποτέλεσε συνειδητή επιλογή συνθετικής προσέγγισης
κυρίως δε από συνθέτες που ακολούθησαν διαδικασίες τυχαιότητας καθώς και εν γένει µαθηµατικές δοµές και
πιθανοκρατικά µοντέλα.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

8.1. Αλγοριθµική Σύνθεση: Γενικά Στοιχεία.

Μπορεί να ισχυριστεί κανείς πως εφόσον κατά τη συνθετική διαδικασία ενυπάρχει στη σκέψη του συνθέτη
µια συγκεκριµένη λογική οργάνωσης και ανάπτυξης των αρµονικών αλλά και των υπολοίπων δοµικών
χαρακτηριστικών ενός έργου, η διαδικασία της µουσικής σύνθεσης ανάγεται εν γένει σε µια αλγοριθµική
λογική. Αρκετές µάλιστα φορές η λειτουργία αυτή είναι ενδογενής.
Θέλοντας να προσδιορίσουµε πληρέστερα τον όρο της αλγοριθµικής σύνθεσης θα πρέπει να
επικεντρωθούµε στη συνειδητοποιηµένη απόφαση του συνθέτη να οργανώσει και να αναπτύξει το µουσικό
του υλικό µε µια προκαθορισµένη λογική ανάπτυξης η οποία εκ πρώτης όψεως εκφέρεται από εξω-µουσικούς
κανόνες. Ο ίδιος µάλιστα ο όρος παραπέµπει πως οι κανόνες αυτοί προέρχονται κυρίως από τον χώρο των
µαθηµατικών, µε τη µορφή απλών αριθµητικών πράξεων ή περισσότερο σύνθετων δοµών όπως για
παράδειγµα στατιστικά µοντέλα, σύνολα, συναρτήσεις, γεωµετρίες κ.λπ. Σε άλλες περιπτώσεις
ακολουθούνται διαφορετικές προσεγγίσεις οι οποίες προέρχονται από ένα πλήθος διαφορετικών πεδίων:
εξελικτικά βιολογικά µοντέλα και γενετικοί αλγόριθµοι, ειδικές γραµµατικές, συστήµατα µηχανικής µάθησης
και τεχνητής νοηµοσύνης, κυτταρικά αυτόµατα κ.ο.κ. Πρακτικά ο κατάλογος αυτός µπορεί να είναι
απεριόριστος: οποιαδήποτε εξελικτική δοµή στον χρόνο αναπαράγει τιµές µε βάση συγκεκριµένους κανόνες
µπορεί να χρησιµοποιηθεί κατά τη διαδικασία προσδιορισµού των µουσικών παραµέτρων µιας σύνθεσης.
Μια βασική κατηγοριοποίηση των διαφόρων αυτών συστηµάτων αφορά στην αιτιοκρατική
(deterministic) ή πιθανοκρατική (stochastic) φύση τους. Στην πρώτη περίπτωση οι διαδικασίες διέπονται από
µια αυστηρά προκαθορισµένη αιτιοκρατική λογική όπου µε βάση τα κατάλληλα δεδοµένα το αποτέλεσµα
µπορεί να προκαθοριστεί πλήρως. Η δεύτερη περίπτωση αφορά, µερικώς ή ολικώς, µη-προβλέψιµες
διαδικασίες, µοντέλα δηλαδή τα οποία διέπονται από µικρότερο έως µεγαλύτερο βαθµό απροσδιοριστίας. Μια
µάλιστα εκδοχή της λογικής αυτής αφορά στον Αλεατορισµό (Aleatorism), σε διαδικασίες δηλαδή πλήρους
τυχαιότητας.
Αν και στο παρελθόν έχουν υπάρξει τέτοιου είδους απόπειρες συνθετικών προσεγγίσεων –
χαρακτηριστικό τέτοιο παράδειγµα πρώιµου έργου αποτελεί η φωνητική σύνθεση «Nuper Rosarum Flores»
(1436) του Guillaume Dufay, όπου ο συνθέτης χρησιµοποιεί εσκεµµένα µια συγκεκριµένη αριθµητική
αναλογία για την ανάπτυξη των µερών του– η αλγοριθµική σύνθεση υλοποιείται και εκφέρεται συστηµατικά
κατά τον 20ό κυρίως αιώνα. Κύριος φορέας αυτής της συνθετικής διαδικασίας αποτέλεσε ο Σειραϊσµός
(Serialism) ενώ µεταπολεµικά αναπτύχθηκαν µια σειρά από διαφορετικές προσεγγίσεις, κάθε µια από τις
οποίες διαµορφώθηκε από το προσωπικό ύφος των σηµαντικότερων συνθετών της Νέας Μουσικής του 20ού
αιώνα.

8.2. Σειραϊσµός: Προς µια Αλγοριθµική Οργάνωση της Μουσικής.

Η τεχνική του Σειραϊσµού αφορά στη χρήση σειρών από αριθµητικές τιµές προκειµένου αυτές να
αντιστοιχηθούν στα βασικά δοµικά στοιχεία µιας µουσικής σύνθεσης: την τονική της ανάπτυξη, τη

254
διάρθρωση των δυναµικών της, τη ρυθµική αγωγή και τις χρονικές αξίες, τη χρήση µουσικών χειρονοµιών
(µουσικές αρθρώσεις - articulation), την ηχοχρωµατική της δοµή. Η διαδικασία της ίδιας της αντιστοίχισης
των σειρών στα παραπάνω δοµικά χαρακτηριστικά αποτέλεσε µια σηµαντική παράµετρο η οποία
χαρακτήρισε διαφορετικές συνθετικές προσεγγίσεις και σχολές που ακολουθήθηκαν από τους συνθέτες του
σειραϊσµού κατά τον 20ό και 21ο αιώνα.
Μια πρώτη εφαρµογή του Σειραϊσµού στη Σύγχρονη Μουσική αποτέλεσε ο Δωδεκαφθογγισµός ή το
Δωδεκαφθογγικό Σύστηµα (Twelve-tone Technique ή Twelve-tone Serialism) το οποίο πρωτο-διατυπώθηκε
από τον Arnold Schoenberg στις αρχές της δεκαετίας του 1920. Η τεχνική αυτή αφορούσε στην ανάπτυξη
µιας σειράς η οποία περιλαµβάνει και τους δώδεκα φθόγγους της χρωµατικής κλίµακας. Κάθε τέτοια βασική
σειρά αναπαράγει νέες σειρές µε βάση κάποιους προκαθορισµένους µετασχηµατισµούς οι οποίοι
αναδιατάσσουν την αρχική της διάταξη. Καθώς λοιπόν η βασική τονική σειρά µαζί µε τις παραγόµενές της
χρησιµοποιούνταν από τον συνθέτη προκειµένου να οργανώσει την αρµονική δοµή ενός µουσικού έργου,
στην πρώτη αυτή φάση του ο σειραϊσµός επικεντρώθηκε κατά κύριο λόγο στην τονική διάρθρωση του έργου,
ενώ οι υπόλοιπες παράµετροι της µουσικής σύνθεσης επιλέγονταν ελεύθερα από τον συνθέτη.
Κατά τη δεύτερη φάση του σειραϊσµού, από τα τέλη της δεκαετίας του 1940 και έπειτα, η χρήση
σειρών επεκτάθηκε προκειµένου να χρησιµοποιηθούν για την ανάπτυξη και των υπολοίπων µουσικών
παραµέτρων της µουσικής σύνθεσης. Για τον λόγο αυτόν ο δεύτερος αυτός σειραϊσµός ονοµάζεται Καθολικός
Σειραϊσµός: Total Serialism, Integral Serialism, General Serialism ή Multiple Serialism είναι µερικοί από
τους όρους που χρησιµοποιούνται για να περιγράψουν την τάση αυτή.
Οι διαδικασίες πλέον οργάνωσης και ανάπτυξης του µουσικού υλικού στα έργα της Νέας Μουσικής
αποκτούσαν µια διαρκώς αυξανόµενη πολυπλοκότητα. Αυτό οδήγησε αρκετούς συνθέτες και ερευνητές στην
επαναδιατύπωση των σχέσεων αυτών µέσα από νέες θεωρίες. Έτσι, αρχικά ο Milton Babbit [1946] διατύπωσε
µια θεωρία για τη χρήση αριθµητικών συνόλων στη µουσική θέτοντας τη θεωρητική βάση του καθολικού
σειραϊσµού, ενώ στις επόµενες δεκαετίες ο Howard Hanson [1960] και ο Alan Forte [1973] ανέπτυξαν την
Θεωρία των Συνόλων στη Μουσική (Musical Set Theory), µε τον πρώτο να εστιάζει στην τονική και τον
δεύτερο στην ατονική µουσική. Η έννοια του Συνόλου στη Μουσική αφορά στην οργάνωση του υλικού µιας
µουσικής σύνθεσης σε σύνολα οµοειδών στοιχείων και διατυπώνει πράξεις, σχέσεις και ιδιότητες οι οποίες
επενεργούν στα στοιχεία αυτά. Η Θεωρία των Συνόλων αρχικά αναπτύχθηκε προκειµένου να χρησιµοποιηθεί
για την τονική διάρθρωση ενός έργου ενώ στη συνέχεια επεκτάθηκε για να περιγράψει και την ρυθµική
αγωγή. Πρακτικά, η θεωρία αυτή µπορεί να λειτουργήσει και σε οποιαδήποτε άλλη παράµετρο της µουσικής
σύνθεσης όπως στους τύπους των µουσικών χειρονοµιών (articulation), στην ηχοχρωµατική δοµή ενός έργου
κ.ο.κ.
Η θεωρία των συνόλων εκτός από ένα πλαίσιο θεωρητικής υποστήριξης του καθολικού σειραϊσµού
αποτέλεσε το εφαλτήριο για να αναπτυχθούν νέα µουσικά ιδιώµατα αλλά και ένα εργαλείο ανάλυσης
προγενέστερων συνθετικών προσεγγίσεων, καθώς ένα µεγάλο µέρος της θεωρίας αυτής εδράζεται στις
βασικές αρχές του Δωδεκαφθογγικού συστήµατος που πρωτο-διατύπωσε ο Schoenberg και οι σύγχρονοί του.

8.3. Η Θεωρία των Συνόλων στη Μουσική - Musical Set Theory.

8.3.1. Σύνολα Τονικών Κλάσεων (Pitch Class Set Theory): Βασικές Έννοιες.

Η θεωρία των συνόλων στην τονική οργάνωση ενός έργου χρησιµοποιεί την έννοια της τονικής κλάσης (pitch
class). Μια τονική κλάση περιλαµβάνει όλες τις δυνατές τονικές θέσεις ενός φθόγγου, αφορά δηλαδή τους
φθόγγους εκείνους οι οποίοι απέχουν µεταξύ τους κατά ακέραιο πλήθος οκτάβων. Έτσι, για παράδειγµα η
τονική κλάση του C ισοδυναµεί µε:

{Cn } = {... C-2, C-1, C0, C1, C2, C3 ...};

Ένα σύνολο τονικών κλάσεων (pitch class set) αποτελείται από ένα πλήθος τονικών κλάσεων των δύο, τριών,
τεσσάρων κ.ο.κ. στοιχείων, το οποίο αντίστοιχα καλείται δυάδα (dyad), τριάδα ή τρίχορδο (triad ή trichord),
τετράδα ή τετράχορδο (tetrad ή tetrachord) κ.ο.κ. µε µέγιστο πλήθος τα δώδεκα στοιχεία (δωδεκάχορδο), όπου
περιλαµβάνονται και οι 12 τονικές κλάσεις του δωδεκαφθογγικού συστήµατος. Κατ’ αυτόν τον τρόπο µια
κλάση εµφανίζεται µια µοναδική φορά εντός του συνόλου. Η σήµανση των κλάσεων γίνεται µε ακέραια

255
αρίθµηση όπου το 0 αντιστοιχεί στην χαµηλότερη τονικά κλάση του συνόλου και το 11 στην υψηλότερη,
ξεκινώντας από την πρώτη κλάση του συνόλου. Ένα τετράχορδο για παράδειγµα το οποίο αποτελείται από τις
τονικές κλάσεις:

{B, Bb, D, Eb}

αποτυπώνεται και ως:

{0, 11, 3, 4}

Σηµειώνεται επίσης πως η σειρά µε την οποία εµφανίζονται οι τονικές κλάσεις σε ένα τέτοιο σύνολο δεν
ταυτίζεται απαραίτητα µε τη χρονική ταξινόµηση των φθόγγων σε µια µουσική φράση. Επιπρόσθετα τα
στοιχεία ενός τέτοιου συνόλου µπορεί να αφορούν µια ταυτοχρονία µουσικών φθόγγων, µια δηλαδή
συγχορδία, ή µια σειρά από ανεξάρτητους τόνους, µια δηλαδή µελωδία, είτε και τα δύο µαζί.
Το τονικό περιεχόµενο ενός συνόλου αποτυπώνεται και ως άνυσµα των διαστηµατικών τάξεων
(interval class vector). Το άνυσµα αυτό περιγράφει το πλήθος και το είδος των διαστηµάτων από όλους τους
δυνατούς συνδυασµούς των τονικών κλάσεων που περιέχονται σε ένα σύνολο. Τα δώδεκα διαστήµατα της
οκτάβας κατηγοριοποιούνται σε έξι διαφορετικά ζευγάρια ή έξι διαφορετικές τάξεις διαστηµάτων, αναλόγως
τη συµπληρωµατικότητά τους: δύο διαστήµατα ανήκουν στην ίδια διαστηµατική τάξη όταν τονικά είναι
συµπληρωµατικά ως προς την οκτάβα. Έτσι τα διαστήµατα 1 και 11 ανήκουν στην πρώτη τάξη, τα 2 και 10
ανήκουν στη δεύτερη τάξη, τα 3 και 9 στην τρίτη κ.ο.κ. Για παράδειγµα, το τρίχορδο: {5, 7, 10} αποτελείται
από ένα διάστηµα της δεύτερης τάξης (5-7), ένα διάστηµα της τρίτης τάξης (7-10) και ένα διάστηµα της
πέµπτης τάξης (5-10). Στην περίπτωση αυτή το άνυσµα των διαστηµατικών τάξεων του τριχόρδου έχει ως
εξής:

<0, 1, 1, 0, 1, 0>

8.3.2. Βασικές Πράξεις των Συνόλων.

Οι βασικές πράξεις που µπορούν να εφαρµοστούν στα στοιχεία ενός συνόλου τονικών κλάσεων είναι οι
πράξεις της τονικής µετατόπισης (transposition - T) και της τονικής αναστροφής (inversion - I). Κατά τη
µετατόπιση, όλες οι τονικές κλάσεις ενός συνόλου µετατοπίζονται κατά πλήθος n ηµιτονίων (T ), ενώ η
n
αναστροφή (I) αφορά στη διαστηµατική αντιστροφή µεταξύ διαδοχικών τόνων ως προς το συµπλήρωµα του
διαστήµατος της οκτάβας. Έτσι, για παράδειγµα το τετράχορδο {B, Bb, D, Eb} µετατοπισµένο κατά ένα
ηµιτόνιο (T1) παράγει ένα νέο τετράχορδο:

{C, B, D#, E}

ενώ, η αναστροφή του αρχικού τετραχόρδου {B, Bb, D, Eb} µε τονικά διαστήµατα {0, 11, 4, 1} παράγει το
νέο τετράχορδο:

{B, C, Αb, G}, µε τονικά διαστήµατα {0, 1, 8, 11}.

Οι δύο παραπάνω µετασχηµατισµοί αποτελούν γεωµετρικές ισοµετρίες, αφού διατηρούν τις αρχικές τους
αποστάσεις (Σχήµα 8.1).

256
Σχήµα 8.1 Γεωµετρικές ισοµετρίες µε τον µετασχηµατισµό (Τ ) ως µεταφορά (translation) και τον (Ι) ως ανάκλαση
1
(reflection) του αρχικού τετραχόρδου (P).

Όπως επισηµάνθηκε και προηγουµένως, η σειρά µε την οποία εµφανίζονται τα στοιχεία ενός συνόλου δεν
αντιστοιχεί απαραίτητα στη χρονική τους ακολουθία. Σε γενικές µάλιστα γραµµές, η χρονική διάσταση δεν
αποτελεί κυρίαρχο στοιχείο της θεωρίας αλλά µια επιπλέον παράµετρο η οποία, στις περιπτώσεις όπου
χρησιµοποιείται, πρέπει να δηλώνεται. Παραδείγµατα χρονικής αποτύπωσης συναντάµε στις σειρές που
αφορούν στο δωδεκαφθογγικό σύστηµα. Στην περίπτωση αυτή στους παραπάνω βασικούς µετασχηµατισµούς
µπορούν συµπληρωµατικά να προστεθούν και δύο ακόµη οι οποίοι ενσωµατώνουν τη χρονική διάσταση. Οι
µετασχηµατισµοί αυτοί αφορούν στις πράξεις της αναδροµής (retrograde - R) και της αναδροµής-αναστροφής
(retrograde-inversion - RI). Η αναδροµή αφορά στη χρονική αντιστροφή των στοιχείων του συνόλου, ενώ η
αναδροµή-αντιστροφή αφορά στη χρονική αντιστροφή των τονικά αντεστραµµένων στοιχείων του. Και οι
δύο αυτές πράξεις αφορούν ισοµετρικούς επίσης µετασχηµατισµούς (Σχήµα 8.2).

257
Σχήµα 8.2 Το αρχικό σύνολο (P), η αντιστροφή του (I) καθώς και οι χρονικοί µετασχηµατισµοί της αναδροµής (R) και της
αναδροµής-αντιστροφής (RI), οι οποίοι αποτελούν επίσης γεωµετρικές ισοµετρίες.

Άλλη µια πράξη που χρησιµοποιήθηκε από διάφορους συνθέτες είναι η πράξη του πολλαπλασιασµού
(multiplication) κατά την οποία ένα νέο σύνολο τονικών κλάσεων δηµιουργείται από το γινόµενο των
στοιχείων ενός αρχικού συνόλου µε έναν ακέραιο πολλαπλασιαστή. Στις περιπτώσεις που το αποτέλεσµα
ξεπερνάει την τιµή του 11, αφαιρούνται αντίστοιχες δωδεκάδες έως ότου η τιµή τελικά περιέλθει στο
διάστηµα 0-11. Ο Pierre Boulez προσδιόρισε επίσης έναν πολλαπλασιασµό µεταξύ συνόλων, όπου το
αποτέλεσµα αφορά ένα νέο τρίτο σύνολο τα στοιχεία του οποίου αποτελούνται από όλους τους δυνατούς
συνδυασµούς αθροισµάτων µεταξύ των στοιχείων των δύο αρχικών συνόλων. Έτσι για παράδειγµα:

{0, 4, 7} x {0, 2} = {0, 2, 4, 6, 7, 9}

Και οι δύο αυτές πράξεις δεν αποτελούν ισοµετρίες. Ισοµετρίες επίσης δεν αποτελούν σύνολα τα οποία
προκύπτουν από την κυκλική µετάθεση των στοιχείων ενός αρχικού συνόλου (cyclic permutation).

8.3.3. Κανονική - Πρωταρχική Μορφή (Normal - Prime Form).

Δύο µορφές στις οποίες µπορεί να αναπτυχθεί ένα σύνολο τονικών κλάσεων αποτελούν η Κανονική Μορφή
(Normal Form) και η Πρωταρχική Μορφή (Prime Form). Οι µορφές αυτές αφενός δίνουν µια πληρέστερη
πληροφόρηση σε σχέση µε το τονικό περιεχόµενο ενός συνόλου και αφετέρου είναι απαραίτητες προκειµένου
να αναλυθούν συγκεκριµένες ιδιότητές του.
Η Κανονική Μορφή ενός συνόλου αφορά στην αναδιάταξη των στοιχείων του µε τέτοιο τρόπο ώστε
να ελαχιστοποιηθούν στον µέγιστο βαθµό οι τονικές αποστάσεις µεταξύ διαδοχικών φθόγγων. Προκύπτει
δηλαδή µια νέα περισσότερο συµπτυγµένη διαστηµατικά διάταξη των στοιχείων του, µε το µικρότερο
διάστηµα να εµφανίζεται αριστερότερα και το µέγιστο να βρίσκεται εκτός συνόλου, να αφορά δηλαδή στο
διάστηµα µεταξύ των τόνων της τελευταίας δεξιάς και της πρώτης αριστερής του θέσης. Έτσι για παράδειγµα
το σύνολο:

258
{2, 9, 10}

καθώς έχει µέγιστο διάστηµα το 2-9 (7), αναδιατάσσεται στην Κανονική Μορφή ως:

{9, 10, 2}

όπου το µέγιστο διάστηµα 2-9 (7) βρίσκεται πλέον εκτός συνόλου ενώ τα υπόλοιπα διαστήµατα 9-10 (1) και
10-2 (4) είναι τοποθετηµένα έτσι ώστε το µικρότερο να βρίσκεται αριστερότερα από το µεγαλύτερο.
Εάν ανάµεσα στην Κανονική Μορφή ενός αρχικού συνόλου και την Κανονική Μορφή της τονικής
του αναστροφής (I) επιλέξουµε το πλέον διαστηµατικά συµπτυγµένο σύνολο και στη συνέχεια το
µετατοπίσουµε τονικά έτσι ώστε ο χαµηλότερος τόνος να ξεκινάει µε τιµή 0, το σύνολο αυτό αφορά στην
Πρωταρχική Μορφή του αρχικού συνόλου. Ένα παράδειγµα:

αρχικό σύνολο P: {7, 8, 2, 5}

Κανονική Μορφή του P: {2, 5, 7, 8}


Τονική Αναστροφή I του P: {5, 4, 10, 7}
Κανονική Μορφή της αναστροφής: {4, 5, 7, 10}

Αν και οι δύο κανονικές µορφές {2, 5, 7, 8} και {4, 5, 7, 10} έχουν τον ίδιο βαθµό σύµπτυξης, επιλέγεται η
δεύτερη, καθώς η διαστηµατική πρόοδος των στοιχείων του εµφανίζεται από τα αριστερά προς τα δεξιά (1-2-
3 αντί για 3-2-1). Τελικά, µετατοπίζουµε τη σειρά {4, 5, 7, 10} κατά 4 ηµιτόνια κάτω και λαµβάνουµε την
Πρωταρχική Μορφή του {7, 8, 2, 5}, ως:

{0, 1, 3, 6}

Σύνολα µε κοινή Πρωταρχική Μορφή, σύνολα δηλαδή τα οποία αποτελούνται από το ίδιο πλήθος φθόγγων
καθώς και τις ίδιες διαστηµατικές σχέσεις, παρουσιάζουν µια ισοδύναµη ακουστική συµπεριφορά µεταξύ τους,
µε τον ίδιο τρόπο για παράδειγµα που συµπεριφέρονται όλες οι µείζονες συγχορδίες στην τονική µουσική. Τα
σύνολα τα οποία έχουν την ίδια Πρωταρχική Μορφή λέµε πως ανήκουν στην ίδια Τάξη Συνόλων (Set Class).

8.3.4. Ιδιότητες Συνόλων: Συµπληρωµατικότητα (Complementation) - Συνδυαστικότητα


(Combinatoriality).

Δύο σηµαντικές ιδιότητες των συνόλων οι οποίες χρησιµοποιήθηκαν από αρκετούς συνθέτες του Σειραϊσµού
αφορούν στη Συµπληρωµατικότητα (Complementation) και στη Συνδυαστικότητα (Combinatoriality).
Το Συµπλήρωµα (Complement) ενός συνόλου αφορά ένα δεύτερο σύνολο το οποίο περιέχει όλα τα
στοιχεία που δεν περιλαµβάνονται στο πρώτο σύνολο. Κατ’ αυτήν την έννοια τα δύο σύνολα –το αρχικό και
το συµπλήρωµά του, τελικά περιέχουν και τις δώδεκα τονικές κλάσεις. Συµπληρωµατικές τονικές σειρές
χρησιµοποιήθηκαν από συνθέτες του Δωδεκαφθογγισµού µε τη µορφή εξαχόρδων, όπου ο συνδυασµός τους
δηµιουργεί µια νέα τονική σειρά η οποία περιλαµβάνει και τους δώδεκα φθόγγους.
Στην περίπτωση που ένα αρχικό σύνολο τροποποιηθεί χρησιµοποιώντας έναν ή περισσότερους από
τους βασικούς µετασχηµατισµούς, όπως για παράδειγµα της τονικής αναστροφής ή της τονικής µετατόπισης,
και το νέο σύνολο που παραχθεί αποτελεί το συµπλήρωµά του, τότε λέµε πως το αρχικό σύνολο πληρεί την
ιδιότητα της Συνδυαστικότητας (Combinatoriality). Ένα παράδειγµα αποτελεί η παρακάτω σειρά έξι φθόγγων
(εξαχορδία):

{0, 1, 4, 5, 6, 7}

η τονική αναστροφή του οποίου ισοδυναµεί µε:

{0, 11, 8, 7, 6, 5}

Εάν στη συνέχεια αυτό µετατοπιστεί τονικά κατά 3:

259
{3, 2, 11, 10, 9, 8}

παρατηρούµε πως το σύνολο που προέκυψε αποτελεί το συµπλήρωµα του αρχικού συνόλου.

Υπάρχουν διάφοροι τύποι συµπληρωµατικότητας αναλόγως τον µετασχηµατισµό που ακολουθείται για να
παραχθεί το συµπλήρωµα του αρχικού συνόλου. Έτσι, σύµφωνα µε τον Babbit, ένα εξάχορδο µπορεί να
ανήκει στους παρακάτω τέσσερις τύπους συµπληρωµατικότητας:

• Πρωταρχικού τύπου συµπληρωµατικό (prime combinatorial), όταν το συµπλήρωµα προκύπτει


από την τονική µετατόπιση του αρχικού συνόλου. Παράδειγµα αποτελεί το εξάχορδο {0, 2, 4,
6, 8, 10}, του οποίου το συµπλήρωµα εξάγεται µε µετατόπιση κατά +1 ηµιτόνιο (T ): {1, 3, 5,
1
7, 9, 11}
• Αναδροµικά συµπληρωµατικό (retrograde combinatorial), όταν το συµπλήρωµα προκύπτει
από αναδροµή. Αυτή θεωρείται µια περιττή, ίσως, κατηγοριοποίηση καθώς η αναδροµή
αποτελεί περισσότερο µια αναδιάταξη των στοιχείων του συνόλου, χωρίς αυτή να επηρεάζει
από µόνη της την ιδιότητα της συµπληρωµατικότητας.
• Ανεστραµµένα συµπληρωµατικό (inversional combinatorial) όταν το συµπλήρωµα προέρχεται
από την τονική αναστροφή του αρχικού συνόλου. Παράδειγµα: το εξάχορδο {0, 1, 4, 5, 6, 7}
µε τονική αναστροφή {0, 11, 8, 7, 6, 5} και µετατόπιση κατά +3 ηµιτόνια (T ): {3, 2, 11, 10,
3
9, 8}
• Αναδροµικά-ανεστραµµένα συµπληρωµατικό (retrograde-inversional combinatorial) όταν το
συµπλήρωµα προέρχεται από αναδροµή-αναστροφή. Εδώ ισχύει, επίσης, η παρατήρηση σε
σχέση µε την ανεπάρκεια της αναδροµικότητας να συµβάλει στην ιδιότητα της
συµπληρωµατικότητας.

Υπάρχει επίσης η περίπτωση το συµπλήρωµα ενός εξαχόρδου να προκύπτει και µε τους τέσσερις παραπάνω
βασικούς µετασχηµατισµούς µε επιπλέον τονικές µετατοπίσεις. Το εξάχορδο αυτό προσδιορίζεται ως ολικά-
συµπληρωµατικό (all-combinatorial). Παράδειγµα αποτελεί το {0, 1, 2, 3, 4, 5}:

µετατόπιση κατά +6 (T ): {6, 7, 8, 9, 10, 11}


6
ανεστραµµένο: {0, 11, 10, 9, 8, 7}
µε τονική µετατόπιση κατά -1 (T-1): {11, 10, 9, 8, 7, 6}

8.3.5. Σειρές Τιµών Διάρκειας (Duration Series) - Σύνολα Χρονικών Στιγµών (Time Point
Sets).

Εκτός από τις τονικές κλάσεις η θεωρία των συνόλων χρησιµοποιήθηκε επίσης προκειµένου να διατυπώσει
σχέσεις και ιδιότητες οι οποίες καθορίζουν τη ρυθµική δοµή και τη χρονική οργάνωση ενός έργου. Η
επέκταση της θεωρίας αυτής στη ρυθµική δοµή προήλθε από τους συνθέτες του δεύτερου – καθολικού
σειραϊσµού µε πρωτεργάτες τους Milton Babbit και Olivier Messiaen. Οι συνθέτες αυτοί στα τέλη της
δεκαετίας του 1940 συνέθεσαν µια σειρά έργων στα οποία σειρές αριθµητικών τιµών χρησιµοποιούνται ως
βάση για τη ρυθµική οργάνωση των έργων τους. Στην πρώτη αυτή φάση οι αριθµητικές τιµές ενός συνόλου
αποτυπώνουν ρυθµικές αξίες µε τη µορφή, συνήθως, πολλαπλασίων µιας βασικής αξίας ή µε τη µορφή
σχέσεων διάρκειας µεταξύ διαδοχικών φθόγγων. Τα αριθµητικά αυτά σύνολα ονοµάστηκαν Σειρές Τιµών
Διάρκειας (Duration Series).
Μια τέτοια σειρά χρησιµοποίησε για πρώτη φορά ο Babbit στο έργο του «Three Compositions for
Piano» (1947–48), όπου το σύνολο {5, 1, 4, 2} στο δεύτερο µέρος του έργου χρησιµοποιείται για να παράγει
πολλαπλάσια µιας βασικής κάθε φορά ρυθµικής αξίας. Στο έργο «Composition for Four Instruments» (1948)
χρησιµοποίησε το σύνολο {1, 4, 3, 2} για να δηλώσει σχετικές διάρκειες σε συνεχόµενους φθόγγους. Κατ’
αυτόν τον τρόπο η δεύτερη νότα έχει τετραπλάσια διάρκεια από την πρώτη, η τρίτη τριπλάσια και η τέταρτη
διπλάσια διάρκεια. Η αξία του αρχικού φθόγγου µεταβάλλεται σε κάθε διαφορετική φράση καταλήγοντας
έτσι σε ένα πλήθος διαφορετικών χρονικών αξιών.

260
Ο Messiaen, αν και διαφοροποιήθηκε ως προς τη λογική του σειραϊσµού προτείνοντας µια σηµειακή
οργάνωση του υλικού φθόγγο προς φθόγγο, χρησιµοποίησε εντούτοις σειρές για τη ρυθµική οργάνωση του
υλικού του µε τη µορφή πολλαπλασίων, στη δεύτερη σπουδή «Mode de Valeurs et d'Intensités» του έργου
του «Quatre Études de Rythme» (1949-50). Αξίζει πάντως να σηµειωθεί πως λίγα χρόνια νωρίτερα στην
εισαγωγή του δευτέρου µέρους «Turangalîla ΙΙ» του έργου του «Turangalîla-Symphonie» (1946-49), ο
Messiaen χρησιµοποίησε µια αριθµητική σειρά µε διττή χρήση: οι ίδιες τιµές αφορούν ταυτόχρονα τόσο στη
ρυθµική, όσο και στη τονική διάρθρωση των φθόγγων στα πρώτα µέτρα της εισαγωγής. Η τεχνική αυτή
καλείται τονική-χρονική σύζευξη (pitch-duration association) και χρησιµοποιήθηκε και από άλλους συνθέτες
αργότερα.
Άλλα χαρακτηριστικά έργα στα πρώτα αυτά χρόνια του καθολικού σειραϊσµού αποτελούν επίσης τα
«Variazioni Canoniche» (1950) του Luigi Nono, η ρυθµική οργάνωση του οποίου καθορίζεται από
πολλαπλάσια της βασικής αξίας του 1/16, το «Structures I» (1952) του Pierre Boulez, στο οποίο εκτός από
σειρές τονικών κλάσεων και ρυθµικών µοτίβων ο συνθέτης χρησιµοποιεί σύνολα αριθµητικών σειρών για να
προσδιορίσει και άλλα χαρακτηριστικά της σύνθεσης, καθώς και µια σειρά έργων του Karlheinz Stockhausen
µε προεξέχοντα τα έργα για πιάνο «Klavierstücke I–IV» (1952).

Εικόνα 8.1 Σύνολο ρυθµικών τιµών έξι στοιχείων {8, 7, 6, 5, 4, 6} στο «Variazioni Canoniche» (1950) του Luigi Nono.
Στο κάτω µέρος σηµειώνονται τα πολλαπλάσια της βασικής αξίας του 1/16 (πηγή: «Nono - Variazioni canoniche, rhythmic
values row» https://en.wikipedia.org/wiki/File:Nono_-
_Variazioni_canoniche,_rhythmic_values_row.png#/media/File:Nono_-
_Variazioni_canoniche,_rhythmic_values_row.png).

Το 1962 ο Milton Babbit εισάγει την έννοια του Συνόλου Χρονικών Στιγµών (Time Point Set) όπου οι τιµές
ενός συνόλου αφορούν πλέον χρονικές τιµές έναρξης (attack points) αντίστοιχες προς κάποιο
συµπληρωµατικό σύνολο κλάσεων φθόγγων. Ο Babbit χρησιµοποίησε την τεχνική αυτή σε µια σειρά έργων
του στις δεκαετίες του 1950 έως 1970: «Partitions» (1957), «All Set» (1957) κ.α.

Εικόνα 8.2 Παράδειγµα χρήσης συνόλου χρονικών στιγµών. Στο αρχικό µέτρο χρησιµοποιείται η αριθµητική σειρά 0-11, η
οποία προσδιορίζει τη χρονική απόσταση από την έναρξη του µέτρου µε την οποία θα εκτελείται η συγκεκριµένη τονική
κλάση. Αυτό φαίνεται στα επόµενα µέτρα όπου ο αριθµός που επιλέγεται αφορά τελικά τόσο στον φθόγγο όσο και στην αξία
του (πηγή: https://commons.wikimedia.org/wiki/File:Time-point_series.png#/media/File:Time-point_series.png).

Η χρήση τιµών χρονικών στιγµών απαντάται επίσης σε έργα µουσικής µε υπολογιστή, ιδιαίτερα στις γλώσσες
προγραµµατισµού για µουσική της σειράς MUSIC-N και των επιγόνων τους, καθώς και σε έργα

261
ηλεκτρονικής µουσικής. Σε αυτές τις περιπτώσεις οι τιµές αυτές µπορεί συµπληρωµατικά να σηµατοδοτούν
τη χρονική στιγµή κατά την οποία ολοκληρώνεται κάποια νότα (release time), ή εν γένει το χρονικό σηµείο
κατά το οποίο πραγµατοποιείται κάποια αλλαγή κατά την εκτέλεση, όπως για παράδειγµα µια αλλαγή στη
δυναµική.

8.3.6. Θεωρία Συνόλων και Σειραϊσµός.

Η Θεωρία των Συνόλων αποτέλεσε ένα εργαλείο αλγοριθµικής σύνθεσης το οποίο ήρθε να καλύψει την
αυξανόµενη πολυπλοκότητα της δοµής των έργων του δεύτερου µεταπολεµικού, καθολικού σειραϊσµού. Παρ’
όλο όµως που ταυτίστηκε µε τον δεύτερο σειραϊσµό, η έννοια ενός κοινού σώµατος τονικών κλάσεων το
οποίο υπόκειται σε τοπολογικούς και χρονικούς µετασχηµατισµούς καθώς και ένα µεγάλο µέρος των
ιδιοτήτων της συγκεκριµένης θεωρίας, είχε ήδη προταθεί µερικές δεκαετίες νωρίτερα µε τη µορφή
αριθµητικών σειρών των δώδεκα τονικών κλάσεων από τον Arnold Schoenberg.

8.4. Δωδεκαφθογγισµός και Πρώτος Σειραϊσµός.

8.4.1. Βασικές Αρχές.

Η βασική αρχή του Δωδεκαφθογγισµού έγκειται στο γεγονός πως και οι δώδεκα φθόγγοι του τονικού
συστήµατος έχουν ακριβώς την ίδια προτεραιότητα στη χρήση τους, καταργώντας έτσι την παραδοσιακή µέχρι
τότε αρµονική ανάπτυξη η οποία προϋπέθετε τη χρήση συγκεκριµένων τονικών κλάσεων µε βάση το µουσικό
κλειδί και τον οπλισµό στον οποίο ήταν κουρδισµένο το έργο. Στον Δωδεκαφθογγισµό ένα έργο
αναπτύσσεται µε βάση µια αρχική σειρά (prime series - P), ενώ υπάρχουν τέσσερις αρχές οι οποίες
ακολουθούνται κατά την ανάπτυξή του:

1. Η αρχική σειρά P αποτελείται από µια συγκεκριµένη ακολουθία η οποία περιλαµβάνει και τους
δώδεκα φθόγγους, ανεξαρτήτως οκτάβας.

2. Κανένας φθόγγος δεν επαναλαµβάνεται δεύτερη φορά εντός της σειράς P.

3. Η αρχική σειρά P υπόκειται στους εξής µετασχηµατισµούς:

• Χρονικής αντιστροφής ή αναδροµής (Retrograde - R), όπου η σειρά των φθόγγων της αρχικής
σειράς P αντιτίθεται:

έστω για παράδειγµα η αρχική σειρά P:


B, Bb, G, C#, Eb, C, D, A, F#, E, Ab, F

η αναδροµή R της P:
F, Ab, E, F#, A, D, C, Eb, C#, G, Bb, B

• Τονικής αντιστροφής ή αναστροφής (Inversion - I), όπου τα τονικά διαστήµατα µεταξύ


διαδοχικών φθόγγων της αρχικής σειράς αναστρέφονται ως προς το συµπλήρωµά τους:

εάν για παράδειγµα η αρχική σειρά P και τα διαστήµατά της:


B, Bb, G, C#, Eb, C, D, A, F#, E, Ab, F
(11, 9, 6, 2, 9, 2, 7, 9, 10, 4, 9)

τότε η αναστροφή της θα έχει ως εξής:


B, C, Eb, A, G, Bb, Ab, C#, E, F#, D, F
(1, 3, 6, 10, 3, 10, 5, 3, 2, 8, 3)

262
• Αναδροµής-Αναστροφής (Retrograde-Inversion - RI), χρονική δηλαδή αντιστροφή των τονικά
ανεστραµµένων διαστηµάτων:

F, D, F#, E, C#, Ab, Bb, G, A, Eb, C, B

4. Κάθε µια από τις τέσσερις παραπάνω σειρές [P, R, I, RI], µπορεί να µετατοπιστεί κατά ένα
σταθερό πλήθος 0 έως 11 ηµιτονίων, µε αντίστοιχες σηµάνσεις [P , R , I , RI ] όπου n ο βαθµός µετατόπισης.
n n n n
Από µια δηλαδή αρχική σειρά P καταλήγουµε έτσι σε ένα πλήθος 48 σειρών. Κάθε τέτοια σειρά P , R , I , ή
0 n n n
RI καλείται set form ή raw form.
n

Πόσες διαφορετικές αρχικές σειρές µπορούν να παραχθούν; Πόσοι δηλαδή διαφορετικοί συνδυασµοί των
δώδεκα φθόγγων µπορούν να δηµιουργηθούν; Με έναν απλό υπολογισµό µπορούµε να δηµιουργήσουµε 12!
συνδυασµούς δωδεκαφθογγικών σειρών (12x11x10x9x…x1), το οποίο ισοδυναµεί µε 479,001,600
διαφορετικές σειρές. Το πλήθος πάντως αυτό µειώνεται σηµαντικά καθώς στην πράξη µόνο 9,979,200 από
αυτές αποτελούν µοναδικές σειρές, αφού οι υπόλοιπες αφορούν µετασχηµατισµούς άλλων σειρών.
Οι παραπάνω κανόνες χρησιµοποιούνται προκειµένου να εξαχθούν σειρές φθόγγων οι οποίοι στη
συνέχεια χρησιµοποιούνται µε διάφορους τρόπους σε µια µουσική σύνθεση. Σε γενικές πάντως γραµµές η
τονική ανάπτυξη ενός έργου δεν προέρχεται από την απλή µεταφορά τέτοιων σειρών. Οι σειρές αυτές
περισσότερο καθορίζουν ένα γενικότερο επίπεδο οργάνωσης της τονικής δοµής του έργου. Η διαδικασία
µάλιστα αυτή, αποτελεί µια σηµαντική παράµετρο διαφοροποίησης ανάµεσα σε διαφορετικές συνθετικές
προσεγγίσεις που ακολουθήθηκαν από συνθέτες του δωδεκαφθογγικού συστήµατος. Πρέπει επίσης να
τονιστεί πως κατά την πρώτη αυτή φάση του σειραϊσµού, στο χρονικό δηλαδή διάστηµα µεταξύ των αρχών
της δεκαετίας του 1920 και λίγο πριν το τέλος της δεκαετίας του 1940, οι υπόλοιπες παράµετροι της µουσικής
σύνθεσης - όπως οι δυναµικές, οι διάρκειες, οι µουσικές χειρονοµίες κ.λπ., επιλέγονται ελεύθερα από τον
συνθέτη.
Καθώς λοιπόν ολοένα και περισσότεροι συνθέτες της Σύγχρονης Μουσικής εµπλέκονται µε τον
δωδεκαφθογγικό σειραϊσµό, εξελίσσουν σηµαντικά τις αρχικές ιδέες του Schoenberg και αναπτύσσουν τις
δικές τους µεθόδους όπου, εκτός των παραπάνω θεµελιωδών µετασχηµατισµών, προτείνουν νέους τρόπους
για την τονική, και όχι µόνο, ανάπτυξη των έργων τους.

8.4.2. Μετασχηµατισµοί στο Δωδεκαφθογγικό Σύστηµα.

Η παραγώγιση (derivation) βασίζεται σε µια αρχική σειρά φθόγγων P το πλήθος των οποίων αντιστοιχεί σε
κάποιο ακέραιο υπο-πολλαπλάσιο του 12 (3, 4 ή 6), µε πιο συνηθισµένη την τριχορδία. Χρησιµοποιώντας
τους θεµελιώδεις µετασχηµατισµούς R, I, RI σε αυτήν την αρχική σειρά, εξάγονται και οι υπόλοιπες µέχρι να
συµπληρωθούν οι δώδεκα φθόγγοι. Η τεχνική αυτή ακολουθήθηκε από τον Anton Webern, ενώ και ο Milton
Babbitt χρησιµοποίησε αρχικές σειρές των έξι φθόγγων (εξαχορδίες) για την παραγωγή δωδεκάφθογγων
σειρών. Εάν για παράδειγµα έχουµε µια αρχική σειρά τριών φθόγγων B, Bb, D (τριχορδία), ξεκινώντας από B
= 0, µπορούµε να την αναπαραστήσουµε και αριθµητικά ως: 0, 11, 3. Σχηµατικά έχουµε τους εξής
µετασχηµατισµούς:

263
Εικόνα 8.3-8.5 Οι διαδοχικοί µετασχηµατισµοί µιας αρχικής τριχορδίας 0-11-3 και η χρήση τους ως δωδεκαφθογγική
πλέον σειρά [0-11-3-4-8-7-9-5-6-1-2-10] στο έργο «Fünf Lieder for Voice and Piano», op. 4 του Anton Webern (1908-
09). (πηγή: Wikimedia Commons – χρήστης Hyacinth).

Η παραγώγιση από υπο-σύνολα των τριών φθόγγων δηµιουργούν γεωµετρικές συµµετρίες, οι οποίες
χρησιµοποιήθηκαν από αρκετούς συνθέτες για τη δηµιουργία δωδεκαφθογγικών σειρών (Εικόνα 8.6).

Εικόνα 8.6 Η ίδια σειρά 0-11-3-4-8-7-9-5-6-1-2-10, αποτυπωµένη ως διαδοχικές γεωµετρικές συµµετρίες της αρχικής
τριχορδίας 0-11-3. (πηγή: Wikimedia Commons-χρήστης Hyacinth).

264
Μια άλλη τεχνική αφορά στην κατάτµηση (partitioning) η οποία, σε αντίθεση µε την παραγώγιση,
χρησιµοποιεί τµήµατα µιας αρχικής δωδεκαφθογγικής σειράς για να δηµιουργήσει νέες σειρές των δώδεκα
φθόγγων. Τα κριτήρια επιλογής και αναδιάταξης τµηµάτων της αρχικής σειράς βασίζονται κυρίως σε
χαρακτηριστικά διαφοροποίησης σε σχέση µε την τονική τους έκταση. Μια τέτοια µέθοδο αποτελεί η
διατµηµατική κατάτµηση (cross partition) η οποία αρχικά διατάσσει την αρχική σειρά σε σειρές και στήλες
των 6 x 2, 4 x 3, 3 x 4 ή 2 x 6:

έστω για παράδειγµα η αρχική σειρά:

0 11 7 4 2 9 3 8 10 1 5 6

σε µια διάταξη 3 x 4:

0 4 3 1
11 2 8 5
7 9 10 6

όπου στη συνέχεια αναδιατάσσει τη σειρά των στοιχείων κάθε στήλης, για παράδειγµα ως εξής:

0 9 3 6
7 4 8 5
11 2 10 1

καταλήγοντας έτσι σε µια νέα σειρά:

0 7 11 9 4 2 3 8 10 6 5 1

Άλλοι µετασχηµατισµοί οι οποίοι χρησιµοποιήθηκαν από τον Schoenberg και τους µαθητές του, όπως η
συνδυαστικότητα, η συµπληρωµατικότητα κ.λπ. διατυπώθηκαν σε µεγάλο βαθµό και από τη θεωρία των
συνόλων. Είναι επίσης σηµαντικό να τονιστεί πως σταδιακά οι αυστηροί κανόνες του Δωδεκαφθογγισµού
άρχισαν να χαλαρώνουν. Αρχικά αυτό αφορούσε τη χρήση σειρών µε λιγότερα από δώδεκα στοιχεία
(εξάχορδα, τετράχορδα κ.λπ.), ενώ σε αρκετά έργα παρουσιάστηκαν επαναλήψεις τονικών κλάσεων στην ίδια
σειρά. Κατ’ αυτόν τον τρόπο τα έργα της περιόδου αυτής απαντώνται και µε τη γενικότερη ορολογία ως έργα
του Πρώτου Σειραϊσµού.

8.5. Σηµειακή Οργάνωση (Punctualism).

8.5.1. Βασικές Αρχές.

Κατά τη Σηµειακή Οργάνωση (Punctualism ή Point Music) ο συνθέτης οργανώνει το υλικό του φθόγγο προς
φθόγγο επιλέγοντας κάθε φορά από ένα σύνολο τιµών µια διαφορετική τιµή για τα εξής χαρακτηριστικά κάθε
φθόγγου:

• τονικό ύψος
• διάρκεια
• δυναµικές
• άρθρωση

Σε αντίθεση δηλαδή µε τη γραµµική – οµαδική οργάνωση των φθόγγων, εδώ η µουσική σύνθεση αποτελείται
από ξεχωριστά οργανωµένα σηµεία. Κατά συνέπεια, φαινόµενα χρονικής µετάβασης στις δυναµικές
(crescendo-decrescendo), στην τονικότητα (glissandi) ή στη ρυθµική αγωγή (accelerando-ritardando) δεν
µπορούν να υπάρξουν: οι χειρονοµίες µουσικής άρθρωσης και οι δυναµικές µεταβάλλονται ανά φθόγγο.

265
Εικόνα 8.7 Παράδειγµα οργάνωσης διαφορετικών δυναµικών ανά φθόγγο (από το έργο «Mode de Valeurs et d'Intensités»
του Messiaen) (πηγή: χρήστης Hyacinth-Wikipedia).

Επακόλουθο είναι πως η ανάπτυξη µιας τέτοιας φόρµας απαιτεί µια αρκετά πολύπλοκη οργάνωση στην οποία
αναπόφευκτα ο συνθέτης εµπλέκει αριθµητικές δοµές για να επιλύσει τα ζητήµατα της ατοµικής οργάνωσης
των φθόγγων. Ο τρόπος αυτός οργάνωσης του µουσικού υλικού άνθισε µεταξύ του 1949 και 1955 µε κύριο
εκπρόσωπό της τον Olivier Messiaen. Χαρακτηριστικό έργο της συνθετικής αυτής διαδικασίας αποτελούν οι
«Τέσσερις Ρυθµικές Σπουδές» («Quatre Études de Rythme»), έργο του 1949-50.

8.5.2. Olivier Messiaen: «Τέσσερις Ρυθµικές Σπουδές» («Quatre Études de Rythme»), 1949-50.

Στο έργο του «Τέσσερις Ρυθµικές Σπουδές» ο Messiaen πρωτο-χρησιµοποιεί την έννοια της αριθµητικής
οργάνωσης στην τονικότητα, την διάρκεια, τις δυναµικές και τον τύπο άρθρωσης (attack mode) κάθε νότας
ξεχωριστά. Τα µέρη του έργου:

• I.«Ile de Feu I» (Fire Island I)


• II.«Mode de Valeurs et d'Intensités» (Mode of Durations and Intensities)
• III.«Neumes Rythmiques» (Rhythmic Neumes)
• IV.«Ile de Feu II» (Fire Island II)

Αναλυτικότερα:

Ι. «Ile de Feu I» (Fire Island I)


Στο πρώτο αυτό µέρος ο συνθέτης ακολουθεί µια πιο κλασική οργάνωση του υλικού (θέµα –
ανάπτυξη), σε αντίθεση µε τα υπόλοιπα τρία που ακολουθούν τη λογική της σηµειακής οργάνωσης.

ΙΙ. «Mode de Valeurs et d'Intensités»


Στο µέρος αυτό ο συνθέτης χρησιµοποιεί συνδυασµούς οργάνωσης του υλικού οι οποίοι προέρχονται
από 36 διαφορετικά τονικά ύψη, 24 χρονικές διάρκειες, 12 τύπους άρθρωσης (11 attacks + 1 χωρίς άρθρωση)
και 7 δυναµικές, όπως φαίνεται και από τις σηµειώσεις του συνθέτη (Εικόνα 8.8).

Εικόνα 8.8 Χρήση συγκεκριµένων τύπων άρθρωσης (εκτελεστικών χειρονοµιών) και δυναµικών κατά τη δεύτερη ρυθµική
σπουδή «Mode de Valeurs et d'Intensités» (από σηµειώσεις του συνθέτη).

Ειδικά για τις διάρκειες ο συνθέτης χρησιµοποιεί τρεις διαφορετικές υπο-οµάδες κάθε µια από τις οποίες
αντιστοιχεί στις τρεις περιοχές τονικής έκτασης του πιάνου (υψηλές, µεσαίες, χαµηλές). Η πρώτη υπο-οµάδα
περιλαµβάνει δώδεκα χρωµατικές ρυθµικές παραλλαγές οι οποίες προέρχονται από συνδυασµούς τριακοστών
δευτέρων, η δεύτερη υπο-οµάδα δώδεκα παραλλαγές διαρκειών από συνδυασµούς δεκάτων-έκτων και η τρίτη

266
δώδεκα παραλλαγές από συνδυασµούς ογδόων, επιλέγοντας από είκοσι τέσσερις µοναδικές αξίες (Εικόνα
8.9).

Εικόνα 8.9 Η οργάνωση των ρυθµικών αξιών ανά τρεις υπο-οµάδες στη δεύτερη ρυθµική σπουδή του Messiaen «Mode de
Valeurs et d'Intensités» (από σηµειώσεις του συνθέτη).

III.«Neumes Rythmiques» (Rhythmic Neumes)


Στο τρίτο αυτό µέρος χρησιµοποιούνται εναλλασσόµενα refrain τα οποία προέρχονται από δύο
διαφορετικά σύνολα. Το πρώτο σύνολο σηµειώνεται ως «rythme en ligne triple: 1 à 5, 6 à 10, 11 à 15» το
οποίο δηλώνει πως χρησιµοποιούνται τρεις τύποι διαρκειών – βραχείες, µεσαίες και µακρές, και οι οποίες σε
κάθε επανάληψή τους σταδιακά επεκτείνονται µε την προσθήκη κάθε φορά µιας αξίας 1/16. Το δεύτερο
σύνολο από refrain σηµειώνεται από τον συνθέτη ως «nombre premier en rythme non rétrogradable», δηλαδή
ως πρώτου αριθµού σε µη-αναδροµικό ρυθµό, και αναφέρεται στη δυνατότητα χρονικής επίσης επέκτασής
τους –όπως και µε τα refrain του πρώτου συνόλου, µε την προσθήκη µιας σειράς αξιών του 1/16 σε
πολλαπλάσια πρώτων αριθµών: 41, 43, 47 και 57.
Οι στροφές οι οποίες παρεµβάλλονται ανάµεσα στις εναλλαγές των refrain των δύο αυτών συνόλων
σηµειώνονται από τον συνθέτη ως «neumes rythmiques, avec résonances et intensités fixes», δηλαδή ως
ρυθµικά νεύµατα µε σταθερούς χρωµατισµούς και δυναµικές. Ο Messiaen εδώ διατυπώνει την έννοια του
ρυθµικού νεύµατος, την εφαρµογή δηλαδή µιας ελικοειδούς µελωδικής κίνησης σε ρυθµικό µοτίβο, µια έννοια
η οποία επανέρχεται σε πολλά έργα του συνθέτη. Κάθε τέτοιο ρυθµικό νεύµα χαρακτηρίζεται από µια
σταθερή δυναµική αξία και έναν σταθερό χρωµατισµό ο οποίος ποικίλλει σε βαθµό από πολύ έντονος έως
σκοτεινός.

IV. «Ile de Feu II» (Fire Island II)


Το αρχικό θέµα στο τέταρτο αυτό µέρος του έργου αποτελεί το βασικό θέµα το οποίο ο συνθέτης
µεταλλάσσει κυκλικά επιλέγοντας από ένα σύνολο από δώδεκα χρονικές αξίες, δώδεκα διαφορετικούς ήχους,
δώδεκα τύπους ανόδου (attack) και πέντε διαφορετικές δυναµικές. Η ρυθµική αγωγή του µέρους αυτού
βασίζεται σε ένα σχήµα ρυθµικών παραλλαγών µιας βασικής ρυθµικής κλίµακας η οποία στην αρχική της
µορφή αποτελείται από µια φθίνουσα ακολουθία τιµών µε διάρκειες από 12 έως 1 (αρχική σειρά). Η αρχική
ακολουθία στη συνέχεια αναδιατάσσεται µε µια λογική επεξεργασίας σχήµατος σφήνας – ή ανοικτής
βεντάλιας όπως την ονόµασε ο ίδιος ο συνθέτης, καταλήγοντας σε 10 ακόµη ακολουθίες τιµών, κάθε µια από
τις οποίες καλεί Intervension I, Intervension II κ.ο.κ. Κάθε επόµενη σειρά τιµών δηµιουργείται λαµβάνοντας
τιµές εναλλάξ από τα δύο άκρα προς το κέντρο. Οι τιµές τοποθετούνται ξεκινώντας από τη δεξιά άκρη της
νέας σειράς, όπως φαίνεται και από τις πρώτες τέσσερις κινήσεις στα παρακάτω σχήµατα (Σχήµα 8.3-8.7).

267
Σχήµα 8.3-8.7 Οι τέσσερις πρώτες µετατοπίσεις τιµών και τελικά η δηµιουργία της πρώτης ακολουθίας Intervension I.

Με τον ίδιο τρόπο ξεκινώντας τώρα από τη σειρά Intervension I και ακολουθώντας την ίδια λογική
αναδιατάξεων, αναπαράγεται η επόµενη σειρά Intervension II κ.ο.κ. καταλήγοντας τελικά σε 11 διαφορετικές
σειρές τιµών, όπως φαίνεται και από τον παρακάτω πίνακα (Πίνακας 8.1).

αρχική σειρά 12 11 10 9 8 7 6 5 4 3 2 1
Interversion I 6 7 5 8 4 9 3 10 2 11 1 12
Interversion II 3 9 10 4 2 8 11 5 1 7 12 6
Interversion III 11 8 5 2 1 4 7 10 12 9 6 3
Interversion IV 7 4 10 1 12 2 9 5 6 8 3 11
Interversion V 9 2 5 12 6 1 8 10 3 4 11 7
Interversion VI 8 1 10 6 3 12 4 5 11 2 7 9
Interversion VII 4 12 5 3 11 6 2 10 7 1 9 8
Interversion VIII 2 6 10 11 7 3 1 5 9 12 8 4

268
Interversion IX 1 3 5 7 9 11 12 10 8 6 4 2
Interversion X 12 11 10 9 8 7 6 5 4 3 2 1

Πίνακας 8.1 Οι δέκα αριθµητικές σειρές που καθορίζουν τη ρυθµική αγωγή του Ile de feu II.

Ο Messiaen συνέθεσε µια σειρά από έργα µεγαλύτερων διαστάσεων βασισµένα στην παραπάνω λογική
ανάµεσα στα οποία και το «Chronochromie» (1960), ένα έργο για ορχήστρα σε επτά µέρη. Αρκετοί από τους
µαθητές του µετεξέλιξαν τις τεχνικές αυτές δηµιουργώντας το δικό τους προσωπικό ύφος. Ανάµεσα σε
αυτούς και οι Pierre Boulez, Karlheinz Stockhausen και Iannis Xenakis.

8.6. Καθολικός Σειραϊσµός (Integral/Total Serialism).

8.6.1. Βασικές Αρχές.

Ο Καθολικός Σειραϊσµός (Integral/Total Serialism) αναπτύχθηκε ως συνέχεια του πρώτου Δωδεκαφθογγικού


σειραϊσµού στα τέλη της δεκαετίας του 1940 και ενέπλεξε τη χρήση αριθµητικών σειρών στη διάρθρωση και
των υπολοίπων - πέραν της τονικής οργάνωσης, παραµέτρων της µουσικής σύνθεσης. Αρχικά στη δεκαετία
του 1940 ο Milton Babbit ανέπτυξε αριθµητικά σύνολα προκειµένου να οργανώσει το τονικό και ρυθµικό
περιεχόµενο των έργων του ενώ την ίδια περίοδο και ο Olivier Messiaen, αν και διατύπωσε µια σηµειακή
οργάνωση της µουσικής, χρησιµοποίησε σειρές τιµών προκειµένου να οργανώσει τη ρυθµική αγωγή των
έργων του.
Ακολούθησε ένα πλήθος συνθετών οι οποίοι κατά την πρώτη φάση των έργων τους, από τις αρχές
δηλαδή της δεκαετίας του 1950 και έπειτα, ανέπτυξαν µια σειρά από έργα βασισµένα στις αρχές του
καθολικού σειραϊσµού µε κύριους εκφραστές τους Pierre Boulez, Karlheinz Stockhausen και Luigi Nono.

8.6.2. Pierre Boulez: «Le Marteau Sans Maître» (1953-54, 1957).

Ο Pierre Boulez ήδη µε το έργο του «Structures I» (1952-53) εγκατέλειψε τη σηµειακή οργάνωση της
µουσικής και τα έργα του πλέον άρχισαν να διέπονται από τις αρχές του καθολικού σειραϊσµού. Το έργο «Le
Marteau Sans Maître» (1953-54, 1957) αποτέλεσε ένα τέτοιο χαρακτηριστικό έργο που τον καθιέρωσε ως µια
ξεχωριστή συνθετική προσωπικότητα. Αποτελείται από εννέα µέρη (έξι στην αρχική του εκδοχή) και είναι
γραµµένο για έξι όργανα και κοντράλτο, µε κείµενα βασισµένα στην ποίηση του σουρεαλιστή ποιητή René
Char. Μια πρώτη σηµαντική διαφοροποίηση αφορά στην ενορχηστρωτική δοµή του έργου η οποία µαζί µε τη
φωνή εµπλέκει έξι εντελώς απρόσµενα συνδυασµένες για την εποχή εκείνη ηχητικές πηγές: φωνή, άλτο
φλάουτο, βιόλα, κιθάρα, βιµπράφωνο, ξυλορίµπα και κρουστά (µπόνγκο, ζίλια, κουδούνες κ.λπ.).

Εικόνα 8.10 Το ηχοχρωµατικό διάγραµµα και οι εκτελεστικές χειρονοµίες που συνδέουν τις διαφορετικές πηγές µεταξύ
τους, στο έργο «Le Marteau Sans Maître» του Pierre Boulez (πηγή: Wikimedia Commons, Brad Smith).

Τα εννέα µέρη του έργου οµαδοποιούνται σε τρεις κύκλους. Ο πρώτος κύκλος αποτελείται από τα µέρη I, III
και VII, η τονική διάρθρωση των οποίων βασίζεται σε ένα αρχικό σύνολο:

{3 5 2 1 10 11 9 0 8 4 7 6}

Το αρχικό αυτό σύνολο µετασχηµατίζεται µε πράξεις αναδιάταξης και πολλαπλασιασµού. Αρχικά ο Boulez
κάνοντας χρήση ενός βασικού αριθµητικού µοτίβου 2–4–2–1–3 µε κατάλληλες κυκλικές αναδιατάξεις
αναπαράγει είκοσι πέντε επιµέρους σύνολα, όπως φαίνεται και στον Πίνακα 8.2.

269
a b c d e
I) 35 2 1 10 11 90 8 476
II) 3521 10 11 9 084 76
III) 35 2 1 10 11 90 8476
IV) 3 521 10 11 9084 76
V) 352 1 10 11 9 0 8 47 6

Πίνακας 8.2 Κυκλικές αναδιατάξεις του αρχικού συνόλου {3 5 2 1 10 11 9 0 8 4 7 6} σε πέντε οµάδες µε βάση το µοτίβο
ανάπτυξης 2–4–2–1–3 για τα µέρη I, III και VII του έργου «Le Marteau Sans Maître».

Στην πρώτη σειρά του πίνακα το αρχικό σύνολο αναδιατάσσεται σε πέντε υπο-σύνολα (Ia-Ie) µε βάση την
αρχική αριθµητική ακολουθία 2–4–2–1–3, στη δεύτερη σειρά µε βάση την ακολουθία 4–2–1–3–2 (υπο-
σύνολα IIa-IIe), κ.ο.κ. Κάθε τέτοιο επιµέρους υπο-σύνολο πολλαπλασιάζεται στη συνέχεια µε τα υπόλοιπα
παράγοντας τελικά τονικές ακολουθίες που θα χρησιµοποιηθούν στη σύνθεση. Έτσι, για παράδειγµα
πολλαπλασιάζοντας το Ib µε το Ic παίρνουµε:

{2, 1, 10, 11} x {9, 0} = {(2+9), (1+9), (10+9), (11+9), (2+0), (1+0), (10+0), (11+0)} = {(11, 10, 19, 20, 2, 1,
10, 11)}

Ανάγοντας τις τιµές εντός της δωδεκάδας και αφαιρώντας τις διπλές εµφανίσεις τιµών καταλήγουµε στην
εξής τονική σειρά:

{11, 10, 7, 8, 2, 1}

η οποία αποτελεί την τονική ανάπτυξη του τρίτου µέτρου του µέρους ΙΙΙ. Με µια αντίστοιχη λογική ο Boulez
αναπτύσσει και τα µέρη του έργου I και VII.
Στον δεύτερο κύκλο, ο οποίος αποτελείται από τα µέρη II, IV, VI, και VIII ο Boulez ακολούθησε την
τεχνική της τονικής-χρονικής σύζευξης (pitch-duration association), σύµφωνα µε την οποία συγκεκριµένοι
τόνοι αντιστοιχούν σε συγκεκριµένες διάρκειες. Έτσι για παράδειγµα το D αντιστοιχεί σε διάρκεια 1/16, το
Eb σε διάρκεια 1/8, το E σε 1/8⋅ κ.ο.κ., µέχρι το C# το οποίο αντιστοιχεί σε διάρκεια 1/2⋅. Επιπρόσθετα στα
ίδια µέρη, µε έναν αντίστοιχο τρόπο ο Boulez συνδυάζει δυναµικές και χειρονοµίες µε τονικά ζεύγη (Πίνακας
8.3).

D - Eb E-F F# - G G# - A Bb - B C - C#
pp p mp mf f ff
legato legato accent accent sforzando sforzando

Πίνακας 8.3 Συσχετίσεις τονικών ζευγών µε δυναµικές καθώς και οι αντίστοιχες χειρονοµίες του πρώτου φθόγγου κάθε
τονικού ζεύγους οι οποίες χρησιµοποιήθηκαν από τον Boulez στο IV µέρος του έργου «Le Marteau Sans Maître».

Οι παραπάνω συσχετίσεις τόνων, διαρκειών, δυναµικών και χειρονοµιών ακολουθούνται στον κύριο όγκο
των µερών αυτών, µε µικρές εξαιρέσεις όπου ο συνθέτης φαίνεται να επιστρέφει σε τοπικές παρεκκλίσεις. Οι
µελετητές του Boulez, Lev Koblyakov και Steven Winick έχουν αναλύσει πως η παραπάνω αλγοριθµική
οργάνωση ακολουθείται κατά ένα ποσοστό περίπου 80%.
Ο τρίτος κύκλος αποτελείται από τα µέρη V και IX όπου σε γενικές γραµµές ο συνθέτης χρησιµοποιεί
συνδυαστικές παραλλαγές των προηγούµενων κύκλων.

8.6.3. Karlheinz Stockhausen: Έργα για Πιάνο («Klavierstücke»).

Ο Karlheinz Stockhausen µεταξύ του 1952 και 1961 συνέθεσε έντεκα έργα για πιάνο. Αν και αρχικός σκοπός
του συνθέτη ήταν να συνθέσει είκοσι ένα, τα έργα αυτά έφτασαν τελικά τα δεκαεννέα σε δύο χονδρικά
χρονικές περιόδους. Τα έργα του πρώτου, του δεύτερου και του τρίτου κύκλου γράφτηκαν κατά κύριο λόγο
στη διάρκεια κυρίως της δεκαετίας του 1950. Αναλυτικότερα:

270
Klavierstücke I – IV (1952)
Klavierstücke V – X (1954-55, 1961, 1963)
Klavierstück XI (1956)

Σε µια δεύτερη περίοδο η οποία ξεκίνησε το 1979 και ολοκληρώθηκε στις αρχές της δεκαετίας του 2000,
επέστρεψε στη συνέχιση των υπολοίπων οκτώ έργων (Klavierstücke XII–XIX) τα οποία ενσωµάτωσε στη
σπονδυλωτή όπερα του «Licht» (1977-2003). Με βάση τη λογική ανάπτυξης φόρµας τα δεκαεννέα αυτά έργα
οµαδοποιούνται σε τέσσερις κατηγορίες:

• Οργάνωση υλικού σε οµάδες - group composition (Klavierstücke I–IV).


• Μεταβλητής φόρµας - variable form (Klavierstücke V–X).
• Ανοικτής/αλεατορικής φόρµας - polyvalent structure ή open form (Klavierstück XI).
• Formula composition and Licht (Klavierstücke XII–XIX).

Από τις παραπάνω κατηγορίες έργων οι δύο πρώτες αφορούν τεχνοτροπίες του Καθολικού Σειραϊσµού.

8.6.3.1. Group Composition: Οργάνωση Υλικού σε Οµάδες.

Εγκαταλείποντας τη σηµειακή οργάνωση του υλικού (punctualism) ο Stockhausen οργανώνει πλέον το υλικό
του σε οµάδες φθόγγων (group composition). Κάθε οµάδα περιλαµβάνει ένα συγκεκριµένο πλήθος φθόγγων
το οποίο χαρακτηρίζεται από κοινές συµπεριφορές σε σχέση µε την τονική τους έκταση, την κατεύθυνση, τις
διάρκειες κ.λπ., ενώ η συνθετική επεξεργασία επικεντρώνεται σε πράξεις και αριθµητικές αναδιατάξεις των
τιµών κάθε οµάδας.
Στο «Klavierstück I» ο συνθέτης χρησιµοποιεί δύο χρωµατικά εξάχορδα: {C, C#, D, D#, E, F} και
{F#, G, G#, A, A#, B}. Η οργάνωση του υλικού βασίζεται σε έξι διαφορετικές ακολουθίες των αριθµών 1-6.
Κάθε µια από αυτές τις ακολουθίες αφορά αναδιατάξεις των έξι αυτών αριθµών παράγοντας έτσι συνολικά
36 διαφορετικές οµάδες. Οι έξι αυτές ακολουθίες διατάσσονται σε έναν πίνακα, κάθε µια και σε µια
διαφορετική γραµµή του (Πίνακας 8.4).

5 2 3 1 4 6
3 4 2 5 6 1
2 6 4 3 1 5
4 1 6 2 5 3
6 5 1 4 3 2
1 3 5 6 2 4

Πίνακας 8.4 Αναδιατάξεις της αριθµητικής ακολουθίας 1-6 ανά γραµµή του πίνακα, στο έργο «Klavierstück I».

Από τον πίνακα φαίνεται πως στις κάθετες στήλες επαναλαµβάνεται η ίδια ακολουθία αριθµών:

153246

µε διαφορετικό κάθε φορά σηµείο έναρξης της ακολουθίας και µε κυκλικότητα. Μια τέτοια µάλιστα
ακολουθία στην στήλη 5 [4 – 6 – 1 – 5 – 3 – 2] χρησιµοποιήθηκε αρχικά από τον συνθέτη προκειµένου να
προσδιορίσει το πλήθος των αρχικών είκοσι ενός έργων του σε οµαδοποιηµένα υπο-σύνολα. Οι τιµές του
πίνακα προσδιορίζουν ένα πλήθος από χαρακτηριστικά οργάνωσης της κάθε οµάδας, όπως τη σειρά των
φθόγγων καθώς και τις χρονικές διάρκειες διαδοχικών µέτρων σε αξίες που κυµαίνονται από 1/4 έως 6/4.
Aντίστοιχα, το έργο «Klavierstück II» βασίζεται σε δύο κύριες οµάδες των πέντε φθόγγων οι οποίοι
µε κατάλληλες κυκλικές αναδιατάξεις παράγουν τελικά τριάντα οµάδες νοτών. Κάθε τέτοια οµάδα

271
καταλαµβάνει και ένα µέτρο. Οι διάρκειες των µέτρων καθορίζονται από τα πέντε πρώτα πολλαπλάσια του
1/8, καταλήγοντας έτσι σε διάρκειες 1/8 έως 5/8, µε την εξής σειρά: 4 µέτρα του 1/8, 5 µέτρα των 2/8, 6
µέτρα των 4/8, 7 µέτρα των 5/8 και 8 µέτρα των 3/8. Οι οµάδες αυτές οµαδοποιούνται περαιτέρω µε τη χρήση
ενός συνόλου χαρακτηριστικών ηχητικών µορφωµάτων (sound forms), τα οποία ο Stockhausen ονόµασε
τρόπους (modes) κατ' αντιστοιχία µε τα νεύµατα (neumes) που χρησιµοποιούσε ο Messiaen.
Με παρόµοιες λογικές οµαδικής οργάνωσης ο συνθέτης οργάνωσε το υλικό του και στα άλλα δύο
έργα του πρώτου αυτού κύκλου «Klavierstück IIΙ» και «Klavierstück IV».

8.6.3.2. Variable Form: Μεταβλητής Φόρµας.

Αν και τα έργα για πιάνο του δεύτερου κύκλου αρχικά ολοκληρώθηκαν σε κοντινό χρονικό διάστηµα µε αυτά
του πρώτου κύκλου (1954), στην πορεία αναθεωρήθηκαν µε αποτέλεσµα ο δεύτερος αυτός κύκλος τελικά να
ολοκληρωθεί το 1961 µε 1963. Καθώς µάλιστα ολοκλήρωνε ήδη τις πρώτες του ηλεκτρονικές σπουδές, ο
Stockhausen επανέρχεται στην κλασική σύνθεση µε ένα ανανεωµένο ενδιαφέρον για τους συνθετικούς και
εκτελεστικούς παράγοντες οι οποίοι διαφοροποιούν δυναµικά τη φόρµα ενός έργου σε σχέση µε την
εκτελεστική στατικότητα ενός ηλεκτρονικού έργου: σύνθετες φυσικές χειρονοµίες σε ποικίλµατα,
αλληλεπιδράσεις µετρικών µοτίβων µε υποκειµενικές διαφοροποιήσεις στο µέτρηµα, εκτελεστικές οδηγίες
του τύπου «όσο το δυνατόν ταχύτερα» κ.λπ. Ο Stockhausen προσδιόρισε το αποτέλεσµα που επιφέρουν όλοι
αυτοί οι υποκειµενικοί παράγοντες ως µεταβλητής φόρµας (variable form).
Ο αρχικός σχεδιασµός των έργων του δευτέρου κύκλου βασίστηκε σε έναν πίνακα 6 αριθµητικών
σειρών (Πίνακας 8.5).

2 6 1 4 3 5
6 4 5 2 1 3
1 5 6 3 2 4
4 2 3 6 5 1
3 1 2 5 4 6
5 3 4 1 6 2

Πίνακας 8.5 Πίνακας τιµών που χρησιµοποιούνται στα έργα Klavierstücke V–X.

Όλες οι σειρές του πίνακα παράγονται από κατάλληλους µετασχηµατισµούς. Η δεύτερη και η τρίτη σειρά
αποτελούν γεωµετρικές µετατοπίσεις της πρώτης (Σχήµα 8.8 - 8.9) ενώ η τέταρτη, η πέµπτη και η έκτη σειρά
αφορούν αναδροµές (retrograde) της τρίτης, δεύτερης και πρώτης σειράς αντίστοιχα (Σχήµα 8.10).

272
Σχήµα 8.8 Παραγωγή των τιµών της δεύτερης σειράς του πίνακα µε διαδοχικές γεωµετρικές µετατοπίσεις των στοιχείων
της πρώτης σειράς.

Σχήµα 8.9 Παραγωγή των τιµών της τρίτης σειράς του πίνακα µε διαδοχικές γεωµετρικές µετατοπίσεις των στοιχείων της
πρώτης σειράς.

273
Σχήµα 8.10 Παραγωγή των τιµών της τέταρτης, πέµπτης και έκτης σειράς του πίνακα µε αναδροµές των προηγούµενων
σειρών.

Με βάση τους παραπάνω µετασχηµατισµούς ο Stockhausen καταλήγει σε έναν πίνακα διαγώνιων συµµετριών
(Σχήµα 8.11).

Σχήµα 8.11 Διαγώνιες συµµετρίες στα στοιχεία του πίνακα των έργων Klavierstücke V–X.

Η πρώτη σειρά του πίνακα περιέχει µια βασική σειρά έξι τονικών κλάσεων η οποία αναπαράγει πέντε ακόµα
µε βάση τους παραπάνω µετασχηµατισµούς. Σύµφωνα µε τους αρχικούς σχεδιασµούς του συνθέτη για τα
έργα του κύκλου αυτού, κάθε έργο θα περιελάµβανε ένα διαφορετικό πλήθος κυρίων µερών καθένα από τα
οποία θα είχε τη δική του ρυθµική αγωγή (tempo). Το πλήθος αυτό καθορίζεται από τη δεύτερη σειρά του
πίνακα. Έτσι, το «Klavierstück V» αρχικά είχε σχεδιαστεί να περιέχει έξι κύρια µέρη -και αντίστοιχο πλήθος
ρυθµικών αγωγών, το «Klavierstück VI» τέσσερα κύρια µέρη, το «Klavierstück VII» πέντε κ.ο.κ. Ένα
δεύτερο στοιχείο αφορούσε την υπο-διαίρεση των κύριων ρυθµικών αγωγών κάθε έργου σε υπο-σύνολα, το
πλήθος των οποίων καθορίζεται ξεκινώντας από το πρώτο στοιχείο κάθε σειράς του πίνακα. Έτσι, τα έξι
κύρια µέρη του «Klavierstück V» υποδιαιρούνται σε 2, 6, 1, 4, 3 και 5 υπο-σύνολα ρυθµικών αγωγών, τα
τέσσερα κύρια µέρη του «Klavierstück VI» σε 6, 4, 5 και 2 υπο-σύνολα, τα πέντε κύρια µέρη του
«Klavierstück VII» σε 1, 5, 6, 3 και 2 υπο-σύνολα κ.ο.κ. Αν και η δοµή των έργων προσδιορίζεται σε µεγάλο
βαθµό σύµφωνα µε τον αρχικό αυτό σχεδιασµό, το περιεχόµενό της καθορίζεται ανά περίπτωση. Έτσι, για
παράδειγµα, στο «Klavierstück IX» ο Stockhausen χρησιµοποιεί αριθµητικές σειρές Fibonacci προκειµένου
να αποδώσει τις ρυθµικές σχέσεις µεταξύ των διαφόρων µερών του. Κατ’ αυτόν τον τρόπο, ενώ η διάρθρωση
των έργων του δευτέρου αυτού κύκλου πραγµατοποιείται σε µια λογική οργάνωσης µετατοπισµένη από το
τοπικό στο γενικό επίπεδο, το ίδιο το περιεχόµενο των δοµών αντιµετωπίζεται σε τοπικό επίπεδο.
Αρκετοί από τους σχεδιασµούς αυτούς στην πορεία αναθεωρήθηκαν καθώς το µουσικό αποτέλεσµα
για διαφόρους λόγους δεν ικανοποιούσε τον συνθέτη. Στην πιο πιστή απόδοση του αρχικού του σχεδίου, στο
έργο «Klavierstück VIII» ο συνθέτης χρησιµοποιεί δύο οµάδες ρυθµικής αγωγής, η πρώτη εκ των οποίων
υπο-διαιρείται σε τρία µέρη και η δεύτερη σε δύο. Στο έργο αυτό οι αριθµητικές σειρές του πίνακα
ρυθµίζουν ένα πλήθος από διαφορετικές παραµέτρους του έργου, όπως το πλήθος των υπο-οµάδων από τις

274
οποίες αποτελείται, το πλήθος των τόνων ανά οµάδα, τις θέσεις τους ως τονικό διάστηµα και χρονική
κατανοµή, τη χρονική διάρκεια των τόνων, το επίπεδο των δυναµικών κ.λπ.

8.7. Στοχαστικά Μοντέλα: η Πιθανοκρατία στη Μουσική (Stochastic Music).

Αν και ο όρος Stochastic Music παραπέµπει σε µεγάλο βαθµό στον Iannis Xenakis και την εµπλοκή, κατά
κύριο λόγο, µαθηµατικών µοντέλων στις παραµέτρους σύνθεσής του, η γενικότερη χρήση του όρου αφορά
µοντέλα για τα οποία, σε αντίθεση µε τα αιτιοκρατικά, δεν µπορούµε να είµαστε βέβαιοι για τα αποτελέσµατα
των διαδικασιών τους. Από την άποψη αυτή, τα συγκεκριµένα µοντέλα περιλαµβάνουν πιθανοκρατικές
διαδικασίες βασισµένες σε µαθηµατικές δοµές αλλά και γενικότερες διαδικασίες τυχαιότητας.

8.7.1. Μοντέλα Τυχαιότητας (Aleatorism).

Σε µια σχεδόν παράλληλη πορεία µε τους συνθέτες του Δεύτερου Σειραϊσµού µια άλλη οµάδα συνθετών
προερχόµενοι κυρίως από την αµερικανική ήπειρο, χρησιµοποιεί µερικώς ή ολικώς διαδικασίες τυχαιότητας
για να προσδιορίσει ένα πλήθος παραµέτρων της µουσικής σύνθεσης. Αν και είχαν προηγηθεί κάποιες
συνθετικές απόπειρες έργων ενταγµένων στο κίνηµα του dada στις αρχές του 20ού αιώνα, οι πρώτες
συστηµατικές διαδικασίες χρήσης της τυχαιότητας καταγράφονται αρχικά από τον Henry Cowell στη
δεκαετία του 1930 και µετέπειτα, στις αρχές της δεκαετίας του 1950, από τη Σχολή της Νέας Υόρκης µε
κύριους εκφραστές τους John Cage, Earle Brown, Morton Feldman και Christian Wolff.
Ο όρος Aleatoric -από τη λατινική λέξη alea που σηµαίνει ζάρι, πρωτοδιατυπώθηκε στις αρχές της
δεκαετίας του 1950 από τον Werner Meyer-Eppler, ενός εκ των συνιδρυτών του εργαστηρίου ηλεκτρονικής
µουσικής στα studio της ραδιοφωνίας της Κολωνίας WDR. Σύµφωνα µε τον ίδιο, εάν τα βασικά
χαρακτηριστικά εξέλιξης µιας διαδικασίας είναι γενικά προσδιορίσιµα αλλά στις λεπτοµέρειές της
χρησιµοποιούνται βαθµοί τυχαιότητας, τότε αυτή µπορεί να χαρακτηριστεί ως Αλεατορική. Η χρήση του
ζαριού, µάλιστα, είχε κυριολεκτικά χρησιµοποιηθεί από Γερµανούς συνθέτες του 18ου αιώνα προκειµένου να
επιλέγουν από ένα πλήθος προ-αποφασισµένων παραµέτρων κατά τη διάρκεια σύνθεσης ενός έργου
(Musikalisches Würfelspiel). Εκτός από την παραπάνω ορολογία, ο John Cage χρησιµοποίησε τους όρους
Indeterminacy (Απροσδιοριστία) και Indeterminate Music, Μουσική δηλαδή της Απροσδιοριστίας, θέλοντας
να περιγράψει τη δυνατότητα εκτέλεσης της ίδιας σύνθεσης µε σηµαντικά κάθε φορά διαφοροποιηµένους
τρόπους. Ο Cage χρησιµοποιεί, επίσης, τους όρους Chance Composition και Chance Music.
Με βάση το στάδιο στο οποίο εµπλέκεται µια διαδικασία τυχαιότητας υπάρχουν τρεις τύποι
αλεατορικής σύνθεσης:

• Καθορισµένης ή σταθερής δοµής (determinate ή fixed form).


• Κινητής δοµής/ανοικτής δοµής (mobile form/open form).
• Σηµειογραφικής απροσδιοριστίας (indeterminate notation).

8.7.1.1. Μοντέλα Τυχαιότητας Καθορισµένης ή Σταθερής Δοµής.

Ο τύπος καθορισµένης δοµής αφορά στην εµπλοκή διαδικασιών τυχαιότητας προκειµένου να παραχθεί τελικά
µια παρτιτούρα αυστηρά καθορισµένη ως προς τη δοµή της. Παράδειγµα αυτού του τύπου σύνθεσης αποτελεί
το έργο του John Cage «Music of Changes» (1951) για solo πιάνο. Η δοµή του έργου βασίζεται στο I Ching
γνωστότερο και ως βιβλίο των αλλαγών (book of changes). Το βιβλίο χρησιµοποιεί 64 µοναδικά σύµβολα
καθένα από τα οποία αντιστοιχεί σε κάποια κατάσταση συνήθως µεταβατικής λογικής. Τα σύµβολα
αποτυπώνονται ως εξάγραµµοι συνδυασµοί δύο βασικών γραµµών: µιας ευθείας γραµµής και µιας
διακεκοµµένης. Για παράδειγµα, το εξάγραµµο το οποίο αποτελείται από µια διακεκοµµένη ακολουθούµενη
από µια ευθεία, στη συνέχεια µια διακεκοµµένη και τελικά από τρεις ευθείες, συµβολίζει τη διαφωνία, τη
σύγκρουση. Ενώ αντίστοιχα το εξάγραµµο το οποίο αποτελείται από τέσσερις διακεκοµµένες, µια ευθεία και
µια διακεκοµµένη συµβολίζει την οµαδοποίηση, τη συνάθροιση, το ταίριασµα (Εικόνα 8.11).

275
Εικόνα 8.11 Το εξάγραµµο της σύγκρουσης (αριστερά) και το εξάγραµµο που συµβολίζει τη συνάθροιση (δεξιά).

Τα σύµβoλα αυτά χρησιµοποιούνται προκειµένου να δώσουν απαντήσεις -υπό µορφή καθοδήγησης, σε


ερωτήµατα: για κάθε ερώτηµα που τίθεται επιλέγεται ένα εξάγραµµο µε τυχαίο τρόπο. Κατά µια εκδοχή,
καθώς το I Ching ενσωµατώνει τη σοφία των δύο κυριότερων θρησκευτικών και φιλοσοφικών ρευµάτων της
Κίνας, του Κοµφουκιανισµού και του Ταοϊσµού, το εξάγραµµο το οποίο τελικά επιλέγεται δεν αποτελεί
απλώς την απάντηση στο ερώτηµα αλλά κινητοποιεί το υποσυνείδητο προς µια διαδικασία η οποία έχει
µεταβατικά χαρακτηριστικά. Ένας συνήθης τρόπος να επιλεγεί ένα εξάγραµµο είναι ρίχνοντας ένα νόµισµα
έξι φορές: η µια πλευρά αντιστοιχεί σε ευθεία γραµµή και η άλλη σε διακεκοµµένη.
Ο Cage χρησιµοποίησε πίνακες των 64 στοιχείων –όσα δηλαδή και τα εξάγραµµα σύµβολα του I
Ching, και βασίστηκε στη συγκεκριµένη διαδικασία για να πάρει αποφάσεις σχετικά µε τη δοµή της
παρτιτούρας του. Ένας από τους πίνακες αυτούς περιελάµβανε στις θέσεις του προκαθορισµένα ηχητικά
συµβάντα, ένας δεύτερος πίνακας διάρκειες και ένας τρίτος δυναµικές. Καθώς επέλεγε κάθε φορά και ένα
στοιχείο από κάθε πίνακα δηµιουργούσε τελικά και µια µουσική φράση. Οι πίνακες µάλιστα των ηχητικών
συµβάντων µοιράζονταν σε 32 θέσεις µε ηχητικά συµβάντα (θέσεις περιττής αρίθµησης) και σε 32 κενές
θέσεις (άρτιας αρίθµησης) οι οποίες αντιστοιχούσαν σε παύσεις. Σε κάποιες άλλες περιπτώσεις εάν
επιλεγόταν µια συγκεκριµένη θέση του πίνακα, ο πίνακας αυτός εναλλασσόταν µε έναν καινούριο
µεταβάλλοντας έτσι το συνολικό περιεχόµενο. Επιπρόσθετα, ένας επιπλέον πίνακας πυκνότητας καθόριζε την
πολυφωνική δοµή του έργου: µε βάση τον πίνακα αυτόν µπορούσαν να προστεθούν από µια έως οκτώ
παράλληλες φωνές σε διάφορα σηµεία του έργου. Η ρυθµική δοµή του έργου αποτελείται από 29⅝
διαφορετικά µέρη και αναλύεται σε αναλογίες των 3, 5, 6¾, 6¾, 5 και 3⅛. Οι εκτελεστικές χειρονοµίες
περιελάµβαναν, ανάµεσα σε άλλα, δακτυλισµούς στις χορδές του πιάνου, κτυπήµατα στο σώµα του κ.λπ.
Αν και το έργο αυτό βασίστηκε σε τυχαίες διαδικασίες, ο Cage θεωρούσε πως δεν αποτελούσε δείγµα
της γενικότερης µουσικής απροσδιοριστίας, καθώς, εκτός από την πρώτη φορά που δηµιουργήθηκε µε
τυχαίες διαδικασίες, σε κάθε µεταγενέστερη επανεκτέλεσή του εκτελείται µε τον ίδιο τρόπο, ακολουθεί
δηλαδή τις ίδιες οδηγίες.
Στην ίδια κατηγορία ανήκουν επίσης και έργα καθορισµένης δοµής, µε ακριβώς τις ίδιες δηλαδή
εκτελεστικές οδηγίες, αλλά διαφορετικών εκδοχών τους σε κάθε νέα εκτέλεσή τους. Οι περίπτωση αυτή
αφορά έργα για τα οποία η συµπεριφορά των πηγών τους είναι απρόβλεπτη. Παραδείγµατα τέτοιων έργων
αποτελούν τα έργα του John Cage «Imaginary Landscape No 4» (1951) για 24 εκτελεστές και 12
ραδιοφωνικούς δέκτες και «Imaginary Landscape No 5» (1952) για µαγνητοταινία και 42 δίσκους βινυλίου.
Και στις δύο αυτές συνθέσεις ο συνθέτης δίνει ακριβείς οδηγίες στους εκτελεστές για τον τρόπο µε τον οποίο
θα χειριστούν τις παραπάνω ηχητικές πηγές, το αποτέλεσµα όµως είναι κάθε φορά απρόβλεπτο καθώς αυτές
σε κάθε εκτέλεση διαφοροποιούνται.

8.7.1.2. Μοντέλα Τυχαιότητας Κινητής Δοµής.

Ο δεύτερος τύπος αλγορίθµων τυχαιότητας αφορά µοντέλα στα οποία ο συνθέτης αφήνει βαθµούς ελευθερίας
στον εκτελεστή µε βάση οδηγίες που συνοδεύουν την παρτιτούρα του έργου (κινητής δοµής - mobile form).
Πρόκειται για µια αρκετά δηµοφιλή συνθετική προσέγγιση των συνθετών της Σχολής της Νέας Υόρκης. Το
1953 ο Morton Feldman συνθέτει το έργο «Intermission 6» για έναν ή δύο εκτελεστές πιάνου το οποίο
αποτελείται από 15 διαφορετικά τµήµατα σε µια µονή σελίδα, µε την οδηγία του συνθέτη: «Η σύνθεση
ξεκινάει µε οποιοδήποτε τµήµα και συνεχίζει µε οποιοδήποτε άλλο». Την ίδια χρονιά ο Earle Brown συνθέτει
το «Twenty-five Pages» για έναν έως είκοσι πέντε εκτελεστές πιάνου. Σύµφωνα µε τις οδηγίες του συνθέτη,
οι 25 σελίδες του έργου µπορούσαν να τοποθετηθούν µε οποιαδήποτε σειρά επιθυµούσε ο εκτελεστής, κάθε
σελίδα εκ των οποίων µπορούσε να εκτελεστεί και από τις κάτω σειρές προς τις επάνω, ενώ οι διπλές σειρές
των µπάσων και πρίµων µπορούσαν κάθε φορά να εναλλάσσουν τα κλειδιά τους µεταξύ τους: του φα (µπάσες
νότες) και του σολ (πρίµες νότες). Αυτή η κατηγορία έργων κινητής δοµής καλείται και ανοικτής δοµής (open

276
form), σύµφωνα µε την οποία ο εκτελεστής επιλέγει κατά τη διάρκεια της εκτέλεσης τη σειρά µε την οποία θα
εκτελέσει τα διάφορα µέρη ή τµήµατα του έργου.
Σε µια εκτέλεση του «Twenty-five Pages» στην Γερµανία, ο Stockhausen εµπνεύστηκε το έργο του
για πιάνο «Klavierstück XI» (1956), το οποίο αποτελεί χαρακτηριστικό παράδειγµα έργου τυχαιότητας
κινητής δοµής. Το έργο αποτελείται από 19 διαφορετικά τµήµατα σε µια µονή σελίδα. Ο εκτελεστής µπορεί
να ξεκινήσει µε οποιοδήποτε τµήµα και να συνεχίσει µε οποιοδήποτε άλλο, έως ότου κάποιο τµήµα
εκτελεστεί για τρίτη φορά οπότε και η εκτέλεση σταµατάει. Οι σηµάνσεις ρυθµικής αγωγής, δυναµικών κ.λπ.
οι οποίες εµφανίζονται στο τέλος κάθε τµήµατος εφαρµόζονται στο επόµενο τµήµα. Εκτός από τις παραπάνω
εκτελεστικές οδηγίες ο Stockhausen χρησιµοποίησε ένα σύνολο από πίνακες µεγέθους έξι σειρών και δύο έως
επτά στηλών, στις θέσεις των οποίων περιέχονται τιµές διάρκειας. Αναλόγως το πλήθος των στηλών οι θέσεις
της πρώτης σειράς κάθε πίνακα περιέχουν την ίδια τιµή διάρκειας: την τιµή [1/8 + 1/4] στους πίνακες
µεγέθους δύο στηλών, την τιµή [1/8 + 1/4 + 1/4⋅] στους πίνακες τριών στηλών, την τιµή [1/8 + 1/4 + 1/4⋅ +
1/2] στους πίνακες των τεσσάρων στηλών κ.ο.κ. µέχρι και την τιµή [1/8 + 1/4 + 1/4⋅ + 1/2 + 1/2⋅ + 1 + 1⋅] για
τους πίνακες των επτά στηλών. Οι πέντε επόµενες σειρές κάθε πίνακα περιέχουν υποδιαιρέσεις της αρχικής
αυτής τιµής της πρώτης σειράς µε αυξανόµενη ρυθµική πολυπλοκότητα. Έπειτα από κατάλληλες µεταθέσεις
των στοιχείων των πινάκων αυτών, επιλέγονται τελικά οι έξι µεγαλύτεροι πίνακες οι οποίοι συνδυάζονται
µεταξύ τους προκειµένου να γεµίσουν τις έξι διαφορετικές στήλες ενός τελικού πίνακα ρυθµικών αξιών. Ο
πίνακας αυτός έχει µέγεθος έξι σειρών και έξι στηλών. Σε κάθε επόµενη γραµµή του πίνακα αυξάνεται και η
πολυπλοκότητα των ρυθµικών υποδιαιρέσεων. Αντίστοιχα, καθώς αυξάνονται οι στήλες του, αυξάνεται και η
συνολική διάρκεια. Από τους 36 αυτούς συνδυασµούς τιµών, ο Stockhausen επέλεξε τελικά 19 ρυθµικές
αξίες, προκειµένου να τις χρησιµοποιήσει σε κάθε ένα από τα 19 διαφορετικά τµήµατα του έργου του
(Πίνακας 8.6).

#5 #11 #17
#6 #8 #18
#1 #9 #12
#2 #13 #14
#3 #10 #15
#4 #7 #16 #19

Πίνακας 8.6 Πίνακας αντιστοίχισης των 19 τµηµάτων του «Klavierstück XI» στις θέσεις του πίνακα ρυθµικών αξιών.

Όπως φαίνεται και από τον παραπάνω πίνακα, ο Stockhausen µοίρασε τα τµήµατα του έργου του ισοµερώς
στις γραµµές και στις στήλες του πίνακα. Εξαίρεση αποτέλεσε η πρώτη στήλη στην οποία έχουν
αντιστοιχηθεί τέσσερα αντί για τρία τµήµατα καθώς και η τελευταία σειρά η οποία έχει επίσης ένα τµήµα
παραπάνω απ’ ότι οι υπόλοιπες. Κατά την τελική µεταφορά των τιµών του πίνακα σε κάθε αντίστοιχο τµήµα
του έργου ο συνθέτης διπλασίασε την τιµή της χρονικής αξίας. Κατ’ αυτόν τον τρόπο τα τµήµατα 1-4
αντιστοιχούν σε διάρκεια των 3/4, τα τµήµατα 5-7 σε διάρκεια των 6/4, τα τµήµατα 8-10 σε διάρκεια των
10/4, τα τµήµατα 11-13 σε διάρκεια των 15/4, τα τµήµατα 14-16 σε διάρκεια των 21/4 και τέλος τα τµήµατα
17-19 σε διάρκεια των 28/4. Εκτός από κοινές ρυθµικές αξίες οι παραπάνω οµάδες τµηµάτων µοιράζονται
επίσης κοινές µελωδικές γραµµές και συγχορδίες.
Με το έργο Klavierstück XI ο Stockhausen συνδύασε µοντέλα τυχαιότητας µε την οργάνωση του
υλικού του σε οµάδες, µια προσφιλή συνθετική προσέγγιση που είχε ακολουθήσει στα προηγούµενα έργα
του.

8.7.1.3. Μοντέλα Τυχαιότητας Σηµειογραφικής Απροσδιοριστίας.

Ο τρίτος τύπος µοντέλων τυχαιότητας αφορά έργα σηµειογραφικής απροσδιοριστίας (indeterminate notation).
Τα έργα αυτά έχουν τον µεγαλύτερο βαθµό απροσδιοριστίας καθώς οι οδηγίες του συνθέτη στην παρτιτούρα
δεν ακολουθούν τη συνήθη µουσική σηµειογραφία αλλά αποτελούνται από σχέδια, κείµενο ή σύµβολα, η

277
µουσική ερµηνεία των οποίων αφήνεται στην κρίση του εκτελεστή. Ένα από τα πρώιµα χαρακτηριστικά έργα
αυτής της προσέγγισης αποτελεί το έργο «December 1952» του Earle Brown (1952). Η παρτιτούρα του έργου
αποτελείται από γραµµές και παραλληλόγραµµα διαφόρων µεγεθών διάσπαρτα στη σελίδα, τα οποία µπορούν
να ερµηνευθούν ελεύθερα από τον ερµηνευτή ως δυναµικές, διάρκειες και συχνότητες (Εικόνα 8.12).

Εικόνα 8.12 Σελίδα από την παρτιτούρα του έργου «December 1952» του Earle Brown (1952) (Courtesy: The Earle
Brown Music Foundation).

Σύµφωνα µε τον συνθέτη η δισδιάστατη αυτή απεικόνιση αποτυπώνει µια στιγµιαία τοµή, µια φωτογραφική
στιγµή ενός συνεχούς τρισδιάστατου χώρου, εντός της οποίας ο εκτελεστής µπορεί να κινηθεί προσθέτοντας
τη διάσταση του χρόνου. Άλλο χαρακτηριστικό πρώιµο έργο της ίδιας τεχνοτροπίας αποτελεί η σύνθεση για
solo πιάνο «Intersection 2» του Morton Feldman (1951). Στο έργο αυτό ο εκτελεστής καλείται να ερµηνεύσει
µια παρτιτούρα σχεδιασµένη σε τετραγωνισµένο χαρτί (milimetre), όπου στον οριζόντιο άξονα αποτυπώνεται
ο χρόνος και στον κάθετο η τονικότητα του έργου µε τη µορφή ορθογωνίων.
Χαρακτηριστικά επίσης έργα αυτού του τύπου αποτελούν τα έργα της σειράς Variations του John
Cage και ειδικότερα τα δύο πρώτα (Variations I, II). Η παρτιτούρα του έργου του «Variations I» (1958)
αποτελείται από έξι τετράγωνες διαφάνειες. Η µια από αυτές περιέχει 27 αποτυπωµένα σηµεία τεσσάρων
διαφορετικών µεγεθών και κάθε µια από τις υπόλοιπες πέντε περιέχουν από 5 γραµµές. Καθώς τα τετράγωνα
αυτά αναδιατάσσονται σε µια επιφάνεια µε τυχαίο τρόπο έτσι ώστε να επικαλύπτονται µεταξύ τους,
δηµιουργείται µια γραφική παρτιτούρα: κάθε ένα από τα 27 σηµεία αντιστοιχεί σε έναν διαφορετικό ήχο ενώ
κάθε µια γραµµή ερµηνεύεται ως ένας άξονας ο οποίος περιγράφει την εξέλιξη κάποιου χαρακτηριστικού του
ήχου. Με µια παρόµοια λογική η παρτιτούρα του έργου «Variations II» (1961) σχηµατίζεται από την
επικάλυψη έντεκα διαφανειών, πέντε µικρότερου µεγέθους κάθε µια από τις οποίες έχει ένα σηµείο επάνω της
και έξι µεγαλύτερων κάθε µια µε µια γραµµή. Και εδώ ο εκτελεστής αποφασίζει για την ερµηνεία των ήχων
και των χαρακτηριστικών που περιγράφονται από την εναπόθεση των διαφανειών (Εικόνα 8.13).

278
Εικόνα 8.13 Δηµιουργία γραφικού score µε την εναπόθεση 11 διαφανειών – 6 γραµµών και 5 σηµείων, για το έργο
Variations II του John Cage (1961) (πηγή: Travis Weller, http://www.stableunstable.com/).

Η χρήση διαφανειών για την δηµιουργία της παρτιτούρας επεκτείνεται και στα επόµενα δύο έργα της σειράς,
«Variations ΙΙΙ» (1962-63) και «Variations IV» (1963), αν και οι οδηγίες του συνθέτη χαρακτηρίζονται
περισσότερο από µια λογική οργάνωσης γεγονότων (performance) παρά µουσικών έργων.
Χαρακτηριστικότερο ίσως όλων, το τελευταίο έργο της σειράς «Variations VΙΙΙ» (1976-78) το οποίο
αποτελείται από µια σελίδα µε την εξής οδηγία: «Καµία µουσική, καµία πηγή ήχου».

8.7.2. Πιθανοκρατικές Διαδικασίες.

Σε µια διαφορετική πορεία µε τους συνθέτες που ακολούθησαν διαδικασίες τυχαιότητας ο Iannis Xenakis από
τα µέσα της δεκαετίας του 1950 εφάρµοσε µια σειρά από πιθανοκρατικές διαδικασίες στις συνθέσεις του
βασισµένες σε αυστηρά µαθηµατικά µοντέλα. Τα µοντέλα αυτά προέρχονταν από την στατιστική µηχανική,
τη θεωρία των οµάδων, τη θεωρία των συνόλων και τη θεωρία των παιγνίων καθώς και από πιθανοκρατικές
διαδικασίες βασισµένες σε στατιστικές κατανοµές και στις αλυσίδες Markov. Χρησιµοποιήθηκαν σε ένα
πλήθος έργων του συνθέτη προκειµένου να καθορίσει την εξέλιξη ενός συνόλου γενικών ή ειδικών
παραµέτρων τους: δυναµικές, µουσικές και εκτελεστικές χειρονοµίες, ηχητικές υφές, πυκνότητα ηχητικού
υλικού κ.ο.κ.
Σε µια τέτοια περίπτωση στο έργο του «Achorripsis» (1956-57), έργο για ορχήστρα µε 21 όργανα,
χρησιµοποιεί στατιστικές κατανοµές για να προσδιορίσει τη θέση και την κίνηση του ηχητικού του υλικού.
Βασικό εργαλείο αποτέλεσε ένας πίνακας πυκνότητας ή συχνότητας εµφάνισης γεγονότων (Σχήµα 8.12).

279
Σχήµα 8.12 Πίνακας συχνότητας εµφάνισης γεγονότων στο έργο του Xenakis Achorripsis. Με διαφορετικές αποχρώσεις
εµφανίζονται οι διαφορετικές πυκνότητες γεγονότων.

Σε κάθε µια από τις επτά γραµµές του πίνακα ο Xenakis έθεσε επτά διαφορετικά ηχητικά γεγονότα και
εκτελεστικές χειρονοµίες:

• φλάουτο
• όµποε
• glissando εγχόρδων
• κρουστά
• pizzicato
• χάλκινα πνευστά
• arco εγχόρδων (παίξιµο µε δοξάρι)

Επιπλέον, οργάνωσε το υλικό του σε 28 διαφορετικές στήλες κάθε µια από τις οποίες αντιστοιχεί σε ένα
χρονικό βήµα. Έτσι εάν η σύνθεση πρόκειται να έχει για παράδειγµα διάρκεια επτά λεπτά, κάθε στήλη
αντιστοιχεί σε χρονική µονάδα ισοδύναµη προς 15 δευτερόλεπτα (420/15). Με tempo ΜΜ = 26, η µονάδα
αυτή αντιστοιχεί σε 6.5 µουσικά µέτρα.
Κατέληξε έτσι σε έναν πίνακα 196 (7 x 28) πλεγµάτων. Σε κάθε τέτοιο πλέγµα του πίνακα, ο
συνθέτης προσδιόρισε πέντε διαφορετικές βαθµίδες πυκνότητας ηχητικών γεγονότων:

• Μηδενικής πυκνότητας, απουσία δηλαδή γεγονότος ή µουσική παύση.


• Μονής πυκνότητας, παρουσία απλού γεγονότος όπως µια εκτελεστική χειρονοµία ή ένα solo.
• Διπλής πυκνότητας, παρουσία διπλού γεγονότος (π.χ. δύο φωνές, δύο glissandi κ.λπ.).
• Τριπλής πυκνότητας, παρουσία τριπλού γεγονότος (π.χ. τρεις φωνές κ.λπ.).
• Τετραπλής πυκνότητας, παρουσία τετραπλού γεγονότος (π.χ. τέσσερις φωνές κ.λπ.).

Προκειµένου να προσδιορίσει τη συχνότητα εµφάνισης κάθε µιας από τις παραπάνω βαθµίδες πυκνότητας
γεγονότων ο Xenakis χρησιµοποίησε την κατανοµή Poisson:

Pk = [λk / k!] e-λ

Θέτοντας ως µέση πυκνότητα γεγονότων λ ισοδύναµη µε:

λ = 0.6 γεγονότα ανά µονάδα

280
εξήγαγε τις εξής τιµές πιθανοτήτων:

P = 0.5488
0
P = 0.3293
1
P = 0.0988
2
P = 0.0198
3
P = 0.0030
4

Ο Xenakis χρησιµοποίησε τις παραπάνω πέντε τιµές για να προσδιορίσει την πιθανότητα εµφάνισης κάθε
µίας από τις πέντε διαφορετικές βαθµίδες πυκνότητας ηχητικών γεγονότων, όπου P είναι η πιθανότητα να
i
συµβεί ένα ηχητικό γεγονός i φορές ανά µονάδα (χρόνου, έντασης κ.λπ.). Προκειµένου να αναχθούν οι
παραπάνω τιµές στις 196 θέσεις του πίνακα πυκνότητας γεγονότων, αρκεί να γίνει µια πολλαπλασιαστική
αναγωγή P x 196 (Πίνακας 8.7).
i

τιµή i τύπος πιθανότητα αντιστοιχία


πυκνότητας εµφάνισης σε πλήθος
ανά θέσεων
µονάδα (Pi x 196)
0 µηδενική 0.5488 107
1 µονή 0.3293 65
2 διπλή 0.0988 19
3 τριπλή 0.0198 4
4 τετραπλή 0.0030 1

Πίνακας 8.7 Αντιστοιχία i γεγονότων σε πλήθος θέσεων από τις 196 διαθέσιµες θέσεις του πίνακα πυκνότητας γεγονότων.

Η παραπάνω δηλαδή αναγωγή (Πίνακας 8.7) δηλώνει πως σε 107 θέσεις του πίνακα θα υπάρχει πλήρης
απουσία γεγονότων -µουσικές δηλαδή παύσεις, σε 65 θέσεις θα υπάρχει ένα απλό γεγονός, σε 19 διπλά
γεγονότα κ.ο.κ. καταλήγοντας έτσι σε ένα σύνολο 196 διαφορετικών ηχητικών γεγονότων.
Το επόµενο βήµα ήταν να µοιραστούν οι διαφορετικοί αυτοί τύποι πυκνοτήτων στα 196 πλέγµατα.
Αρχικά κατένειµε κάθε διαφορετική βαθµίδα πυκνότητας γεγονότων αναλογικά ως προς το σύνολο των 28
χρονικών βηµάτων των στηλών του πίνακα. Μια ισοδύναµη χρονικά κατανοµή για παράδειγµα των 65 απλών
γεγονότων, θα αφορούσε και µια ισοδύναµη διασπορά τους σε κάθε µια από τις 28 στήλες. Η τιµή αυτή
ισούται µε ένα πλήθος 2.32 (= 65/28) εµφανίσεων γεγονότων µονής πυκνότητας ανά στήλη. Ο Xenakis
ανακατένειµε την ισοδύναµη αυτή διασπορά µε βάση την κατανοµή Poisson. Θέτοντας αυτή τη φορά ως µέση
πυκνότητα γεγονότων λ = 2.32, προσδιόρισε το πλήθος των στηλών για τις οποίες τα ηχητικά γεγονότα µονής
πυκνότητας εµφανίζονται από καµία έως επτά φορές. Κατέληξε έτσι στις τιµές του Πίνακα 8.8.

k c
πλήθος πλήθος cxk
εµφανίσεων στηλών
0 3 0
1 6 6
2 8 16
3 5 15
4 3 12
5 2 10

281
6 1 6
7 0 0
σύνολα: 28 65

Πίνακας 8.8 Αντιστοιχία διαφορετικών τιµών εµφάνισης ενός απλού γεγονότος, σε πλήθος στηλών του πίνακα συχνότητας
εµφάνισης γεγονότων.

Έτσι, µε βάση τους παραπάνω υπολογισµούς σε 3 στήλες του πίνακα θα υπάρχει πλήρης απουσία απλών
γεγονότων, 6 στήλες θα περιέχουν από µια εµφάνιση ενός απλού γεγονότος, 8 στήλες θα περιέχουν δύο
εµφανίσεις απλών γεγονότων κ.ο.κ. Με τον ίδιο τρόπο κατένειµε σε πλήθος στηλών και τα υπόλοιπα ηχητικά
γεγονότα µηδενικής, διπλής, τριπλής και τετραπλής πυκνότητας. Η διασπορά των τιµών πυκνότητας στους
οριζόντιους άξονες του πίνακα καθορίστηκε επίσης µε έναν παρόµοιο τρόπο µε κατανοµές Poisson. Σύµφωνα
µάλιστα µε τον ίδιο, η ίδια κατανοµή θα πρέπει να υπαγορεύει τη διασπορά των τιµών του πίνακα στις
διαγώνιές του και εν γένει σε οποιαδήποτε τοµή του.
Οι παραπάνω υπολογισµοί του συνθέτη αφορούν στην κατανοµή του υλικού του στο χρονικό
επίπεδο. Με ακόµα πιο λεπτοµερείς µαθηµατικούς υπολογισµούς ο συνθέτης προσδιόρισε επίσης το ίδιο το
ηχητικό περιεχόµενο του έργου του. Η χρήση glissando για παράδειγµα καθορίστηκε µέσω τριών πινάκων
πιθανοτήτων: ένας πίνακας διαρκειών, ένας πίνακας ταχυτήτων και ένας διαστηµατικός πίνακας.
Ο Xenakis απέρριπτε τα µοντέλα τυχαιότητας κινητής δοµής και σηµειογραφικής απροσδιοριστίας,
µοντέλα που όπως είδαµε αφήνουν µικρότερους ή µεγαλύτερους βαθµούς ελευθερίας στην κρίση του
ερµηνευτή σε σχέση µε το πώς θα ερµηνεύσει εκτελεστικά ένα έργο. Εκτός του ότι δεν ενέκρινε την
υποκατάσταση της συνθετικής διαδικασίας από τον ερµηνευτή και την αλλαγή ρόλων µεταξύ συνθέτη και
εκτελεστή, θεωρούσε επίσης πως η τυχαιότητα δεν µπορεί να προέλθει από την κρίση ενός ερµηνευτή καθώς
αυτή καθορίζεται σε µεγάλο βαθµό από υποκειµενικούς παράγοντες. Επιπρόσθετα, θεωρούσε αφελείς τις
προσεγγίσεις διαδικασιών τυχαιότητας µέσω απλοϊκών σχηµάτων ρίψης ζαριών κ.λπ. καθώς αυτές
αφορούσαν µιµήσεις τυχαιότητας οι οποίες δεν µπορούσαν να υποκαταστήσουν την πραγµατική τυχαιότητα.
Είχε µάλιστα την πεποίθηση πως ακόµη και οι διαδικασίες τυχαιότητας µέσω µαθηµατικών µοντέλων που ο
ίδιος πρότεινε, µπορούσαν να την προσεγγίσουν µε αρκετή δυσκολία µέχρι ενός βαθµού, αλλά ποτέ να την
αποτυπώσουν πλήρως.
Παρόλο, τέλος, που ο Xenakis καθόριζε µε µεγάλη λεπτοµέρεια µέσω µαθηµατικών µοντέλων πολλά
από τα χαρακτηριστικά των συνθέσεών του, πίστευε επίσης πως οι περιορισµοί που προέκυπταν από αυτά
αποτελούσαν περισσότερο κάποιες γενικές κατευθύνσεις, παραχωρώντας βαθµούς ελευθερίας στον συνθέτη.
Όπως µάλιστα ο ίδιος χαρακτηριστικά τόνιζε, τα µαθηµατικά πρέπει τελικά να υποτάσσονται στη µουσική
σκέψη [Xenakis, 2001].

8.8. Άλλες Μορφές Αλγοριθµικής Σύνθεσης.


Στις επόµενες δεκαετίες νέες µορφές αλγοριθµικής οργάνωσης ακολουθήθηκαν από ένα πλήθος συνθετών
από διαφορετικούς χώρους, οι οποίες πλέον αποδεσµεύονται από σχολές και ρεύµατα και εκπορεύονται
κυρίως από το προσωπικό στυλιστικό ύφος κάθε συνθέτη.
Χαρακτηριστικό παράδειγµα αποτελεί η περίπτωση του Αµερικανού, πολιτογραφηµένου Μεξικανού,
συνθέτη Conlon Nancarrow ο οποίος ενέπλεξε αλγοριθµικές δοµές στις περίφηµες «Σπουδές για Μηχανικό
Πιάνο» («Studies for Player Piano»). Τα έργα αυτά, τα οποία καλύπτουν µια χρονική περίοδο από τα τέλη της
δεκαετίας του 1940 µέχρι περίπου τις αρχές της δεκαετίας του 1990, αφορούν συνθέσεις οι οποίες
αναπαράγονται από µηχανικά πιάνα τα ρολά των οποίων έχει κατάλληλα προετοιµάσει ο συνθέτης.
Επηρεασµένος από τον Henry Cowell, ο οποίος κατ’ αντιστοιχία µε τις τονικές κλίµακες είχε προτείνει την
εµπλοκή ρυθµικών κλιµάκων, άρχισε να δηµιουργεί έργα µε πολυ-επίπεδα ρυθµικά µοτίβα και µελωδικούς
κανόνες αυξανόµενης πολυπλοκότητας. Σε αρκετές µάλιστα περιπτώσεις, έχοντας επηρεαστεί από τα έργα για
προετοιµασµένο πιάνο του Cage, µετασκεύασε τον µηχανισµό παραγωγής ήχου καλύπτοντας τα µηχανικά
σφυριά τους µε δέρµα ή µέταλλο προκειµένου να αναπαράγουν διαφορετικές ηχοχρωµατικές υφές.
Σε άλλες περιπτώσεις η χρήση αλγοριθµικών διαδικασιών απαντώνται είτε σε περιστασιακούς
πειραµατισµούς των συνθετών της Νέας Μουσικής - «Désordre», György Ligeti (1985), είτε ως βάση
προκειµένου να υποστηριχθούν νέες συνθετικές προσεγγίσεις - «It’s Gonna Rain», Steve Reich (1965). Η

282
δεύτερη µάλιστα περίπτωση αφορά ένα χαρακτηριστικό έργο της Διαδικασιακής Μουσικής (Process Music).
Η µουσική αυτή εµπλέκει διαδικασίες οι οποίες επενεργούν στο ηχητικό υλικό µεταβάλλοντάς το δυναµικά
κατά την εκτέλεσή του και µετουσιώνοντάς το σε ένα σύνθετο ηχητικό αποτέλεσµα. Οι διαδικασίες που
επιλέγονται από τον συνθέτη αφορούν συγκεκριµένα συστήµατα οργάνωσης µέσω των οποίων επιλέγονται
και οργανώνονται οι τονικές και χρονικές αξίες των µουσικών φθόγγων -ή του ηχητικού υλικού εν γένει,
καθώς και οι µετασχηµατισµοί σχετικά σύνθετων συνθετικών παραµέτρων. Χαρακτηριστικό των διαδικασιών
αυτών είναι η σχετικά µακρά χρονική εξέλιξή τους καθώς και η ελάχιστη χρήση µουσικού υλικού. Για τους
λόγους αυτούς η Διαδικασιακή Μουσική έχει συνδεθεί στενά µε τον Μινιµαλισµό (Minimalism) στη µουσική
δηµιουργία. Ο Michael Nyman καθόρισε πέντε τύπους διαδικασιών:

• Διαδικασίες απροσδιοριστίας (chance determination processes), κατά τις οποίες το υλικό δεν
καθορίζεται άµεσα από τον συνθέτη αλλά προέρχεται από ένα σύστηµα το οποίο δηµιουργεί
ο ίδιος.
• Υποκειµενικές διαδικασίες (people processes), κατά τις οποίες οι εκτελεστές καλούνται να
επιλέξουν από προκαθορισµένο υλικό και το οποίο µπορούν να ερµηνεύσουν µε τον δικό
τους τρόπο.
• Διαδικασίες εκτελεστικού πλαισίου (contextual processes), οι οποίες αφορούν ενέργειες µε
βαθµό απροσδιοριστίας που διαµορφώνονται δυναµικά κατά την εκτέλεση του έργου και
προκύπτουν µέσα από το συνολικό εκτελεστικό πλαίσιο.
• Επαναληπτικές διαδικασίες (repetition processes), κατά τις οποίες το υλικό διαµορφώνεται
µέσα από εκτεταµένες επαναλήψεις.
• Ηλεκτρονικές διαδικασίες (electronic processes), οι οποίες διαµορφώνονται και καθορίζονται
σε µεγαλύτερο ή µικρότερο βαθµό από τη χρήση ηλεκτρονικών διατάξεων.

Εκ πρώτης όψεως, αρκετοί από τους παραπάνω τύπους διαδικασιών φαίνεται να συµφωνούν µε τις
διαδικασίες απροσδιοριστίας που ενέπλεξαν οι συνθέτες της στοχαστικής µουσικής. Με µια όµως σηµαντική
διαφοροποίηση: για τον Steve Reich και τους περισσότερους συνθέτες της Διαδικασιακής Μουσικής η
διαδικασία δεν πρέπει να αφορά τη συνθετική διεργασία αλλά το ίδιο το µουσικό έργο. Κατ’ αυτήν την έννοια
η διαδικασία πρέπει να αποτελεί µέρος της µουσικής ακρόασης, να γίνεται αντιληπτή δηλαδή από τον
ακροατή µέσα από το ίδιο το µουσικό έργο: η ίδια η µουσική αποτελεί µια διαδικασία. Για τον λόγο αυτόν,
σύµφωνα µε τον Reich, µια διαδικασία πρέπει να εξελίσσεται µε εξαιρετικά αργές χρονικά µεταβολές.
Αλγοριθµικές διαδικασίες έχει επίσης χρησιµοποιήσει και ένα πλήθος συνθετών της αστικής
ηλεκτρονικής σκηνής. Χαρακτηριστικότερο ίσως παράδειγµα, αποτελεί ο Brian Eno ο οποίος ακολουθώντας
µια αντίστοιχη τεχνική µε αυτήν του Cage και το βιβλίο των αλλαγών, κατασκεύασε µια σειρά από κάρτες µε
την ονοµασία Oblique Strategies. Κάθε µια από τις κάρτες αυτές περιέχει µια φράση ή µια δήλωση, η οποία
µπορεί να χρησιµοποιηθεί προκειµένου να ληφθεί µια απόφαση κατά τη διαδικασία σύνθεσης ενός µουσικού
έργου, προτείνοντας µια λογική οργάνωσης της µουσικής σύνθεσης παρόµοια µε το έργο του Cage «Music of
Changes».

283
Βιβλιογραφία

Albright, D. Modernism and Music, Chicago: University of Chicago Press, 2004.


Alegant, B. «Cross-Partitions as Harmony and Voice Leading in Twelve-Tone Music», Music Theory
Spectrum, Άνοιξη 2001, τ. 23, αρ. 1, σελ. 1-40.
Babbit, M. The Function of Set Structure in the Twelve-Tone System. Princeton: Princeton University Press,
1946 (επαν. 1992).
Babbitt, M. «Twelve-Tone Rhythmic Structure and the Electronic Medium», Perspectives of New Music 1,
Άνοιξη 1962, αρ. 1, σελ. 49-79.
Cage, J. Silence. Lectures and Writings by John Cage, 2η εκ., Middletown, CT: Wesleyan University Press,
2011.
Di Scipio, A. «Formalization and Intuition in Analogique A et B», Πρακτικά International Symposium Iannis
Xenakis 2005, Makis Solomos, Anastasia Georgaki, Giorgos Zervos (εκδ.), Αθήνα, Μάιος 2005.
Forte, A. The Structure of Atonal Music. New Haven: Yale University Press, 1973.
Grant, M. J. Serial Music, Serial Aesthetics: Compositional Theory in Post-War Europe. Cambridge:
Cambridge University Press, 2005.
Hanson, H. Harmonic Materials of Modern Music: Resources of the Tempered Scale. Ν. Υόρκη: Appleton-
Century-Crofts, 1960.
Koblyakov, L. «P. Boulez Le Marteau Sans Maître: Analysis of Pitch Structure», Zeitschrift für Musiktheorie,
8, αρ. 1, σελ. 24-39, 1977.
Koblyakov, L. Pierre Boulez: A World of Harmony. Chur: Harwood Academic Publishers, 1990.
Nyman, M. Experimental Music. Cage and Beyond. Λονδίνο: Studio Vista, 1974.
Reich, S. Writings About Music, 1965-2000. Oxford: Oxford University Press, 2004.
Reich, S. Music as a Gradual Process, 1968,
http://ccnmtl.columbia.edu/draft/ben/feld/mod1/readings/reich.html (πρόσβαση: 22/11/2015).
Russo, W. Composing Music: A New Approach. Chicago: The University of Chicago Press, 1988.
Straus, J. N. Introduction to Post-Tonal Theory, (3η έκ.). Λονδίνο : Pearson, 2004.
Truelove, S. «The Translation of Rhythm into Pitch in Stockhausen's Klavierstück XI», Perspectives of New
Music, Χειµώνας 1998, τ. 36, αρ. 1, σελ. 189-220.
Whittall, A. The Cambridge Introduction to Serialism. Cambridge Introductions to Music. Cambridge:
Cambridge University Press, 2008.
Winick, S. D. «Symmetry and Pitch-Duration Associations in Boulez' Le Marteau Sans Maître», Perspectives
of New Music, Άνοιξη 1986, τ. 24, αρ. 2, σελ. 280-321.
Wittlich, G. Aspects of Twentieth-Century Music, Wittlich, Gary (επιµέλεια). Englewood Cliffs, New Jersey:
Prentice-Hall, 1975.
Xenakis, I. Formalized Music. Thoughts and Mathematics in Composition. (2η έκ). Ν. Υόρκη: Pendragon
Press, 2001.

284
Κεφάλαιο 9
Περιβάλλοντα Αλληλεπίδρασης.
Σύνοψη
Πολλά από τα θέµατα που αφορούν σε τεχνικές πτυχές της αλληλεπίδρασης και της οργανολογίας που
χρησιµοποιεί, εξετάστηκαν στο Κεφάλαιο 7. Στο παρόν κεφάλαιο θα αναπτύξουµε ορισµένα θεωρητικά
ζητήµατα για τη βαθύτερη κατανόηση της έννοιας της αλληλεπίδρασης και θα παρουσιάσουµε δύο εφαρµογές
αντίδρασης-αλληλεπίδρασης σε αντίστοιχες εικαστικές και ηχητικές εγκαταστάσεις.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

9.1. Εισαγωγή.
H έρευνα στο πεδίο της αλληλεπίδρασης µεταξύ ανθρώπου και µηχανής (Human Computer Interaction, HCI)
αναπτύχθηκε ιδιαίτερα κατά τη δεκαετία του 1980 ως τοµέας της Επιστήµης των Υπολογιστών. Στα χρόνια
που ακολούθησαν, περιέλαβε ένα ευρύ φάσµα επιστηµονικών αντικειµένων το οποίο εκτείνεται από τις
γνωσιακές επιστήµες και την κοινωνιολογία ως τη µηχανική και το design. Σήµερα, όλοι οι χώροι διαβίωσης,
επικοινωνίας και εργασίας, τουλάχιστον στον δυτικό κόσµο, είναι εφοδιασµένοι µε υπολογιστικά συστήµατα
τα οποία ορίζουν και ελέγχουν, σε µεγάλο βαθµό, τη λειτουργία τους. Όλο και περισσότερα αντικείµενα
καθηµερινής χρήσης περιέχουν µικροεπεξεργαστές οι οποίοι αναλύουν και επικοινωνούν πληροφορίες στον
χρήστη78. Καθώς αυτά τα υπολογιστικά συστήµατα είναι µονίµως ενεργά και διαθέσιµα προς χρήση, είναι
απαραίτητη η ανάπτυξη µεθόδων επικοινωνίας και αλληλεπίδρασής τους µε τον άνθρωπο. Η διερεύνηση
αυτών των µεθόδων και η διαµόρφωση των σχέσεων µεταξύ ανθρώπου και µηχανής αποτελούν αντικείµενα
ενός δυναµικά εξελισσόµενου πεδίου έρευνας, σκοπός του οποίου είναι η εξέλιξη των µηχανών και η
κατανόηση των συµπεριφορών τους από τον άνθρωπο.
Οι πρώτες απόπειρες στον τοµέα της µουσικής εντοπίζονται στη δεκαετία του 1960 µε συνθέτες
όπως ο Gordon Mumma και ο David Berhman. Ήδη, από τα τέλη της δεκαετίας του 1950, οι πρωτοπόροι
συνθέτες της Αµερικής πειραµατίζονταν µε το νέο είδος της ζωντανής ηλεκτρονικής µουσικής (Live
Electronics) χρησιµοποιώντας µαγνητοταινίες µε προηχογραφηµένα ηχητικά δείγµατα και ηλεκτρονικά
κυκλώµατα για τη σύνθεση και την επεξεργασία του ηχητικού υλικού. Ο Mumma ενδιαφέρθηκε ιδιαίτερα για
την κατασκευή µουσικών δοµών από τον ηλεκτρονικό υπολογιστή σε πραγµατικό χρόνο. Ονόµασε αυτήν την
προσέγγιση Cybersonics και την εφάρµοσε σε σηµαντικά έργα του, µεταξύ των οποίων τα «Medium Size
Mograph» και «Megaton for Wm. Burroughs» του 1964, «Hornpipe» του 1967, «Conspiracy 8» (µε τον
Stephen Smoliar) του 1970 και «Cybersonic Cantilevers» του 1973. Η εξάπλωση των προσωπικών
υπολογιστών στα µέσα της δεκαετίας του 1970, οι οποίοι ήταν εφοδιασµένοι µε µικροεπεξεργαστές,
συνέβαλε στην εδραίωση αυτών των τάσεων και επέκτεινε τους πειραµατισµούς που περιελάµβαναν την
ενεργή συµµετοχή του υπολογιστή στη µουσική δηµιουργία.

9.2. Από την Επίδραση στην Αλληλεπίδραση.


Οι διαδικασίες της επίδρασης, της συνεπίδρασης, της αντίδρασης, της ανάδρασης και της αλληλεπίδρασης,
µπορούν να συνυπάρξουν όλες µαζί, ταυτόχρονα ή σε συνδυασµούς, ως κινητήριες δυνάµεις που πυροδοτούν
και διατηρούν σε λειτουργία ένα κλειστό σύστηµα το οποίο αποτελείται από τον χρήστη, του ελεγκτές που
χρησιµοποιεί και τον υπολογιστή. Πρόκειται για δυναµικές διαδικασίες τις οποίες εφαρµόζουµε σε συνθήκες
κατά τις οποίες απαιτείται συνεχής επικοινωνία και συνεργασία µεταξύ του µουσικού και του υπολογιστή,
όπως η ζωντανή ηλεκτρονική µουσική, η εκτέλεση έργων για όργανα και υπολογιστές και ο αυτοσχεδιασµός
µε υπολογιστές και ελεγκτές. Η κατανόηση της φύσης και της σηµασίας αυτών των εννοιών αποτελεί
προϋπόθεση για την ολοκληρωµένη δηµιουργία και την οµαλή λειτουργία ενός λογισµικού, ενός µουσικού
έργου ή µιας εγκατάστασης µε τη βοήθεια του υπολογιστή.

285
Η έννοια της επίδρασης αναφέρεται στο σύνολο των οδηγιών που διαµορφώνουν τη λειτουργία ενός
αλληλεπιδραστικού προγράµµατος, καθώς και στη συµπεριφορά και στις αποφάσεις τις οποίες καλείται να
λάβει. Πρόκειται για ένα µονόδροµο µοντέλο το οποίο περιλαµβάνει όλες τις εντολές και τα γενικότερα
χαρακτηριστικά µε τα οποία ο προγραµµατιστής εφοδιάζει το πρόγραµµα.
Η πολυπλοκότητα όµως ενός προγράµµατος και η ολιστική ή επιλεκτική λειτουργία του απέναντι στη
λύση προβληµάτων, είναι αποτέλεσµα συνεπίδρασης, της ταυτόχρονης δηλαδή επίδρασης πολλών και
διαφορετικών παραγόντων. Η ευκολία στη χρήση του, ο συνυπολογισµός ή η παράβλεψη διαφόρων
παραµέτρων του προβλήµατος που καλείται να επεξεργαστεί, η λειτουργία του σε πραγµατικό ή µη
πραγµατικό χρόνο, και πολλά άλλα, συνεπιδρούν στον τρόπο µε τον οποίο διαµορφώνεται από τον
προγραµµατιστή του. Το φαινόµενο της οµογενοποίησης που εξετάσαµε στο Κεφάλαιο 3, προκύπτει, σε
µεγάλο βαθµό, εξαιτίας της συνεπίδρασης ενός αριθµού παραγόντων που πηγάζουν από τις κοινές απαιτήσεις
µουσικών και προγραµµατιστών για το πώς πρέπει να συνταχθεί και να λειτουργήσει ένα µουσικό
πρόγραµµα.
Η αντίδραση δηλώνει την ίση και αντίρροπη δύναµη που αναπτύσσεται υπό την επίδραση µιας άλλης
δύναµης, την ενέργεια δηλαδή που έχει αιτία µια άλλη ενέργεια. Όπως είδαµε στο Κεφάλαιο 7, ο έλεγχος των
µουσικών και ηχητικών παραµέτρων είναι το επακόλουθο των ερεθισµάτων που στέλνονται από εξωτερικούς
ελεγκτές και αισθητήρες. Μια σηµαντική παράµετρος που πρέπει να ληφθεί υπόψη σε τέτοια συστήµατα,
είναι ο χρόνος αντίδρασης ή χρόνος καθυστέρησης, ιδιαίτερα όταν το διάστηµα που µεσολαβεί µεταξύ του
ερεθίσµατoς και της αντίδρασης είναι υπολογίσιµο (> 20 ms).
Η ανάδραση ή ανατροφοδότηση (feedback) περιγράφει ένα φαινόµενο κατά το οποίο µέρος της
ενέργειας που υπάρχει στην έξοδο ενός συστήµατος επιστρέφει στην είσοδό του. Έτσι, ενόσω ο χρήστης
τροφοδοτεί τον υπολογιστή, ο υπολογιστής µπορεί να τον πληροφορήσει για την εξέλιξη κάποιας
επεξεργασίας µέσω εκτύπωσης µηνυµάτων. Η ανατροφοδότηση περιέχει όλες τις πληροφορίες που χρειάζεται
ο χρήστης για να συνεχίσει να τροφοδοτεί µε ερεθίσµατα τον υπολογιστή.
Η αλληλεπίδραση βασίζεται στην αµφίδροµη επικοινωνία. Είναι διαλεκτική και περιλαµβάνει την
ώσµωση και την αµοιβαία επίδραση και αντίδραση. Οι κανόνες µε τους οποίους συντελείται, αντλούνται από
τη χαρτογράφηση και την ταξινόµηση των συµπεριφορών ανθρώπου και µηχανής. Καθώς η επικοινωνία
συµβαίνει µεταξύ µιας βιολογικής οντότητας και µιας µηχανικής κατασκευής, είναι απαραίτητη η µετατροπή
και η συνεχής ανατροφοδότηση διαφορετικών τύπων ενέργειας µεταξύ των δύο. Στο κλειστό σύστηµα
αλληλεπίδρασης, ο υπολογιστής µπορεί να ανατροφοδοτήσει µέρος της εξόδου του στους ελεγκτές, αλλά και
να επηρεάζει τις αποφάσεις και τις κινήσεις του χρήστη. H προσθήκη πολλαπλών χρηστών, όπως τα µέλη του
ακροατηρίου ή οι επισκέπτες µιας εγκατάστασης, θα απαιτήσει περαιτέρω διεύρυνση και διαφοροποίηση των
κανόνων της αλληλεπίδρασης.
Πολύ συχνά, οι έννοιες της αντίδρασης και της αλληλεπίδρασης χρησιµοποιούνται καταχρηστικά
υπερκαλύπτοντας η µια την άλλη. Η χρήση ηλεκτρονικών συσκευών και γραφικών ή απτικών διεπαφών
(Graphical User Interfaces-GUI και Tangible User Interfaces-TUI) σε ένα σύστηµα αντίδρασης δεν το
καθιστά απαραίτητα σύστηµα αλληλεπίδρασης. Ένα απλό σύστηµα εντοπισµού και ανίχνευσης της κίνησης,
περιγράφεται από τους Rubine και McAvinney (1990) ως µια µηχανή που αντιστοιχεί παραµέτρους της
κίνησης σε παραµέτρους του ήχου. Οι κινητικές χειρονοµίες ανιχνεύονται από ένα όργανο (κάµερα,
αισθητήρας κ.ά.) και µεταφέρονται στον υπολογιστή όπου κωδικοποιούνται και αντιστοιχίζονται σε ηχητικές
χειρονοµίες. Σκοπός ενός τέτοιου συστήµατος είναι να διερµηνεύσει τις κινήσεις του µουσικού σε µουσική,
τη σωµατική κίνηση σε ηχητική ενέργεια.
Όπως είδαµε στο παράδειγµα του Κεφαλαίου 7, η ανάλυση των ηχητικών παραµέτρων του φλάουτου
και των MIDI µηνυµάτων από τον υπολογιστή, αποτέλεσε τη βασική πηγή πληροφοριών για τη λειτουργία
του patch στο έργο «Li Po». Με τη µέθοδο amplitude thresholding, η γεννήτρια Amplitude ενηµερώνεται
για τη δυναµική µιας συγκεκριµένης νότας του φλάουτου και αντιδρά σύµφωνα µε µια προκαθορισµένη
οδηγία. Το patch, σε αυτήν την περίπτωση, αντιδρά αιτιοκρατικά και προβλέψιµα, σύµφωνα µε το ερέθισµα
που δέχεται.
Η αυτονόµηση του υπολογιστή και η αποδέσµευσή του από αιτιοκρατικές διαδικασίες, προϋποθέτει
τον κατάλληλο προγραµµατισµό. Συνήθως, χρησιµοποιούνται γεννήτριες ψευδοτυχαίων αριθµών ώστε να
παραχθεί ένα φαινοµενικά απρόβλεπτο και ασύµµετρο αποτέλεσµα. Η έννοια της αλληλεπίδρασης εδώ,
σηµαίνει ότι ο χρήστης θα πρέπει να δράσει και να συνεχίσει την τροφοδότηση του υπολογιστή
ακολουθώντας µη ευδιάκριτα µοτίβα. Ένα χαρακτηριστικό παράδειγµα συναντούµε στα video games:
γεννήτριες ψευδοτυχαίων αριθµών ορίζουν την κίνηση ενός χαρακτήρα του παιχνιδιού κατά τρόπο
απρόβλεπτο για τον χρήστη. Κατά παρόµοιο τρόπο, η κίνηση ενός αισθητήρα µπορεί να πυροδοτήσει µια

286
ανάλογη γεννήτρια τυχαίων αριθµών µε σκοπό τον µη προσδιορισµένο έλεγχο του τονικού ύψους µιας νότας.
Σε ένα τέτοιο σύστηµα, ο µουσικός και ο υπολογιστής αλληλεπιδρούν επηρεαζόµενοι από µια αµοιβαία
ανατροφοδότηση. Η απρόβλεπτη αντίδραση του ενός οδηγεί στην αλλαγή συµπεριφοράς του άλλου, γεγονός
που οδηγεί σε µια επόµενη απρόβλεπτη αντίδραση κ.ο.κ. Οδηγούνται έτσι στην διαισθητική αρχή του
αυτοσχεδιασµού. Για να δράσει µε έναν τέτοιο τρόπο ο υπολογιστής, θα πρέπει να είναι εφοδιασµένος µε
κάποιες γνωσιακές ικανότητες.
Όπως επισηµαίνει ο Sergi Jordà (2007):

…σύνθετα συστήµατα τα οποία αντιδρούν στην ανθρώπινη


συµπεριφορά µέσω ανίχνευσης παραγόντων όπως ο άµεσος φυσικός
χειρισµός, η κίνηση του σώµατος, ή οι µεταβολές στη
φυσιολογική ή ψυχολογική κατάσταση, ονοµάζονται
αλληλεπιδραστικά, παρότι, θα πρέπει να επισηµανθεί, ότι όταν
η λειτουργία της γνώσης δε συµµετέχει, η αντίδραση
αντικαθιστά την αλληλεπίδραση. Σε ένα απλό σύστηµα
αντίδρασης, τα µηνύµατα της εξόδου του εξαρτώνται µόνο από το
προηγούµενο µήνυµα που λαµβάνει στην είσοδό του, γεγονός που
καθιστά το σύστηµα απόλυτα προβλέψιµο. Ένας διακόπτης φωτός
θα παραµείνει ένας (αντιδραστικός) διακόπτης φωτός ανεξάρτητα
από τον αριθµό εκλεπτυσµένων αισθητήρων µε τους οποίους είναι
εφοδιασµένος79. (Μ.τ.Σ.)

Η λειτουργία της γνώσης δρα καθοριστικά στην ανάπτυξη ενός αλληλεπιδραστικού συστήµατος. Πώς
συµβαίνει αυτό και πού αποσκοπεί; Αποθηκεύοντας όλο και µεγαλύτερη ποσότητα οδηγιών στη µνήµη ενός
συστήµατος, το καθιστούµε ικανό να αντιδράσει κατάλληλα σε κάποιο ερέθισµα. Αν το τροφοδοτήσουµε µε
πληροφορίες σχετικές µε τα ερεθίσµατα που λαµβάνει, τότε αποκτά την πρόσθετη ικανότητα να αποφασίζει
ποια οδηγία θα εκτελέσει ώστε να ανταποκριθεί καταλληλότερα σε κάποιο συγκεκριµένο ερέθισµα. Για
παράδειγµα, αν τροφοδοτήσουµε τη µνήµη ενός υπολογιστή µε όλα τα πρελούδια του Johann Sebastian Bach
και µε επιπλέον στατιστικές πληροφορίες για τη δόµηση της αρµονίας και των αντιστικτικών τεχνικών, τη
χρήση του ισοκρατήµατος και της δεσπόζουσας, τις ποικιλµατικές συµπεριφορές και τη ρυθµική αγωγή, ο
υπολογιστής θα αποκτήσει την ικανότητα να επιλέξει την κατάλληλη εναρµόνιση ενός βάσιµου ή µιας
µελωδίας διατρέχοντας στα στατιστικά στοιχεία και στις οδηγίες µε τις οποίες είναι εφοδιασµένος. Η µνήµη,
η συνδυαστική επιλογή ανάµεσα σε αποκλίνουσες οδηγίες ή στατιστικά στοιχεία και η ικανότητα απόφασης
αποτελούν τις βασικές παραµέτρους ενός εξελιγµένου αντιδραστικού συστήµατος.
Ωστόσο, ένα σύστηµα αλληλεπίδρασης µεταξύ ανθρώπων, βασίζεται όχι µόνο σε στατιστικά
µετρήσιµες αντικειµενικές παραµέτρους αλλά και σε µη υπολογίσιµα υποκειµενικά κριτήρια. Ακόµη
περισσότερο, ένα σύστηµα επαυξηµένης αλληλεπίδρασης είναι εµποτισµένο µε εµπειρία, θυµικό και
διαίσθηση. Η περίπτωση του υπερ-υπολογιστή Deep Blue της IBM, ο οποίος αντιµετώπισε τον παγκόσµιο
πρωταθλητή στο σκάκι Garry Kasparov, µεταξύ του 1996 και του 1997, είναι ενδεικτική µιας πολύπλοκης και
«σκεπτόµενης» µηχανής, εφοδιασµένης µε τεχνητή νοηµοσύνη. Ο Deep Blue είχε εφοδιαστεί µε έναν
τεράστιο όγκο πληροφοριών οι οποίες αφορούσαν σκακιστικές τεχνικές, επιθετικές και αµυντικές κινήσεις
και στατιστικά δεδοµένα. Καµία όµως από τις οδηγίες του δεν περιελάµβανε την άρνηση συµµετοχής σε
κάποια παρτίδα ή τη διαµόρφωση προσωπικής άποψης για την προσωπικότητα του Kasparov. Ο υπερ-
υπολογιστής δεν ήταν εµποτισµένος µε θυµικό και υποκειµενικότητα.

9.3. Αλληλεπίδραση και Κινησιολογία.


Η ενσωµάτωση αλληλεπιδραστικών συστηµάτων στη µουσική µε υπολογιστές, διανέµει την ευθύνη της
δηµιουργίας από κοινού στο δηµιουργό και στον υπολογιστή. Το ζητούµενο σε ένα τέτοιο σύστηµα είναι η
δυνατότητα διάδρασης µεταξύ των µερών του, η συνεχής και αµφίδροµη επικοινωνία δεδοµένων που θα
διαµορφώσουν σε πραγµατικό χρόνο τη µουσική δηµιουργία. Όπως είδαµε, πρόκειται για την εγκαθίδρυση
σχέσεων αλληλοεξάρτησης και όχι απλώς για µονόδροµες αντιδράσεις που επηρεάζονται από την

287
χειρονοµιακή κίνηση ή άλλα εξωτερικά ερεθίσµατα. Κάτι τέτοιο βέβαια, προϋποθέτει την ύπαρξη δύο,
τουλάχιστον, «σκεπτόµενων» πόλων (µουσικός-υπολογιστής), εµποτισµένων µε µια βασική έστω νοηµοσύνη
για να µπορούν να αποφασίσουν την επόµενη δράση τους µεταξύ των δεδοµένων που λαµβάνουν ο ένας από
τον άλλο.
Τα πλεονεκτήµατα που µπορεί να προσφέρει ένα αλληλεπιδραστικό σύστηµα είναι πολλά και
σηµαντικά: αποσυνδέει την ανάγκη συγχρονισµού χειρονοµίας και µουσικής από την αυστηρότητα του
γραµµικού χρόνου, επιτρέπει στον µουσικό να εισάγει στοιχεία αυτοσχεδιασµού οδηγώντας τον σε µια
βαθύτερη συνειδητοποίηση των σωµατικών του κινήσεων και επαναπροσδιορίζει τον ρόλο του στη
δηµιουργία ενός σύµπλοκου έργου.
Παρόλα τα πλεονεκτήµατά τους, τα αλληλεπιδραστικά συστήµατα έχουν και δύσκολα διαχειρίσιµα
µειονεκτήµατα. Πριν από την εξέτασή τους, θα αναφερθώ στις κύριες κατηγορίες αλληλεπιδραστικών
συστηµάτων που χρησιµοποιούνται τα τελευταία χρόνια. Ο Mulder (1994) ταξινοµεί τις τεχνολογίες
εντοπισµού της ανθρώπινης κίνησης σε τρεις οµάδες:

1. Inside-in systems. Χρησιµοποιούν αισθητήρες τοποθετηµένους στο σώµα για να ανιχνεύσουν


πληροφορίες από αυτό.
2. Inside-out systems. Χρησιµοποιούν αισθητήρες τοποθετηµένους στο σώµα (κάµερα
τοποθετηµένη στο κεφάλι ή στο σώµα κ.ά.) για να ανιχνεύσουν πληροφορίες από εξωτερικές
πηγές.
3. Outside-in systems. Χρησιµοποιούν αισθητήρες οι οποίοι δεν είναι τοποθετηµένοι στο σώµα,
όπως µια κάµερα τοποθετηµένη στη σκηνή, για να ανιχνεύσουν πληροφορίες από τις κινήσεις
του σώµατος ή του περιβάλλοντος.

Είναι σαφές ότι πριν από την υιοθέτηση οποιασδήποτε από τις παραπάνω κατηγορίες τεχνολογιών, πρέπει να
ισοσταθµιστούν τα πλεονεκτήµατα και τα µειονεκτήµατα που προκύπτουν από τη χρήση τους. Λαµβάνοντας
υπόψη ότι ένα ιδεατό σύστηµα εντοπισµού κίνησης πρέπει να α) ανιχνεύει τέλεια την κίνηση από την αρχή
µέχρι το τέλος της και σε όλα τα ενδιάµεσα στάδιά της, β) να µην περιορίζει καθόλου τον χρήστη στις
κινήσεις του, γ) να ξεχωρίζει και να αποµονώνει τις κινήσεις που προέρχονται από διαφορετικά κινούµενα
σώµατα µέσα στον ίδιο χώρο και δ) να είναι, κατά το δυνατόν, αόρατο στους θεατές, θα εστιάσουµε σε
κάποια από τα προβλήµατα που προκύπτουν:

• Αν το σύστηµα αλληλεπίδρασης απαιτεί εξειδικευµένες κινήσεις από τον χρήστη τότε είναι
πιθανό να περιορίζει την ελευθερία της κίνησής του αλλά και να υπαγορεύει τις
κινησιολογικές του επιλογές.
• Ανάλογα µε τους τύπους κίνησης και τον εξοπλισµό που χρησιµοποιείται, µπορεί να
παρατηρηθούν φαινόµενα καθυστέρησης στην αντίδραση κάποιου µέρους του συστήµατος,
οι οποίες µε τη σειρά τους θα επιδράσουν αρνητικά στην ανατροφοδότηση και, κατά
συνέπεια, στην αλυσιδωτή επικοινωνία χρήστη-υπολογιστή-µουσικού αποτελέσµατος. Ένα
τέτοιο σύστηµα πρέπει να λειτουργεί συνεχώς µε µεγάλη ταχύτητα και ακρίβεια.
Καθυστερήσεις στην επεξεργασία δεδοµένων που είναι µεγαλύτερες των 20 χιλιοστών του
δευτερολέπτου είναι αντιληπτές και, κατά συνέπεια, µη αποδεκτές.
• Στην περίπτωση χρήσης τεχνολογιών inside-in ή inside-out, οι αισθητήρες που τοποθετούνται
στο σώµα του χρήστη µπορεί να είναι όχι µόνο αισθητικά ατελείς αλλά και να εµποδίζουν
την κίνησή του. Δε λείπουν άλλωστε περιπτώσεις όπου κατά τη διάρκεια µιας παράστασης,
αισθητήρες έχουν απαγκιστρωθεί ή σπάσει εξαιτίας µιας λανθασµένης κίνησης του χρήστη, ή
στιγµές όπου έχει διαπιστωθεί ότι έχουν τοποθετηθεί λανθασµένα µε αποτέλεσµα να µην
αντιδρούν στις αγωνιώδεις προσπάθειες του χρήστη.
• Συχνά, σε συστήµατα outside-in, η τοποθέτηση αισθητήρων ή κάµερας στη σκηνή αναγκάζει
τον χρήστη να χαρτογραφεί τις κινήσεις του σύµφωνα µε ένα προκαθορισµένο σταθερό
σηµείο.
• Συνήθως, υπάρχει ένα όριο στο πόσες και ποιες σωµατικές κινήσεις µπορούν να εντοπιστούν
από το λογισµικό και το υλισµικό που χρησιµοποιείται κάθε φορά.
• Πολλοί χρήστες δεν είναι εξοικειωµένοι µε τέτοιου είδους συστήµατα.
• Το κόστος και η διαθεσιµότητα τέτοιων τεχνολογιών είναι παράγοντες που πρέπει επίσης να
εξετάζονται.

288
• Εξαιτίας των παραπάνω, υποβόσκει πάντα ο κίνδυνος να επιβληθεί µια συγκεκριµένη
κινησιολογική αισθητική στον χρήστη από τη χρησιµοποιούµενη τεχνολογία. Η προσπάθειά
του να ελέγξει το σύστηµα µπορεί να τον αποµακρύνει από τον σκοπό του και να αλλοιώσει
την αυτοσυγκέντρωσή του.

Τα αλληλεπιδραστικά συστήµατα µας προσφέρουν τη δυνατότητα να επανεξετάσουµε συνολικά τη σχέση


µουσικής και κινησιολογίας, µέσα από το πρίσµα µιας εξελικτικής διαδικασίας που µεταβάλλεται στη
διάρκεια της παράστασης δηµιουργώντας συνεχώς νέες προκλήσεις. Η εγρήγορση του χρήστη αποκτά µια
διαφορετική υπόσταση, καθώς δε συνδέεται µόνο µε την εκτέλεση της µουσικής αλλά και µε την ταυτόχρονη
δηµιουργία της.

9.4. Παραδείγµατα Χρήσης Ελεγκτών και Διεπαφών σε Δύο Εγκαταστάσεις.


Τέλος, θα αναφερθούµε σε δύο αλληλεπιδραστικές εγκαταστάσεις οι οποίες αντιµετωπίζουν τα ζητήµατα της
απτότητας, του εντοπισµού κίνησης και του παραµετρικού ελέγχου µε χρήση ελεγκτών.

9.4.1. Παράδειγµα 1. Η Εγκατάσταση «Ασκός: το Δοχείο των Ανέµων».

Το πρώτο παράδειγµα αφορά στην εγκατάσταση «Ασκός: το Δοχείο των Ανέµων» της εικαστικού Τάνιας
Τσιρίδου και του ερευνητή Πάνου Πανδή (Εικόνα 9.1).

Εικόνα 9.1 Η Τάνια Τσιρίδου µε τον Ασκό στο Zentrum für Kunst und Medientechnologie (ZKM), Καρλσρούη.

Παρατίθεται ένα κείµενο περιγραφής της εγκατάστασης από τη δηµιουργό:

Το «Ασκός: το δοχείο των Ανέµων» είναι µια διαδραστική


ηχητική εγκατάσταση η οποία χρησιµοποιεί την έννοια του
ανέµου ως µεταφορά για να διερευνήσει τη φύση της απτότητας
και το αντίθετό της: τη µη απτότητα. Άµεσα συνδεδεµένες µε
αυτές τις έννοιες, είναι επίσης ιδέες που σχετίζονται µε τον
έλεγχο και την προβλεψιµότητα και τα αντίθετά τους, δηλαδή το
απρόβλεπτο και το χάος.

289
Η εγκατάσταση χρησιµοποιεί δεδοµένα του ανέµου από το νησί
της Κέρκυρας, που δόθηκαν από την Εθνική Μετεωρολογική
Υπηρεσία της Ελλάδας και τα οποία εκτείνονται από το 1985 ως
σήµερα. Τα δεδοµένα αντιστοιχούν σε παραµέτρους του ήχου και
η αλληλεπίδραση µε τον επισκέπτη-χρήστη παράγει την τελική
ηχητική αφήγηση µέσω ανίχνευσης κίνησης, η οποία
πραγµατοποιείται, ως επί το πλείστον, µε τη χρήση αισθητήρων
αφής.
Ενώ, συνήθως, στις ηχητικές εγκαταστάσεις ο επισκέπτης µέσω
διάδρασης παράγει τους ήχους, στην παρούσα εγκατάσταση
συµβαίνει το αντίθετο: ο επισκέπτης, αφού ενεργοποιήσει τα
ηχητικά αρχεία µε το πρώτο άγγιγµα, καλείται στη συνέχεια να
τους αποσβέσει ανακαλύπτοντας και αγγίζοντας τα οκτώ σηµεία
διεπαφής που βρίσκονται διακριτικά στο αντικείµενο, µέχρι να
επαναφέρει την αρχική ισορροπία. Αυτό αποτελεί µια δυσκολία
για τον επισκέπτη και ταυτόχρονα µια πρόκληση σε ό,τι αφορά
την επικοινωνιακή επιτυχία του έργου, καθώς ο επισκέπτης
καλείται να κατανοήσει τον τρόπο µε τον οποίο λειτουργεί ο
συγκεκριµένος «ασκός».
Οι ήχοι αντανακλούν το χάος, και το άγνωστο που αντιµετώπισε
ο Οδυσσέας όταν άνοιξε ο ασκός του Αιόλου και οι άνεµοι του
κόσµου αφέθηκαν ελεύθεροι. Η γενικότερη ηχητική αφήγηση
εµπεριέχει τρία στάδια: α) την αρχική ισορροπία, β) τη
διαταραχή της ισορροπίας, κατά την οποία απελευθερώνονται
όλοι οι άνεµοι του κόσµου µε όλες τις καταστροφές και το
χάος, όπως συµβολίζονται στο Οµηρικό έπος, και γ) την
επαναφορά της αρχικής ισορροπίας.
Τα λογισµικά και υλισµικά που χρησιµοποιήθηκαν είναι το
Processing που διαβάζει τα δεδοµένα του ανέµου από ένα
αρχείο csv, το OpenFrameworks που χρησιµοποιήθηκε σε
συνδυασµό µε το Kinect για την αναγνώριση της κίνησης και η
τεχνολογία του Arduino που χρησιµοποιήθηκε για να διαβαστούν
οι αισθητήρες αφής. Η τελική παραγωγή και σύνθεση του ήχου
τελείται στο περιβάλλον του PureData.
Αντλώντας στοιχεία από την ιδέα του ασκού του Αιόλου, ο
στόχος αυτής της εγκατάστασης είναι να διερευνήσει τις
φιλοσοφικές διαστάσεις του µύθου, εντάσσoντάς τον στην εποχή
των νέων τεχνολογιών.

Η εγκατάσταση απαρτίζεται από τρεις εφαρµογές λογισµικού και το αντικείµενο (Ασκός) το οποίο φέρει
µηχανισµό ασύρµατης επικοινωνίας µε τον υπολογιστή µέσω WiFi.
Οι εφαρµογές εκτελούν τις εξής λειτουργίες:

• Ανάγνωση και αναπαράσταση µετεωρολογικών δεδοµένων.


• Εντοπισµό της ύπαρξης και θέσης του επισκέπτη µέσω κάµερας υπέρυθρων (Kinect).
• Αναπαραγωγή δειγµάτων ήχου και αλγοριθµική σύνθεση ήχου.

Αρχικά, η εφαρµογή που διαχειρίζεται τα µετεωρολογικά δεδοµένα στο περιβάλλον Processing, αναλαµβάνει
την ανάγνωση και αναπαράσταση δεδοµένων του ανέµου (ταχύτητα, ριπή, θερµοκρασία, κατεύθυνση) από
ένα αρχείο csv το οποίο έχει δοθεί από την Ελληνική Μετεωρολογική Υπηρεσία (Εικόνα 9.2).

290
Εικόνα 9.2 Συνεχής ροή µετεωρολογικών δεδοµένων.

Η εφαρµογή, µέσω του πρωτοκόλλου OSC (Open Sound Control), στέλνει µε σταθερό ρυθµό τις
διαφορετικές τιµές προς την εφαρµογή αναπαραγωγής και σύνθεσης ήχου, η οποία έχει κατασκευαστεί στο
περιβάλλον PureData (Εικόνα 9.3). Διαφορετικές παράµετροι του ήχου συνδέονται και επηρεάζονται από τα
δεδοµένα του ανέµου. Έτσι δηµιουργείται ένας αρχικός ήχος ο οποίος επικρατεί στον χώρο της εγκατάστασης
µονίµως. Όταν ο επισκέπτης εισέλθει και πλησιάσει τον ασκό, γίνεται αντιληπτός από την εφαρµογή που
εποπτεύει συνεχώς τον χώρο στον οποίο βρίσκεται, µέσω της συσκευής Kinect. Όταν η κίνηση του επισκέπτη
εντοπιστεί, αυξάνεται σταδιακά η ένταση του αρχικού ήχου όσο ο επισκέπτης πλησιάζει το αντικείµενο. Η
συγκεκριµένη εφαρµογή έχει αναπτυχθεί στο περιβάλλον OpenFrameworks.

Εικόνα 9.3 Το κεντρικό patch στο περιβάλλον PureData για την επεξεργασία και τον έλεγχο των δεδοµένων της
εγκατάστασης.

Στην επιφάνεια του αντικειµένου έχουν ραφτεί, µε αγώγιµη κλωστή, οκτώ σηµεία αφής τα οποία συνδέονται
όλα σε ένα κύκλωµα αίσθησης της αφής που είναι συνδεδεµένο σε µια πλατφόρµα Arduino. Τα συµβάντα
αφής στέλνονται µέσω OSC από το Arduino προς τον υπολογιστή που τρέχει το λογισµικό σύνθεσης ήχου σε
περιβάλλον PureData. Η αποστολή πραγµατοποιείται µέσω του πρωτοκόλλου SlipSerial. Αγγίζοντας τα
σηµεία αφής, ο επισκέπτης ενεργοποιεί και ελέγχει οκτώ ηχητικά αρχεία δηµιουργώντας µια νέα σύνθεση.

291
Επιπλέον πληροφορίες και videos σχετικά µε την εγκατάσταση µπορούν να αναζητηθούν στην
ιστοσελίδα http://www.eastn.eu/EASTNArtist/tania-tsiridou-panos-pandis.

9.4.2. Παράδειγµα 2. Η Εγκατάσταση «Tribal Cities».

Στο δεύτερο παράδειγµα θα εξετάσουµε ορισµένες µεθοδολογίες και στρατηγικές µέσω των οποίων
αναπτύσσονται τοπικές και υπερ-τοπικές δοµές στη µουσική και στην εικόνα της οπτικοακουστικής
εγκατάστασης «Tribal Cities»80. Η εγκατάσταση αποτελείται από δύο videos µε ξεχωριστά ηχητικά αρχεία
και ένα τρίτο που προβάλλει τον χώρο της εγκατάστασης σε πραγµατικό χρόνο. Ένα µικρόφωνο
(προαιρετικά) συλλέγει το ηχοτοπίο της εγκατάστασης, το οποίο τροφοδοτεί σε µονάδες ηχητικής
επεξεργασίας και από εκεί στα ηχεία που είναι τοποθετηµένα περιµετρικά του χώρου.

9.4.2.1. Κίνητρα και Αλληλεπίδραση.

Βασικός σκοπός της εγκατάστασης είναι η διερεύνηση των σχέσεων που αναπτύσσει ο άνθρωπος µε διάφορα
τοπικά και υπερ-τοπικά περιβάλλοντα στα οποία ζει. Μεταξύ των φιλοσοφικών και επιστηµονικών
προσεγγίσεων που εξετάζουν τη ζωή στον πλανήτη, και τα µοντέλα συµπεριφορών στους τόπους
καθηµερινής διαβίωσης (διαµερίσµατα, σπίτια, τόποι εργασίας, κοινότητες), εντοπίζεται ένας προσωπικός
οικείος χώρος, µέσα από τον οποίο παρατηρούµε και κατανοούµε τους τοπικούς χώρους διαβίωσης και τον
παγκόσµιο χώρο του πλανήτη. Αυτός ο συµφυής οικείος χώρος, επαυξάνεται µε γνώση και εµπειρία, αλλά και
µε προκαταλήψεις και περιορισµούς. Η εγκατάσταση προσκαλεί τον επισκέπτη να εξερευνήσει τις σχέσεις
του µε τους προβαλλόµενους χώρους, να διαµορφώσει συνδέσεις µεταξύ τους και να αποκαλύψει στοιχεία
(κείµενα ή εικόνες) τα οποία καλύπτονται από αυτούς. Για να επιτευχθεί αυτό, απαιτείται ένα υψηλό επίπεδο
αλληλεπίδρασης, ώστε να ενθαρρύνεται συνεχώς ο επισκέπτης στην εξερεύνηση και στη συµµετοχή.
Όπως είδαµε, ο εννοιολογικός ορισµός της αλληλεπίδρασης είναι µια περίπλοκη υπόθεση, καθώς η
σηµασία του όρου µετατοπίζεται και επαυξάνεται συνεχώς. Τα µέσα της σύγχρονης ψηφιακής τεχνολογίας
µπορούν να µετατρέψουν τον επισκέπτη της εγκατάστασης από απλό παρατηρητή σε ενεργό συµµετέχοντα,
προτρέποντάς τον συνεχώς να επικοινωνήσει µε τον εαυτό του και µε το περιβάλλον του. Ο David Rokeby
(1995) περιγράφει αυτήν τη διαδικασία ως εξής:

Το µέσο, δεν αντικατοπτρίζει µόνο αλλά και διαθλά αυτό µε το


οποίο τροφοδοτείται. Αυτό που επιστρέφει είναι ο εαυτός µας,
επεξεργασµένος και µεταµορφωµένος. Στο βαθµό που η τεχνολογία
αντικατοπτρίζει τον εαυτό µας αναγνωρίσιµο, µας παρέχει µια
αυτο-εικόνα, µια αίσθηση του εαυτού. Στο βαθµό που η
τεχνολογία αντικατοπτρίζει µεταµορφωµένη την εικόνα µας, µάς
προµηθεύει µε µια αισθητηριακή σχέση για τον εαυτό και τον
εµπειρικό κόσµο81. Μ.τ.Σ.

Η αλληλεπίδραση στην εγκατάσταση δροµολογείται από µια σταθερά τοποθετηµένη κάµερα η οποία
ανιχνεύει τις κινήσεις του επισκέπτη και από ένα µικρόφωνο το οποίο λαµβάνει την οµιλία του και τους
ήχους του περιβάλλοντος. Το ολοκληρωµένο σύστηµα κάµερα-µικρόφωνο-υπολογιστής-ηχεία συλλέγει και
διαθλά τις πληροφορίες που δέχεται ως επεξεργασµένες και µεταµορφωµένες οπτικο-ηχητικές προβολές.

9.4.2.2. Τοπικές Δοµές.

Ο µηχανισµός και η επεξεργασία των δεδοµένων ελέγχου πραγµατοποιείται σε περιβάλλον Max (Εικόνα 9.4).
Όλα τα δεδοµένα της εγκατάστασης ανανεώνονται κάθε 7½ λεπτά. Αυτή η διάρκεια αποτελεί τη βασική
χρονική δοµή της εγκατάστασης η οποία ελέγχεται από το subpatch «time» (Εικόνα 9.14) που θα εξετάσουµε
πιο κάτω.

292
Εικόνα 9.4 Το κύριο patch της εγκατάστασης «Tribal Cities» σε περιβάλλον Max.

Οι Φυλές (Tribes).

Οι αρχές για τη δηµιουργία και τον έλεγχο των τοπικών δοµών στην εικόνα και στη µουσική προήλθαν από
την εφαρµογή βασικών κανόνων που διέπουν µια φυλετική και κλειστή, σε πιθανά εξωτερικά ερεθίσµατα,
κοινωνία. Το ηχητικό µέρος της εγκατάστασης αποτελείται από τέσσερις ηχητικές οµάδες οι οποίες
αναφέρονται ως φυλές (tribes) (Εικόνα 9.5).

Εικόνα 9.5 Οι φυλές: τέσσερις ηχητικές οµάδες οι οποίες αποτελούν τοπικές δοµές.

Οι πρώτες τρεις ηχητικές οµάδες αναπαράγουν έναν προηχογραφηµένο ήχο σαξοφώνου ενώ η τέταρτη οµάδα
αναπαράγει ένα ηχητικό δείγµα φωνής µέσω του αντικειµένου sfplay~. Κάθε οµάδα διέπεται από τους δικούς

293
της τοπικούς (φυλετικούς) κανόνες και µηχανισµούς για την υπεράσπισή της από εξωτερικά ερεθίσµατα. Ένα
εξωτερικό ερέθισµα – το οποίο συντελείται κυρίως µέσω αποστολής (send) και αποδοχής (receive)
µηνυµάτων σε subpatches – ορίζεται ως η απόπειρα µιας ηχητικής οµάδας να µεταλλάξει τις τοπικές ηχητικές
παραµέτρους µιας άλλης οµάδας. Οι τοπικοί κανόνες που έχουν ορισθεί για κάθε οµάδα σχετίζονται µε
ηχητικές παραµέτρους, όπως η ένταση, η ταχύτητα αναπαραγωγής των ηχητικών αρχείων και η πανοραµική
θέση στο στερεοφωνικό πεδίο. Για παράδειγµα, µια ηχητική οµάδα µπορεί να «επιτεθεί» σε µια άλλη
στέλνοντας µηνύµατα (bangs) τα οποία προκαλούν ασυνέχειες στην ένταση του ηχητικού της αρχείου ή
ψηφιακές αλλοιώσεις στην κυµατοµορφή του (glitches). Το αποτέλεσµα στην πρώτη περίπτωση είναι ότι η
ένταση της ηχητικής οµάδας που δέχεται την «επίθεση» τροποποιείται και χάνει τη συνοχή της µέχρι να
επανακτήσει τις αρχικές τοπικές τιµές της (Εικόνα 9.6). Στη δεύτερη περίπτωση συντελείται µια περισσότερο
δραµατική µεταµόρφωση: η κυµατοµορφή του ηχητικού αρχείου υφίσταται έντονη παραµόρφωση.

Εικόνα 9.6 Τοπικές ρυθµίσεις έντασης για τις ηχητικές οµάδες 1 και 2.

Με τον ίδιο τρόπο, µια ηχητική οµάδα µπορεί να επηρεάσει την ταχύτητα κίνησης (panoramic speed) ή
χωροθέτησης (panoramic) του ηχητικού αρχείου µιας άλλης οµάδας, η οποία ελέγχεται από έναν µετρονόµο
(metro) (Εικόνα 9.7).

Εικόνα 9.7 Οι ρυθµίσεις του µετρονόµου ο οποίος ελέγχει την ταχύτητα κίνησης και χωροθέτησης των ηχητικών αρχείων
για τις οµάδες 3 και 4.

294
Η περισσότερο καταστροφική ή µεταµορφωτική επίδραση που µπορεί να επιχειρήσει µια ηχητική οµάδα σε
µια άλλη, συντελείται µέσω των subpatches «anarch» (Εικόνα 9.8). Αποστέλλοντας µηνύµατα, η επιτιθέµενη
οµάδα τροποποιεί το εύρος κατανοµής πιθανοτήτων σε δύο πίνακες (itables) οι οποίοι ελέγχουν συνολικά τις
παραµέτρους του τονικού ύψους, της έντασης και της ταχύτητας αναπαραγωγής του ήχου µιας άλλης οµάδας
(Εικόνα 9.9). Ωστόσο, λόγω των ορισµάτων των αντικειµένων random, στην Εικόνα 9.8, υπάρχουν 80%
πιθανότητες επιτυχίας της επιχειρούµενης αλλοίωσης των παραµέτρων. Έτσι, κάθε φορά που µια οµάδα
δέχεται την επίθεση µιας άλλης, έχει 80% πιθανότητες να µεταµορφωθεί και 20% πιθανότητες να παραµείνει
στις αρχικές παραµετρικές τιµές της. Τα συγκεκριµένα ποσοστά ισχύουν για το subpatch «anarch1».

Εικόνα 9.8 Τα subpatches anarch1 και anarch2.

295
Εικόνα 9.9 Οι δύο πίνακες πιθανοτήτων (itables) οι οποίοι επηρεάζονται από τα subpatches «anarch». Τα αντικείµενα
pattr ελέγχουν την ταχύτητα αναπαραγωγής των ηχητικών οµάδων 3 και 4.

Ταυτόχρονα, αριθµητικές τιµές οι οποίες είναι συνδεδεµένες µε τα αντικείµενα pattr, ελέγχουν επίσης την
ταχύτητα αναπαραγωγής των ηχητικών οµάδων 3 και 4 (pattr @bindto speed3 και pattr @bindto speed4 στην
Εικόνα 9.9) Με αυτόν τον τρόπο, αναπτύσσεται ένα αυτο-εξελισσόµενο δίκτυο ηχητικών οµάδων, στο οποίο
κάθε µια από αυτές προσαρµόζει συνεχώς τις τιµές των παραµέτρων της ανάλογα µε τις εξωτερικές
επιδράσεις που δέχεται και τους περιορισµούς της.

Υπερ-τοπικά περιβάλλοντα. Παγκόσµιος χώρος: video 1.

Η ταχύτητα αναπαραγωγής του video 1 ελέγχεται από την ταχύτητα αναπαραγωγής του ηχητικού αρχείου της
οµάδας 1. Η εικόνα περνά από φίλτρα τα οποία, αφού ανιχνεύσουν τα όρια των σχηµάτων και τη φωτεινότητά
τους, αποδίδουν µαυρόασπρα φωτεινά σχήµατα τα οποία προσοµοιάζουν νυχτερινές λήψεις φωτισµένων
πόλεων από το διάστηµα (Εικόνα 9.10).

Εικόνα 9.10 Στιγµιότυπο από το video 1: Υπερ-τοπικά περιβάλλοντα. Παγκόσµιος χώρος.

296
Τοπικά περιβάλλοντα. Χώροι διαβίωσης: video 2.

Ένας άλλος υπολογιστής αναπαράγει ένα δεύτερο video το οποίο περνά από τα ίδια φίλτρα και αποδίδει
εικόνες οι οποίες προσοµοιάζουν γεωµετρικά αρχιτεκτονικά σχέδια (Εικόνα 9.11). Αυτές οι εικόνες
αναφέρονται στους καθηµερινούς χώρους διαβίωσης και αντιτίθενται στις αφηρηµένες εικόνες του video 1.

Εικόνα 9.11 Στιγµιότυπο από το το video 2: Τοπικά περιβάλλοντα. Χώροι διαβίωσης.

Διασταυρώσεις: οικείοι χώροι 1. Επεξεργασία εικόνας σε πραγµατικό χρόνο.

Η τρίτη εικόνα βρίσκεται ανάµεσα στις δύο προηγούµενες και προβάλλει την κίνηση των ανθρώπων που
κινούνται στον χώρο της εγκατάστασης (Εικόνα 9.12). Αυτό είναι το σηµείο στο οποίο πραγµατοποιείται η
αλληλεπίδραση µεταξύ ανθρώπων και εγκατάστασης. Η κίνηση των επισκεπτών ανιχνεύεται από µια σταθερή
κάµερα και τροφοδοτείται σε έναν τρίτο υπολογιστή, στον οποίο χαρτογραφείται και γίνεται η επεξεργασία
της σε πραγµατικό χρόνο µέσω ενός patch σε περιβάλλον Jitter. Κάθε φορά που η κάµερα ανιχνεύει την
κίνηση ενός επισκέπτη, το patch σκιαγραφεί κινούµενα φωτεινά στοιχεία και σχήµατα βασισµένα σε αυτήν.
Τα φωτεινά σχήµατα αποκαλύπτουν αποσπάσµατα ενός κρυµµένου κειµένου και ανατροφοδοτούν πίσω στον
επισκέπτη θραύσµατα της µεταµορφωµένης εικόνας του. Για να αποκαλυφθεί το κείµενο στην ολότητά του, ο
επισκέπτης θα πρέπει να κινείται συνεχώς, ανακαλύπτοντας τις κατάλληλες διαδροµές στον χώρο και τις
κινήσεις µέσω των οποίων θα αποκαλύψει το κείµενο.

Εικόνα 9.12 Διαθλώµενα φωτεινά σχήµατα που προκύπτουν από την επεξεργασία της κίνησης των επισκεπτών,
αποκαλύπτουν τµήµατα του κειµένου.

297
Διασταυρώσεις: οικείοι χώροι 2. Επεξεργασία ήχου σε πραγµατικό χρόνο.

Το δεύτερο επίπεδο αλληλεπίδρασης πραγµατοποιείται από ένα subpatch µε είσοδο µικροφώνου (Εικόνα
9.13). Ήχοι, θόρυβοι και οµιλίες των επισκεπτών τροφοδοτούνται στο subpatch, όπου γίνεται φασµατική
επεξεργασία µέσω ενός resonator και στη συνέχεια δροµολογούνται στα ηχεία.

Εικόνα 9.13 Το subpatch µε την είσοδο µικροφώνου και τις ρυθµίσεις για τις παραµέτρους της ηχητικής επεξεργασίας.

9.4.2.3. Μακροδοµή.

Ένα subpatch µε µηχανισµό καταµέτρησης χρόνου, λειτουργεί ως ρολόι το οποίο ελέγχει τη χρονική
ανάπτυξη της εγκατάστασης παράγοντας χρονικούς κύκλους µε διάρκεια 7½ λεπτά ο κάθε ένας (Εικόνα
9.14). Στο τέλος κάθε χρονικού κύκλου ενεργοποιείται ένα άλλο subpatch το οποίο επαναπροσδιορίζει όλες
τις τιµές για όλες τις παραµέτρους των ηχητικών οµάδων (Εικόνα 9.15). Μέσω των επαναλαµβανόµενων
χρονικών κύκλων, οι τέσσερις ηχητικές οµάδες µεταλλάσσονται συνεχώς επηρεάζοντας την εξέλιξη της
εικόνας και της µουσικής.

298
Εικόνα 9.14 Το subpatch «time» για τον χρονικό έλεγχο της εγκατάστασης, το οποίο παράγει χρονικούς κύκλους διάρκειας
7½ λεπτών.

Εικόνα 9.15 Το subpatch που επαναπροσδιορίζει όλες τις τιµές για όλες τις παραµέτρους των ηχητικών οµάδων κάθε 7½
λεπτά.

Ο επισκέπτης θα πρέπει να παραµείνει στον τόπο της εγκατάστασης τουλάχιστον για 7½ λεπτά ώστε να
αποκτήσει µια ολοκληρωµένη εµπειρία της λειτουργίας της. Κατά τη διάρκεια αυτής της περιόδου εξερευνά
τις προβαλλόµενες και συνεχώς µεταλλασσόµενες εικόνες των χώρων. Ο επισκέπτης, δηµιουργεί έναν

299
ενδιάµεσο χώρο, στον οποίο η σωµατική του κίνηση αποκαλύπτει έναν διαθλώµενο ψηφιακό εαυτό µε τη
µορφή προβαλλόµενων φωτεινών σχηµάτων.
Επιπλέον πληροφορίες σχετικά µε την εγκατάσταση µπορούν να αναζητηθούν στην ιστοσελίδα
http://www.lotis.gr.

Βιβλιογραφία

Aarseth, E. We All Want to Change the World: The Ideology of Innovation in Digital Media. Cambridge MA:
The MIT Press, 2003.
Bachelard, G. La Poetique de l'Espace. Παρίσι: Presses Universitaires de France, 1957.
Bayle, F. «Mi-Lieu», L'Espace du Son II. Ohain: Musiques et Recherches, 1991, σελ. 131-135.
Bayle, F. «Image-of-sound, or i-sound: Metaphor/Metaform», Contemporary Music Review, τ. 4. Λονδίνο:
Harwood Academis Publishers, 1989, σελ. 165-170.
Blum, F. Digital Interactive Installations. Berlin: VDM Verlag Dr. Müller.
Card, S. K., T. P. Moran και Α. Newell. The Psychology of Human-Computer Interaction. Λονδίνο, Ν.
Υόρκη: CRC Press, 1986.
Dobrian, C. «Strategies for Continuous Pitch and Amplitude Tracking in Realtime Interactive Improvisation
Software», Πρακτικά SMC 2004 Sound and Music Computing, Παρίσι, 2004.
Jordà S. «Interactivity and Live Computer Music», The Cambridge Companion to Electronic Music. Collins,
N. και J. d’Escrivan (επιµέλεια). Cambridge: Cambridge University Press, 2007, σελ. 89-106.
Lotis, T. «The Creation and Projection of Ambiophonic and Geometrical Sonic Spaces with Reference to
Denis Smalley’s Base Metals», Organised Sound, τ. 8, αρ. 3, Cambridge: Cambridge University
Press, 2003, σελ. 257-267.
Mulder, A. «Human Movement Tracking Technology». Technical Report 94-1 of the Hand Centered Studies
of Human Movement Project, Simon Fraser University, 1994.
Mumford, L. The Myth of the Machine. Techniques and Human Development. USA: Mariner Books, 1974.
Paradiso J. A. και S. O’Modhrain, «Current Trends in Electronic Music Interfaces», Journal of New Music
Research, τ. 32, αρ. 4, 2003, σελ. 345-349.
Rokeby, D. «Transforming Mirrors: Subjectivity and Control in Interactive Media», Critical Issues in
Electronic Media, Simon Penny (επιµέλεια). N. Υόρκη: SUNY Press, 1995, σελ. 133.
Rowe, R. Interactive Music Systems. Cambridge MA: The MIT Press, 1993.
Rubine D. και P. McAvinney, «Programmable Finger-Tracking Instrument Controllers», Computer Music
Journal, τ. 14, αρ. 1. Cambridge MA: The MIT Press, 1990, σελ. 26-41.
Siegel W. και J. Jacobsen, «The Challenges of Interactive Dance: An Overview and Case Study», Computer
Music Journal, τ. 22, αρ. 4, 1998, σελ. 29-43.
D. Smalley, «Spectro-morphology and Structuring Processes», The Language of Electroacoustic Music,
Simon Emmerson (επιµέλεια), Λονδίνο: Macmillan Press, 1986, σελ. 61-93.
Winkler, T. «Creating Interactive Dance with the Very Nervous System», Πρακτικά 1997 The Connecticut
College Symposium on Arts and Technology, Connecticut, 1997.

300
Κεφάλαιο 10
Codetta. Συµπεράσµατα.
Σύνοψη
Η αποτίµηση των επιδράσεων της µουσικής πληροφορικής στην τέχνη της µουσικής είναι ανέφικτη. Άλλωστε,
είναι αδύνατο να αποτιµηθεί µια ενέργεια σε πλήρη εξέλιξη. Θα αναπτύξουµε µόνο ορισµένες σκέψεις για τον
ρόλο της µουσικής πληροφορικής στη διαµόρφωση της µελλοντικής µουσικής τέχνης.

Προαπαιτούµενη γνώση
Δεν απαιτείται προηγούµενη γνώση για την κατανόηση του κεφαλαίου.

10.1. Νέες Τάσεις και ο Ρόλος της Μουσικής Πληροφορικής στη Διαµόρφωση του
Μελλοντικού Μουσικού. Μια Υπόθεση.
Η χρήση των υπολογιστών στη µουσική δηµιουργία ενθάρρυνε δύο σηµαντικές καινοτοµίες:

• Τη µικροδοµική έρευνα στα αδιάσπαστα συστατικά του ήχου, όπως οι ηµιτονοειδείς


συχνότητες, και στις ηχητικές παραµέτρους. Η τεχνική της granular synthesis αποτελεί
χαρακτηριστική εφαρµογή αυτής της έρευνας, εισάγοντας την έννοια του ηχητικού
µικρόκοσµου στη µουσική, ενός δοµικού πεδίου που µπορεί να αναλυθεί µεµονωµένα και
ανεξάρτητα από τα υπόλοιπα δοµικά επίπεδα του µουσικού έργου.
• Την προσµονή µιας νοήµονος συµπεριφοράς από έναν ιδεατό υπολογιστή-µουσικό, ο οποίος
συµπράττει στη µουσική δηµιουργία και συνδιαµορφώνει το µουσικό έργο.

Ενώ η πρώτη καινοτοµία βρίσκεται σε πλήρη άνθιση, η δεύτερη αναζητά ακόµη τους τρόπους πραγµάτωσής
της. Η διαδικτυακή µουσική, τα µουσικά robots, τα ολογράµµατα ψηφιακών καλλιτεχνών και οι ψηφιακές
µουσικές µηχανές καταδεικνύουν, σε µικρότερο ή µεγαλύτερο βαθµό, την απόπειρα εµφύτευσης νοηµοσύνης
σε ψηφιακά συστήµατα. Ένα ενδιαφέρον παράδειγµα µιας µηχανής ικανής να «ακούσει» και να παράξει
µουσική, αποτελεί το αυτοµατοποιηµένο σύστηµα «The Listening Machine» των Daniel Jones και Peter
Gregson σε συνεργασία µε το σύνολο Britten Sinfonia. Η µηχανή παρήγαγε συνεχή ροή µουσικής από τον
Μάιο του 2012 ως τον Ιανουάριο του 2013, βασισµένης στις αναρτήσεις 500 χρηστών του Twitter στο
Ηνωµένο Βασίλειο. Αναρτηµένες λέξεις, σκέψεις, συναισθήµατα και emoticons διερµηνεύονταν από τη
µηχανή σε µουσικά µοτίβα σε πραγµατικό χρόνο. Η µηχανή επεξεργαζόταν πληροφορίες που αντλούσε από
τα tweets µε βάση την ανίχνευση συγκεκριµένων λέξεων, φράσεων και εικονιδίων.
Στο υποκεφάλαιο 9.2 αναφέραµε ότι αν αποθηκεύουµε όλο και µεγαλύτερη ποσότητα οδηγιών στη
µνήµη ενός συστήµατος, το καθιστούµε ικανό να αντιδράσει κατάλληλα σε κάποιο ερέθισµα. Αν το
τροφοδοτούµε συνεχώς µε πληροφορίες σχετικές µε τα ερεθίσµατα που λαµβάνει, τότε αποκτά την πρόσθετη
ικανότητα να αποφασίζει ποια οδηγία θα εκτελέσει ώστε να ανταποκριθεί καταλληλότερα σε κάποιο
συγκεκριµένο ερέθισµα. Αυτές οι πρακτικές αποτελούν τη βάση της προσπάθειας των ερευνητών της
Τεχνητής Νοηµοσύνης να εµφυσήσουν συνείδηση και µηχανισµούς κατανόησης στις µηχανές. Ωστόσο, η
ολιστική συνείδηση δεν επιτυγχάνεται µόνο µε τη συµµόρφωση προς τους κανόνες και τις αρχές ενός
συστήµατος ή τις υποδείξεις του συντακτικού και σηµασιολογικού περιεχοµένου µιας φυσικής ή τεχνητής
γλώσσας. Οι κανόνες, οι αρχές και οι υποδείξεις είναι εργαλεία για την αντιµετώπιση των βασικών
γνωστικών δοµών. Για την ανάπτυξη της συνείδησης, απαιτείται επιπρόσθετα κριτική σκέψη, παρόρµηση και
διαίσθηση, χαρακτηριστικά µιας νοήµονος συµπεριφοράς, ο προγραµµατισµός των οποίων παραµένει, µέχρι
σήµερα, εξαιρετικά δύσκολος. Ο Polanyi (Dreyfus, 2001, σελ. 115) αναφέρεται στο ζήτηµα ως εξής:

Οι αρχές είναι κανόνες, η ορθή εφαρµογή των οποίων αποτελεί


µέρος της τέχνης την οποία διέπουν. Οι πραγµατικές αρχές του
γκολφ ή της ποίησης βαθαίνουν τις γνώσεις µας για το γκολφ
και την ποίηση και ίσως µάλιστα να προσφέρουν πολύτιµη
καθοδήγηση στους παίκτες του γκολφ και στους ποιητές. Αλλά

301
αυτές οι αρχές θα µεταλλάσσονταν αυτόµατα σε παραλογισµό αν
επιχειρούσαν να αντικαταστήσουν τη δεξιοτεχνία του παίκτη του
γκολφ ή την τέχνη του ποιητή. Οι αρχές δεν είναι δυνατό να
κατανοηθούν και πολύ λιγότερο να εφαρµοστούν από κάποιον που
δεν έχει πρώτα εµπεδώσει σε βάθος το πρακτικό µέρος της
τέχνης.

Ένας υπολογιστής µε νοήµονα συµπεριφορά θα πρέπει να µπορεί να ρωτά, να απαντά, να γνωρίζει και να
αποφασίζει, να ενεργεί δηλαδή στα πλαίσια ενός συνόλου αλληλένδετων δράσεων, να εµπλέκεται σε
αµφισβητήσεις και διαφωνίες, σε κριτική αναµονή και σε επανεξέταση των στρατηγικών του. Ένας
υπολογιστής που παίζει σκάκι ή που αυτοσχεδιάζει µε έναν µουσικό θα είναι νοήµονας αν πληροί τις
παραπάνω προϋποθέσεις. Ο Dreyfus (2001, σελ. 364) επισηµαίνει σχετικά:

Αλλά οι υπολογιστές δεν εµπλέκονται σε καταστάσεις. Ένα δυφίο


δεδοµένων έχει πάντοτε την ίδια τιµή. Οι υπολογιστές µπορούν
να εφαρµόσουν έναν κανόνα σε µια συγκεκριµένη περίπτωση, αν η
συγκεκριµένη αυτή περίπτωση έχει ήδη περιγραφεί χωρίς
αµφισηµίες βάσει γενικών γνωρισµάτων που αναφέρονται στον
κανόνα. Οι µηχανές δεν µπορούν να δεχθούν την αµφισηµία και
την παραβίαση των κανόνων αν οι κανόνες για την αντιµετώπιση
των αποκλίσεων δεν έχουν προσδιοριστεί µε τέτοια πληρότητα
ώστε να καταργείται η αµφισηµία.

10.1.1. Ο Ψηφιακός Τενόρος82.

Ας εξετάσουµε µια φανταστική ιστορία µιας µουσικής µηχανής: έναν ψηφιακό τενόρο ειδικευµένο στην
ιταλική όπερα, ο οποίος έχει σπουδάσει αυτό το είδος µε κάποιον µέντορα/προγραµµατιστή. Ο µέντορας, για
πολλά χρόνια, προµηθεύει τον ψηφιακό µας τενόρο µε καταιγισµό πληροφοριών για τη ζωή, την ηθική, τη
µαγειρική, το ποδόσφαιρο, το αργεντίνικο τάνγκο και, φυσικά, την ιταλική όπερα. Ό,τι περίπου συµβαίνει και
µε έναν νεαρό σπουδαστή που ξεκινά τη µαθητεία του σε κάποια µουσική σχολή. Στο τέλος της µαθητείας
του, ο ψηφιακός τενόρος θα έχει διαµορφώσει ένα προσωπικό ερµηνευτικό ύφος, θα είναι έτοιµος να
ξεκινήσει την καριέρα του και να επιλέξει σε πόσες και ποιες παραστάσεις θα τραγουδήσει. Η ως τώρα
ανάπτυξη της Τεχνητής Νοηµοσύνης δε µας επιτρέπει φυσικά να απολαύσουµε σύντοµα µια συναυλία µε τον
ψηφιακό µας τενόρο. Μας δίνει όµως το έναυσµα να φανταστούµε τι ακόµη µπορεί να προσφέρει η ψηφιακή
τεχνολογία, αναλογιζόµενοι ταυτόχρονα τις µακρινές συνέπειες των πράξεών µας σε ζητήµατα αισθητικής και
ηθικής.
O Nickolas Collins στο άρθρο του «Trading Faures: Virtual Musicians and Machine Ethics»
επισηµαίνει την ολοένα αυξανόµενη ικανότητα των µηχανών να µιµηθούν και να αναπαράγουν την
ανθρώπινη µουσικότητα. Οι µηχανές είναι ικανές να ακούν, να κωδικοποιούν, να µαθαίνουν, να µιµούνται
και να αναπαράγουν µουσικά ύφη και δοµές. Είναι ικανές για παράδειγµα, να κρίνουν ποια συγχορδία είναι η
καταλληλότερη σε µια αρµονική αλυσίδα για µια δεδοµένη στιγµή και µε ποια δυναµική θα πρέπει ακουστεί.
Ο ρόλος τους όµως παραµένει παρασκηνιακός σε σχέση µε αυτόν του µουσικού-συνθέτη. Καµία αναγνώριση
δεν έχει παραχωρηθεί στις µηχανές για τη σύνθεση ή την εκτέλεση ενός έργου. Καµία δόξα. Οι ίδιες οι
µηχανές άλλωστε δε θα µπορούσαν να απαιτήσουν ακόµη κάτι τέτοιο, στον κόσµο τουλάχιστον της λόγιας
µουσικής.
Στη µουσική pop όµως, οι ψηφιακές σταρλέτες της Ιαπωνίας ακολουθούνται από θαυµαστές, τον
αριθµό των οποίων θα ζήλευαν πολλοί διάσηµοι αστέρες. Η νέα γενιά των Ιαπώνων µεγαλώνει µε το ψηφιακό
ολόγραµµα της Hatsune Miku, γνωρίζοντας ταυτόχρονα παλαιότερους αστέρες που δε βρίσκονται στη ζωή,
µέσω των ολογραµµάτων τους σε ζωντανές συναυλίες. Θρυλική έµεινε η ζωντανή εµφάνιση του
ολογράµµατος (ή της προβολής, σύµφωνα µε µια άλλη προσέγγιση) του, εκλιπόντος από το 1996, ράπερ
Tupac στο φεστιβάλ της Coachella Valley το 2012. Εντούτοις, ένα ολόγραµµα, όσο πειστικά και αν
αποδίδεται, δεν εµφορείται από προσωπικότητα και συνείδηση. Παραµένει µια ρεαλιστική, ταυτόχρονα όµως

302
άυλη απεικόνιση. Το γεγονός παραµένει πως οι χιλιάδες θαυµαστές των ανερχόµενων Kagamine Rin και Len
Migikata, τις θαυµάζουν επειδή ακριβώς δεν είναι ανθρώπινες, επειδή όταν τελειώνει η συναυλία διαλύονται
στα pixel τους, επειδή αποτελούνται από φως και αριθµούς. Η λατρεία του κοινού δεν απευθύνεται στο αθώο
πρόσωπο µε τις κοτσίδες, αλλά στη µηχανή, η οποία ως ένας «άλλος άνθρωπος» στα παρασκήνια δίνει ζωή
και νόηµα στο ολόγραµµα.
Τι θα συµβεί όµως όταν οι εξελίξεις στις τεχνολογίες ανθρωποειδούς ενσωµάτωσης, κατανόησης
ανθρώπινων συµπεριφορών και εµφύτευσης συνείδησης σε άπνοες µηχανές, επιτρέψουν τη δηµιουργία και
εκπαίδευση του ψηφιακού µας τενόρου; Το σίγουρο είναι πως ένας τενόρος (ακόµη και ψηφιακός) που
γνωρίζει από κουζίνα, ποδόσφαιρο και ιταλική όπερα, έχει αναπτύξει ένα είδος ολιστικής συνείδησης και
αντίληψης του κόσµου. Και όπου υπάρχει ολιστική συνείδηση απαιτείται και η διαµόρφωση ενός χάρτη
ατοµικών και κοινωνικών δικαιωµάτων και υποχρεώσεων. Ο τενόρος της ιστορίας µας θα είναι ατοµικά
υπεύθυνος για τις επιλογές του, για τον προγραµµατισµό των συναυλιών του, πιθανώς να είναι δύστροπος
στις συνεργασίες του ή να περνά µακρές περιόδους αφωνίας.
Επιπλέον, ένα πλαίσιο ροµπο-ηθικής ή ηθικής των µηχανών θα πρέπει να καθορίζει και την
κοινωνική ενσωµάτωση του τενόρου. Παρότι δεν έχει ακόµη διαπραχθεί φόνος µε πρόθεση ή δόλο από
µηχανή, τι θα συµβεί αν ο τενόρος διαπράξει έγκληµα πάθους στα παρασκήνια; Με ποιο νοµικό πλαίσιο θα
δικαστεί και ποια ελαφρυντικά θα του αναγνωριστούν;
Κυρίως όµως τα ερωτήµατα που προκύπτουν σχετίζονται µε τις αισθητικές και ηθικές αξίες που θα
πηγάζουν από τη µουσική του τενόρου µας. Πόσο ελεύθερη θα αφεθεί η συνείδηση της µηχανής να παράξει
µουσική ανεξάρτητη από κοινωνικές συµβάσεις και τρέχουσες αισθητικές; Σε τι είδους ακροατήρια θα
απευθύνεται ο ψηφιακός τενόρος και µε ποια οικονοµικά ή κοινωνικά κριτήρια θα τα επιλέγει; Πόσο πιθανό
είναι να ακούσουµε τον Καρούζο να τραγουδά και πάλι και ποια θα είναι η εκπαιδευτική διαδικασία που θα
επιλεγεί, γνωρίζοντας εκ των προτέρων ότι εκπαιδεύουµε τη «µηχανή Καρούζο»; Ποια θα είναι η αντίδραση
των θαυµαστών του Καρούζο απέναντι στη «µηχανή Καρούζο», η οποία απαλλαγµένη από τη φυσική φθορά
των φωνητικών χορδών θα µπορεί να τραγουδά αδιάκοπα, καταστρέφοντας ίσως µέσα στην άφθαρτη
αιωνιότητά της τον µύθο του προτύπου που κλήθηκε να συνεχίσει; Οι απαντήσεις σε αυτά και άλλα
ερωτήµατα δεν µπορούν να προέλθουν από εργαστηριακές υποθέσεις. Θα δοθούν από τον ίδιο τον τενόρο και
τους ακροατές του.
Μπορούµε όµως να προχωρήσουµε σε κάποιες υποθέσεις. Κάθε οργανισµός που εµφορείται από
συνείδηση εκπαιδεύει τις επόµενες γενιές του είδους του. Θα είναι φυσικό επακόλουθο λοιπόν, η µηχανή του
παραδείγµατός µας να εκπαιδεύσει τις επόµενες µηχανές, αντικαθιστώντας τους αρχικούς µέντορες-
προγραµµατιστές. Ο ίδιος ο τενόρος µας θα γίνει δάσκαλος µιας δεύτερης γενιάς µηχανών-τραγουδιστών, οι
οποίοι µε τη σειρά τους θα εκπαιδεύσουν τις επόµενες γενιές. Με τον ίδιο τρόπο µε τον οποίο ο µαθητής
εµπεριέχει τον δάσκαλό του αλλά και διαφέρει από αυτόν, οι µηχανές θα εξελίσσονται µε τρόπους που
δύσκολα µπορούµε σήµερα να φανταστούµε. Αν δεχτούµε όµως ότι η εξέλιξη της ολιστικής συνείδησης
προέρχεται κυρίως από τη συνεχή αµφισβήτηση της εκπαίδευσης, της καθιερωµένης δηλαδή γνώσης,
µπορούµε να υποθέσουµε ότι κάποιες από τις µελλοντικές γενιές των µηχανών θα αντιδράσουν στο µοντέλο
εκπαίδευσής τους. Τι είδους ρήξεις θα δηµιουργηθούν και σε ποιους µοντερνισµούς θα οδηγήσουν; Θα
θεωρηθούν ακαδηµαϊκές οι αρχικές µηχανές και πώς θα αντιδράσουν σε µια τέτοια κατηγοριοποίηση;
Το σηµαντικότερο όµως ερώτηµα που προκύπτει είναι για πόσο καιρό οι µηχανές θα δέχονται να
υπηρετούν ένα πολιτιστικό και µουσικό µοντέλο εµφυτευµένο σε αυτές από τον άνθρωπο και, άρα, ξένο προς
αυτές. Μπορούµε και πάλι να υποθέσουµε ότι η ύπαρξη συνείδησης θα τις οδηγήσει σε αντίδραση και
αποµάκρυνση από το αρχικό µοντέλο και στη δηµιουργία µιας νέας µουσικής, µιας πραγµατικής µουσικής
των µηχανών, δηµιουργηµένη από τις µηχανές και απευθυνόµενη σε αυτές.
Η προσπάθεια δηµιουργίας ελεύθερα σκεπτόµενων και ανεξάρτητων µηχανών µπορεί να οδηγήσει
µελλοντικά σε απόλυτα νέες µουσικές πρακτικές, σκέψεις και µεθοδολογίες. Έναν αιώνα µετά την έκρηξη
του φουτουρισµού, µια τέτοια προοπτική φαίνεται πιθανή αν και απόµακρη. Τόσο ο Καρούζο όσο και η
Hatsune Miku µοιάζουν προς το παρόν να αγνοούν τις εξελίξεις που συνδέονται µε το όνοµά τους.
Διαφορετικοί και µακάριοι, συνδέουν το παρελθόν µε το παρόν, την αγάπη της µουσικής µε τη λατρεία της
µηχανής, δίνοντας το έναυσµα για τη µελλοντική εξέλιξη της µουσικής δηµιουργίας.

303
10.1.2. Συµπεράσµατα.

Αν και απέχουµε πολύ από τη συναισθηµατικά σκεπτόµενη µηχανή που περιγράψαµε πιο πάνω, οι εξελίξεις
στους τοµείς της µουσικής πληροφορικής και της µουσικής τεχνολογίας προχωρούν ραγδαία αλλά και
αβέβαια. Νέα ψηφιακά εργαλεία αναπτύσσονται συνεχώς και νέα υβριδικά µουσικά σύνολα εµφανίζονται
συνταιριάζοντας ανθρώπους, υπολογιστές και ψηφιακές µηχανές. Η διεύρυνση της οργανολογίας στην
ψηφιακή µουσική δηµιουργία, η οποία περιλαµβάνει λογισµικά, υλισµικά, ελεγκτές και κάθε είδους ψηφιακή
ιδιοκατασκευή, οδηγεί σε αναθεωρήσεις της γλώσσας της µουσικής τέχνης και των αισθητικών της
προσεγγίσεων. Από τη µουσική του ενός bit και των µικροεπεξεργαστών µέχρι τις µεγάλες πολυκάναλες
ορχήστρες ηχείων και τον τρισδιάστατο ήχο, από τη µουσική των µικροσυσκευών και των κινητών
τηλεφώνων µέχρι τη διαδικτυακή µουσική δηµιουργία, από την ηχητική τέχνη του ανθρώπινου σώµατος
µέχρι την τέχνη των κυβερνο-οργανισµών, ο δρόµος είναι πολυπύρηνος και συνεχώς διακλαδούµενος. Δεν θα
επιχειρήσουµε να αποτιµήσουµε αυτήν την πορεία, καθώς εξελίσσεται δυναµικά και απρόβλεπτα. Ο στόχος
της διδασκαλίας αυτού του βιβλίου θα παραµείνει η µελέτη και η ενσωµάτωση της ψηφιακής τεχνολογίας στη
µουσική τέχνη, ο διαρκής πειραµατισµός αλλά και η κριτική στάση προς αυτήν.

Βιβλιογραφία

Ελληνόγλωσση Βιβλιογραφία.

Dreyfus, H. Τι Δεν Μπορούν Ακόµη Να Κάνουν Οι Υπολογιστές. Κριτική Της Τεχνητής Νοηµοσύνης. Ηράκλειο:
Πανεπιστηµιακές Εκδόσεις Κρήτης, 2001.

Ξενόγλωσση Βιβλιογραφία.

Collins, N. «Trading Faures: Virtual Musicians and Machine Ethics», Leonardo Music Journal
τ. 21, 2011, σελ. 35-40.
Ferrand, M., A. Smaill και C. Anagnostopoulou. «Music and Artificial Intelligence», Second International
Conference, ICMAI 2002, Edinburgh, Scotland, UK, Σεπτέµβριος 2002, Berlin: Springer, 2002.
Miranda, E. R. Readings in Music and Artificial Intelligence. Λονδίνο: Routledge, 2000.
Polanyi, M. Personal Knowledge. Towards a Post-Critical Philosophy. Λονδίνο: Routledge and Kegan Paul,
1962.

304
Ευρετήριο Αντιστοίχισης Ελληνικών και Ξενόγλωσσων Όρων
A
aftertouch διαµόρφωση κυµατοµορφής (ανάλογα µε τoν βαθµό πίεσης του δαχτύλου στο πλήκτρο ενός συνθετητή,
vibrato)
alias frequencies ψευδώνυµες συχνότητες
aliasing επικάλυψη, θόρυβος επικάλυψης
amplitude πλάτος κύµατος, πλάτος ταλάντωσης
amplitude envelope περιβάλλουσα πλάτους, περίγραµµα δυναµικής
Analog to Digital Convertor-ADC Μετατροπέας Αναλογικού Σήµατος σε Ψηφιακό
antialiasing filter φίλτρο εξοµάλυνσης
array διάταξη, πίνακας
attack time χρόνος εκκίνησης (dynamics processing)
auxiliary output βοηθητική έξοδος
B
band ζώνη συχνοτήτων
bi-directional (figure of 8) δικατευθυντικό (µικρόφωνο)
bit width ή bit depth εύρος ανάλυσης σε δυαδικά ψηφία
bit δυφίο, δυαδικό ψηφίο
bottom up µέθοδος βάσης/κορυφής
buffer προσωρινή µνήµη, ενδιάµεση µνήµη
building block δοµική µονάδα, θεµέλιος λίθος
byte ψηφιολέξη
C
cardioid καρδιοειδές (µικρόφωνο)
channel κανάλι
classes κλάσεις
clipping ψαλιδισµός
compiler µεταγλωττιστής
composite wave σύµπλοκη κυµατοµορφή, (σύνθετη κυµατοµορφή)
compression συµπίεση
computer assisted composition σύνθεση υποβοηθούµενη από υπολογιστή
controller ελεγκτής
convolution συνέλιξη
crossfade διασταυρούµενη κίνηση
crossover διαχωριστής συχνοτήτων
D
de-esser αποσυριστής
decay rate ταχύτητα εξασθένισης
denoiser αποθορυβοποιητής
destructive editing καταστροφική επεξεργασία
Digital Signal Processing (DSP) Ψηφιακή Επεξεργασία Σήµατος
Digital to Analog Convertor-DAC Μετατροπέας Ψηφιακού Σήµατος σε Αναλογικό
distortion παραµόρφωση
drone δρόνος, κρατηµένος ήχος
dynamic range δυναµικό εύρος, εύρος δυναµικής
dynamics processing επεξεργασία δυναµικού εύρους
E
echo ηχώ, φθίνουσα επανάληψη
écoute réduite ελαχιστοποιηµένη ακρόαση, αφηρηµένη ακρόαση
editing βασική επεξεργασία
effect µονάδα επεξεργασίας ήχου
Elektronische Musik Ηλεκτρονική Μουσική (Κολωνία 1950-)
encapsulation ενθυλάκωση

305
equal loudness curves καµπύλες ισοδύναµης στάθµης, ισοακουστοτική καµπύλη
expander διαστολέας
F
fade in-out σταδιακή έναρξη-απόσβεση στάθµης
fader κυλιόµενο ποτενσιόµετρο
feature extraction εξαγωγή γνωρισµάτων, εξαγωγή χαρακτηριστικών
feedback ανατροφοδότηση
flat response επίπεδη απόκριση (µικροφώνου)
foldover αναδίπλωση
Fourier Transform Μετασχηµατισµός Fourier
frequency response απόκριση συχνοτήτων
frequency response curve καµπύλη απόκρισης συχνοτήτων
frequency συχνότητα
G
gain ενίσχυση
H
hardware υλισµικό, υλικός εξοπλισµός
harmonics αρµονικοί
high level programming language γλώσσα προγραµµατισµού υψηλού επιπέδου
hiss θόρυβος ψηλών συχνοτήτων από ενισχυτικά κυκλώµατα
hold διατήρηση
hum µηχανικός θόρυβος χαµηλών συχνοτήτων, βόµβος
I
impulse response παλµική απόκριση, απόκριση στιγµιαίου παλµού, κρουστική απόκριση
inheritance κληρονοµικότητα
input είσοδος
insert ένθετο,παρέµβληµα
installation εγκατάσταση
intensity ένταση
Interaural Time Difference Διαωτική Χρονική Διαφορά
interface διεπαφή
interpolation παρεµβολή
interpreter διερµηνευτής
K
knee (compression) γωνία µετάβασης
L
limiter αναστολέας
linker διασυνδετής
look ahead (dynamics processing) πρόβλεψη
loop βρόγχος, λούπα
loudness ακουστότητα
Low Frequency Oscillator (LFO) Ταλαντωτής Χαµηλής Συχνότητας
M
machine musicianship µουσικότητα της µηχανής
mapping χαρτογράφηση, αντιστοίχιση
modular σπονδυλωτό, αρθρωτό
morphing µορφική µετατροπή
multiband πολυζωνικό
Musique Concrète Συγκεκριµένη Μουσική (Παρίσι 1948-)
N
non destructive editing µη καταστροφική επεξεργασία
O
objet sonore ηχητικό αντικείµενο

306
omni-directional πανκατευθυντικό (µικρόφωνο)
oscillator ταλαντωτής
oscilloscope παλµοσκόπιο
output έξοδος
overdub επάλληλη εγγραφή, προσθήκη πάνω στο ήδη εγγεγραµµένο
P
panoramic πανοραµικό, στερεοφωνική διάταξη, χωροθέτηση ήχου στο στερεοφωνικό πεδίο
partial µερική, απλή
phase φάση
physical modeling φυσική µοντελοποίηση, φυσική προτυποποίηση
plug in ένθετο πρόγραµµα, εµβυσµάτωση
polar diagram πολικό διάγραµµα
polymorphisme πολυµορφικότητα
proximity effect φαινόµενο εγγύτητας
Q
quantization noise θόρυβος κβαντισµού
R
real time operation λειτουργία σε πραγµατικό χρόνο
reconstruction filter φίλτρο αναδόµησης
release time χρόνος απελευθέρωσης, χρόνος επαναφοράς
reproducing piano πιάνο αναπαραγωγής
reset αναδιατάσσω, αναδιάταξη
S
sample δείγµα
sampling frequency ή sample rate συχνότητα δειγµατοληψίας
sawtooth πριονωτή κυµατοµορφή
sensitivity ευαισθησία (µικροφώνου)
sequencer διαδοχέας
set up διατάσσω, διάταξη
Short Time Fourier Transform-STFT Μετασχηµατισµός Fourier Μικρής Διάρκειας
signal to noise ratio λόγος σήµατος προς θόρυβο
sinewave ηµιτονοειδής κυµατοµορφή
slider ολισθητής
software λογισµικό
sound editor εφαρµογή επεξεργασίας ήχου
spectral analysis ανάλυση φάσµατος
spectrogram φασµατογράφηµα
spectrum φάσµα
spectrum analyzer αναλυτής φάσµατος
spectrum plot γράφηµα φάσµατος, γραφική παράσταση φάσµατος
squarewave τετραγωνική κυµατοµορφή
T
tape music µουσική για µαγνητοταινία
threshold κατώφλι
top down µέθοδος κορυφής/βάσης
tracking εντοπισµός, ανίχνευση
transfer function συνάρτηση µεταφοράς
transient µεταβατικό φαινόµενο (απότοµη στιγµιαία µεταβολή τάσης ή συχνότητας)
transient response απόκριση µεταβολής, µεταβατική απόκριση
transition time χρόνος µετάβασης
triangle τριγωνική κυµατοµορφή
trim ενίσχυση
U

307
ultra-directional (shotgun) κατευθυντικό µεγάλης εστίασης (µικρόφωνο)
W
waveform κυµατοµορφή

Υπάρχουν ελάχιστες πηγές µε ελληνική µετάφραση ξενόγλωσσων όρων µουσικής πληροφορικής. Ο


αναγνώστης µπορεί να ανατρέξει στα:

Συµβουλόπουλος, Α. Λεξικό Όρων της Σύγχρονης Μουσικής Τεχνολογίας. Αθήνα: Φ. Νάκας, 1994.

«Γενική και Ειδική Ορολογία Ακουστικής»


http://www.eleto.gr/download/Bodies/TE2-OE5_AcousticalTerms_EN_GR.pdf

Εκτεταµένο ευρετήριο όρων υπάρχει στο:


«EARS-ElectroAcoustic Resource Site»
http://www.ears.dmu.ac.uk/

308
Αναφορές

1. Παρότι η γέννηση της συγκεκριµένης µουσικής τοποθετείται χρονικά το 1948 µε τις Πέντε
Σπουδές του Pierre Schaeffer, ο Αµερικάνος αιγυπτιακής καταγωγής συνθέτης Halim El-
Dabh πειραµατίστηκε µε τη χρήση επεξεργασµένου ηχογραφηµένου ηχητικού υλικού ήδη
από τις αρχές της δεκαετίας 1940. Συνέθεσε το πρώτο έργο για µαγνητοταινία το 1944 µε
τίτλο «The expression of Zaar».
2. Οι φουτουριστές παρουσίασαν την πρώτη φουτουριστική συναυλία θορύβων το 1914 στο
Μιλάνο.
3. Η µετάφραση του όρου «écoute réduite» ως ελαχιστοποιηµένη ή αφηρηµένη ακρόαση δεν
αποδίδει πλήρως όλο το εύρος της σηµασίας του.
4. Schaeffer (1966).
5. Σε προσωπικές συζητήσεις του συγγραφέα µε µαθητές του Schaeffer στο Conservatoire
National Supèrieur de Musique de Paris στο οποίο δίδαξε µέχρι το 1980, υποστήριξαν ότι ο
Schaeffer υπήρξε αυστηρός στην τήρηση των αρχών του και συχνά απαξιωτικός προς άλλες
πρακτικές.
6. Musique acousmatique: όρος που εισήγαγε ο Francois Bayle κατά τη δεκαετία του 1970 για
να διαχωρίσει τη µουσική πρακτική του από αυτήν της ηλεκτρονικής µουσικής σε
πραγµατικό χρόνο. Ακουσµατική µουσική είναι η µουσική η οποία παράγεται αποκλειστικά
σε στούντιο, αποθηκεύεται σε κάποιο µέσο (µαγνητοταινία, σκληρός δίσκος υπολογιστή κ.ά.)
και αναπαράγεται κατά τη συναυλία από µια συστοιχία ηχείων (acousmonium).
7. Ο αναγνώστης θα πρέπει να διαχωρίσει τον ιστορικό όρο Elektronische Musik, ο οποίος
αναφέρεται στο στούντιο της Κολωνίας κατά τις δεκαετίες 1950-60, από το νεότερο και
γενικότερο όρο «ηλεκτρονική µουσική» ο οποίος περιλαµβάνει µια πληθώρα πρακτικών και
αισθητικών τάσεων.
8. Παρότι το πρώτο έργο το οποίο συνδέθηκε µε το στούντιο της Κολωνίας είναι το «Musica su
Due Dimensioni» του Bruno Maderna, τα έργα µέσω των οποίων προσδιορίστηκε τόσο ο
τεχνοτροπικός όσο και ο αισθητικός προσανατολισµός του ήταν οι πρώτες σπουδές των
Eimert («Klangstudie II» το 1952) και Stockhausen («Studie I» το 1953 και «Studie II» το
1954).
9. Κατασκευασµένο από τον Γερµανό µηχανικό και κατασκευαστή ηλεκτρονικών µουσικών
οργάνων Harald Bode.
10. «Unsentimental about old Europe, they were prepared to believe that Europe’s time was past
and that the evolution of important art would cycle into a more modern society like United
States. They wrote as if History herself stood at their shoulder, promising artists her highest
regard», Stevens και Swan, 2013, σελ. 220.
11. Idem, σελ. 292.
12. «Tape, then, wasn’t a medium in which to compose sounds, it was a conveyor, a means to
record them and play them back one after another in chronological order». Lucier και
Douglas, 1980, σελ. 30-34. Στο Chadabe, 1997, σελ. 76.
13. «There are no theoretical limitations to the performance of the computer as a source of
musical sounds, in contrast to the performance of ordinary instruments». Mathews, 1963, σελ.
553-557.
14. «...the pallete of computer sound, potentially boundless, was in fact quite restricted, and one
did not know how to generate certain sounds...». Risset, 1985, σελ. 11-18.
15. Στο Menabrea, L. F. και Lovelace Augusta Ada, 1843.
16. «…the Engine might compose elaborate and scientific pieces of music of any degree of
complexity or extent». Στο Cambridge Companion to Electronic Music (επιµέλεια: Collins,
N., d’Escrivan, J.), 2007, σελ. 12.
17. Ceruzzi, 2006, σελ. 34.
18. Roads, 1996, σελ. 53.
19. Ένα σηµερινό δείγµα του τραγουδιού µπορεί να βρεθεί στο
https://www.youtube.com/watch?v=V-XZKS4BItI

309
20. http://news.bbc.co.uk/2/hi/technology/7458479.stm
21. http://www.cis.unimelb.edu.au/about/csirac/music/music.html
22. CSIRAC: Council for Scientific and Industrial Research Automatic Computer. Η πρώτη
ονοµασία του υπολογιστή, πριν τη µεταφορά του στο Πανεπιστήµιο της Μελβούρνης το
1955, ήταν CSIR Mk1.
23. Conference of Automatic Computing Machines. 7-9 Αυγούστου 1951.
24. http://www.cis.unimelb.edu.au/about/csirac/music/music.html
25. «Computer music appears to be very promising technically…At present, our goal is to interest
and educate …musicians in its use». Mathews, 1963, σελ. 553-557.
26. https://www.youtube.com/watch?v=PM64-lqYyZ8
27. https://www.youtube.com/watch?v=TExxv1-j42Y
28. Ο IBM 704 (1954) υπήρξε ο πρώτος υπολογιστής µαζικής παραγωγής που πραγµατοποίησε
πράξεις µε αριθµούς κινητής υποδιαστολής. Ήταν εφοδιασµένος µε το πρώτο λειτουργικό
σύστηµα της IBM.
29. Ο Illiac, βάρους 4.500 κιλών, τέθηκε σε λειτουργία το 1951 και υπήρξε ο πρώτος
υπολογιστής που κατασκευάστηκε και λειτούργησε σε Πανεπιστηµιακό Ίδρυµα. Τα
προγράµµατα µε τα οποία τροφοδοτείτο ο Illiac είχαν τη µορφή διάτρητων χάρτινων καρτών.
Οι τρύπες στις κάρτες αντιπροσώπευαν δυαδικές τιµές (16) που αντιστοιχούσαν στους
αριθµούς 0 έως 9 και στα ψηφία K, S, N, J, F και L.
30. «Dear computer, I understand that someone has worked with you in composing music…»,
Chadabe, 1997, σελ. 109.
31. https://www.youtube.com/watch?v=n0njBFLQSk8&list=PLOpv-
xCXkg1kO666mFfBcE1pFGgmlRdtW
32. «The sound imagined by a composer was in fact generated first by the main computer – which
by the time of Music IV was an IBM 7094 – as an accumulating and inaudible table of
numbers, called samples, which were stored on magnetic computer tape. Then, in separate
step, those samples were converted to sound and stored on normal audio tape», Chadabe,
1997, σελ. 113.
33. Ceruzzi, 2006, σελ. 43.
34. Chadabe, 1997, σελ. 112.
35. Η LISP που παρουσιάστηκε στα τέλη της δεκαετίας του 1950 ήταν µια από τις πρώτες
υψηλού επιπέδου γλώσσες προγραµµατισµού.
36. Η εταιρία IBM παρουσίασε τον πρώτο µικροεπεξεργαστή της τεσσάρων bits το 1971.
37. Βλέπε Κεφάλαιο 6.
38. Το MSP υποδηλώνει ταυτόχρονα τα αρχικά του ονόµατος του Miller S. Puckette και το «Max
Signal Processing».
39. Μια εκδοχή της Max σε περιβάλλον Java είναι η jMax. Η πιο πρόσφατη jMax Phoenix
αποτελεί νεότερη εκδοχή της jMax.
40. Πηγή: Το πρώτο πρόγραµµα σε C++. Alan R. Neibauer. Αθήνα: Γκιούρδας. 1995.
41. Ceruzzi, 2006, σελ. 107.
42. Augé, 1999, σελ. 81.
43. Οι σύγχρονες τεχνικές mastering υιοθετούν µεθόδους οι οποίες βασίζονται στο γεγονός ότι τα
παραγόµενα µουσικά έργα θα αναπαραχθούν, κατά κύριο λόγο, από MP3 players, ή θα
αναµεταδοθούν µέσω διαδικτύου.
44. Augé, 1999, σελ. 10.
45. Idem, σελ. 33.
46. Idem, σελ. 170.
47. Τα συµπεράσµατα που θα εξαχθούν από την εξέταση αυτής της περίπτωσης αφορούν ένα
µεγάλο ποσοστό των µουσικών έργων που δηµιουργούνται µε τη χρήση ψηφιακής
τεχνολογίας.
48. Τέτοιου είδους αλγόριθµοι αντικαθιστούν, σε πολλές περιπτώσεις, τις παραδοσιακές
παρτιτούρες. Για αυτόν το λόγο θα αναφερόµαστε σε αυτούς µε τον όρο «παρτιτούρα» ή
«αλγόριθµος-παρτιτούρα».
49. Το πρόγραµµα γραφικού προγραµµατισµού Max δηµιουργήθηκε αρχικά από τον Miller S.
Puckette στα µέσα της δεκαετίας του 1980 για υπολογιστές Macintosh.

310
50. Αντικείµενα: objects, στη γλώσσα γραφικού προγραµµατισµού Max.
51. Από τον Miller S. Puckette, το 1999.
52. Κυρίως, αναφερόµαστε σε κλειστά πακέτα λογισµικού τα οποία χρησιµοποιούν το
πρωτόκολλο MIDI και λιγότερο σε λογισµικά ανοικτού κώδικα.
53. Rechenberg, 1992, σελ. 250.
54. Με την έννοια του ολοκληρωµένου, «αυτού που οδηγεί στην εκπλήρωση του σκοπού».
Μπαµπινιώτης, 2002, σελ. 1748.
55. Ο όρος «ροκοκό» (από τη συγχώνευση των λέξεων rocaille και coquille µε την ιταλική λέξη
barocco) χρησιµοποιήθηκε ως δάνειο από τη µεταγενέστερη ευρωπαϊκή τέχνη και προτάθηκε
από τον αυστριακό επιστήµονα Wilhelm Klein στο βιβλίο του «Von Antiken Rokoko» (1921)
για να περιγράψει την τέχνη της ύστερης ελληνιστικής πλαστικής από το 150 ως το 50 π.Χ.
56. Οι παραπάνω σκέψεις πηγάζουν κυρίως από τον J. J. Pollitt, 2006, σελ. 186-7.
57. Rowe, 2001, σελ. 3.
58. Για περισσότερες λεπτοµέρειες βλέπε Rowe, 2001.
59. Τα πολλά συνέδρια Μουσικής Πληροφορικής που διοργανώνονται παγκόσµια αποτελούν µια
σταθερή πηγή πληροφόρησης για το πώς αντιµετωπίζουν οι σηµερινοί µουσικοί την ψηφιακή
τεχνολογία.
60. Διάφοροι τύποι αισθητήρων χρησιµοποιούνται σε αλληλεπιδραστικά συστήµατα ηχητικής
επεξεργασίας και σε εγκαταστάσεις (installations). Η χρήση τους, συχνά, περιορίζεται στο να
στέλνουν δεδοµένα τα οποία ελέγχουν ηχητικές παραµέτρους όπως το τονικό ύψος, η
δυναµική, οι χρονικές διάρκειες κ.ά. Για περισσότερες πληροφορίες σχετικά µε τη λειτουργία
τους βλέπε Κεφάλαιο 7.
61. Το θέµα της αιτιοκρατικής σχέσης αναπτύσσεται εκτενέστερα στο Κεφάλαιο 7.
62. Braudel, 2001, σελ. 46-7.
63. Roads, 1996, σελ. 545 και 1075-6.
64. «We are not yet able to make all vibrating bodies describe their vibrations directly on paper,
although much progress has recently been made in the methods required for this purpose».
Helmholtz, 1863, σελ. 21.
65. 1887. Εφεύρεση του Emile Berliner.
66. Το phantom power χρησιµοποιήθηκε για πρώτη φορά το 1966 από τη γερµανική εταιρία
Neumann GmbH. Ο όρος phantom δηλώνει ότι πρόκειται για «κρυφή» ενίσχυση καθώς
χρησιµοποιεί το ίδιο καλώδιο µε το ηχητικό σήµα.
67. Everest, 2003, σελ. 144.
68. Στην πραγµατικότητα, κάθε MIDI µήνυµα αποτελείται από bytes των 10 bits. Το πρώτο bit
ενός byte ονοµάζεται start bit (bit έναρξης) ενώ το τελευταίο, stop bit (bit λήξης). Ενδιάµεσα
βρίσκεται το byte των 8 bits (status και data bytes).
69. Η καταµέτρηση της ταχύτητας καθόδου του πλήκτρου προσοµοιάζει τον τρόπο µε τον οποίο
ένας πιανίστας παράγει δυναµικές στο παίξιµό του. Όσο πιο γρήγορα κατεβάζει µε τα
δάχτυλά του τα πλήκτρα τόσο πιο δυνατά θα ακουστούν οι νότες.
70. Ως «υβριδικό», εννοούµε ένα όργανο το οποίο, παρότι χρησιµοποιεί καινοτόµες
κατασκευαστικές τεχνικές, παράγει παραδοσιακά ηχητικά αποτελέσµατα (παρόµοια µε αυτά
των οργάνων της ορχήστρας), τα οποία βασίζονται στην παραδοσιακή µελωδική και
αρµονική δόµηση του µουσικού έργου.
71. Αισθητήρες µπορούν να τοποθετηθούν ακόµη και σε φρούτα ή λαχανικά. Σχετικό άρθρο
δηµοσιεύτηκε στην εφηµερίδα Daily Mail Online (φύλλο της 4ης Φεβρουαρίου 2014), στο
οποίο παρουσιάστηκε η παραγωγή ήχου από τον συνθετητή Ototo της σχεδιαστικής εταιρίας
Dentaku στο Λονδίνο, µέσω αισθητήρων σε µια σειρά λαχανικών.
72. «The musician performs control strategies instead of performing data and the instrument leans
towards more intricate responses to performer stimuli. This situation tends to surpass the note-
to-note and the 'one gesture-one acoustic event' playing paradigms present in all traditional
instruments, thus allowing musicians to work at different musical levels and forcing them to
take higher-level (i.e. more compositional) decisions on-the-fly». (Jordà 2007).
73. «In trying to reproduce the sound of a Hammond, one of the first considerations is that the
basic electromechanical tone-generation system has a sound all of its own; The ‘pure’ sound

311
that Laurens Hammond was striving for was ‘let down’ by limitations of the design and
manufacturing process, and what he regarded as many ‘imperfections’ crept into the sound.
Secondly, most Hammond players use a Leslie cabinet as an amp...this makes a huge
difference to the sound, and most players consider it part of the Hammond experience...In
short, the ‘imperfections’ in the sound of a real Hammond are responsible for much of what
gives it its charm, and a decent software emulation has to make a good job of capturing these
quirks». (πηγή: http://www.soundonsound.com/sos/apr04/articles/hammondbakeoff.htm).
74. «With microphone and digital camera now built into new laptops...audio and video are
extremely useful sources of performance data. Both types of stream are non-invasive sources
of information, in that air molecules or photons can transmit useful gestural information from
a musician or dancer without the attachment of auxiliary sensors. While there are other ways
to gather data on human action with sensors at a distance...audio and video provide two
immediate data-collection mediums...» Collins 2010, σελ. 201-202.
75. Roads, 1996, σελ. 513-514.
76. Ο κώδικας στο περιβάλλον SuperCollider συντάχθηκε σε συνεργασία µε τον συνθέτη Sergio
Luque.
77. Smalley, 1986, σελ. 61-93 και 1997, σελ. 107-126. Στο κείµενο του 1986, ο Smalley
αναφέρθηκε σε τρεις κατηγορίες υποκατάστασης, ενώ σε αυτό του 1997 πρόσθεσε µια
τέταρτη.
78. Η αυξανόµενη διείσδυση των µικροεπεξεργαστών σε αντικείµενα και εργαλεία καθηµερινής
χρήσης περιγράφεται από τους όρους pervasive computing και ubiquitous computing.
79. «...complex systems that sense and react to human behaviour through the detection of aspects
such as direct physical manipulation, body movement, or changes in the human physiological
or psychological states, are often called interactive, although it should be pointed out that
when cognition is left out of the equation, reaction replaces interaction. In merely reactive
systems, output messages, are only related to the immediately previous input message, which
makes these systems fully predictable. A light switch will remain a (reactive) light switch
independently of the amount of sophisticated sensors it may hide». Jordà, 2007, σελ. 90.
80. Η εγκατάσταση «Tribal Cities» δηµιουργήθηκε από τον Θεόδωρο Λώτη σε περιβάλλον
Max/MSP/Jitter και παρουσιάστηκε για πρώτη φορά στο Πανεπιστήµιο Ιωαννίνων το 2012.
Για την επεξεργασία της εικόνας χρησιµοποιήθηκε επιλεκτικά µια εφαρµογή την οποία
ανέπτυξε ο Andrew Benson σε περιβάλλον Jitter.
81. «The medium not only reflects back, but also refracts what it is given; what is returned is
ourselves, transformed and processed. To the degree that the technology reflects ourselves
back recognizably, it provides us with a self-image, a sense of self. To the degree that the
technology transforms our image in the act of reflection, it provides us with a sense of the
relation between this self and the experienced world». Rokeby 1995, σελ. 133.
82. Πρωτοδηµοσιεύτηκε στο τεύχος 60 του περιοδικού «Πολύτονον», Σεπτέµβριος-Οκτώβριος
2013.

312
Ήχος 1: Παρτιτούρα Εικόνας 7.10, σελ. 240

Ήχος 2: Παρτιτούρα Εικόνας 7.11, σελ. 241

Ήχος 3: Παρτιτούρα Εικόνας 7.12, σελ. 242

Ήχος 4: Παρτιτούρα Εικόνας 7.13, σελ. 243

Ήχος 5: Παρτιτούρα Εικόνας 7.14, σελ. 244

Video 1: Απόσπασμα της οπτικοακουστικής εγκατάστασης "Tribal Cities"


(Κεφάλαιο 9.4.2)
ΘΕΟΔΩΡΟΣ ΛΩΤΗΣ
Τµήµα Μουσικών Σπουδών,
Σχολή Μουσικής & Οπτικοακουστικών Τεχνών, Ιόνιο Πανεπιστήµιο

ΤΑΞΙΑΡΧΗΣ ΔΙΑΜΑΝΤΟΠΟΥΛΟΣ
Διδάσκων ΑΣΚΤ

Μουσική Πληροφορική &


Μουσική µε Υπολογιστές

313

You might also like