Download as pdf or txt
Download as pdf or txt
You are on page 1of 116

szerkesztő

dr. habil. Vas Bence

Zenepszichológia
szöveggyűjtemény
szerkesztő
dr. habil. Vas Bence
Zenepszichológia
szöveggyűjtemény
szerkesztő
dr. habil. Vas Bence

Zenepszichológia
szöveggyűjtemény

2015
Pécsi Tudományegyetem Művészeti Kar
Zeneművészeti Intézet
lektor: dr. Gocsál Ákos

szerkesztő: dr. habil. Vas Bence

felelős kiadó és vezető: dr. habil. Vas Bence


PTE Művészeti Kar Zeneművészeti Intézet
H-7630 Pécs, Zsolnay Vilmos u. 16.

tipográfia: molnARTamás

kottagrafika: Fábián Pál Tamás

A kiadvány jogvédelem alatt áll!


A szerzői jog jogosultjának engedélye nélkül a kiadvány egyetlen része sem többszörözhető és vihető
át semmilyen formában és eszközökkel, sem mechanikus, sem pedig elektronikus úton, kivéve, ha kiadó
engedélyezi.

TÁMOP-4.1.2.B.2-13/1-2013-0012. számon, a
„Szakmai tanárképzés országos módszertani- és képzésfejlesztése”

digitális kiadvány
ISBN 978-963-642-778-8
Tartalomjegyzék
A szerkesztő előszava 11
5

A zenei képesség: mi az, és mitől különleges?


Ray Jackendoff és Fred Lerdahl,
fordította dr. Holics László 15

1. Mi a zenei képesség? 17

2. A zene ritmikai szervezettsége 19


2.1 A csoportszerkezet 20
2.2 Metrikai struktúra 22

3. A dallamstruktúra 26
3.1 A tonalitás és a „hangmagasság-tér” 27
3.2. Tonalitás és pszichoakusztika 29
3.3 A tonalitás kognitív jellemzői 31
3.4 Dallamstruktúra és a nyelv 33
3.5 A dallamok hierarchikus szerkezete 34

4. Gondolatok az affektusokról a zenében 40


4.1 A probléma meghatározása 40
4.2. A zenei affektus általános célú komponensei 42
4.2. A zenére inkább jellemző affektív tulajdonságok 44

5. Záró gondolatok 47

Köszönetnyilvánítás 47

Bibliográfia 48

A zene kifejezőerejének öt tényezője:


a zenei előadásmód a pszichológus szemszögéből
Patrik N. Juslin
Uppsala University
Fordította: Bandi Szabolcs Ajtony 53

Absztrakt 55

Kulcsszavak: 55

Munkadefiníciók 57
Az előadásmód kifejezőerejének kutatási problémái 58
Az előadásmód kifejezőerejének pszichológiai megközelítése 60
Generatív szabályok (g) 61
Érzelmi kifejezés (e) 61

Véletlenszerű variációk (r) 61

Mozgásos alapelvek (m) 62


6
Váratlan stilisztikai fordulatok (s) 62

Tovább az előadásmód kifejezőerejének


elmélete felé: a germs modell 63

Egy előzetes alkalmazhatósági vizsgálat 65

További kutatási irányok 66

Zenepedagógiai lehetőségek 67

Érzelmek és kommunikáció 68

A pszichológiai megközelítés korlátai 71

Köszönetnyílvánítás 72

Jegyzetek 72

Bibliográfia 73

Zenei analízis és zenei percepció


Ian Cross
Fordította: dr. Holics László 79

Bevezetés 81

A zene „naiv pszichológiája” 82

Lerdahl és Jackendoff – egy generatív elmélet 83

Narmour – kogníció és analízis 86

Naiv pszichológia „vs.” tudományos pszichológia 89

Következtetések 91

Hivatkozások 93
Illúzió és aura a klasszikus hangfelvételen
Peter Johnson
Fordította: dr. Holics László 95 Tartalomjegyzék

I. 97
A felvétel vagy élő előadás? 97 7

II. 100
A klasszikus hangfelvétel, mint szándékos illúzió 100
A tökéletes felvétel 101

III. 102
Aura 102
Hogyan hallgatunk hangfelvételeket? 103

Bibliográfia 105

Végjegyzetek; hivatkozott,
ill. megjegyzésekkel ellátott bibliográfia 106
8
Szerzők

Ray Jackendoff
Center for Cognitive Studies
Department of Philosophy
Tufts University 9
Medford, MA02155, USA

Fred Lerdahl
Department of Music
Columbia University
New York, NY 10027, USA

Patrik N. Juslin
Department of Psychology
Uppsala University
Box 1225,
SE – 751 42 Uppsala, Sweden

Ian Cross
Facultx of Music
University of Cambridge
Cambridge, United Kingdom

Peter Johnson
Birmingham Conservatoire
Birmingham City University
B42 2SU, United Kingdom
A szerkesztő előszava 11
Kedves olvasó!
Ezzel a szöveggyűjteménnyel az volt a szándékunk, hogy a Zenepszichológia tankönyvünkben
megismert összefoglaló, tömör fejezetek mögé lehessen látni. A hatalmas irodalom csak egy valóban A szerkesztő előszava
parányi szeletét mutattuk meg, de ahhoz, hogy a zenepszichológiának ne csak a felületét, hanem annak
mélységét is megérezzék, szükséges volt néhány, látszólag ‚önkényesen’ kiválasztott cikk bemutatása.
Ezek jelentős publikációk és jól érzékeltetik, hogy egy-egy hivatkozás mögött, mint például (Juslin 2003) 13
milyen nagyformátumú írások, cikkek találhatóak.
Terveink szerint ezt a szöveggyűjteményt frissíteni fogjuk a későbbiekben. Most ezzel a négy
írással bocsátjuk útjára és kívánjuk minden olvasónak, hogy haszonnal forgassa.

Vas Bence
14
Ray Jackendoff
és Fred Lerdahl,
fordította dr. Holics László

A zenei képesség: mi az, 15

és mitől különleges?
1. Mi a zenei képesség?
A zenei képesség: mi az,
Lerdahl és Jackendoff (1983, a továbbiakban: GTTM), valamint Lerdahl (2001, a továbbiakban: és mitől különleges?
TPS) megközelítését alkalmazva, az emberi zenei képességét öt kérdés alapján vizsgáljuk. Az első kérdés a
zenei percepció/kogníció jellegzetességeivel kapcsolatos: mit jelent „hallani” egy zeneművet.
• K1 (Zenei struktúra): Amikor az ember egy számára ismerős zenei stílusban megírt zene- 17
művet hall, a zenére adott reakcióként milyen kognitív struktúrákat (vagy mentális reprezentá-
ciókat) hoz létre magában?
Ezeket a kognitív struktúrákat nevezhetjük a hallgató zenei értelmezőképességének – azt a szervező-
dést, amelyet a hallgató a zenére adott reakcióként tudat alatt létrehoz magában, túlmenően azon, hogy
pusztán csak egy „hangfolyamot” halljon. A K1 az előadó és/vagy a zeneszerző helyett a zenehallgatóra
koncentrál, mert a zenehallgatás élménye sokkal általánosabb, mint a másik kettőé, s mert az előadás ill.
komponálás tevékenysége megköveteli magát a hallgatást is (amelybe beleértendő a zene képzeletbeli lét-
rehozása és „belső meghallgatása” is).
Tekintve, hogy az a hallgató, aki otthonosan mozog egy bizonyos zenei stílusban, képes az adott stí-
lusban megírt, számára új művek megértésére is, ezt a megértési képességét jellemezhetjük bizonyos alap-
elvek együtteseként, egyfajta „zenei nyelvtanként”, mely auditív eseménysorozatokat rendel hozzá zenei
struktúrákhoz. Így a második kérdés:
• K2 (Zenei nyelvtan): Bármely konkrét „Z. S.” zenei stílust tekintve, melyek azok a tudat alat-
ti törvényszerűségek, melyek alapján a gyakorlott zenehallgatók megkonstruálják magukban a
Z. S. zenei stílusú művek értelmezését (vagyis, mi a Z. S. zenei nyelvtana)?
A zene a különböző kultúrák között, de egy adott kultúrán belül is különböző formákban és stílu-
sokban ölt testet. A különböző zenehallgatók (különböző mértékben) más-más stílusokban jártasak. Az,
hogy valaki számára ismerős egy bizonyos stílus, részben függ attól, hogy mennyit találkozott vele, és ta-
lán függ a célzott gyakorlástól is. Így a harmadik kérdés:
• K3 (A zenei nyelvtan elsajátítása): Hogyan sajátítja el egy hallgató a Z. S. zenei nyelvta-
nát, bármilyen fajta megismerési folyamattal is járjon ez?
A K3 viszont ahhoz a kérdéshez vezet, hogy milyen kognitív erőforrások teszik lehetővé a tanulást:
• K4 (Belső erőforrások a zene elsajátításához): Az emberi elmében/agyban milyen, elő-
zetesen is már meglévő erőforrások teszik lehetővé a zenei nyelvtan elsajátításának a folyamatát?

Ezek a kérdések teljes mértékben párhuzamba állíthatók azon jól ismert kérdésekkel, melyek a mo-
dern nyelvészeti vizsgálódások alapját adják, csak be kell helyettesíteni bennük a „nyelv” szót a „zené”-vel.
Bár más válaszok adódhatnak, mint a nyelv esetében, mégis, maguk a kérdések ugyanannyira helytállóak.
Különösképp például, a „nyelvi képesség” kifejezést azon erőforrások megjelölésére használják, amelyeket
egy gyermek már eleve magával hoz a nyelv elsajátításához. Ennek megfelelően azt javasoljuk, hogy a K4-es
kérdés megválaszolásához a „zenei képesség” kifejezést használjuk. A zenei képesség azokból az emberi el-
mében/agyban lévő erőforrásokból áll, amelyek lehetővé teszik egy ember számára, hogy megszerezze an-
nak a képességét, hogy a világ bármely stílusához tartozó zenét megértsen megfelelő ingerbevitel esetén.
A zenei kompetencia megszerzésének a képessége az egyének között nagyobb változatosságot mu-
tat, mint a nyelvi kompetencia megszerzésének általános képessége. A zenei (nyelv-) tanulási képességek
skálája talán a felnőttként való nyelvtanuláséhoz hasonlítható. Néhányan feltűnően tehetségesek; néhá-
nyan botfülűek. Az emberek többsége valahol a kettő közötti átmenetben van, s képesek több száz dal-
lamot felismerni, elfogadhatóan kórusban énekelni, és így tovább. Ez a verbális nyelvtől való eltérés nem
veszi el a létjogosultságát annak, hogy párhuzamba állítsuk a K1–4 kérdéseinket a verbális nyelvvel kap-
csolatos kérdésekkel; csupán azt mutatja meg, hogy a zenei képességnek némileg más tulajdonságai van-
nak, mint a nyelvi képességnek.
Ehelyütt mi a zenei képességet a nyelvelméletben használtakkal párhuzamos fogalmakkal közelít-
jük meg – vagyis, a zene formális, szerkezeti tulajdonságait annak viszonylatában vizsgáljuk, ahogy a hall-
gatók és előadók azt megértik. Ugyanúgy, mint a nyelvtudomány esetében, egy ilyen vizsgálódás ideális
esetben párhuzamosan zajlik kísérleti kutatásokkal, melyek a zene valós idejű feldolgozását, zenei kompe-
tenciák megszerzésének folyamatát (hallgatóként vagy előadóként), a zenei funkciók agyi lokalizációját,
elhelyezkedését, vagy mindezek genetikai alapjait célozzák. Jelenleg a formai elemzés területe az, ame-
lyik a leginkább kínálkozik arra, hogy a zene megértésének a teljes gazdagságát és komplexitását térké-
pezzük fel vele. Az ide vonatkozó, agyi tevékenységekkel kapcsolatos pillanatnyi tudásunk, bár gyorsan
gyarapszik, még mindig csak korlátozottan tud választ adni az időbeli és hierarchikus struktúrákkal kap-
18 csolatos kérdésekre. Ennek ellenére mi úgy gondoljuk, hogy a formai analízisnek (s elméletkészítésnek),
valamint a gyakorlati jellegű kísérleti kutatásoknak kölcsönösen kiegészíteniük és befolyásolniuk kell egy-
mást1. Reméljük, hogy jelen tanulmány viszonyítási alapként, egyfajta „szintjelzőként” szolgálhat a zenei
jelenségek tekintetében, amely segítséget adhat a zeneészlelés még több agyműködés-alapú, tudományos
megközelítésének értékeléséhez.
Egy további fontos kérdés, amely a nyelvhez hasonlóan a zene esetében is felmerül, hogy a képes-
ség mely részei, mely aspektusai tekinthetők specifikusnak az adott tevékenységi formára nézve, és mely
aspektusok származnak az emberi megismerés általánosabb tulajdonságaiból. Például az, hogy a zene
nagyrészt egy jól meghatározott frekvenciatartományon belül zajlik, az emberi hallórendszer frekvencia-
érzékenységének határértékeiből és az emberi hang hangterjedelméből fakad; ennek semmi köze nincs
specifikusan magához a zenéhez. (Ha a denevérek zenélnének, valószínűleg a hanglokátoruk hangterje-
delmében énekelnének.) Hasonlóképp, a zene észlelése és megértése olyan általános célú képességeket
igényel, mint a figyelem, a munkamemória vagy a hosszú távú memória, melyeknek vagy van, vagy nincs
kifejezetten a zene feldolgozását szolgáló, specializált formája.
Ebből eredően hasznos, ha terminológiailag különbséget teszünk a zene befogadásában és feldol-
gozásában érintett elme- ill. agyműködés minden komponensét magába foglaló, tágabb értelmű zenei ké-
pesség, illetve a szűkebb értelemben vett zenei képesség között, mely csak azokat a működési komponenseket
foglalja magában, amelyek kifejezetten a zene feldolgozására specializálódtak, és nem játszanak szerepet
semmilyen más kognitív tevékenységben. Könnyen lehet, hogy e két megkülönböztetett kategória között
fokozatos átmenet van: bizonyos általános képességek esetleg „ráhangolódhatnak” a zenei felhasználásra.
Néhány esetben akár lehetetlennek is bizonyulhat, hogy éles határvonalat húzzunk egy általánosabb ké-
pesség speciális „hangolása” és valami minőségileg különböző és specifikus képesség között. A konkrét
példák majd később terítékre kerülnek. Összességében a következőképp tehetjük fel a kérdést:

• K5 (tágabb vagy szűkebb értelemben vett zenei képesség): A zenei képesség mely te-
rületei fakadnak általános kognitív képességekből, és melyek kötődnek specifikusan csak a zené-
hez?

A „szűkebb” és a „tágabb” értelemben vett képességek megkülönböztetésére a zene esetében talán


még inkább szükség van, mint a nyelvnél. Mindkét képesség egyedien az ember tulajdonsága, tehát mind-
kettő esetében valaminek meg kellett változnia az emberi elmében/agyban a más emberszabásúaktól való
differenciálódás során az elmúlt nagyjából ötmillió évben – vagy a tágabb értelemben vett képességek-
ben megjelenő, egyedileg az emberi fajra jellemző innovációk következtében, vagy olyan újítások során,
amelyek létrehozták a szűk értelemben vett képességet valamilyen evolúciós elődjükből, vagy mindkét
folyamat segítségével. A nyelv esetében nem nehéz elképzelni olyan szelekciós nyomást, amely a kifejező,
precíz és gyors kommunikációt jutalmazta, s így olyan populációkat részesített előnyben, amelyek gazda-
gabb, szűkebb értelemben vett nyelvi képességekkel rendelkeztek. A biztonság kedvéért megjegyzendő,
hogy nem mindig helytálló az, amit az ember könnyen el tud képzelni, és a szakirodalomban is jelentős
vita folyik a szűk képességek létéről, gazdagságáról, valamint az evolúciós kialakulásuk mögötti esemé-
nyek sorrendjéről (összehasonlításra ajánljuk például: Hauser, Chomsky, & Fitch, 2002, illetve Pinker &
Jackendoff, 2005.) De bármit is képzeljünk a nyelvről, ehhez képest sokkal kevésbé találhatjuk kényszerítő
erejűnek azokat az elképzelhető szelekciós nyomásokat, melyek egy szűk zenei képesség kialakulását ösz-

1 Úgy látjuk, hogy jelentős nyelvtudományi körök léteznek, amelyek nem kötelezik el magukat ilyen
irányban, különösen a kísérlet felől a formális elmélet felé mutató irányban. Mi azonban igen ko-
molyan vesszük azt, hogy a formai analízist a kísérleti bizonyítékok igazolhatják. Ennek a nyelvtu-
dományi vonatkozásait tekintve, lásd Jackendoff (2002) különösen a 6-os és 7-es fejezeteket.
tönözték volna. (Nem mintha a szakirodalom hiányt szenvedne ilyen feltételezésekből (lásd Cross, 2003;
Huron, 2003; számos publikáció itt: Wallin, Merker, & Brown, 2000). Ha minden egyéb körülményt vál- A zenei képesség: mi az,
tozatlanul hagyunk, az a kívánatos – mivel kevesebb feltételezéssel jár –, hogy a zenei képesség minél na- és mitől különleges?
gyobb részét a tágabb értelemben vett képességek alapján magyarázzuk, vagyis úgy tekintsünk a zenei ké-
pességre, mint egy Gould és Lewontin (1979) értelmezése szerint vett, kevéssé kidolgozott „spandrelre”,
azaz ívmezőre, amely az ívek közötti teret kitölti. A nehézség a következő: minek az „ívmezője”? 19
Mindemellett, nem csak az a probléma, hogy más, evolúciós értelemben elfogadhatóbb kognitív
komponensek segítségével kívánunk magyarázatot szolgáltatni a zenei képességekre. Empirikus feladat
meghatározni, hogy a zenei képesség mely aspektusai speciálisak – ha egyáltalán bármelyikük az. Az evo-
lúciós plauzibilitás csak egy az ide vonatkozó, figyelembe veendő faktorok közül. Egy másik faktor a defi-
citek létezése, akár genetikai természetűek, akár agysérülés következményei, melyek differenciáltan gya-
korolnak befolyást a zenére (Peretz 2003, Peretz a jelen kiadásban). Az a faktor, melyet elsősorban célba
veszünk ebben a cikkben, az nem más, mint annak a szükségessége, hogy számot adjunk a zene szervező-
désének részleteiről a világ különböző zenei műfajaiban, s arról, hogy ezek a részletek miképp tükrözik a
kognitív szerveződést, vagyis a zenei struktúrát és a zenei nyelvtant. Reményeink szerint ezzel megmu-
tathatjuk, hogy a zenei struktúra kognitív megközelítése miképp segítheti információval a zene biológi-
ai alapjainak kutatását.
Nem minden, a zene lehetséges evolúciós előzményeire irányuló kutatás tűzte ezt célul maga elé.
Például, Hauser és McDermott (2003) az okfejtéseiket olyan keretek közé rendezik, melyek megfelel-
tethetők ugyan a mi K3-5 kérdéseinknek, azonban ezeket a kérdéseket nem abban a kontextusban teszik
fel, hogy mi lehet vajon „a zenei képesség érett formája” – melyre a mi K1 ill. K2-es kérdéseink vonatkoz-
nak. Anélkül, hogy biztonsággal és részletesen ismernénk, hogy a kompetens zenehallgató hogyan is érti
meg a zenét, nehéz a képességek öröklődésével és evolúciós történetével kapcsolatos hipotéziseket érté-
kelni, mivel nem világos, hogy az evolúciós folyamat végpontja tulajdonképpen mi. Okfejtésünk három fő
részből áll. A 2. fejezet a zene ritmikai szervezettségével foglalkozik; első fele a hangok csoportosításával,
második fele a metrikus szerveződésükkel kapcsolatos. A 3. fejezet a hangmagasság struktúráit tárgyal-
ja, előbb a skálák és harmóniai viszonyok, majd a dallamok konstrukciójának szempontjából. A 4. fejezet
a zenei kogníció talán leglátványosabb témaköréről, a zene érzelmekkel és affektusokkal való kapcsolatá-
ról ad áttekintést. Ez szükségszerűen a zenei struktúra komponenseinek a vizsgálata után következik, hi-
szen a struktúrának alá kell támasztania mindent, ami a zenei affektusok jelenségéhez tartozik, túlmutat-
va annak felszíni aspektusain.

2. A zene ritmikai szervezettsége

A zenei struktúra első komponense nem más, mint amit zenei felszín-nek hívunk: hangmagasság-
gal, hangszínnel, intenzitással és hosszúsággal rendelkező hangok szimultán (= egyidejűleg) és szekvenciá-
lis (= egymást követő) hangok rendje. Azon komplex folyamatok tanulmányozása, melyek által az agy egy
meghallott zenei felszínt konstruál a hallószervbe érkező auditív bemenetből, az akusztika és a pszichoa-
kusztika tárgykörébe tartozik. Elfogadjuk, hogy ezek a folyamatok főleg itt játszódnak le.
A zenei felszín, mely alapvetően nem más, mint hangok sorozata, a zenei kogníciónak csak az első
lépcsőfoka. A zenei felszín mögött egy olyan struktúra keletkezik, amely a hang-szervezettségnek két,
egymástól független dimenziójának találkozásából, kereszteződéséből születik. E két dimenzió a ritmus
és a hangmagasság. Továbbá, a ritmikai szervezettség szintén két, független szerkezeti dimenzió, a cso-
portosítás és a metrum terméke. A ritmikai és hangmagasságbeli struktúrák viszonylagos függetlensé-
gét az jelzi, hogy lehetőségünk van a kettőt szétválasztani egymástól. Bizonyos műfajok, mint a dob-zene
vagy a rap, rendelkeznek ritmikai szervezettséggel, hangmagasságbeli (vagyis, melodikus és/vagy harmo-
nikus) szervezettség nélkül. Vannak olyan műfajok is, mint például különböző fajta recitatív, kántáló jel-
legű énekek, melyek rendelkeznek hangmagasságbeli szervezettséggel és csoportosítottsággal, azonban
semmilyen jelentős metrikai renddel nem. (Peretz (2001) a függetlenségükre neurofiziológiai bizonyíté-
kot is szolgáltat, melyet agysérülések esettanulmányaira alapoz.)
Az alatt, hogy a csoportosításbeli, a metrumbeli és a hangmagasságbeli szervezettség független
struktúrákat alkot, nem azt értjük, hogy nem befolyásolják egymást. Inkább azt állítjuk, hogy ezen kom-
ponensek mindegyikének megvannak a saját, jellegzetes egységei és kombinatorikai alapelvei. A csoporto-
sítás alapegysége nem más, mint egy vagy több, egymással szomszédos2 hang csoportja a zenei felszínen. Az
egymással szomszédos csoportok további, nagyobb csoportokba foglalhatók. A metrikus struktúra alap-
20 egysége az ütés, egy időbeli pont, mely általában egy hang megszólalási pillanatához kötődik a zenei felszín-
ben. Az ütések metrummá – a szerzők által használt eredeti fogalmazásban: metrikus „hálóvá”, „ráccsá”–
állnak össze, mely különböző relatív erősségű ütések hierarchikus mintázata. Ahogy a 3. fejezetben látni
fogjuk, a hangmagasságbeli struktúra alapegysége egy, az adott műfajra jellemző hangmagasságbeli térhez
tartozó – ill. ahhoz valamilyen módon viszonyuló – hang; egy dallam összefűzött hangjai hierarchikusan
kombinálódnak oly módon, hogy feszültséget és oldódást hozzanak létre, melyet redukciónak hívunk. Egy
zenemű megértése ezen struktúrák mindegyikét egyidejűleg magában foglalja, és sok alapelv, mely egy ze-
neműhöz egy struktúrát rendel az egyik területen, interakcióba lép a többi területen lévő struktúrákkal is.
Ebből a szempontból az eredmény nem áll távol a verbális nyelv világától, melyben egy mondat struktúrája
párhuzamosan magában foglalja a fonológia, a mondattan és a jelentéstan független dimenzióit.3
# # 12 œ œ œj œ ™ j œj œj j
& # # 8 Ϫ Ϊ e
(sitar)

J J œ œ ™ nœj œ j œ™
œ œ™ en e e™
I once had a girl or should I say she once had me She...
3 2 3 2 3 2 3 2 3 2
3 2 3 2 3
3 2

a 1. ábra: A Norwegian Wood első frázisa és annak csoportosításbeli struktúrája

& 2.1œA csoportszerkezet


œ œ œ œ œ œ œ œ œ
A csoportosítás a zeneiœfelszínœmotívumokra,
œ œ frázisokra
Tonika
és formai részekre való felosztása. Az 1. ábra a
3
Beatles Norwegian 2 című
Wood 3 számának elején elhangzó
2 3 dallam csoportszerkezetét
2 3 2
mutatja: a csoporto-
kat
b a kotta4 alá rajzolt kapcsos vonalak jelzik. A tagoltság legalacsonyabb szintjén, az első hang önmagában
&szitár-közjáték,
œ œ átfedésben
œ œ van Œ négy csoport pedigœegy-egy
is egy csoportot képvisel, a további Œ négyhangos
œ A œ csoportosítás Œ közül az utolsó, a
szakasz. Ezek
Tonika
kis œ œ csoport
a következő œ első hangjával. œ œ œ szintjén,
következő œ
az első négy
3 csoportban két-két csoportpár
2 3 keletkezik, a közjáték
2 3 pedig pár nélkül marad.2 3 a teljes
Végül, 2 ze-
nerészlet is egy nagy csoportot alkot, mely a dal első frázisa. Még magasabb szinteken nézve, ez a frázis párt
c
alkot œa következővel,
œ œ így képezve œ œ œ
& összeadódva alkotják Œ a dal első szakaszát, majd Œ a dal különböző szakaszaiŒegyetlen nagy cso-
Tonika
porttá œ a dal egészét.
œ œ Így aœcsoportosítás egy hierarchikus œ rekurzív
œ struktúra.
œ œ
3 2 3 2 3 2 3 2
2 Megjegyzés: Az „egymással szomszédos”-ság, ahogy a szerzők írják, nem feltétlenül jelenti a hangok
időbeli fennállásának közvetlen összeérését, mint két, egymást követő hangjegy legato-ja esetén. Ha
egy Xzeneileg összetartozó mintázat
X X
staccato hangokból áll, vagy egyX jellegzetesen egy-ként
X értelme-
X X X X X X
zendő dallam vagy kísérőanyag szüneteket is tartalmaz, az szintén csoportosítható, X X X sőt, csoportosí-
X

##tandó nœ
X X X X X X X X X X X X X X X X X X X X
4 œ œ
is egymással, ha a zene lényegi struktúráját
nœ œ nœ œ œ œ œ œ ™ ˙ – illetveœ a Œhallgató
fel akarjuk tárni. A csoport-alkotás alapkövetelmé-
4 Ó az ‰„egymással
Tonika & nyeként
J J ‰
szomszédos”-ság Ó tehát‰csak „soron J ‰
J J következő”-séget Ó per-
cepciós mechanizmusa szempontjából „elérhető távolságon belüli”-séget – jelenthet; meghatározását
semmiképpen 'cause
semI'm the tax - man
szűkíthetjük yeah
le az időben egymáshoz I'm the hangok
hozzáérő tax - man
körére. – a fordító
3 Megjegyzés:3 Ezen utalás leginkább laza 2 hasonlatnak 3 2 3 2
ját vesszük (a hangzásbeli felszíntől a mögöttes
3 struktúra középrétegén át a tartalmi 2 jelentésanalógiá-
tekinthető. Ha a réteges elrendeződés
mélyré-
3 2
tegéig), akkor azt látjuk, hogy a szerző által említett három nyelvi paraméter: a fonológia, a nyelvtan
és a jelentéstan lényegileg egy az egyben megfelelnek az imént vázolt horizontális rétegeknek, azon-
ban az Xitt tárgyalt zenei paraméterek mindegyikének van felszíni X (puszta hangi), közép- (mögöttes
struktúraalkotási)
X és mély (értelmezésbeli,
X jelentésbeli) rétege,Xés ábrázoláskor inkább e rétegekenX át-
nyúló, X vertikális sávokként
X jeleníthetnénk
X meg
X őket – természetesen X ábrázolhatatlanul
X sűrű átfedé-
X
## 12 egymás
##sekkel
X X Xközött. X –X a fordító
X
j
X X X X X X
j j j
X X X X X X X X X
j
& Minden, œ
8 Beatles-dalokból œ œ œ idézet œ œforrásból
œ ™ a következő œ származik: Thej Beatles
œ Completej Scores, Mil-
Tonika 4
J J
való
œ n œ

waukee, Hal Leonard Publishing Corporation, 1993. Cikkünk összes zenei példájaœa Beatles-dalok- œ™

I
ból származik, once had ismertségük
széleskörű a girl okán.or should I say she once had me
3 2 3 2 3 2 3 2
3 2 3 2
3 2

X
X X X X X X
a X X X X X X X X X X X X X X X
Azok az alapelvek, amelyek a csoportstruktúrákat létrehozzák (GTTM, 3. fejezet), nagyrészt általá-
nos célú gestalt (alaklélektani) perceptuális elvek, melyek – miképp Wertheimer jó ideje, 1923-ban készült A zenei képesség: mi az,
tanulmányában rámutatott – a látásra ugyanúgy érvényesek, mint a hallásra. (A GTTM keretrendszerén és mitől különleges?
belüli értelmezésben, a zenei csoportalkotásról szóló friss tanulmányok között található Deliége 1987-es
kísérleti kutatása, valamint Temperley 2001-es számítógépes modellje; a metrumról és csoportalkotásról
szóló kísérleti kutatások átfogóbb összefoglalását lásd: Handel, 1989, (különösen: 11. fejezet.) Az 1. ábrán, a 21
rövidtávú csoportalkotás mögötti rendező elv főleg a viszonylagos közelség: ahol nagyobb időbeli távolság
van a hangindítások között, különösen, amikor szünet van a hangok között, az ember csoporthatárt észlel.
De a jel más tulajdonságai is képesek csoporthatár-észlelést kiváltani. A 2a ábrán lévő hangok időben egyen-
letesen vannak elhelyezve, s itt az ember a hangmagasság-változások alkalmával érzékel csoporthatárt.
Könnyű olyan zenei felületeket5 létrehozni, melyekben különböző jellegű csoporthatároló jeleket
állíthatunk szembe egymással. A 2b ábra ugyanazt a hangsorozatot tartalmazza, mint a 2a ábra, de a szü-
netek meg-megszakítják a hangmagasság-változásokat. Itt az érzékelt csoportosítás a szüneteket fogja kö-
vetni. A 2c ábra ugyanazt a ritmust mutatja, mint a 2b, de sokkal szélsőségesebb hangmagasság-válto-
zásokkal, s így az érzékelt csoporthatárok inkább a hangmagasság-változásokhoz, és nem a szünetekhez
igazodnak. Így, ahogy a vizuális észlelés esetében is, a csoportosítás alapelveinek érvénye viszonylagos, hát-
térbe szorítható, felülbírálható, sokkal inkább fokozatokban nyilvánul meg, mint abszolútumként, és az
egymásnak ellentmondó elvek közötti versengés a zenei struktúra megállapításának normális velejárója.
(Emiatt a GTTM ezeket az alapelveket preferencia-elveknek nevezte el.) Mivel(sitar) ezeknek az alapelveknek
####a12 œ œ œ j j j a jzenei nyelvtant
j
j ΠϪ
&
ilyenek
8
tulajdonságai,
J J œ œ ™ œ œ œ œ ™ nœ œ j
lehetetlennek bizonyul ugyanolyan módon
™ e leírni, formalizálni,
n

mint a hagyományos generatív nyelvtanokat, melyek az összes nyelvtanilag œ œ™ helyes mondat
e e „legyártására”
e™
vannak berendezkedve, de csak azokat tudják generálni. Ehelyett, ha a zenei nyelvtan szabályait felülbí-
I once had a girl or should I say she once had me She...
rálható, átugorható
3 2 3 korlátokként 2 kezeljük,
3 akkor az összhangban
2 3 van a legújabb
2 3 megszorítás2 alapú nyelv-
tudományi 3 megközelítésekkel, mint 2 pl.3 a Head-Driven Phrase Structure Grammar 2 (Pollard3 & Sag, 1987,
1994) és az3 Optimality Theory (Prince & Smolensky, 1993). Jackendoff (2002, 5. fejezet) 2 kifejleszt egy
olyan, átfogó nyelvi architektúrát, mely kompatibilis a zenei nyelvtannal.
a
& œ œ œ œ œ œ œ œ œ œ œ œ œ œ
Tonika

3 2 3 2 3 2 3 2
b
& œ œ œ Œ œ Œ œ œ Œ
Tonika
œ œ œ œ œ œ œ œ
3 2 3 2 3 2 3 2
c
œ œ œ œ œ œ
& Œ Œ Œ
Tonika
œ œ œ œ œ œ œ œ
3 2 3 2 3 2 3 2
2. ábra A közelség és hasonlóság gestalt (alaklélektani) elveinek alkalmazása a csoportosításbeli struktúra létrehozásában
X X X X X
X X X X X X X X X X

# Visszatérve
‰ nAz
œegymás
X X X X X X X X X X X X X X X X X X X X
4 Ó ‰ csoportok œ ‰ nœ Ó
a Norwegian Wood-ra (1. ábra), két,
nœ œ œhatárvonalait œ œ felé
œ konvergáló rendező elvet fedezhetünk
œ ‰ œ ™melynek
Tonika &ha# 4a nagyobb
fel, J J figyeljük. J J
egyik a J
szimmetria, ˙ megfelelően
œ Œ Ó a cso-
portok párokba rendeződnek, hogy körülbelül
'cause I'm the tax - man azonos méretű,
yeah nagyobb
I'm the csoportokat
tax - man alkossanak, melyek
azután rekurzív módon
3 szintén párba állnak.2 A másik
3 a tematikus
2 3 párhuzamosság elve, amely
2 az azono-
3 2
3 2
5 A „musical surface” angol kifejezést korábban „zenei felszín”-nek fordítottuk, ehelyütt azonban a „ze-
nei felület” illik rá jobban. A kettő között csupán annyi a különbség, hogy a „zenei felszín” általános-
ságban utal
X a zene legkülső rétegére, a „zenei felület” pedig inkább
X egy konkrét felületet jelöl, mely egy
bizonyosXzenerészletnek a felszíne. Mint
X látható, a két kifejezés csak
X árnyalatban különbözik, X a lényeget
X X X X X X X
tekintveX ekvivalensek egymással. A későbbiekben is ennek megfelelően szerepelnek a fordításban.
# ## 12 j j j j j œj j
X X X X X X X X X X X X X X X X X X X X
Tonika & # 8 œ™ œ
J œ
J œ œ™ œ œ œ œ™ nœ œ œ™
I once had a girl or should I say she once had me
3 2 3 2 3 2 3 2
3 2 3 2
3 2
san kezdődő csoportokat kedveli. A párhuzamosság elve különösképp az 1. ábra végén motiválja a csopor-
talkotást: s második frázisnak ugyanúgy kell kezdődnie, ahogy az első kezdődik. Ez esetben azt az „árat
kell megfizetni”, hogy egymást átfedő csoportok keletkeznek, s ez egy olyan szituáció, amit a közelség
elve nem kedvel. Ennek ellenére, mivel az átfedés területén végződő csoportot a szitár játssza, s a kezdő-
dő csoportot pedig éneklik, az átfedést az észleléskor nem nehéz feloldani A csoporthatár-átfedés a vizu-
22 ális percepció világában azzal a helyzettel rokon, amikor egy vonal egyszerre szolgál két, egymással hatá-
ros alakzat határaként.

2.2 Metrikai struktúra


A ritmikai szerveződés második komponense a metrikai rács, mely nem más, mint egy ütésekből álló,
az időben végig jelenlévő hierarchikus keretrendszer, mely a zenei felületre illeszkedik. A 3. ábra a Yellow
Submarine c. dal refrénjéhez illeszkedő metrikai rácsot mutatja. Mindegyik, „x” jelből álló függőleges osz-
lop egy ütést reprezentál: az oszlop magassága az ütés relatív erősségét jelzi. Vízszintes irányban olvasva,
az x-ek minden sora más-más léptékben reprezentál időbeli szabályosságot. Az alsó sor lokális szabályos-
ságokat kódol, az egyre magasabban lévő sorok pedig egyre nagyobb léptékű, egyre hosszabb távú szabá-
lyosságokat kódolnak egyre erősebb ütések között. Tipikus, hogy az ütések legalsó sora időben egyenletes
(legalábbis kognitív szempontból – fizikai időmérés szempontjából többszörösei (kétszeresei vagy há-
romszorosai). Például, a 3. ábrán, az ütések legalsó sora megfelel a negyedhangos ritmusértékek szabályos-
ságának a zenei felszínen, a következő sor kétnegyedes távolságoknak, a legfelső pedig egy egész ütemnek.
Az ütemvonalak a kottában általában az ütem legerősebb ütését előzik meg.
X X X X
X X X X X X X X
#4 ™œ j r j r j r j r j r j r
X X X X X X X X X X X X X X X X
& 4 œ œ œ œJ R œ™ œ œ™ œ œ Œ œ™ œ œ™ œ œ Œ œ™ œ œ™ œ œ Œ
We all live in a yel - low sub - ma - rine yel - low sub - ma - rine yel - low sub - ma - rine.
3 2 3 2 3 2
3 2
3 2
‰ ‰ 3. ábra A Yellow Submarine első sora
qqq qq q
Egy ütést az ember egy időbeli pontként képzeli el (a csoportokkal ellentétben, melyeknek időtar-
tamuk van). Az ütések időben tipikusan egy hang megszólalásának pillanatához kötődnek, vagy egy olyan
időponthoz, amikor valaki tapsol a kezével vagy dobbant a lábával. Ez azonban nem mindig van így. Pél-
dául, a 3. ábrán, a második ütem negyedik ütése nem kötődik egy hangindításhoz sem. (A hangfelvéte-
len a gitárok és dobok, mindemellett, játszanak ezen az ütemrészen, azonban nem feltétlenül a metrikus
struktúra érzékeltetése céljából.) Sőt, a hangindítás és az ütés kapcsolata egyáltalán nem merev, mivel az
előadásbeli rugalmasság korábbra hozhat vagy megkésleltethet hangindításokat anélkül, hogy megtörné
az érzékelt metrikai struktúrát. A Norwegian Wood felvételének figyelmes meghallgatása számos ilyen
részletre világíthat rá. Páldául, a szitár a kis közjátékát nem pontosan az ütésen kezdi, hanem egy nagyon
picit korábban. Általánosságban, ezek a korábbi kezdések (anticipációk) és késleltetések jellemzők a jazz-
és rock-előadásokra (Ashley, 2002; Temperley, 2001) és a kifejező klasszikus zenei előadásokra (Palmer,
1996; Repp, 1998, 2000; Sloboda & Lehmann, 2001; Windsor & Clarke, 1997). Ezek zenében betöltött
szerepére a 4.3-as fejezetben térünk vissza.
A 3. ábrán a csoportok kezdetei az erős ütésekkel sorakoznak fel. Azonban az is gyakori, hogy egy
csoport a metrikus rácshoz nem igazodik – ez esetben a frázis többnyire egy felütéssel kezdődik. A 4. áb-
rán látható frázis a Taxman c. számból olyan szituációra hoz példát, melyben az első kétütemes csoport
három nyolcadhanggal kezdődik, mielőtt elérné az erős ütést (az „ütem 1”-et), a második kétütemes cso-
port pedig négy teljes ütést tesz meg, mielőtt a legerősebb ütését elérné. A második csoport a hangin-
dításoknak a metrikus rács egészéhez viszonyított meglehetősen radikális elcsúsztatására is illusztráci-
ót szolgáltat.
c
a œ œ œ œ œ œ
& Œ Œ Œ
œœ œ œ œ
œ œœ œ œ œ œ
Tonika
Tonika & œ œ œ œ œ 2 œ3 œ œ œ œ2
3 2 3 2 3
3 2 3 2 3 2 3 2
b
ŒX ŒX ŒX
X X X X X
& œX œ X œ œ œ X X œX œX œX Xœ X X Xœ X œ X
A zenei képesség: mi az,
Xœ œX Xœ X
Tonika X X X X X

# 43 és mitől különleges?
‰ nœ œJ 2 œJ œ3 œJ ‰ œ ™ ˙
X X X X X
œ œ 2 œ ‰3 nœ Ó
& # 4 Ó ‰ nœJ
2 œ 3Œ Ó 2
Tonika J
c
œ œ œ'cause I'm theŒ tax - man œ yeah I'œm theœ tax - man
& Π2 3 Π2 23
Tonika 3 œ œ œ 2 œ 33 œ œ 2 œ œ
3 32 3 2 3 2 3 2 2
4. ábra A Taxman eg y sora

X X X X X X X
X X X X X X X X X X X X XX
X X X X X X X XX X X X XX X X
# #4 nœX
X X X X X X X X X X X

& # 4# 12 nœ œ œ œ j nœ ‰j œj œJ œj œ œ ‰ œ ™ ˙ j œ Œ Ó
X X X X X X X X X X X X X X X X X X X X
8Ó œ ™ ‰ J œJ œJ J œ‰ œ ™ Ó œ Jœ œJ ™

j œ j
œ œ™
Tonika
Tonika

I 'causeonce
I'm the
had taxa - man
girl yeah
or should I I'm the
say tax she
- man
once had me
3 23 3 2 2 33 2 3 2 3 2 2
3 3 2 33 2
2 2
3 2
5. ábra A Norwegian Wood első sora

X X X
Finomabb X módszerek is léteznek X Xerre. Az X 5. ábra a csoportosításbeli
X X X és metrikus X struktúrákat
X mu-
a a Norwegian
tatja
# # 4 X X X∑ Xerősek; Wood-ban. Itt mindegyik
X X X X X X csoport X X X XolyanXütéseken X X indul,X Xamelyek,
X Xa metrikus
X X rács X leg-
X 3 nXœ ™ X X X ™ X X 5 X X X X X 4
& #####412 œrétegében j a második,
8azonban œ j harmadik j8 œ™j és negyedik œ j 4 jmind w olyan ütéseken
X X X X X
alacsonyabb
œ œ œ œ œ csoport
& 8melyek a rácsJmásodik œ œ œ œ
œ here itnœ comesœjrétegben
Tonika
J Sun,

Ϫ
Tonika indulnak, rétegében ™ gyengék (vagyis nem esnek™ egybe a harmadik is sze-
sun, sun,
replő ütésekkel); I legerősebb ütésük
once had a girl valójában a csoport
or should I utolsó hangján
say található. Ez a példa
she once had me megmutatja,
hogy a „felütés”
3 fogalmát2 3 mindig a metrikus 2 hierarchiának
3 egy bizonyos 2 rétegéhez
3 képest kell értelmezni.
2
A nyugati X 3
klasszikus zenében és 2
könnyűzenében 3
a X
metrikai rácsok tipikusan szabályosak, mindegyik 2 szin-
X 3 X X X X X 2
tebegységesen
X Xkétszerezi X Xvagy háromszorozza X az alatta X lévő szintet. DeX időnként találunk Xeltéréseket is. A
# 4Comes
X X X X X X
˙ ˙ 3 Œ Œ 4 ˙ 3 Œ Œ
& 4
Here the Sun c. számból4 œe e e e 4 e
származó 6a ábra a kis léptékű metrikai szinten 4 œe X e e e
megjelenő szabálytalan-
J ütés
‰ van Œ beszúrva
Ó̇
Tonika
ságról árulkodik. Itt három, háromegységnyi hosszúságú egy alapvetően kétegységes
X X X X X X
metrumba;
a Love a hallgató love ezt a szabálytalanságot úgyXérzékeli, mintha kizökkenne a X X XAz XAll You
ritmusból. A
#
loveX X X X love love love
Need##is 4Love-ból származó
X X X X X X
∑ 3 nœ ™ egy magasabb œ ™ szinten 5 megjelenő œ 44 w mutat be, mely-
Tonika & 4 8
6b ábra,
ben a frázisok hétütéses periodicitást mutatnak. A nagyobb időbeli lépték
8 œ™ szabálytalanságot
œ miatt nem minden hallgató ve-
Sun,
szi észre a jelenséget, de a képzett zenészek számára szembeötlő.sun, sun, here it comes
x x
A 3. és 5. ábrákon x láthatóakhoz x hasonló, szabályos xmetrikai struktúrák x nagyon gyakoriak a világ
Xx x xx Ezek
zenei stílusaiban. x
x x mellett
x x
x x x vannak x xolyan x stílusok,
x X x
x melyek
x x jellemzően
x
x x x xa kettes és hármas egységek sza-
X X X X X X
bálytalan
b Xa(pontosabban:
fa-Xmi- liar X sto-Xrymeghatározott
a-boutX BeetX mintázat
-ho- wen szerint,
ma X rendszeresen
-nu -fact
X váltakozó
- ur ing con- sent
X– lásd:X változó
X ütem-
# X
j
X X
& 44 a˙œbalkáni
œ œ œnépzene ˙ œ œ œ 43œ œe œ Œeœ œŒ‰‰‰e œ44 œ˙e œ œ œ œ œ 43 œe Œe Œstb.)e, mint
mutató) periodicitásait alkalmazzák a rövid távú metrikai szinten (2 + 2 + 3, 2 + 3 + 2 + 2 + 3,
e 1974). JA poliritmikus ‰ Œ Ó̇ afrikai zene metrikai komplexitá-
Tonika
például (Nettl, 1973; Singer, e
sa többféle
Love interpretáció
love tárgyátloveképezte. Az egyik interpretáció love szerint,
love a poliritmusok love több különböző
metrikaia rácsot xhelyeznek b egymásra,xegymással c „ütköztetve” x x őket oly módon, hogy csak a legalacsonyabb
szinten (tehát
x
x x x
a legkisebb
x xidőbeli lépték
x x x x
x szintjén), x illetve
x x x x
x egyx viszonylag magas szinten (hosszú távú lépték-
ben) illeszkedjenek
kan- ga-roo egymással, de acourt
kan- ga-roo köztes szinteken
*kan - ga-nyilvánvaló
roo court függetlenséget mutassanak egymástól.
# x x
Tonika & œ œx œ x œ œx œ x œ
x x
œ œx œ œxx x
x
xx x x x x x x x x x x x x x x x x
a fa- mi- liar sto-ry a-bout Beet-ho- wen ma-nu -fact- ur ing con- sent
# j
& œxx œ xœ xœ xxœ œx œx œx œ x œ œ ‰‰‰x œx œx œ œ x œ œx œ [Egyenletes ütésmérő szint]
x x
Tonika
x(xx) x(x) x x (x) x(x) x x(xx) x(x)

# j j j
Hick-or - y, dick - or - y, dock, e mouse ran up the clock
Tonika & a xœ œ xx œ œ bœx œ œ ™ Œxx œ c œx œ xx œ xxœ œ ™ Œ
x x x x x x x x x x x
kan- ga-roo kan- ga-roo court *kan - ga-roo court
#
Tonika & x œ xœ œx x x œ x œ( ) œx
x x x
œx x
x œ Feszített
œ œ rács œ
Speech af - ter long si - lence; it is right
x x x x x
x x x x x x xx x x x Egyenletes rács (Jambikus
x pentameter)
x x x x x x x x [Egyenletes ütésmérő szint]
x x x x x x x(xx) x (x) x x(x) x x(xx) x(x)
9 Hick-or - y, dick -or - y, dock,
x(x) x
e mouse ran up the clock
#4 3 ‰ nœ œJ œJ œ œJ ‰ œ ™ ˙
Tonika & #4 Ó ‰ nœJ œ œ œJ ‰ nœ Ó œ Œ Ó
2
'cause I'm the tax - man yeah I'm the tax - man
X
3 X 2X 3 X2 3 X X 2 X
a
# #4
X X X X X3 X X X X X X X X2 X X
3 nœ ™ 5 œ™ 4w 2
&#4 ∑ œ™
3
Tonika 8 8 œ œ 4
Sun, sun, sun, here it comes
X X
X X X X
X X X X X X X X X
# #
œ X œj X œ ™ X
X X XX X X XX X X X X Xj
X X
j
X XX X X X
j
X X X X
b # #X12 œX ™ X œX j X j
X X
& 8 œ œX Xœ Xj
#4 J J3 Œ Œ œ 44 ˙e œ™ nœ 3
X X X
œ œ™Œ
œe hadŒe me
Tonika
24 Tonika & 4˙ I
˙ once 4 œ
had a girl e
e e e J ‰I Œ say Ó̇
or should she 4once e e
Love 3
3 2 love
3 love
2 3 2 3 love 2
2 3 love love 2
3 2
6. ábra Metrikai szabálytalanságok az (a) Here Comes the Sun és (b) All You Need is Love-ban

x x X
x Xx X xX xX X X
a
### 4 x x x x ∑ x x x x 3 nœx ™ x x œ ™ x x 5 x x x x x
x x x Xx X X X X x X xX X X xX X X X X X
4w
Tonika & 4 a fa-mi- liar sto-ry a-bout8 Beet-ho-wen ma-nu -8factϪ
- ur ing conœ- sent œ 4
# j
Tonika & œœ œ œ œ œ œ œ œ œ œ Sun, ‰‰‰
sun, 7. ábra sun, œ œ œ œ œ œ œ
here it comes

AXmásik megközelítés szerint a poliritmusok egyX szabályos metrikai rácsszerkezethez viszonyított


szinkopációk
aX eredményeként
x X b értelmezhetők
X x c (Locke,xX1982; x Temperley, X 2001). A Xnyugati zenehallgatók
b
# 4 tradíciókból
X X X X X X X érezhetik, azonbanXaz ilyen
X X X zenék X metrikai
X Xstruktúrái-
x x3 x xΠΠx x 4x x 3 ΠΠhogy
az ilyen x x származó
x zenét izgalmasnak
x x x x
&szóló ˙
4 kan
x x x
˙ 4-rooœe kevésbé ˙
4rooe court 4 œe – olyemértékig,
J ‰ Œ Ó̇
ról mentális
- ga-roo reprezentációik e fejlettek,
Tonika kan- ga court e*kane- ga-mint azoké, akik ebbe születtek
akár#azzal is nehézségeik lehetnek, hogy a lábukkal dobolva megbízhatóan kövessék azok ritmusát (Tre-
e e
Tonika & és Love
hub œ œ œ love
Hannon). œ œ love
Végül, számos œstílusœ létezik aœvilágon,
œ œlovemelynek
œ alapja love
a kántálás,love
a recitatív ének. Ezek a
stílusok kerülik az időben merev metrikai rácsot, zenéjük szorosabban követi a beszéd ritmusait.
Azok az alapelvek, amelyek x egy metrikai rácsot egy zenei felülettel x társítanak (GTTM, 4-es fejezet;
Temperley,xx 2001), a x
csoportalkotásért
x x x x x x(xx)x x(x) x
x x felelős alapelvekhez
x x hasonlóan x
x (x) x x(x) x x(xx) xx(x)
xszintén[Egyenletes ütésmérő az
felülbírálhatóak; szint]
együtt-
működésben és x x x x
x -ay,versengésben x megfigyelhető interakciójuk x optimalizációt igényel. A metrikai lüktetés
# x x x mögötti x jx elvek többek x j x között
x j x (a)
Hick-or dick
x - or - y, dock, x e mouse ran
x up the clock x
meghatározása
™BeetŒ-ho-œwen œ maœ -nuœ-factœ-ur œing™ conŒ - sent
x x xlegerősebb
x x x vezérlő x a hangok
x x megszólalási pillanatai (han-
Tonika & aœfakülönösen
œ -œliar œsto-aryœhosszú
- mi aœ-boutœhangoké,
#
gindítások), (b) a hangindítások erőssége, impulzivitása, és (c) a csoporthatá-
Tonika &
rok œ œ œ œ œ œ œ œ œ œ œa szinkopáció
jelenléte. Ezen alapelvek közül az elsőt ‰‰‰ œj œ fölülírja, œ œ œmintœ pl.œa 4. ábra második felében, ahol a
hangindítások körülvesznek egy viszonylag erős ütést. A második alapelv például akkor íródik fölül, ami-
x x x x
kor egyx dobos x súlytalan
x x x ütésre x ( ) hangsúlyt
x x x tesz. A Feszítettharmadik rácsalapelv pedig akkor íródik felül, amikor egy
csoport aegyaffelütéssel
Speech - ter bsi- lence; Általában
x longkezdődik. it xis rightazcütések oly x módon
x helyezkednek el, hogy fenntartsanak egy
x x x x x x x x x x x x
stabil ésx szabályos
x xx xx metrikai x x x rácsot.
x x x x x Dexxmég x ez azx előfeltételezés
x x xrács is(Jambikus
Egyenletes megdől,pentameter)
amikor a zenei felszín megfelelő
„destabilizáló”
kan- ga-roo eseményeket kan- gaszolgáltat,
-roo courtmint *kan ahogy- gaa-roo
6a éscourt
6b ábrákon láthattuk. Más szóval, egy metrikai
rács#9kiépülése ingerek és az internalizált, szabályos mintázatok egymáshoz legjobban illeszkedő interakci-
Tonika &
& 8 œazœeredménye.
œœ œœ œ œœ œœ œœ œœ œ œ œ œ œ
Tonika ójának
Ezen a ponton elkezd érdekessé válni annak a kérdése, hogy mi teszi a zenét különlegessé. A zenei
metrikai rácsok
x
ugyanis
x
formailagx hasonlítanak azokra a rácsokra,
x x x x
x
x
amelyeket
x
a verbális nyelvben meg-
[Egyenletes ütésmérő szint]
jelenő
a relatív hangsúlyok ábrázolására
x x x x x x x(xx) x(x)használnak,
x x (x) ahogy
x x(x) ax 7. ábrán
x(xx) látható
x(x) (Liberman és Prince, 1977).

#
Itt az ütések
Hick-aormagánhangzók megszólalásához
e mouseigazodnak
ran up theminden clock egyes szótagban; és a szótag fölött
Œ œj (hangsúlyt
œœ) œj œjelöl.œjItt œtehát
- y, dick - or - y, dock,
az&X-ek nagyobb
œ œ œszáma œ œnagyobb œ &œ ™ mértékű ™ Œmegkérdezhetjük, hogy a formális
°
œ hasonlóságot is? Itt két különbség azonnal szembetűnik. A
Tonika Tonika
hasonlóság vajon jelent-e egyúttal kognitív
köznyelvi beszédben a hangsúlyrácsok nem szabályosak, mint a zenében a metrikus rácsok (hasonlítsuk
Tonika és Domináns &
össze ax7. ábrán a 3. xés 5.xábrával!), és korántsem x œ
olyan egyenletesen produkáljuk őket, mint amilyenek œ a
x
zenei rácsok. x Mindemellett,
x x x x két x x œazonosság
( ) feltűnő x Feszített
is van.rács
Először is: zene esetében a tapsolás vagy lábbal
Speech
dobolás af - ter jellemzően
időzítése long si - lence; olyan,it hogy
is right
az illeszkedik a zenei ütésekre – pont ugyanilyen módon a kéz-
x x x x x
gesztusokx is,xmelyek x x a beszédet
x x x kísérik x x –,xtipikusan a beszédben hangsúlyokhoz igazodnakœidő-
lévő erőspentameter)
ben (McNeill, 1992). Terc & œ
Egyenletes rács (Jambikus
œ œ
9
Tonika &8 œ œ œ œ œ œ œ œ œ
Diatonikus skála & œ œ œ œ
œ œ œ œ
a
°& œ #œ œ œ
œ #( œ) œ #œ œ œ #œ œ #œ
Kromatikus skála
Tonika & œ
œ
¢&
Folyamatos hangtartomány
(glisszandó) œ
#4 J ‰ Œ Ó
3 4˙ 3
Tonika ˙
& 4Love ˙
love œe x Œe
4 love Œ
e e 4 eJ ‰ Œ
love xÓ̇
love œe Œe
4 love Œ
e e
x x x x
Love x love x x x x love x x
xx x x x x x xlove x x x x x x x love
x x x love
xx x x x x x x x x x x x x x
x x x
a fa- mi- liar sto-ry a-bout Beet-ho- wen ma-nu -fact- ur
ing con- sent
## a fa-mi- liar sto-ry a-bout Beet -ho- wen
jj
ma-nu -fact- ur
ing con- sent
& œ x œ œ ‰‰‰
œ œ œx œ œx œ œ œx œx œ œ ‰‰‰ œœx œœ œœxx œœ
œ œ œ œ
x œœ œ œ œœ œœxx œœ
x
Tonika
Tonika & x
xx x x x x x x x x x x x x
x x x x
a fa- mi
x
x - liar sto
x -ry a-bout x Beet
x
x -ho- wen ma
x
x -nu -fact
ing con
x
x - ur
x - sent
A zenei képesség: mi az,
# a x x x xx x x bx x x x xx x x c x j xx x xxx x
a b c és mitől különleges?
œ ‰‰‰xx xma
x x x
Tonika & xxœa faœx-miœx- liar œ sto œ -ryœxx œa-bout
œ Beet œ -hoœ -wen œ -xnuœ -fact
œ con
ing xœ - ur
œ
œ - sent
œ
# kan x x x
kanœ- gaœ-roo œcourtœ œ ‰‰‰
x x jx x
& # kanœ --œga ga-œrooœ œ œ
*kan - gaœ-rooœ court œ œ œ œ œ
x x x x x x x
Tonika -roo
kan- ga-roo court *kan - ga-roo court
& #
& œœx œœ œœxx œœ œœ œœ œœx œœ œœ œœx œœx
Tonika a b c 8. ábra 25
Tonika x x x x x
a x x x b x x x x c x x xx xx
kan x x
x - ga-roo kanx - ga-roo court *kanx - ga-roo x court
# xx x x x x x xxx xx
x x x x
xx x x x x
& kan œxx - gaœxx-roo
œxx xx kan xœ x- gaœ œ œ œ œ œ œ
x x [Egyenletes ütésmérő szint]
Tonika xx(xx)
-roo xx(x) x *kan
court xx (x)- gax-roo xx(x)
court xx(xx) xx(x) [Egyenletes ütésmérő szint]
# Hick-or - y, dick -or - y, dock, e mouse9.ran
x x x x
x(xx) x(x) x x (x) x(x) x x(xx) x(x)
& # Hick œ œ-or -œy, dick -orœ- y,œdock, œ œ ej mouse œ œran j œup œthej clock
ábraup the clock
# œœ œœ œœ œœ œœ œœ œœx ™™ ŒŒ œœj œœ œœj œœ œœj œœx ™™ ŒŒ
Tonika
Tonika
Tonika
&
& x x x x x x x x [Egyenletes ütésmérő szint]
x x x x x x x(xx) x(x) x x (x) x x(x) x x(xx) x(x)
x x
# x x x x xx xx x x(xx) x(x) xxj x (x) x j x(x) x j x(xx) x(x)
Hick
x -or - y, dick x - or - y, dock, x x e mouse x ran up x the clock x x [Egyenletes ütésmérő szint]
Tonika & xxHick œ x-orœ -xœy, dickxœ -xor Œ
œ œx ( )) œ ™xx xx e œxx mouse
œ Feszítettœ upœ rács œ clock
œ™ Œ
#Speech afx - terx long x x - xy, (dock,
j j j
ran
Feszített the
rács
& Speechœ afx œ- terœ long si lence;œ ™it Œis right œx œ œ œ œ œ ™ Œ
xœ œ- œ
si - lence; it is right
Tonika x x
x x x x x x x x x x Egyenletes rács (Jambikus pentameter)
xx x x xx xx x x x x xx Egyenletes rács (Jambikus pentameter)

99Speech
x x x x x x () x x x Feszített rács

& 88 œœx œœx œœx œœx œœx xœœ( ) œœx œœx œœx
&
Tonika x af - ter 10.long
x ábra
six -Eg y sor aitYeats-ből,
lence; is right
x After Long Silence (Halle és Keyser (1971) nyomán)
Tonika Feszített rács
x af
Speech x - terx long x six - lence;
x x itx isx right x Egyenletes rács (Jambikus pentameter)
Másodszor:x
az
x
előadásbeli
x x
hangsúlyozás
x
tekintetében, a legfontosabb nyelvközi (minden nyel-
9
vet érintő)
x rendező
x x xelvek x egyikex x x a szótagrax x eső Egyenletes hangsúly,rács mely szerintpentameter)
(Jambikus (nyelvtől függően) egy szótag
Tonika & aa8 számít
akkor œ œ hangsúlyosnak,
œ œ œ œ haœvanœbenne œ hosszú magánhangzó és/vagy, ha mássalhangzóra végző-
9
& 8 œ œ œ œTonika
dik (Spencer,
œ ° œ œ œ œa preferenciának,
1996). Ez megfelel annak
œ
hogy erősebb ütéseket hallunk szívesebben a
& Harmadszor:
œœ ( œ) hangsúlyozása egy szabályosabb, a zenei metrikus rács-
Tonika
Tonika &
hosszabb és hangosabb °
hangokon. ( ) a nyelvek kedvelik a váltakozó hangsúlyozást, ugyanis
így, bizonyos
a kontextusokban egy szó normális
hoz közelebb álló hangsúlymintázat felé tolódhat el. Például, normális esetben, ahogy a 8a ábra mutat-
° a hangsúly azœutolsó szótagon van, azonban œœ
Tonika & œœ ha e szó a „kangaroo court”
ja, aza angol „kangaroo” szóban
Tonika és Domináns
Tonika és Domináns
kifejezésben jelenik meg, a ° & œ
œ
hangsúly eltolódik
( )
a szó első szótagjára, hogy a hangsúlyozás közelítsen egy
& a 8c helyett). ( œ)
œaz ilyen párhuzamok. A versmértéket egy metrikai rácsnak
váltakozó mintázathoz Tonika(8b ábra,
A költészetben Terc &
még gyakoribbak œœ œœ te-
& œ
kinthetjük, melyre a szöveg hangsúlyaiœoptimálisan illeszkednek
Tonika és Domináns
Terc œœ (Halle és Keyser, 1971). Különösen a
költészet népiésműfajaiban,
Domináns mint & pl. gyermek-mondókákban és a limerickekben œ 6
, a metrikai rácsœkvá-
œ
Tonika
zi-izokronikusan (kvázi-egyenletesen) jelenik meg az előadásban, épp úgy, ahogy a œzenében –œolyannyi-
& œœ (Burling, œœ
ra, hogy még
Diatonikus skála
akár szünetek
Diatonikus &
Terc (hangtalan
skála œœütések) isœœkerülhetnek œœ aœœrácspontokra œ 1966; œ Oehrle,
1989)7. A 9-es ábra eztTerc & Megjegyzendő, hogy azœelső frázisa egyœ ütéssel, a második egyœfelü-
illusztrálja.
œ bizonyos keretek között lehetséges a hangsúlyok mintáza- œœ
œœ ##œœ œœ megfe-
téssel kezdődik. A kifinomult költészetben
skála &
Kromatikus
tát pontatlanul &
illeszteni a metrikai rácsra;
Diatonikus
Kromatikus skála œœ ##ezœœ nem œœ más,
##œœ mint œœ ##œœ költészetbeni
œœ a œœzenei##œœszinkopálás
Diatonikus skála & œ œ œ
œ œ hogy aœkét rendszer
lelője. A 10. ábra egy ilyen esetet illusztrál.
Ezeket a jelentős hasonlóságokatœlátva, ésszerű œ feltételezni,
œadni.œœÍme
egy azonos mö-
Folyamatos hangtartomány
skála ¢& & œ # œ œ # œ œ #œ
göttes kognitív
Folyamatos képességből
hangtartomány
Kromatikus
(glisszandó) táplálkozik. œ œ azœ időzítés
De ezután szükséges
œ #elvei œ
#œ hierarchikus szabályszerűségét kedvelik. A
a különbségekről is számot
œ
(glisszandó) ¢
#œ œ kötőd-
egy lehetőség: A metrikai rácsok rendező
Kromatikus skála &
nyelvi hangsúlyokat azonban korlátok œközé # œszorítjaœ #az,œ hogy #œ œ szavak
œ a œhangsúlyok #œ œsorozatához
b œ
¢°&
b
Folyamatos hangtartomány
œ
œœ
(glisszandó) elterjedt, öt soros, humoros verses műfaj. – A fordító
œ
6 Az angol nyelvterületen
°&
& œ
Folyamatos hangtartomány
7 Ezt a kapcsolódási pontot tekintve,
( )Lerdahl (2003) a GTTM analitikus eljárásait alkalmazza Robert
œ
Tonika
œ című rövid versének hangzására. Bár a szótagok számából arra kö-
Tonika
(glisszandó) ¢ ( )
bFrost „Nothing Gold Can Stay”
vetkeztethetnénk, hogy a vers jambikus triméterben van, az elemzés úgy kezeli a verset, mint jam-
bbikus °& mindenœ sor végén egy hangtalan ütéssel.
tetraméterben lévőt,
œœ œœ
Ezt az interpretációt a minden
Tonika és Domináns
sor végére
Tonika és odaírt
Tonika
Domináns & œœ vagy
pontosvessző ( )pont motiválta. Nemrég tudomásunkra jutott, hogy Frost saját
° Paschenœés Mosby (2001) által került rögzítésre, szintén ezt a hangtalan
előadása a verséből, mely
ütéseket is tartalmazó & ( )
Tonika előadásmódot
œköveti.
& œœ œœ
Terc
Tonika és Domináns
Terc & œœ bbœœ
& œ œ
œ
Tonika és Domináns

& œœ bbœœ ŒŒ bbœœ ŒŒ œœ


Diatonikus skála
Terc
Diatonikus skála & œœ œœ bbœœ œœ
œ
nek, a szavak megválasztását pedig elsősorban az korlátozza, hogy a beszélő egy gondolatot akar köz-
vetíteni. Ennek következtében a hangsúlyok egyenletessége csak másodlagos. A hangsúly-időzítéses
verselésben az is korlátozó tényező hogy a metrikai rácsnak szabályosnak, s ebben az értelemben ide-
álisabbnak kell lennie. Ezzel ellentétben, sok zenében elsődleges szempont a metrikai rács ideális, sza-
bályos formája. Mivel a metrikai szabályosság adottnak tekinthető, a zenei felszínen megjelenő hang-
26 súlyok nagyobb mértékben sérthetik meg, mint a költészet esetében. Röviden, ugyanazt az alapvető
kognitív rendszert használjuk, de kissé eltérő módon, azok miatt az egymástól független korlátozások
miatt, amelyeket a vele kölcsönhatásba lépő, más nyelvi vagy zenei tényezők kényszerítenek rá.
Így szemlélve, a metrikai struktúra a tágabb értelemben vett zenei képesség része. Továbbra is
kérdés azonban, hogy milyen tág értelemben. Kevés bizonyítékát látjuk annak, hogy a zenén és a nyel-
ven kívül a metrikai rácsok szerepet játszanának bármilyen emberi (vagy állati) tevékenységben. Per-
sze, más tevékenységek, mint például a sétálás vagy lélegzés is tartalmaznak időbeli periodicitásokat.
Azonban a periodicitás önmagában nem igényel metrikai rácsokat: a metrikai rácsokhoz szükséges
az erős és a gyenge ütések megkülönböztetése, amelyek hierarchikusan szerveződnek. Például, a séta
közben a lábak váltakoznak, de nincs semmi okunk arra, hogy az egyik lábbal tett lépést erős ütésnek, a
másik lépést pedig gyenge ütésnek nevezzük, és ezek a tevékenységek végképp nem bizonyítják olyan
metrikai rácsok létét, amelyek két ütéserősségi szinten túl is terjeszkednének, vagyis, olyan komplexi-
tást, amely mindennapos a nyelvben és különösképpen a zenében. Ígéretes jelölt a zenével való metri-
kai párhuzamokra a tánc, melyben a) mozgást a zenei metrum koordinálja. Nem tudunk semmi más,
ember vagy más élőlény által végzett tevékenységről, amely metrikai rácsok jeleit mutatná, bár talán a
tudományos megfigyelés és elemzés szolgáltat majd erre új példát. Ebből előzetes jelleggel arra követ-
keztetünk, hogy a metrikai struktúra, bár része a tágabb értelemben vett zenei képességnek, jellemző-
en nem része más kognitív rendszereknek. Így éles kontrasztot mutat a csoportosításbeli struktúrával
szemben, melynek használata igen széles körű – kiterjed a statikus vizuális csoportosításra és a fogalmi
csoportosítások számos fajtájára is.
Kevés bizonyíték igazolja, hogy léteznének olyan, nem-emberi viselkedésformák, amelyekhez
metrikus rács szükségeltetik. A bonobók hajlamosak szinkronizáltan pulzáló hangkiadásra, melyhez
szükséges egyfajta periodicitás („pulzálás”), de nem egy olyan, hierarchikusan felépülő metrikus rács,
melyben erős és gyenge ütések váltakoznának (további példák és értekezés olvasható Trehub és Hannon
cikkében). Ezzel ellentétben, az embergyerekek gyakran már két-hároméves korukra spontán végeznek
zenéhez hierarchikusan időzített mozgássorokat (és mi személyesen láttunk már ennél kisebb gyereke-
ket is, akik megpróbálták a mozdulaaikat a zene ritmusához igazítani). Phillips-Silver és Trainor (2005)
kimutatták, hogy még akár héthónapos kisgyerekek is érzékelik a különbséget a 2-es és a 3-as ütemmu-
tató között (bár ennek a kontrollja nem emberi kísérleti alanyokkal még várat magára). Mindezek fényé-
ben úgy tűnik, hogy az emberekben valamilyen különleges folyamat zajlik még a ritmusnak ezen a lát-
szólag elemi szintjén is.

3. A dallamstruktúra

A dallamstruktúra megtárgyalását azzal az észrevétellel kezdjük, hogy a nyugati zene összhang-


zattana nem reprezentálja a világ sok különböző, helyi hagyományokban gyökerező zenei stílusát. Más
stílusok vonatkozásában (legalábbis a nyugati zene széleskörű elterjedése előtti időszakot tekintve)
nem helytálló, ha a zenét dallam és kísérőakkordok együtteseként jellemezzük. Mai szemléletünk a
nyugati tonális összhangzattanról az európai középkorban kezdett kialakulni, s többé-kevésbé moder-
nnek tekinthető formáját a XVIII. századra érte el. A tonális összhangzattan XIX. és a XX. századi fej-
lődése inkább tekinthető a már létező rendszer kiterjesztésének, mint egy új rendszer létrejöttének.
3.1 A tonalitás és a „hangmagasság-tér”
A világ zenei stílusait nem az összhangzattan reprezentálja jól, hanem inkább a tág értelemben A zenei képesség: mi az,
vett tonalitás-érzet, amely nem követeli meg, és még csak nem is foglalja magába a harmóniai folyama- és mitől különleges?
tokat, s amelynek nem kell a jól ismert nyugati dúr és moll skálákon alapulnia (Nettl, 1973). A nyugati
összhangzattan ennek az alapvető tonalitás-érzetnek egy sajátságos kulturális terméke. Az ilyen érte-
lemben vett tonális rendszerben (mostantól csak egy tonális rendszerről fogunk beszélni), a hallgató a 27
zene minden hangját egy bizonyos rögzített hangmagassághoz, az alaphanghoz viszonyítva észlel. Az
alaphang szólhat akár folyamatosan is az egész darabon keresztül, mint például a duda vagy az indiai
rágákban a tambura által szolgáltatott orgonapont; de az alaphang lehet implicit (azaz megszólaltatás
nélkül beleértendő) is. Akár explicit, akár implicit az alaphang, úgy érezzük, stabil pont a zenemű dal-
lamában,; és a dallamok is tipikusan ezen a hangon érnek véget. Ahogy a moduláció folyamán a nyuga-
ti zenében történik, az alaphang időnként változhat a műben, illetve ideiglenesen egy helyi alaphang is
kiérezhető lehet az általános alaphanghoz képest. Egy alaphangnak a jelenléte megkönnyíti a feldolgo-
zást (Deutsch, 1999), és zenei megnyilvánulását képezi az eg y kategórián belüli kognitív referenciapont
általános pszichológiai alapelvének (Rosch, 1975). (Figyelemreméltó kivételt képez a tonalitás rendje
alól a XX. század eleje óta létező nyugati atonális zene – a zeneművészetnek egy olyan területe, mely-
nek egyik lényegi eleme a tonalitás-érzet kialakulásának meggátlása. Mi most ezzel a területtel nem
foglalkozunk.)
A tonális rendszer egy másik fontos eleme a hangmagasság-tér, amely az alaphang köré épül. A
legegyszerűbb esetben az alaphanghoz kötődő hangmagassági tér pusztán hangmagasságok halma-
za, mindegyik hangmagasság egy meghatározott hangköznyi távolságban (meghatározott frekven-
cia-arányban) helyezkedik el az alaphangtól. A zenészek ennek a térnek az elemeit hagyományosan
fölfelé vagy lefelé mutató sorrendben, zenei skála formájában adják elő, mint pl. a jól ismert dúr és moll
diatonikus skálák. Természetesen, maguk a dallamok egy skála elemeit végtelen sok különböző sor-
rendben szólaltathatják meg8.
Egy hangmagasság-tér az alaphang és a skála többi hangja közötti különbségeken túlmenően ál-
talában még több struktúrával rendelkezik. E további szervezettségnek az az érzékünk ad alapot, hogy
a hangmagasságok közötti távolságok nem csak pszichofizikailag, hanem kognitív értelemben – s egy-
úttal más mércével mérve – is mérhetőek. Például, C-dúr hangnemben a desz hang közelebb áll a C-hez
másodpercenkénti rezgésszám tekintetében, mint a D, azonban a D kognitív értelemben közelebb áll
hozzá (vagyis, a tonalitás szemszögéből közelebb), mivel a D része a C-dúr skálának, a desz azonban
nem. Hasonlóképp, C-dúrban az alaphang fölötti G kognitív értelemben közelebb áll a C-hez, mint
az F, amely pszichofizikailag közelebb áll, mivel a G egy konszonáns tiszta kvintet alkot a C-vel, míg
(a klasszikus összhangzattan hagyományai szerint) az F egy viszonylag disszonánsabb kvartot alkot a
C-vel. Mind kísérleti, mind elméleti alapon (Krumhansl, 1990, TPS, 2. fejezet), a kognitív hangmagas-
ság-térbeli távolságok hierarchikusan szerveződnek. Sőt, a hangmagasság-térbeli távolságok geomet-
riai térben is ábrázolhatók, multidimenzionális skálázás és elméleti modellezés segítségével, hagyomá-
nyos három- ill. négydimenziós geometriai struktúrák formájában. Még előzetes jellegű bizonyíték is
van arra, hogy ezen struktúráknak agyi korrelátumaik vannak (Janata et al., 2003). A hangmagassági
tér geometriai reprezentációjának vizsgálata azonban e tanulmány keretein túlmutat.

8 Lehetséges az is, hogy egy skála különböző hangmagasságokat tartalmazzon annak függvényében,
hogy a dallam épp emelkedik, vagy ereszkedik. Egy jól ismert példája ennek a nyugati melodikus
moll hangsor, mely megemelt hatodik és hetedik fokokat tartalmaz fölfelé menet, de leszállított ha-
todik és hetedik fokokat lefelé menet. Az is lehetséges, még ha szokatlan is, hogy a hangmagasság-so-
rozat nagyobb távot öleljen fel egy oktávnál, s hogy a fölső oktáv más hangközöket tartalmazzon,
mint az alsó. Erre példákat találhatunk Nettl (1960, 10. oldal) és Binder (1959, 85. oldal) munká-
jában; az utóbbi egy olyan skála, melyet amerikai zsinagógákban használnak a Tóra kántálására „on
Rosh Hashana and Yom Kippur”.
x x x x x
x x x x x x x x x x Egyenletes rács (Jambikus pentameter)

9
Tonika &8 œ œ œ œ œ œ œ œ œ

a
°
& œ
œ
Tonika ( )

28
& œ œ
œ
Tonika és Domináns

& œ œ
Terc
œ œ

& œ œ œ œ
Diatonikus skála
œ œ œ œ

& œ #œ œ #œ œ œ
œ # œ œ #œ œ œ #œ
Kromatikus skála

œ
¢&
Folyamatos hangtartomány
(glisszandó) œ

b
°
& œ
œ
Tonika ( )

& œ œ
œ
Tonika és Domináns

& œ œ
Terc
œ bœ

& œ œ bœ Œ bœ Œ œ
Diatonikus skála
œ bœ œ

Kromatikus skála & œ # œ nœ bœ nœ nœ #œ nœ bœ nœ bœ nœ œ

œ
¢& œ
Folyamatos hangtartomány
(glisszandó)

10. ábra Eg y sor a Yeats-ből, After Long Silence (Halle és Keyser (1971) nyomán)

a
##A# C11. ábraœ a dúr œ œ zene mindennapi
œ ésœa moll œskáláknakœa nyugati #œ œ gyakorlatában
œ
alkalmazott, meg-
Tonika ‰ œ
& terét mutatja. Hasonlóan ahhoz, amit a metrikai rács erős ütéseinél láttunk, az
szokott œ Œ
œ a hangmagasság,
œ
amely egy bizonyos szinten stabil, a következő, magasabb œ
œ szinten is megjelenik. A rendszer legfelső réte-
ge az alaphang. A következő réteg a tonikát (tehát az alaphangot) és a dominánst (tehát az ötödik fokot)
jegy‰ kvinttel œj van.
œ œföljebb j
b
### ‰ mely
tartalmazza,
œ azœalaphangnál
œ ‰ #œ sœmelyre,
A domináns a következő
‰ œ
legfontosabb hang-
Tonika &
magasság a halmazban, melyen œ
gyakran végződnek a félfrázisok, a œ
nyugati œ œ Œ
összhangzattanban, a
‰ œJa domináns
Œ ‰ A harmadik
Œ ‰ harmadik
rétegœa skála Œ Ófokát teszi hoz-
tonikán kívül a legfontosabb akkord, épül.
œJ J

a b
& œ œ œ œ œ œ œ œ
Tonika
œ œ œ œ œ œ
zá, hármashangzatot hozva létre, mely a harmonikus tonalitás alapvetőhangzása. A negyedik réteg tartal-
mazza a diatonikus skála többi hangját . Az ötödik réteg a kromatikus skálából áll, amelyben az egymás A zenei képesség: mi az,
melletti hangok mind félhangnyi távolságra vannak egymástól (a legkisebb hangköz a tonalitás hétközna- és mitől különleges?
pi gyakorlatában). A tonális dallamok gyakran alkalmaznak kromatikus hangmagasságokat diatonikus
hangok alterációiként, alapvetően diatonikus keretek között. A legalsó réteg a teljes hangmagasság-konti-
nuumból áll, melyből a glissandók és mikrotonális hajlítások fakadnak. A nyugati zenében általában nem 29
kottázzul a mikrointervallumokat, de az énekesek illetve azok a zenészek, akiknek a hangszerei ezt meg-
engedik (pl. a jazzben minden hangszer, kivéve a zongorát és a dobfelszerelést) gyakran használnak csúszá-
sokat és hajlított hangokat a hangok előtt vagy között, azok sajátos kifejezőerejéért.
A hangmagasság-tér rendszerező elve irányokat jelöl ki a dallamok számára: egy hangmagasság nem
csak az alaphang viszonylatában hallható, hanem több, stabil hang viszonylatában is, melyek között helyet
foglal a térben. Például, a 11a-b ábrákon, az F hang nem csak az alaphang fölötti kvartként hallható, hanem
egyúttal a domináns, G alatt egy lépésnyiként is, valamint a terc, E vagy esz fölötti egy lépésnyiként. A 11a
ábrán, a kromatikus diszt (vagy eszt), amely nem tartozik a skálához, a D és az E – a mellette lévő legköze-
lebbi, relatíve stabil hangok – viszonylatában észleljük. Egy, disz és E közötti „hasadékban” játszott hang ha-
misnak fog hallatszani, de ugyanezen a hangmagasságon nyugodtan keresztülhaladhat egy énekes vagy he-
gedűs, miközben épp egy csúszást tesz fölfelé az E-re, s ezzel semmiféle rendellenesség-érzetet nem vált ki9.
A hangmagasság-tér szerveződésének módja mekkora részben csak a zene sajátja? E kérdés megválaszolása
felé három nyomvonal vezet: az egyik a pszichoakusztikán keresztül, a másik az elvont kognitív tulajdonságokon ke-
resztül, a harmadik pedig a hangmagasság intonációban és a tonális nyelvekben való nyelvi használata segítségével.

3.2. Tonalitás és pszichoakusztika


Az emberek gyakorta énekelnek oktávpárhuzamban anélkül, hogy azt egyáltalán észrevennék: ös�-
szeillőnek érzünk két, egy időben megszólaló hangmagasságot, melyek egy oktávnyi távolságra vannak
egymástól (a frekvencia-arány 2:1). Ezzel szemben, két olyan egyidejűleg megszólaló hang, melyek egy
egészhangnyi (a frekvencia-arány 9:8 a „tiszta” hangolás esetén), félhangnyi (16:15), vagy egy kis szeptimnyi
(16:9) távolságra vannak egymástól, érdesnek, súrlódónak hat, és nehéz is őket kiénekelni. Más vertikális
intervallumok, mint a kvint (3:2), a kvart (4:3), a nagy terc (5:4) és a nagy szext (5:3) az észlelt disszonancia
tekintetében valahol az oktávok és a szekundok között helyezkednek el. Általánosságban azok a hangkö-
zök, melyeknek kis egész-számokkal kifejezhető frekvencia-arányuk van (pl. 2:1, 3:2), konszonánsabbnak
hatnak, mint azok, melyek frekvencia-aránya nagyobb egész-számokkal fejezhető ki (pl. 9:8, 12:11).
A teoretikusok az ókori görögországi püthagoreusokkal kezdődően gyakran magyarázták a kon-
szonáns hangközöket ezen kis egész-számokkal leírható arányokkal (eredetileg húrhosszak formájában).
Rameau-tól (1737) kezdve történtek kísérletek arra, hogy a konszonancia és disszonancia jelenségének
magyarázatát ne csak matematikai arányokkal, hanem fizikai törvényszerűségekkel is megalapozzák,
mégpedig a természetes felhangsoron keresztül. Tág értelemben szólva, a modern pszichoakusztika
szemléletmódja két összetevőből áll. Először is, a Helmholtz (1885) pulzálás-alapú disszonancia-elméle-
tének fiziológiai hátterét tovább finomították (Plomp & Levelt, 1965). Ha két spektrális hangmagasság
(vagyis az alaphangok és felhangjaik) egy közeli tartományba (egy kritikus sávba) esik a fül alaphártyáján
–, az auditív jel hallókéreg felé történő továbbítása során interferencia keletkezik, ami érdesség-érzetet
okoz. Másodszor, egy kognitívabb szinten, a hallórendszer megpróbálja a spektrális hangmagasságokat a
felhangsor-sablonhoz illeszteni, melyet a kisgyermekek már születésük előtt elkerülhetetlenül elsajátíta-
nak az emberi hang passzív befogadásával (Lecanuet, 1996; Terhardt, 1974). Azokat a hangközöket, me-
lyek beleillenek ebbe a sablonba, az ember azok közös „virtuális” alaphangjához képest hallja – s ez az, ami
a zeneelméleti értelemben vett alaphang pszichoakusztikai alapját adja. Egy akkord akkora mértékben
disszonáns, amekkora mértékben nem illik egy felhangsor-sablonhoz, miközben többszörös vagy nem
egyértelmű virtuális alaphangokat produkál.
9 Érdekes kérdés, hogy vajon a „blue” hang a jazzben, mely valahol az alaphang fölötti nagy és kis terc
között helyezkedik el (például, C-dúrban az E és esz között), tulajdonképpen egy teljes értékű skála-
hangnak tekinthető-e – Sargent (1964) elemzése szerint –, vagy egy konvencionálissá vált, skálán kí-
vüli hangnak. A skála többi hangjánál nagyobb mértékben, a „blue” hang instabil: az előadók jellem-
zően „játszanak a hangmagasságával”. R. Jackendoff, F. Lerdahl / Cognition 100 (2006) 33–72 47
A 11. ábrán látható két hangmagasság-tér általános szerkezetükben a pszichoakusztikai (vagy szen-
zoros) konszonanciát és disszonanciát tükrözi. A legkonszonánsabb hangközök a legfölső réteg soraiban
jelennek meg, az alatta következő rétegekben pedig az egyre disszonánsabb hangközök. Így az oktáv a leg-
fölső rétegben van, a kvint és kvart a második rétegben, a terc a harmadikban, a szekundok (egész és fél-
hangok) a negyedikben, és csupa félhangok az ötödikben.
30 Egy bizonyos zenei stílus hangmagasság-tere azonban nemcsak szenzoros disszonanciát tükrözhet
– amely, ha nem evolúciós léptékben nézzük, akkor változatlan –, hanem zenei disszonanciát is, amely
a szenzoros bemenettől csak részben függő kulturális termék. Íme két olyan eset, amelyek nehézséget
okoztak azon teoretikusoknak (mint pl. Hindemith, 1952 és Bernstein, 1976), akik megpróbálták a to-
nális struktúrát teljes egészében a felhangrendszerből levezetni: (1) A 11a-b ábrák második rétegében, a
kvart (a G és a felső C között) azonosnak tűnik a kvinttel (az alsó C és a G között), miközben a szabvá-
nyos tonális gyakorlatban a kvartot disszonánsabbnak tekintjük; (2) a harmadik rétegben, a 11a ábrán lát-
ható dúr hármashangzat (C-E-G) és a 11b ábrán látható moll hármashangzat (C-Esz-G) szerkezetileg ek-
vivalensek bár a moll hármashangzat nem vezethető le könnyen a felhangsorból és disszonánsabb, mint
a dúr hármashangzat. De ezek csak kis részletbeli igazítások a kultúra részéről. Ha az ellenkező végletet
vesszük, ritkán fordulhatna elő, hogy egy kultúra stabil harmóniákat hozzon létre három, egymástól fél-
hangnyi távolságra lévő hangból. A kívánt stabilitás és az észlelt disszonancia közötti ellentmondás túl
nagy lenne ahhoz, hogy életképes legyen. A kultúrák általában kiaknázzák a szenzoros konszonancia és
disszonancia közti különbségtétel lehetőségét – tág értelemben véve mindenképp.
A hagyományos nyugati tonalitás nagyobb mértékű konvergenciára törekedett a szenzoros és a zenei
faktorok között, mint sok más kultúra. A balinéz gamelán zenét például nagyrészt olyan fémhangszereken
játsszák, amelyek nem harmonikus spektrumokat produkálnak (vagyis, olyan felhangokat, melyek nem
egész számú többszörösei az alaphangnak). Következésképp, a balinéz kultúra nem törekszik magas fokú
konszonanciára, és viszonylag nagy eltéréseket tolerál a hangközök hangolásában. Ehelyett, az egyszerre
megszólaló hangok által keltett csillámló hangszínt értékelik, amelyet optimális intenzitású lüktetés hoz
létre (Rahn, 1996). A nyugati tonalitás és a balinéz gamelán zene egymással szembenálló példái illusztrálják,
hogy a mögöttes pszichoakusztika hogyan befolyásol, ámde nem diktál egy bizonyos zenei mondattant.
A pszichoakusztikai tényezők a zenének nemcsak a vertikális, hanem a horizontális vonásaira is ha-
tással vannak. Huron (2001) ezt a nyugati kontrapunktika hagyományos szabályaira vonatkozóan mutatta
ki. Például, az oktáv- és kvintpárhuzamokat kerülni kell, mert az ennyire konszonáns hangközt alkotó szó-
lamok párhuzamos mozgása hajlamos eggyé olvasztani a két szólamot, ami ellent mond a független polifó-
nikus szólamvezetés nyugati kontrapunktikában uralkodó ideáljának. (A kvintpárhuzamban énekelt dal-
lamoknak „középkori” hangzása van a mai nyugati fül számára.) A párhuzamosan mozgó tercek és szextek,
melyek mindennaposak a modern nyugati dallamok harmonizációjában, azért elfogadhatóak, mert ezek a
hangközök kellőképp disszonánsak ahhoz, hogy az egybeolvadást meggátolják, de nem annyira disszonán-
sak, hogy érdesség-érzetet okozzanak. Azon kultúráknak viszont, amelyek nem törekszenek polifonikus
ideál elérésére, nem szükséges beépíteniük ilyen szintaktikus tulajdonságokat a zenei stílusaikba.
A hangközök érdessége/disszonanciája csak a hangok eg yidejű megszólalására vonatkozik, és sem-
mit sem mond, arról, hogyan szólalnak meg egymás után egy dallamban. Mivel a nem-nyugati és pre-mo-
dern tonális tradíciók körében ritkák az összhangzattani rendszerek, az eg ymás utáni (szekvenciális) meg-
szólaltatás legalább ennyire hozzátartozik a tonalitás pszichológiai „természetességének” kérdéséhez. A
kis hangközök, mint az egész- és a félhang, harmóniailag érdesek. Ám egy dallam kontextusában az ilyen
hangközök a leggyakoribbak, a legstabilabbak, legkevésbé kiugróak, és a legkevésbé erőteljesek. Ezzel
szemben, bár az oktáv, mint hangköz, maximálisan „sima” és konszonáns harmóniai értelemben, az oktáv-
lépések viszonylag ritkák és igen jellegzetesek egy dallam részeként (például, a Somewhere Over the Rain-
bow c. szám figyelemfelkeltő nyitóugrása).
A kis dallambéli hangközlépések természetessége részben két általános alapelvből következik, me-
lyekből mindkettő a viszonylag kis frekvenciakülönbségeket részesíti előnyben a kis egész-számokkal leír-
ható frekvenciaarányokkal szemben. Az egyik: az éneklésben vagy más vokális műfajban egy kis hangma-
gasság-változást fizikailag könnyebb megvalósítani, mint egy nagyot. A másik: a melodikus percepcióra is
érvényesül a folyamatosság alaklélektani elve. Egy melódia, mely mértéktartóan lépked az egyik hangma-
& œ œ œœ
Terc
Tonika és Domináns
œ œ œ

& œ œ œ œ œ œ œœ
Diatonikus skála
Terc
œ œ bœ

Œ œ œœ
gasságról a másikra, perceptuális értelemben párhuzamban áll az állóképek lejátszásakor észlelt látszóla-
gos mozgással; egy nagyobb
Kromatikus
Diatonikus &
œ œ egy
skála hangközlépés
#œ nagyobb, #œœ œbœ #œ Œfelelœbmeg,
œœ œ mozdulatnak
bœ #œ látszólagos
œ#œ (Gjerdingen, A zenei képesség: mi az,
1994). Egy olyan hang, amely nagy hangköznyi távolságra van a dallambéli környezetétől, perceptuálisan és mitől különleges?
elkülönül, különösen, ha az összeköthető más, szintén elkülönült hangokkal ugyanabban a hangmagas-
skála & nœ b„kiugrik”
bœ hang
nœ mély œœ
œ nœ a dallam-
bœábrán
nœa 12a nœ #œextrém
nœ a három,
Folyamatos hangtartomány
œ # œœ
ság-tartományban
Kromatikus (Bregman,
(glisszandó) ¢ 1990). Például,
ból, s együttesen egy második, független szólamként észleljük őket, a 12b ábrán látható módon. 31
Azok a tényezők, amelyek miatt a dallamokban inkább a kis hangközlépéseket kedveljük, nem kizá-
œ
(glisszandó) ¢& œ
rólagba zenehangtartomány
Folyamatos sajátjai. Folyamat-izoláció megy végbe nem-zenei auditív ingerek esetében és zeneiek esetében
egyaránt. A vizuális területhez ° hasonlóan,
&(Scharf,( œQuigley,
az auditív percepció a pszichofizikailag közeli hangmagasságok-
œ
ra fókuszál, illetve figyeli azokat
Tonika ) Aoki, Peachery, & Reeves, 1987). Hasonlóképp, a beszélt
nyelvben is jelentősebb a nagy frekvencia-különbségek megkülönböztető funkciója, mint a kicsiké.

œ œ œ œ
a
# #Tonika ésœDomináns
œ œ &œ #œ œ œ œ œ
Tonika &#C‰ œ œ œ Œ
œ œ
œ
& œ œ j œ
b
## j œ bœœj
œ œ œ œ ‰ œ ‰ #œ œ
Terc
‰ œ œ Œ
Tonika &# ‰ œ œ
‰ œ Œ ‰
œJ Œ œJ b‰œ ŒŒ bœ Ó
& J œ bœ œ œ Œ œ
œ
Diatonikus skála

12. ábra. Részlet Mozart Klarinétkvintettjének 4. tételéből , (a) ahog y a kottában szerepel, (b) ahog y halljuk

& nœ bœ nœ bœ nœ œ
3.3 A tonalitás kognitívœjellemzői # œ nœ bœ nœ nœb #œ
a Kromatikus skála

& Aœhangmagasság-terek œ œ további, œ


œ kognitív œ is, egy
œis van.œElőször
Tonika
œ elemei œ œ struktúrájának œ œ helyezkednek
vonatkozású fontossága
œ egyenletesen
hangmagasság-tér
Folyamatos hangtartomány
tipikusan aszimmetrikusan,
& œ 1999). Például,
ám majdnem el œ
(Balzano,
1980; Clough, Engebretsen, k2 ¢& Kochavi,
(glisszandó) k2 a 11. ábrán a domináns hang k3 (a G) az k3 oktávot nem
c d illeti, amelyek alapján mérjük a hangkö-
œ
két félre, hanem majdnem két félre osztja (ami a œfrekvenciaarányokat
œ
& #œ œ œ
œ van az alsó alaphang fölött, és egy kvarttal a fölső œ œ
Tonika zöket): œegy kvinttel œ œalatt. Aœ 13a ábrán látható di-
œ alaphang
atonikus dúr hangsorban a félhang-lépések egyenetlenül oszlanak el a két ill. három egészhang-lépés között.
### C aœ13b œábránœ láthatóœpentatonœskálaœ az œegészhang-lépések
a
Hasonlóképp,
œ és kis tercek
#œ egy,
aszimmetrikus kombi-
k2 bőv.2 k2 k2
‰ œ œ és klezmer
Tonika &
nációjából épül fel. A 13c ábrán látható konfigurációt tartalmazza a zsidó liturgikus œ œ Œzenében
gyakran használt skála,, az Ahava raba,œvagy más néven Fregish. Ez a skála félhangokat,
œ
œ egész hangokat és egy
bővített szekundot használ. Ezzel szemben azok a rendszerek, amelyek az oktáv egyenlő részekre való fel-
b
### ‰ œ œ°elosztott
osztásával
œ j
épülnek fel, mint pl. a hatj hangból állóœ egészhangú
œhallgatót œ ‰ œj œ való tájékozódásban
skála, ritkák a „természetes” zenei stílusokban.
œ hangközök
œ œ‰ ‰ #œa hangmagasság-térben Œ
&
Az
Tonika &
aszimmetrikusan segítik a œ œ
œ ‰ egyœJ fizikai
Tonika
Œ térben.‰ (Képzeljük
œJ Œ más megkülönböztető
csak el, hogy‰ megpróbálunk
Œ Ó tájékozódni
( )
(Browne, 1981), épp, ahogy tennék
œJ
egy egyenlő oldalú hatszög-alapú szobában, melynek semmilyen tulajdonsága nincs; a
látvány ugyanaz lenne mindegyik sarokból nézve. De ha a szobának egyenlőtlen hosszúságú oldalai lennének,
Tonika és Domináns & œ œ
aszimmetrikusan œ sarokból egyedi lenne a kilátás.)
elosztva, minden
a b
& œ œ œ œ œ œœ
Tonika
œ Tercœ & œ œ œ œ œ œœ œ œ
k2 k2 k3 k3
œ œœ
c d
skála &
œ œ #œ œ œ
& Diatonikus œ œœ œ œœ œ
œ
œ
œ œ
Tonika
œ œ

& œ # œ œ #œ œ œ #œ œ #œ œ bœ nœ œ
k2 bőv.2 k2 k2
Kromatikus skála
¢
13. ábra. Példák a skálaterekre (a) diatonikus skála, melyben C a tonikus hang, (b) pentaton skála, melyben C a tonikus
hang, (c) Fregish skála, melyben E a tonikus hang, (d) eg yenetlensége miatt ritkán használt skála

& ( œ)
a °
° ####œ
Tonika
œ)
Tonika &
œ
(

Tonika és Domináns & œ œ


####œ œ
Tonika és Domináns & œ
°
& œ
œ
Tonika ( )

& œ œ
œ
Tonika és Domináns

32
& œ œ
Terc
œ œ

& œ œ œ
Diatonikus skála
œ œ œ œ

œ bœ nœ œ
Kromatikus skála
¢& œ #œ œ #œ œ œ #œ œ #œ

14. ábra Példa rosszul kialakított hangmagasság-térre


Aszimmetria viszonylagos egyenletesség nélkül azonban már nem kívánatos: a 13d ábrán látható
tereta nem kedveljük, mert meglehetősen egyenetlen, olyan lépésekkel, melyek már kihagyásoknak érződ-
nek az F és A, valamint az A és# C között. Egy nagymértékben preferált hangmagasság-tér, mint amilyenek
ábrákon&
## # a hangjait
° láthatóak, ( œminden
œ
a 11. és a 13a-bTonika ) rétegében aszimmetrikusan osztja el, azonban olyan
egyenletesen, amennyire csak lehetséges az aszimmetria adta lehetőségeken belül.
A hangmagasság-terek második kognitív jellemzője a 11. ábra szigorú rendszerében rejlik: mindegyik
Tonika és Domináns &
réteg az ###
alatta lévő rétegből#választott œ teljes választékából épülnek
hangokból áll. Így a skálák a hangok œ fel, az
œ
akkordok a skálahangokból, az alaphangok pedig vagy a skálákból, vagy az akkordokból kerülnek ki, attól füg-
gően, hogy a szóban forgó stílus használ-e akkordokat. Így például a 14. ábrán látható hangmagaság-tér kialakí-
Terc &
### hármashangzatban,œ amely ugyanakkor
tása rossz, mert van egy G a#tonikai œ
œ nem tagja a diatonikus skálának.
10

œ
A tonális hangmagasság-terek két további kognitív tulajdonsága is szerepet játszik a dallamok szer-
veződésében, és némileg részletesebben is meg fogjuk őket vizsgálni a 3.5. alfejezetben. Az első ilyen tu-
#### œ œ
nœa kialakulását.
œ elmozdulás
lajdonság, hogy a hangmagasság-tér lehetővé teszi a feszültség és az oldódás érzetének Az
Diatonikus skála &
alaphang az otthon, a¢maximális oldódás œ œ Az œalaphangról
helye. œ történő – akár melodikusan,
akár harmonikusan, vagy egy másik hangnembe való moduláció által – a feszültséget növeli, az alaphang
felé való elmozdulás pedig oldódást hoz létre (TPS, 4. fejezet). Mivel a zene feldolgozása hierarchikus, a
b
# ## 12 és oldódások különböző j j ej ejjönnek létre. A második j ej ilyen
feszültségek mozzanatai a zenei struktúra számos szintjén párhuzamosan zajla-
#
& melynek 8 œeredményeként œ j tulajdonság,
J œ
nak, e finoman kimunkált mintázatok
J vonzás érzetét táplálja (TPS, 4. fejezet; Larson, ne 2004). Egy
™ e
Ϫ hang
Tonika e ™ e ™
hogy a hangmagasság-tér a tonális e instabil
hajlamos egyIközeli, stabilabb,
once hadrögtön utána következő
a GIRL hang felé
or should I vonzódni
SAY (Brarucha,
she once1984,
had 1996).
ME A to-
c vonzások pedig elvárásokat szülnek. A hallgató azt várja el egy hangtól vagy akkordtól, hogy annak
#### az™ irányábae mozduljonjel, amelyik a legerősebben
nális
a& œ e œ œ™ j ej ejvonzza. Ha így tesz, j
j azeelvárásj teljesül; ha vi-
Tonika
hangnak
J œ œ
szont nem, akkor az elvárásJsem teljesül (lásd még: Meyer, 1956; Narmour, 1990).
™ nœ A feszültség
œ ésœ™a vonzás
általában fordított
I arányosságban
once had A állGIRL egymással:OR egy should
stabil hang
I felé való elmozdulás
SAY SHE once csökkenti
HAD ME a feszültsé-
get, ugyanakkor növeli az elvárást, hogy a stabil hang elérkezzen.
Hogy az eddigieket összegezzük, a pszichoakusztika a tonalitás és a hangmagasság-struktúra vizs-
gálata számára egy felülírható, kulturálisan nem kötelező érvényű alapot szolgáltat. Különösen a kis
a
#### a kis
egész-számokkal leírható frekvenciaarányok eredményeznek b viszonylagos szenzoros konszonanciát;
j j
&
azonban ˙ frekvencia-különbségek j
(melyek harmóniailag
œ
érdesek) e segítikœja dallam˙ folytonos-
inkább
œ
Tonika e e
ságát. Ugyanakkor a hangmagasság-tér néhány absztrakt kognitív tulajdonsága összefügg a kogníció más
I girl say me or should I say
10 A hangmagasság-terek mögöttes szerkezete hasonlít a metrikai rácsokhoz (lásd a 3. ábrán lévő rá-
csot), eltekintve attól, hogy a nyugati zenében az ütések közötti időintervallumok tipikusan egyen-
lőek, ellentétben a hangmagasságok közötti különbségekkel. A nyugat-afrikai dobzenében azonban
vannak olyan ritmikai alapmintázatok, melyek megfeleltethetőek a diatonikus és pentaton hangso-
rok aszimmetrikus struktúráinak (Pressing, 1983; Rahn, 1983). Így ennek a tonális struktúra nélkü-
li stílusnak a ritmusvilága az, ami bizonyos mértékig más stílusok tonális rendszereinek strukturális
gazdagságával párhuzamba állítható.

# # 12 œ œ œj œ ™ j œj œj j
Tonika & # # 8 œ™ j œ j Œ™
területein megtalálható tulajdonságokkal. A hangmagasság-terek tipikus aszimmetriája lehetővé teszi a
hallgató számára, hogy könnyebben tájékozódjon az alaphanghoz képest; a hangmagasság-tér hierarchi- A zenei képesség: mi az,
kus szervezettsége pedig megteremti a lehetőségét a tonális vonzás, feszültség és oldás érzetének. és mitől különleges?
Ugyanakkor szinte minden zenei stílus hangmagasságbeli szervezettsége olyan szinten egyedi és ös�-
szetett, hogy az már messze túlmutat ezeken az általános hatásokon. A pszichoakusztikai megfontolások
például önmagukban nem adnak magyarázatot arra, hogy a zene miért egy fix hangmagasságokból álló, to- 33
nális hangtérré szerveződő hangokból áll. Sőt: bár a közelség és a folytonosság általános alaklélektani elvei
állnak, amögött, hogy a kis melodikus hangközlépéseket kedveljük inkább, ezek az elvek nem adnak ma-
gyarázatot arra, hogy miért épp az egészhang és a félhang hangközei olyan uralkodóak világszerte a zenei
stílusok meloldikus szerveződésében. Arra következtetünk, hogy az elmében/agyban kell lennie a pszicho-
akusztikai alapelveknél valami speciálisabbnak, amely felelős a tonalitás létezéséért és szerkezetéért.

3.4 Dallamstruktúra és a nyelv


Lehetséges-e, hogy ez a pluszban hozzáadódó speciális tulajdonság valami olyasminek a következ-
ménye, ami mindettől függetlenül a beszélt nyelvhez szükségeltetik (ahogy azt a metrikai struktúra ese-
tében megállapítottuk)? Két nyelvi jellegzetesség emlékeztet a zenei hangmagasságra. Először is, a prozó-
diai dallamgörbék (a mondatok és az egy levegőre vett csoportok a mondatokon belül) tipikusan lefelé
ívelnek az adott egység vége felé tartva, kivéve néhány esetet, mint például az eldöntendő kérdések fel-
felé ívelő intonációját az angol nyelvben. Ezek a dallamgörbék párhuzamba állíthatók a melódiák tipikus
alakjával, amely szintén hajlamos lefelé ívelni a frázisok végén, ahogy pl. a 3-6. ábrákon láthattuk. (Huron
1996-ban statisztikailag is alátámasztotta ezt a tendenciát, egy nagy, európai népdalokat tartalmazó adat-
bázis segítségével.) Egyébként a nem-nyelvi felkiáltások szintén ilyen lefelé mutató intonációt mutatnak –
és nem csak embereknél (pl. Hauser & Fowler, 1991). Ebből arra következtethetünk, hogy a dallamvonal
bizonyos aspektusai zenén kívüli tényezőkből származnak.
A prozódiai dallamgörbék azonban nem különálló hangok sorozatából állnak, ahogy a dallamok,
még akkor sem, amikor nagy hangmagasság-intervallumon ívelnek át. A beszédhang magasságára az jel-
lemző, hogy folyamatosan magas és mély pontok között ingadozik. Az intonációról szóló jelenlegi beszá-
molók (Beckman & Pierrehumbert, 1986; Ladd, 1996) a prozódiai dallamgörbéket kitüntetett, magas és
mély hangok közötti átmenetként vizsgálják, tehát az intonációt olyan hangmagasság-térben kezelhetjük,
amelynek egyik rétege (a) a magas és a mély hangokból (melyek közül a mély talán az alaphang), a másik
pedig (b) az általuk közrefogott hangmagasság-kontinuumból áll. A magas és a mély hangoknak azonban
még így sincs rögzített frekvenciájuk ahhoz hasonlóan, ahogy a domináns és a tonika hangoknak fix he-
lyük van a hangmagasság-térben.
Egy másik nyelvi jellegzetesség, mely analóg lehet a zenei hang-térrel, az a hangmagasságok haszná-
lata a tonális nyelvekben, mint pl. a kínaiban és sok nyugat-afrikai nyelvben (Yip, 2002). A tonális nyelvek-
nek van egy hangokból álló repertoárjuk, melynek elemei (magas, mély, néha középmagas; néha különbö-
ző fajta emelkedő, ill. ereszkedő hangok) elválaszthatatlan részét képezik a szavak kiejtésének. E hangok
egy olyan fix halmazt alkotnak, amely a tonális zenében használt hangmagasság-térhez ill. skálákhoz ha-
sonló szerepet játszik. De az analógia nem pontos. A hangokon ugyanis intonációs dallamgörbe ível át,
úgy, hogy a használt hangok teljes spektruma – a magastól a mélyig – fokozatosan lefelé csúszik a frázis
folyamán. Sőt, a lefelé csúszás folyamán a magas és a mély hangok közti frekvenciaarány szintén csökken
(Ladd, 1996; Ladd, személyes kommunikáció). A zenében ennek az lenne a meglehetősen valószínűtlen
megfelelője, hogy szól egy dallam, melyben nemcsak a hangmagasságok csúsznak fokozatosan lefelé a frá-
zis előrehaladtával, mintha egy analóg felvételt lassítanánk le, hanem ezzel együtt a hangközök is zsugo-
rodnának, az oktávok kvintekké, a kvintek tercekké, és így tovább. Tehát sem a hangmagasságok, sem a
köztük lévő távolságok nem rögzítettek a tonális nyelvekben, míg a zenei hang-terekben igen.
A nyelvvel való iménti összehasonlítás megerősíti az előző alfejezet végén megfogalmazott követ-
keztetést. Bár a zenei hangmagasság néhány tulajdonsága általánosabb kognitív képességekből eredez-
tethető, van egy alapvető fontosságú szempont, mely a zenének sui generis (önálló, egyedülálló; kategóri-
ateremtő értékű) sajátossága: egy rögzített hangmagasságokból álló halmaz léte mindegyik zenei hangnem
számára, melyekben a hallgató mindegyik hangmagasságot egyrészt az alaphanghoz viszonyítva, másrészt
– a hang-tér több különböző rétegére is nézve – szomszédos hangmagasságokhoz viszonyítva érzékeli.
& œ œ œ œ œ œ œ œ
Tonika
œ œ œ œ œ œ
k2 k2 k3 k3
c d
œ œ œ œ œ
& œ œ #œ œ œ œ œ œ
œ
Tonika

E jellegzetességek
k2 bőv.2 k2
némelyikétk2provizórikusan már igazolták neurofiziológiai bizonyítékokkal. Úgy
tűnik, két különböző agyi alrendszer foglalkozik a hangmagassággal: az egyik a hangmagasság dallam-
görbéivel, a másik a rögzített hangmagasságok és hangközök felismerésével foglalkozik. Az előbbi káro-
sodása intonációs zavarhoz vezet a zenében és a nyelvben egyaránt; az utóbbi sérülése kihat a zenére, de
megkíméli a nyelvet (Peretz, 2001). Ez a bizonyíték azt sugallja, hogy van valami különleges a fix hangma-
34 gasságok és hangközök ° észlelésében.œ A tonalitás bonyolultabb aspektusainak agyi vonatkozásai még fel-
&Janata et(al.,)2003).
fedezésre várnak (de lásd: œ
Tonika

3.5 A dallamok hierarchikus szerkezete


& œ œ
œ
TonikaEddig csak hangmagasságok és hangközök azon halmazáról beszéltünk, melyekből a dallamok felépül-
és Domináns
nek. Most néhány olyan strukturális alapelv felé fordítjuk figyelmünket, melyek a hangok sorozatából dallamo-
kat hoznak létre. Ehelyütt figyelmen kívül fogjuk hagyni a harmóniameneteket és modulációkat, mivel azok túl
&szempontjából; ezek egyébként œ œ
bonyolultak a jelen célunk
Terc
œ œ nem is vonatkoznának a világ legtöbb zenei stílusára.
A Norwegian Wood első frázisa, annak változatlan tonikai harmóniájával ismét hasznos példá-
val szolgál. E dallam megértése több annál, mint hogy pusztán hangok sorozatát hallanánk. A dallam ka-
œ œ
rakterét a hosszú
Diatonikus & határozzák
hangok
skála
œ œ œ œ melyek az E-dúr œhármashangzat hangjait
meg („I…girl…say…me”),
– H-Gisz-E-H – szólaltatják meg. Ezek a meghatározó hangok viszonylag stabil pontok, mivel a tonikai
akkord rétegéhez tartoznak az E-dúr hangmagasság-terében, melyet a 15a ábra mutat (egy leszállított szep-
#œ œúgybœészleljük,
nœ mint œ egy-
timmel, disz helyett
Kromatikus
¢& a dalœmodális
skálaD-vel,
# œ œ #œ œ œ hangjait
színezete miatt). A œfrázis#œrövidebb
fajta átvezetést az egyik meghatározó hangról a másikra; például, a Cisz-H-A („once had a”) a dallamot a
H-ról („I”) a gisz-re („girl”) juttatják el. Ennek elemzése a 15b ábrán látható; az ívek a meghatározó hangok
által bejárt akkordfelbontást kötik össze, az összekötő hangokat pedig kisebb hangjegyekkel tüntettük fel.
a
° #### œ)
Tonika & œ
(

## œ
Tonika és Domináns &## œ œ

## œ
Terc &## œ œ œ

#### œ nœ œ
& œ œ œ œ
Diatonikus skála
¢ œ

b
# # 12 j j j j
& # # 8 Ϫ
j j j
J
e
J
e Ϫ Ϫ ne Ϫ
Tonika e e e e e
e
I once had a GIRL or should I SAY she once had ME
c
## j j j j j
& # # Ϫ J
e
J
œ œ™ œ e œ™ nœ
j e j
œ œ™
Tonika e e
I once had A GIRL OR should I SAY SHE once HAD ME

15. ábra. (a) Az E-dúr hangmagasság-tere leszállított szeptimmel; (b) a Norwegian Wood első frázisának strukturális
elemzése, amely azt mutatja, hog y a fő hang jai eg y ereszkedő hármashangzatot alkotnak; (c) a (b) kidolgozása olyan módon,
a hog y a fő hangok eg y ereszkedő diatonikus
b skálát alkotnak
## ˙ j j j
& #Az# átmeneteken j
œ œ első meghatározó
˙
belül további
œ
Tonika e szervező
e elv is létezik, melyet a 15c ábra
e mutat. Az
hangról, a H-ról,
I a másodikra, agirl
giszre való
say átmenetnek
me a legközvetlenebb
or útja az A-nI keresztül
should say vezet – ez
pedig pontosan a közöttük lévő hang a hangmagasság-térben egy réteggel lejjebb. És valóban, ez a hang
## œ
Terc &## œ œ œ

#### œ nœ œ
& œ œ œ œ
Diatonikus skála
¢ œ
van jelen az cisz-H-A átmenetben (az „a”) szón. Következésképp azt mondhatjuk, hogy az A hang az át-
menet lényegi eleme, a cisz és H viszont csak díszítőelem. Ugyanez a megkülönböztetés másképp is meg- A zenei képesség: mi az,
világítható:
b ha csak az A maradna benne és a másik két hangot kivennénk, akkor egy sima, lefelé irányuló és mitől különleges?
###hallanánk j
# 12 œ ™ H-ról egisz-re.e A hangmagasság-térben j j erők olyan iránybanj hatnak, hogy az A
j működő
œ ™ hangnejközötte (giszj és E), megta-
lépést
a&gisz felé8vonzódik. Hasonlóképp,
J J e a második œ ™ és harmadik
e e meghatározó e œ™
Tonika e
láljuk a közvetlen átvezető hangot, a fiszt (az „or” szó), amelyet két díszítőhang követ. A harmadik és ne- 35
I once had a GIRL or should I SAY she once had ME
gyedik
c meghatározó hang között, a dallam két lépést tesz, hogy az E-ről („say”) lefelé a H-ra („me”) jusson;
itt a#D##(„she”)
# œ ™ és a cisze („had”) j is szükséges azj átmenethez,
j j és csak az A („once”) j a díszítő hang.11 A
&
hang
œ œ œ együttesen egy ereszkedő j j A dallam az
meghatározó hangokJ és a lényegi
J œ™ nskálát
œ adnakœki.
e
Ϫ
Tonika ™
átvezetőhangok e e e
absztrakció különböző szintjei szerint szerveződik: egy viszonylag absztrakt szinten egy tonikai hármas-
I once had A GIRL OR should I SAY SHE once HAD ME
hangzatot rajzol ki; egy másik szinten, a felszínhez közelebb, egy ereszkedő skálát ad ki. A dallamnak azt a
hangját, mely absztraktabb szintekhez tartozik, az ember viszonylag stabil hangnak hallja, olyan pontok-
nak, amelyek köré a többi hang csoportosul.
a
##
b
j j j
&## ˙ j
œ œ ˙
œ
Tonika e e e
I girl say me or should I say

16. ábra. (a) Hierarchikus differenciálás (a) a 15b ábrán látható ereszkedő hármashangzat, illetve (b) a frázis harmadik
alcsoportja esetén
Ezt a struktúrát még tovább részletezhetjük. Ha teljes egészében nézzük, úgy halljuk, hogy ez a frá-
zis a magas H-ról („I”) indul és az egy oktávval alatta lévő H-ra („me”) jut el. A gisz és az E köztes megatá-
rozó hangok átvezető hangok ebben az oktávnyi ereszkedésben, ahogy a 16a ábra mutatja. (Ezen a kottán
a ritmusértékek nem hanghosszúságokat, hanem strukturális fontosságot jelölnek: minél nagyobb a rit-
musérték, annál stabilabb a hang.) A hierarchia legalacsonyabb szintjét vizsgálva, vegyük a fisz-A-gisz-E
(„or I should say”) hangokból álló kis csoportot! Már megállapítottuk, hogy a két középső hang, az A és a
gisz, díszítőelemként funkcionál a lépésben ereszkedő fisz-E vonalhoz képest. Azonban a hangok ennél is
# 12 különböztetve
jobban meg#vannak j j œj œj átmenet stabilabb, j mint a fisz-a-e,
& # # Így,
egymástól, mivel a fisz-gisz-e ebben
8 œa kettő œ œa gisz œ œ œ j œ j Œ
J J œ nœ
™ közül ™ fisz-ről a
a kontextusban. a lényegesebb, az A-t pedig díszítésként
œ œ™
értelmezhetjük a
Tonika ™ ™
gisz-re való átmenet Isorán. once
Ezt ahad
16b ábra
a girl
mutatja.or should I say she once had me
Ez az elemzés azt illusztrálja, hogy egy hang stabilitását nem kizárólag a magassága alapján határoz-
hatjuk meg. Ugyanaz a hangmagasság más és más szerepet játszhat a dallam különböző pontjain, a szom-
szédos hangokkal való viszonya pedig – az absztrakció minden szintjén az alacsonytól a magasig – alapve-
tő fontosságú. Például, a Norwegian Wood-ban a gisz először meghatározó hangként („girl”), majd később
díszítőhangként („I”) jelenik meg. Az első esetben átvezetés a szerepe az oktávon átölelő, nagy ívű moz-
gás számára: a legközvetlenebbül a H-hoz és az E-hez, mint szomszédos meghatározó hangokhoz kötő-
dik, ahogy a 16a ábrán látható. Abmásodik
bC ˙ ˙ Œ œ ˙ E, mintœ meghatározó
œ œ œ œ bœ nœ œ ˙ œ bœ ™ œ
esetben azt a szerepet tölti be, hogy átmenetként szolgáljon a
fisz, mint&„lényeges” átvezető hang, ésbaz
Tonika hang között; a fisz-ről a köztük lévő, még
inkább díszítő Mifunkciót ellátó A-nma
- chelle keresztül
belle, jutunk el rá,words
ese are ahogythata 16bgoábrán
to - látható.
ge - ther well. My Mi- chelle
Ennek az elemzésnek az eredménye egy hierarchikus, rekurzív szerkezet, melyben a dallam min-
œ b3œ kötődik œ ˙ ™ Az egymáshoz
œ 3œa struktúrában. bœ kötődőœ hangoknak nem
Œ ‰ œ œ œ ‰ œ œ
den hangja nála stabilabb hangokhoz
Tonika &b ˙ J bœ bw
I love you, I love you, I love you, at's all I want to say.

11 Megjegyzendő, hogy az A („once”) hang annyira kiugrik a többi közül, hogy bár díszítőelemnek is
tekinthető az átmenetet képező lényeges hangok között, az ember mégis egy bizonyos fokig önálló
tartalommal bíró mozzanatként is érzékelheti. A főhangokat körbefolyó ornamentika helyett inkább
gesztusszerű mozdulatként hat, mely jelentős mértékben „kikacsint” a lefelé lépkedő szólam vona-
lából, egy olyan érzékeny pontot hozva létre, mely az egész dallam arculatát döntő mértékben meg-
határozza. E részlet újabb példát szolgáltat arra, hogy a dallamok – és egyéb zenei mozzanatok – az
emberben mennyire sokszempontú, komplex módon kerülnek értelmezésre – a fordító.
a
##
b
j j j
&## ˙ j œ œ ˙
œ
Tonika e e e
I girl say me or should I say
kell szomszédosnak lenniük a zenei felszínen, azonban szomszédosnak kell lenniük az absztrakció valame-
lyik szintjén. Ez a fajta szerveződés, melyet zenetudományi körökben gyakran hangredukciónak12 hívnak
(Schenker, 1935 tanulmánya nyomán), a GTTM fa-szerkezetként ábrázolta; lásd a 17. ábrát.

36

# # 12 œ œ œj œ ™ j j j j
& # # 8 œ™ J J œ œ œ œ™ nœ
j œ j Œ™
œ œ™
Tonika

I once had a girl or should I say she once had me


17. ábra A Norwegian Woon hang jainak hierarchikus faszerkezete

Minél magasabb ponton kapcsolódik a fához egy hang ága, annál fontosabb szerepet játszik a hang
a dallam vázszerkezetében; illetve minél alacsonyabb ponton kapcsolódik az ág, annál ornamentálisabb
(díszítésszerűbb).13
A redukciós struktúra szerepet játszik a feszültség és oldás mértékének meghatározásában egy adott
˙ ˙ egyŒviszonylag
& bACredukcióban bœ b˙ stabilœhangœ– az,œamelyik
dallamban.
Tonika œ bœ nœmagasan
œ viszonylag œ ˙csatlakozikœ bœ ™a fához
œ
– egy viszonylagMioldott pontot
- chelle
jelöl ebben a dallammenetben. Egy relatíve instabil hang – olyan,
ma belle, ese are words that go to - ge - ther well. My Mi- chelle
amelyik vi-
szonylag alacsonyan csatlakozik a fához – egy relatíve feszesebb pontot jelöl. Amekkora mértékben egy dal-
œ b3œkíván
lambeli pont feszült, olyan mértékben
œoldódást œ egy
is, azaz,
œ baloldali ˙ ™ nagyobb stabilitással rendelkező pont felé
bœ œ œ Abœciszb(„once”)
b Œ ‰ œ œ œ ‰ œ w
3
Tonika & ˙
való továbbhaladást. Ezt
J
különösen a 17. ábrán lévő leágazások teszik láthatóvá:
felé vonzódik és arra oldódik („had”); hasonlóan, az A („a”) és a gisz („girl”) esetéhez és így tovább.
aH
I love you, I love you, I love you, at's all I want to say.
A TPS egy olyan kvantitatív mérési rendszert dolgozott ki, amely egy dallam és/vagy egy akkor-
dsor bármely pontján mérni tudja a feszültség és a vonzás mértékét. A mérési rendszert kísérleti kutatá-
sok támasztják alá (Lerdahl & Krumhansl, 2004; Smith & Cuddy, 2003). Ezek részletei túlmutatnak je-
len cikkünk keretein, de a beágyazódás mélységén kívül néhány tényezőt még megemlíthetünk, amelyek
szerepet játszanak a melódiai feszültség és vonzás élményében. Hasonlítsuk össze az A hang három elő-
fordulását a Norwegian Wood-ban („a”, „should” és „once”)! Az elsőre fölülről, lépésről lépésre jut el a dal-
lam, és lépésről lépésre halad tovább a következő hangra. Ez az átmenet melodikusan egyszerű és egyen-
letes. Ennélfogva, a kis helyi „feszültség-csúcs”, melyet ez a bizonyos hang szül, annak tulajdonítható, hogy
átvezető hang a H és gisz között, és nem alapvető fontosságú vagy meghatározó hangja a dallamnak.
Most vessünk egy pillantást a második A-ra („should”)! Ezt a hangot a dallam egy fisz-ről való, erő-
teljesebb, tercnyi ugrással éri el; azonban az előző A-hoz hasonlóan, ez a hang is a következő gisz felé von-
zódik s oldódik rá természetes módon. Ennélfogva ez egy némileg nagyobb feszültséggel rendelkező
pont a frázisban. Végül, a harmadik A‑t („once”) a dallam egy eléggé nagy, kvint távolságú felfelé ugrás-
sal éri el az előző D-ről; a hang azonban nem a közeli gisz-re oldódik kényelmesen, hanem visszafordul, és
a ciszre ugrik. Továbbá, a D-A-cisz hangok egyike sem foglal el magas pozíciót a 15a ábra tonális hierar-
chiájában. Emiatt az A elhelyezkedése szokatlan a dallamrajzban, így az összes hang közül a legnagyobb

12 Angolul „pitch reduction” néven szerepel; szó szerint fordítható hangmagasság-, hang jegy-, vagy zene-
ihang-redukciónak, lényegét tekintve akár hangsorozat-redukciónak is. A magyar szakirodalomban pl.
„Schenker-analízis” néven találkozhatunk vele – a ford.)
13 A 17. ábra a hangokat nem csak a két, időben szomszédos hang közé illeszkedőként szemlélteti, ha-
nem vagy egy jobboldali ágként, amely az előzményekhez kapcsolódik, vagy egy baloldali ágként,
amely azt követi. A terjedelmi korlátok nem teszik lehetővé, hogy ezt az aspektust alátámasszuk; en-
nek tárgyalásához lásd: GTTM, 8-9. fejezet, és TPS, 1. fejezet. A GTTM-ben különösen az Idő-
táv-redukció („Time-Span Reduction”) és a Meghosszabítási redukció („Prolongational Reduction”)
közötti különbségtételt vesszük nagyító alá.
feszültséget kelti a frázisban. Ha a frázis egészét nézzük, a feszültség szintje fokozatos csökkenést mutat,
ahogy a főbb hangok lefelé haladnak a redukcióban. De ezek térközeiben, minden egyes soron következő A zenei képesség: mi az,
átmenet, amely az egyik stabil pontról a másikra vezet, feszültebb, mint az azt megelőző. és mitől különleges?
Hangsúlyoznunk kell, hogy a harmadik A hanghoz kötődő feszültség nem abból fakad, hogy a
dallam ne teljesítené a hallgató tudatos elvárásait. A legtöbbünk már jó néhány éve jól ismeri a Norwegi-
an Wood-ot, így ezt a hangot mindenképp elvárjuk tudatosan. A feszültség ezen a ponton inkább a dal- 37
lamra ható, tudat alatt működő vonzóerők (vagy nyelvtani elvárások) következménye. Azt a tudat alatti
elvárást, amely szerint az A-nak a saját regiszterében lévő gisz-re kell oldódnia, felülírja az a vele versengő,
másik tudat alatti elvárás, hogy az alsó vonalnak – amely az elvárás szerint immár egy polifonikus dal-
lamnak tekinthető – folytatnia kell a skálaszerű lefelé ereszkedését a D-ről ciszre és H-ra. A tudatos és
tudat alatti elvárásoknak ez a kontrasztja a zene feldolgozásának moduláris nézetén alapul: a beépített
zenei modul, amely a zene struktúráját menet közben konstruálja, tudat alatt kiszámítja annak pillanat-
ról pillanatra változó feszültségeit és vonzásait, függetlenül a hallgató tudatos memóriájától (Jacken-
doff, 1992; Meyer, 1967).
A 17. ábrán látható fa-szerkezet a dallamhoz kapcsolódó kognitív struktúrát mutatja be (a K1-es
kérdés az értekezésünk elejéről). Ezután meg kell kérdeznünk, milyen kognitív alapelvek teszik lehetővé,
hogy a hallgató egy ilyen struktúrára következtessen (illetve konstruálja vagy származtassa azt) a zenei fel-
szín alapján (K2-es kérdés). Ahogy a csoportosítás és a metrum esetében is, az alapelvek felülírható korlá-
tozások szerint alakulnak. Íme ezek közül néhány, csak nagy vonalakban. A fenti gondolatmenetben már
valamennyire illusztráltuk ezeket. Az összességében „legjobb” vagy „legstabilabb” struktúra egy zenemű
egészére nézve az összes alapelv optimális kölcsönhatásából fakad, amelyet a darab minden egyes pont-
ján alkalmazunk.

Lokális jó forma:

• (A dallammenettel való kölcsönhatás) Azoknak a hangoknak, melyekre a zene kis hangközlépé-


sekkel jut el az előző hangokról (a redukció bármely szintjén), oldódniuk kell a saját környezetük-
ben (a redukció megfelelő szintjén).
• (A metrummal való kölcsönhatás) A viszonylag oldott dallambéli pontoknak időben illeszked-
niük kell a metrikai szempontból viszonylag jelentős ütésekre.
• (A hangmagasság-térrel való kölcsönhatás) Azoknak a hangoknak, amelyek viszonylag stabilak
a tonális hangmagasság-térben, melódiai értelemben viszonylag oldottnak kell lenniük. Egy har-
móniákkal is rendelkező stílusban ez az alapelv kiegészül a következőkkel:
• Az éppen aktuális harmóniához illeszkedő (vagy azzal konszonáns) hangoknak viszonylag
oldottnak kell lenniük.
• Az aktuális tonikához közel eső harmóniák viszonylag oldottak.

Globális jó forma:

• (A csoportosításokkal való kölcsönhatás) Egy csoportban a legoldottabb pillanatoknak a cso-


port elején vagy a végén, vagy ezekhez közel kell lenniük.
Hangmagasságot érintő megfontolások a zenei felszínen:
• A hangmagasság-spektrumban egy lejjebb lévő hely viszonylag oldottabb
• A hangmagasság-spektrumban egy kevésbé szélsőséges hely viszonylag oldottabb.

Figyeljük meg e két utóbbi alapelv hatásait! Az első azt határozza meg, hogy az emelkedő dallam-
vonalak általánosságban egyre feszültebbé válnak, az ereszkedők pedig általában oldódnak. De a második
alapelvvel is kölcsönhatás áll fenn. Mindkét szabály a nagyon magas hangokat feszültnek minősíti. Lefelé
haladva csökken a feszültség, egészen addig, amíg el nem érjük a különösen mély hangokat, amikortól is a
feszültség elkezd ismét emelkedni (gondoljunk csak egy tubára, amely azzal kérkedik, hogy milyen mély-
re tud lemenni).
Ezek az alapelvek együttesen megkövetelik az összes, e tanulmányban sorra vett tényező integráció-
ját: a ritmus két komponenséét (csoportosítás és metrum), a hangmagasság‑térbéli hierarchiáét, valamint
a hangok sorozatából kialakult melódiai feszültségét és oldódásét. Bármely zeneműben, ezen faktorok
időbeli összehangoltsága folyamatosan változik, s egymásra hatásuk így a feszültségnek egy további for-
rása lesz [ezt „meta-feszültségnek” (vagyis feszültségek mögötti, ”eg y szinttel feljebb értelmezett” feszültségnek
38 – a ford.) is nevezhetnénk]: azok a helyzetek, ahol az alapelvek egymásnak ellentmondanak, feszültebbek,
mint azok, ahol az alapelvek egybehangzó (és redundáns) kimenetet eredményeznek (Temperley, 2001,
11. fejezet). Általános következmény, hogy egy dallam vége (amely szükségképpen egy nagy csoport vége
is), a legkisebb feszültség pontja legyen – egy erős metrikai ütésen, a tonális hierarchia legstabilabb hang-
ján, és egy relatíve mély regiszterben – hogy mindegyik alapelv maximálisan teljesüljön. Ez nem jelenti azt,
hogy minden dallam így végződik (sőt, a Norwegian Wood dallama sem az első, hanem az ötödik fokon
zárul), és azt sem, hogy ezek az alapelvek általánosságban azt diktálnák, hogy a dallamoknak bármilyen
meghatározott formát kellene felvenniük.

Ahogy láttuk, a különböző zenei stílusok a metrikai struktúrák és hangmagasság-terek számára le-
hetséges tartományokat határoznak meg. Továbbá, a legtöbb stílus rendelkezik olyan, már hagyományos-
sá vált melódiai és ritmikai sémák egész sorával, amelyek szabadon komponált szakaszokkal építőkövei le-
hetnek a dallamoknak. Ezekre a sémákra leginkább úgy tekinthetünk, mint egy lexikonra egy nyelvben,
ám attól két fontos tulajdonságuk miatt különböznek. Először is, míg a mondatoknak teljes mértékben
már tárolt szavakból és morfémákból kell felépülniük, a dallamoknak nem muszáj teljes mértékben melo-
dikus és ritmikus sémákból állniuk. Sőt, a dallamok olyan mértékben egyediek, amilyen mértékben mel-
lőzik ezeket a sémákat. Másodszor, a zenei formulák nemcsak a zenei felszín szegmensei lehetnek, hanem
egészen absztrakt keretet alkothatnak, amelyekből a dallamok megszületnek, mint például a 12 ütemes
blues, a 32 ütemes popdal-forma, vagy a klasszikus szonáta-forma. Ezek az absztrakt mintázatok szabadon
módosíthatók a zeneszerző szeszélyei szerint. Így, ha ezek a sémák hasonlítanak is valamire a nyelvben, ak-
kor azok nem a szavak és a morfémák, hanem egy egész kontinuum, amely a szavaktól és morfémáktól
kezdve a különféle egyéni sajátosságokkal bíró konstrukciókon át az általános nyelvtani szabályokig ter-
jed, ahogy néhány új keletű, konstrukcionista megközelítésű nyelvelméleti cikk állítja (pl. Culicover &
Jackendoff, 2005; Culicover, 1999; Goldberg, 1995; Jackendoff, 2002; Tomasello, 2003).
Hogyan sajátítja el a zenehallgató a dallamszerkezeti alapelveket (K3-as kérdés), és milyen belső erő-
források segítik ezt az elsajátítási folyamatot (K4)? Hogy az ember megértsen egy dallamot egy adott stí-
lusban, megfelelő mennyiségű élményanyag segítségével meg kell ismernie a stílus csoportosítási és metri-
kai lehetőségeit, hangmagasság-terét, valamint kellő mértékben meg kell ismerkednie legalább azokkal a
melódiai és ritmikai formulákkal, amelyek alapvetően szükségesek ahhoz, hogy felismerje az adott stílus-
ban írt művek közötti hasonlóságokat és különbségeket. E tényezők nagy részét Trehub és Hannon tár-
gyalja; magyarázatukat mi is elfogadjuk. Azt sejtjük azonban, hogy az embernek nem kell elsajátítania a
„jó forma” fentiekben felsorolt alapelveit, amelyek a zenei felszínhez a feszültség és a vonzódás szintvona-
lait rendelik hozzá. Ezek inkább az ember zenei képességnek részét képezik. Mivel azonban ezek az alap-
elvek mindig egy stílus metrikai és tonális jellegzetességeire, illetve hagyományossá vált sémakészletére
vonatkoznak, melyek mindegyikét teljes egészében el kell sajátítani, a különböző stílusok különböző fe-
szültség‑ és vonzásmeneteket fognak produkálni, ezeknek a sajátosságoknak megfelelően. Így mindegyik
stílusnak meglesznek a saját, jellegzetes struktúrái, amelyek a stílusspecifikus tonális és metrikai elvek, il-
letve a feszültség és oldódás általános alapelveinek a kölcsönhatásából születnek.
Ahogy a zene más aspektusai esetén is, következő lépésként itt is feltehetjük a kérdést, hogy a me-
lódiai szerveződésnek mely alapelvei specifikusak a zenére nézve (a szűkebb értelemben vett képesség), és
melyek következnek a kogníció általánosabb tulajdonságaiból (a tágabb értelemben vett képesség) (K5).
Több olyan alapelv is létezik, amely a melódiai szervezettség mellett más területekre is vonatkozik. Általá-
nos például a hangmagasság-spektrum és a tipikusan lefelé irányuló dallamvonal problémaköre, ezek a jel-
legzetességek az emlősök mindenféle hívójel-rendszerére érvényesek. Általános az is, hogy a kis melódiai
hangközlépések kisebb feszültséget keltenek, mint a nagyok, ez a közelség és a folytonosság alaklélektani
elveiből, valamint a hangképzés izomrendszerbeli korlátaiból ered. Az, hogy egy dallam felbomolhat kü-
lönböző dallammenetekre vagy szólamokra, ez a hallásijelenet-elemzés („auditory scene analysis”, ASA,
Bregman, 1990) általános elveinek zenei téren való megnyilvánulása. S hogy a melódiai szerveződés alap- A zenei képesség: mi az,
elvei interaktívak és felülírhatóak, számos kognitív rendszer sajátossága. és mitől különleges?
A tonális tér azonban – a fix hangmagasságok és hangközök rendszere, s a benne lévő hangmagassá-
gok, akkordok, hangnemek, és a köztük lévő távolságok hierarchiája – teljes mértékben a zene sajátja, s így
a melódiai szervezettségé is. Ugyanez a helyzet a disszonancia kezelésével, amely disszonancia, a tonális tér 39
egy meghatározott formájával összefüggésben jelenik meg. Szintúgy ide tartoznak a dallamok megértésé-
nek hangredukció14 alapú elvei. Sőt, bár a rekurzió némely formája széles körben elterjedt az emberi kogni-
tív rendszerek világában (Pinker & Jackendoff, 2005), az a fajta rekurzió15, amely a hangredukciókban meg-
jelenik, úgy tűnik, a zene sajátossága. Különösen a nyelv mondattanában nincs ehhez hasonló struktúra. A
zenei fa‑szerkezetek semmilyen analógiát nem mutatnak a beszéd alkotórészeivel, és a nyelvi szintaktikai
fák sem kódolnak feszültség- és oldódás-mintázatokat.16 Ha a zenei fa‑szerkezetek a zene sajátosságai, akkor
a „jó forma” alapelveinek – melyek hozzákötik őket a zenei felszínhez – is azoknak kell lenniük.
Ha a tonális rendszerek és melodikus struktúrák alapelvei a zene sajátosságai, érdekes lehet szá-
munkra, hogy állatkísérletek eredményei alapján mik lehetnek azok evolúciós előzményei. D’A mato
(1988) munkájában csuklyásmajmokat és patkányokat próbált rávenni arra, hogy különbséget tegyenek
kétfajta dallammenet között. Azt állapította meg, hogy az állatok nem a dallamvezetés, hanem a dal-
lamon belüli, egy vagy két jellegzetes pont alapján választottak. Ezzel szemben Wright, Rivera, Hulse,
Shyan, és Neiworth (2000) azt találták, hogy a rhesus majmok megbízhatóan képesek hathangú dalla-
mokról megállapítani, hogy egyezőek vagy különbözőek-e. Sőt, azt találták, hogy ezek a döntések sok-
kal megbízhatóbbak, ha a dallamok egy diatonikus hangtérre illeszkednek, mint akkor, amikor nem. Az
eredeti dallam oktáv-transzpozícióját mindkét kísérletben hasonlónak érzékelték; az utóbbiban a tritó-
nusz-transzpozíciókat pedig tipikusan különbözőnek.
A mi tanulságunk ezekből a kísérletekből az, hogy a majmok valamennyire ismerik a hangmagassá-
got, a hangközöket illetve a dallammeneteket. A kísérletek azonban nem mutatják ki, hogy a majmok ké-
pesek volnának az emberi értelemben vett zenei kognícióra. A majmoknak például az a képessége, hogy
felismerik az oktáv-transzpozíciókat, könnyen lehet, hogy sokkal inkább a pszichoakusztika jelenségkö-
rébe tartozik, mint a melódiai percepcióéba, a 3.2-es fejezetben tárgyaltak szerint. Az emberek képesek
egy dallamot ugyanazon dallamként érzékelni bármilyen transzpozíció esetén. Ennél is sokatmondóbb,
hogy ezek a kísérletek nem vizsgálják sem a tonális stabilitásra való érzéket, sem a hang-redukción alapu-
ló dallammegértő képességet.
Arra következtetünk, hogy a zenének nem minden tulajdonsága ered általánosabb kognitív alap-
elvekből. Így jogosan merül fel az igény a szűkebb értelemben vett zenei képesség létezésének feltétele-
zésére. Ahogy előre haladunk az emberi kognitív struktúrák mind szélesebb skálájának egyre részlete-
sebb megértésében, talán kiderül majd, hogy a hangmagasság-tereknek és redukciós struktúráknak van
más területen is párhuzamos megfelelőjük. Jelen pillanatban azonban ezek a zene sajátosságainak tűnnek.

14 Redukció, Schenker már említett eljárása, mely a fentiekben bemutatott fa-szerkezetet eredményezi. –
a ford.
15 A rekurzió egy önmagára hivatkozó – tehát végrehajtáskor önmagával találkozó s így önmagát újrap-
rodukáló – művelet vagy művelet-sor, amely (ha egy konkrét utasítás határt nem szab neki,) végte-
lenített folyamatot eredményez. Egyik egyszerű szemléltetése a következő: „Ez a mondat azt tartal-
mazza, hogy ez a mondat azt tartalmazza, hogy ez a mondat azt tartalmazza, hogy...” stb. Egy vizuális
példa a leágazás leágazásának a leágazása, amely, mint struktúra, rekurzív természetű. – a ford.
16 A zenei fa-szerkezetek azonban bizonyos szempontból hasonlítanak a fonológiai hangsúlyok fa‑szer-
kezeteivel (GTTM, 11. fejezet), valamint a költészet világából való hierarchikus szótag-mintázatok-
kal (Lerdahl, 2003). A metrikai struktúra esetében pedig, a költészet szemmel láthatóan „kölcsön
veszi” a zenei struktúrát – aktivizálja, „segítségül hívja” a zenei képességet – oly módon, ahogyan a
hétköznapi nyelvhasználat azt nem teszi.
4. Gondolatok az affektusokról a zenében

4.1 A probléma meghatározása


Most rátérünk arra a kérdéskörre, hogy mi az, amit a zenetudósok kivételével gyakorlatilag minden-
ki a legfontosabbnak tart a zene pszichológiájában: ez a zene és az affektus kapcsolata. Itt szükségszerűen
40 spekulatívnak kell lennünk, de még így is megéri felhozni jó néhány lehetőséget a zenei struktúráról szóló
jelen tanulmányunk keretében. Összességében azt valljuk, hogy több különböző, egymás felé tartó útvo-
nal vezet a zenei felszíntől a zenei affektusig, s ezen útvonalak skálája a meglehetősen általános pszicholó-
giai reakcióktól az eléggé zene-specifikus effektusokig terjed.
Azt a problémakört, amelyet mi „affektus” címszó alatt most nagyító alá veszünk, általában a zene
érzelmekhez való viszonyaként definiálják, mint ahogy két kiemelkedő könyv, Leonard Meyer Emotion
and Meaning in Music (1956), illetve Juslin és Sloboda Music and Emotion (2001a) c. gyűjteményes kö-
tete is teszi. Azért részesítjük előnyben az affektus17 szót, mert szélesebb körű vizsgálódást tesz lehetővé,
mint az érzelem. Például, Juslin és Sloboda kötetében számos tanulmány próbál zenei részleteket reprodu-
kálható alapérzelmekkel azonosítani, mint pl. vidám, szomorú, vagy dühös. Nem tagadjuk, hogy mond-
juk a Yellow Submarine vidám, a Michelle pedig inkább szomorú, és hogy ezek az ítéletek összefüggenek
a tonalitásukkal (dúr ill. moll), ritmusaikkal és az általuk használt hangmagasság-tartománnyal. Azonban
lényegesen több jellemző létezik még, amelyeket szintén meg kellene határozni. Egy zenei részlet lehet
gyöngéd, erőteljes, esetlen, nyers, kapkodó, statikus, komoly, kinyíló, lezáródó, misztikus, baljós, közvet-
len és egyenes, nemes, tiszteletteljes, transzcendens, lágy, eksztatikus, szentimentális, vágyakozó, törekvő,
elszánt, depresszív, játékos, szellemes, ironikus, feszült, nyugtalan, hősies vagy vad. Ezek közül csak keve-
set lehet szó szerint vett érzelmekként jellemezni. S míg egy zenerészlet lehet „undorító”, nehéz elképzelni,
hogy egy zeneműnek az undor emberi alapérzelmét tulajdonítsuk, vagyis, hogy azt mondjuk, „ez a zene
undorodik”.
Néhány filozófiai/konceptuális kérdést is meg kell vizsgálni, hogy foglalkozni tudjunk ezzel a prob-
lémával. (Davies, 1994, 2001 részletesen áttekinti az ez ügyben képviselt álláspontokat; megállapításainak
többségével mi is egyetértünk). Először is, mi nem akarjuk azt állítani, hogy az affektus vagy az érzelem
a zene „jelentése”, abban az értelemben, amiben a nyelv jelentéssel bír. A nyelvvel ellentétben, a zene nem
közvetít olyan állításokat, amelyek igazak vagy hamisak lehetnek. Zenét nem lehet használni arra, hogy
megszervezzünk egy találkozót, megtanítsunk valakit egy kenyérpirító használatára, továbbadjunk egy
pletykát, vagy felköszöntsünk valakit a születésnapján (kivéve, ha egy jól ismert, hagyományos dallamot
használunk). Sőt, elég közhelyszerűvé tenné a zenét, ha például azt mondanánk, hogy az egyik darab vi-
dámságot „jelent”, a másik pedig szomorúságot „jelent”. Ebben a megközelítésben minden vidám darab
ugyanazt jelentené – és így minek bajlódna bárki is egy újabb vidám darab írásával? Amennyiben a zenét
úgy jellemezzük, hogy jelentéssel rendelkezik (ill. amennyiben azzal a szándékkal hozzák létre, hogy le-
gyen jelentése), úgy ez abban az általános értelemben igaz, ahogyan bármilyen élményre mondjuk, hogy
jelentése van, vagyis, hogy affektív benyomást kelt bennünk.
Raffman (1993), hozzánk hasonlóan elutasítja, hogy egy az egyben a puszta érzelmeket tekint-
sük a zene jelentésének. A zene jelentéséről, mint „kvázi-szemantikáról”18 beszél, amely a zenei struktú-
ra részletes érzékelése során megtapasztalt érzések összességéből áll. Bár egyetértünk ezzel a felfogással,
mi inkább nem használnánk a „szemantika” kifejezést ebben az összefüggésben, mivelhogy semmiféle
propozicionális19 következtetés nem fakad a zene percepciójából. Egyetértünk Davies-szel (1994), aki a
„zenehallgató értelmezése a zeneműről” kifejezést használja azon kognitív struktúrák (csoportosításbeli,
metrikai és tonális/redukciós) megnevezésére, amelyeket a hallgató tudat alatt konstruál a zene hatására.
Következő lépésben pedig azt, amit Raffman a „zenei jelentés” kifejezés alatt ért, úgy jellemeznénk, mint
azokat az affektusokat, melyeket a hallgató a zeneműhöz társít annak megértése során.

17 Az affektus fogalmát magyarul viszonylag jó közelítéssel jelölheti még az érzet szó – a ford.
18 Szemantika = jelentéstan
19 Propozicionális: Konkrét jelentéssel bíró, kijelentés-szerű; A valóságról tesz olyan állítást, mellyel
kapcsolatban érvényes módon föltehető az „igaz vagy hamis?” kérdése.
Egy további fogalmi nehézség: az ember azt gondolhatja, hogy az affektusok csak érző lényeknek
tulajdoníthatók, mint pl. az emberek és talán az állatok. Akkor mit is jelent az, ha azt mondjuk, hogy hang- A zenei képesség: mi az,
jegyek bizonyos sorozata játékos vagy szentimentális? Ez a kérdés már túlmutat a zene területén. Hogyan és mitől különleges?
tudunk vidámként, statikusként vagy játékosként jellemezni egy regényt, egy verset, vagy egy festményt
(különösen egy absztrakt festményt)? Ez nem feltétlenül jelenti azt, hogy a bennük lévő szereplők vagy
tárgyak vidámak, statikusak vagy játékosak lennének. Nem feltétlenül kell beszélnünk a szerző vagy az 41
előadó személyes érzelmeiről sem, hiszen egy természetes tájkép is jellemezhető komorként vagy vad-
ként. (Kivy, 2001-ben úgy érvel, hogy ezek az „érzelmi tulajdonságok” a zenében „nem mások, mint tisz-
tán perceptuális tulajdonságok”. Mi ezzel nem értünk egyet, s ezt alább kifejtjük.)
Ez a probléma nem kizálag az esztétikai élményre korlátozódik. Ha valamit unalmasnak vagy ér-
tékesnek hívunk, akkor egy vélhetően objektív jellemzőt tulajdonítunk neki, hasonlóan a méretéhez vagy
hőmérsékletéhez. Mégis, nem lehet valami unalmas, ha senkit sem untat; valami nem lehet értékes, ha
senki sem értékeli. Tehát az ilyen értékítéletbeli állítások burkoltan magukban foglalják a megfigyelő re-
akcióját. Jackendoff (2006, 7. fejezet) felvetése szerint ezt a burkoltan beleértendő megfigyelőt tulajdon-
képpen egy nem-specifikus általános személynek tekintjük, olyasminek, amit a német man és a francia on
szó jelent – vagy amit az angolban az általános alanyként használt one vagy hangsúlytalan you szó bizonyos
használatai (pl: „You do not hear the Grieg piano concerto played much any more”). (A mondat szó szerin-
ti magyar fordítása: „Te már nem gyakran hallod a Grieg zongoraversenyt elhangzani”; itt az angol you ma-
gyarul: te szó ebben a szóhasználatban megfelel a magyar „az ember” általános alanynak: „Az ember már
nem gyakran hallja a Grieg zongoraversenyt elhangzani” – a ford.). Felvetésünk szerint a zenére vonatko-
zó, affektív tartalmú állítások lényegileg a következőképp néznek ki: egy hallgató egy zenerészletet akkor
tart misztikusnak, ha úgy ítéli, hogy az a misztikum érzetét váltja ki az általános megfigyelőből – általában
oly módon, hogy maga a hallgató veszi fel az általános megfigyelő szerepét.
Óvatosnak kell lennünk azonban azzal, hogy mit is értsünk itt a „váltja ki” kifejezés alatt. Nem fel-
tétlenül jelenti ez azt, hogy „valamit megtapasztaltat”,. A mazochistákat kivéve, az emberek általában nem
akarják magukat szomorúvá tenni; ennek ellenére tolonganak azért, hogy rengeteg fajta szomorú zenét
hallgassanak. Ez ismét egy általánosabb problémakör. Emberek évszázadok óta tolongnak a Hamletért
vagy az Oedipus Királyért is. Az emberek szeretnek nagyon csípős ételeket enni és kockázatos tevékenysé-
gekkel foglalkozni, mint például a barlangászat [Bharucha, Curtis és Paroo, Davies (1994)]. Egy lehetséges
megoldás erre a talányra, hogy a zene és a dráma percepciója keretek között történik, Goffman-i (1974) ér-
telemben: az ember a zenét és a drámát olyan hozzáállással közelíti meg, amely különbözik a mindennapi
életben megszokottól – úgy, ahogy egy keretbe foglalt képet. A művészet megtapasztalása nem az egyet-
len lehetséges keret. Az olyan keretek, mint például egy feladat gyakorlása, vagy játékok játszása, elválasz-
tanak egy tevékenységet a szokványos céloktól. Zenehallgatáskor az észlelők megválaszthatják, mekko-
ra mértékben merüljenek el a keretbe foglalt anyagban, s mekkora mértékben maradjanak kívülállók; az
érzelmi hatás nagyobb, ha az ember jobban belemerül a keretbe foglalt anyagba – miközben továbbra is
keretbe foglaltnak érzékeli azt. A zeneszerzők és az előadók hasonlóképpen választhatnak: senkinek sem
kell félnie attól, hogy baljós zenét komponáljon vagy adjon elő. 20
Maga a zenei tevékenység is beágyazható keretek közé. Például, amikor az ember egy zeneművet
gyakorol egy jövőbeli előadásra, gyakran teljes mértékben felfüggeszti az affektusok átélését. Továbbá,
vegyük csak fontolóra (Goffman szellemében) azokat a kereteket, elmebeli beállítottságokat, amelyeket
különböző helyzetekben alkalmazunk, például egy kórus hallgatásakor, kórusban való énekléskor, vallá-
si szertartás keretében egyházi gyülekezeti énekléskor, egy sporteseményen a nemzeti himnusz éneklé-
sekor, sétálás közben egyedül énekelgetéskor, amikor altatódalt éneklünk egy gyermeknek, vagy amikor
egy háttérben szóló filmzenét meghallunk (vagy épp: nem hallunk meg!) egy filmben. Ezen körülmények
mindegyike módosítja az ember összességben vett beállítottságát, amelynek megfelelően a zenei affek-
tust az ember megéli.

20 RJ visszaemlékszik egy kamarazene-tanár intelmére: „Neked nem feladatod táncolni. Neked az a fel-
adatod, hogy elérd, hogy a közönség akarjon táncolni!” Valóban, a hatásos előadás (legalábbis bizonyos
műfajokban) jelentős mértékű elszakadást igényel.
Általában a zenét úgy foglaljuk keretbe, hogy azt részben az esztétikai élvezettel társítjuk, ami
egyébként bármilyen más modalitásban is megtörténhet (az ételt is beleértve!). Raffman (1993, 60. oldal)
egy „sajátságos esztétikai érzelemről” beszél; Kivy (2001, 105. oldal) úgy beszél az esztétikai élménnyel
együtt járó affektusról, mint „egy lelkesedés, egy intenzív zenei izgalom azzal kapcsolatban, amit hallok”. 21
Ez az, amit a régebbi korokban a „szépség élvezetének” nevezhettek. A XX. századi nyugati kultúrában
42 azonban lehetővé vált, hogy egy tudatosan létrehozott művészeti objektumnak vagy tevékenységnek a
kereteit leválasszuk annak észlelhető tulajdonságairól, lehetővé téve olyan híres példák létrejöttét, mint
Andy Warhol Campbell leveskonzerv-sorozata, vagy John Cage olyan művei, melyekben az előadók kü-
lönböző, egyszerre szóló rádiókat hangolnak véletlenszerűen. Ezek a példák arra támaszkodnak, hogy a
befogadó olyan esztétikai kerethez kapcsolódó affektusokat él meg, mely keret túlmutat a szemlélődés
tárgyát képező objektum vagy esemény tartalmán.
Az esztétikai élmény általános keretén kívül, a zene más affektus-források széles köréből is részesül.
Egyik ezek közül az az affektus, mely a virtuozitás iránti rajongással jár együtt, legyen az bármilyen jellegű,
akár egy hegedűművészé, egy akrobatáé, egy sztár futball-csatáré, vagy akár egy leleményes bűnözőé. Egy
másik affektust a nosztalgikus emlékek idéznek elő („Drágám, a mi dalunkat játsszák!”), amely hasonló-
an működik, mint például az ismerős ételek, szokások, vagy helyszínek. Ez a helyzet bonyolultabbá válik a
zenében, amikor a zeneszerzők szándékosan beépítenek ilyen affektusokat a zenéjükbe. Ha a virtuozitást
nézzük, a jól ismert bravúrdarabok a koloratúr áriáktól a versenyműveken át a menő jazz improvizációkig,
mind a műélvezetnek ebből a forrásából táplálkoznak. Ami pedig a nosztalgikus (vagy akár ironikus) érzé-
sek előidézését illeti, gondoljunk csak az olyan Beatles-dalokra, mint a Your Mother Should Know („Let’s
all get up and dance to a song/That was a hit before your mother was born”22) vagy a Honey Pie („Honey
Pie, you are making me crazy/I’m in love but I’m lazy...”), melyek egy korábbi korszak stílusában íródtak.
Szintén ebbe a kategóriába tartozik a népi elemek használata az olyan klasszikus szerzők zeneműveiben,
mint Haydn, Mahler vagy Bartók. Ahhoz, hogy elérjük a megfelelő affektust, természetesen ismerünk
kell azt a stílust is, amelyikre utalunk, és a velejáró, zenén kívüli, másodlagos jelentéstartalmait is. Példá-
ul, Sztavinszkij Tavaszi áldozat c. művét még inkább élvezzük, ha némileg ismerjük az orosz népzenét.
Vannak olyan körülmények is a zenehallgatásban, amikor a keret teljes mértékben eltűnik, ez talán
olyan kifejezésekkel írható le, mint: az ember „belefeledkezik a zenébe”, vagy az embert „magával ragadja a
zene”. Ez az érzet sem kizárólag a zene sajátja. Megjelenik például a vallási extázisban, a felszabadult szexu-
alitásban, vagy nagy tömegben a „csordaszellem” eluralkodásakor.

4.2. A zenei affektus általános célú komponensei


A zenei affektus néhány aspektusa könnyen tulajdonítható a hallás általános jellemzőinek. Ennek
egyértelmű példája az az emberben a hirtelen hangos hangok hallatán keletkező ijedtség- (és félelem?) re-
akció, mely áttevődik a hirtelen kirobbanó zenei gesztusokra. Bizonyos hangok belső tulajdonságaikból
fakadóan kellemesek (madárcsicsergés) vagy kellemetlenek (motoros fűrész), s így a hasonló akusztikai
karakterrel rendelkező zene is hasonló hatást vált ki.
Hasonlóképpen világos azon zenei jelenségek esete, melyek a vokális hangképzés affektív jellemzőit
szimulálják. Nemcsak az emberi, hanem nagyrészt az emlősök közötti kommunikáció is modulálja a vo-
kális hangmagasságot, hangerőt és hangszínt, hogy az fenyegetést, kibékülést, félelmet, izgatottságot stb.
hordozzon (Hauser, 2001). Ezek a modulációk átültethetők a zenei előadásra, néha a dallamvezetés jelle-
gébe, de gyakran az előadó énekes vagy hangszeres hangképzésébe is (Bharucha et al.; Juslin és Laukka,
2003; lásd még a 4.3-as alfejezetet). A hallgatók affektív értelemben ugyanúgy reagálnak az ilyen hang-
képzésre, mint a velük párhuzamba állítható vokális kommunikációra – ezért beszélhetünk „síró hege-
dűkről”.

21 Kivy ezt az élményt azonban a zenei affektus egyetlen forrásának tartja, elutasítva
a többi, itt tárgyalt forrást. Mint sokan mások, úgy tűnik, ő is azt feltételezi, hogy
csak egyetlen forrása lehet az affektusnak; a mi álláspontunk az, hogy egyszerre
számos, egymással kölcsönhatásban lévő forrás létezik.
22 „Keljünk fel mind, és táncoljunk egy dalra/Ami azelőtt volt sláger, mielőtt anyád megszületett ” – a
ford.
# # 12 œ œ œj œ ™ j j j j œj j
Tonika & # # 8 œ™ J J œ œ œ œ™ nœ œ œ™
Ϊ
I once had a girl or should I say she once had me

Nagyobb léptékű skálán nézve, egy dallam általános affektív tónusát befolyásolhatja annak hang-
terjedelme: ahogy a beszédben is, a szűk hangterjedelem és az összességében alacsony hangfekvés egy sze- A zenei képesség: mi az,
líd 23 affektív tónusnak felel meg; a széles hangterjedelem pedig egy nyitottabb és kifejezőbb affektív tó- és mitől különleges?
nusnak (Juslin és Laukka, 2003). Ez a szabályszerűség használható dinamikus, változó módon is.

Tonika & bC ˙ ˙ Œ bœ b˙ œ œ œ œ œ bœ nœ œ ˙ œ bœ ™ œ
43

Mi - chelle ma belle, ese are words that go to - ge - ther well. My Mi- chelle

œ b3œ œ œ 3œ œ œ ˙ ™ ‰ œ bœ œ œ bœ bw
Tonika &b ˙ Œ ‰ œJ
I love you, I love you, I love you, at's all I want to say.
18. ábra eg y részlet a Michelle-ből

A Michelle dallamának nagy része, mely a 18. ábrán látható, egy viszonylag kis spektrumban mo-
zog a közepes-alacsony vokális hangtartományban, egy általánosságban ereszkedő vonal mentén (1-6. üte-
mek); összességében az affektus szelíd. Azonban ezt megszakítja egy ismétlődő és affektíve szenvedélyes
kitörés egy magasabb hangfekvésben (7. és 8. ütem), a szövegnek megfelelően, majd fokozatosan visszahú-
zódik az eredeti hangtartományba (9. és további ütemek).
Ha a struktúra nagyobb ívű szerveződését nézzük, találunk egy affektus-forrást, amely a nyelvben is
megtalálható: ez az, amit „retorikai effektusoknak” hívhatnánk. Ennek egy egyszerű példája a fokozás cél-
jából használt ismétlés, mint az „I love you, I love you, I love you” megzenésítése a 18. ábrán. Ezzel rokon a
zenei refrén használata, amelyre a dal visszatér – ez talán az evangéliumi prédikáció retorikus természetű
refrénhasználatával állítható párhuzamba.
A szerveződést még nagyobb léptékű skálán szemlélve, figyeljük meg a kiterjedt zenei formák ke-
zelését! Egy mű állhat ismételt strófák sorozatából (ahogy egy tipikus népdalban), vagy össze nem függő
epizódokéból (ahogy egy tánc-szvitben, vagy a Beatles Abbey Road c. számának második részében). Vagy
pedig fennállhat nagy léptékű kohézió is olyan formában, amely több a részek puszta összefűzésénél. En-
nek legegyszerűbb példája, hogy egy vagy több össze nem függő szakasz után, az első szakasz visszatér (pl.
egy da capo ária, egy menüett és egy trió, vagy a Beatles A Dayin the Life c. száma). Egy műben fokozato-
san növekedhet az intenzitás egészen a csúcspontig, amely győzedelmesen vagy tragikusan oldódhat fel,
vagy úgy, hogy visszaáll a nyugalom. Egy darab kezdődhet egy olyan bevezető szakasszal, amely megala-
pozza azt a kezdőhangulatot, amelyből a zene többi része kiindul; példa erre – az angolul „vamp”-nek neve-
zett – pár ütemes hangszeres bevezetőszakasz egy popszám elején, vagy a halk bevezető szakasz egy rága
elején, mielőtt a tabla-dobok belépnek. 24 Egy darab tartalmazhat igen erősen szervessé vált struktúrákat,
mint pl. a klasszikus szonáta-forma esetében. Lehetnek zenei szakaszok, amelyekben semmi jelentős nem
történik, és a feszültséget csak az idő múlása okozza, és az az érzésünk, hogy valaminek történnie kell ha-
marosan. Ezek a strukturális elemek számos módon kombinálhatóak és egymásba ágyazhatóak, s így na-
gyobb ívű szerkezeti formák széles választékára nyílik lehetőség, melyek mindegyikéhez kapcsolódik va-
lamilyen fajta affektus.
E nagyobb struktúráknak rengeteg közös tulajdonságuk van az elbeszélések és drámák struktúrái-
val. A bevezető szakasz nagyon hasonló szerepet tölt be, mint egy jelenet felvezetése egy elbeszélésben; a
nézőben kialakul egy hangulat, és várja, hogy kezdődjön a játék. A regények vagy színdarabok cselekmé-
nyében gyakori, hogy a feszültség csak lassan éri el a csúcspontot, amelyet gyorsan követ a végkifejlet. A
feloldást gyakran késlelteti hosszú, eseménytelen szakasz, vagy akár egy másodlagos cselekményre való
kitérés. Természetesen az ilyen dramaturgiai struktúrák létrehozásához használt irodalmi eszközök egé-
23 Szelíd, vagy letompított; a szerző által használt angol kifejezés mindkettőt jelenti; zeneileg e kifejezés
mindkét jelentése helytálló lehet, bár valószínűbb, hogy a szerző elsősorban a szelíd affektusra kíván
célozni – a ford.
24 Nagyobb időbeli léptékben nézve pedig, könnyen juthatnak eszünkbe bizonyos klasszikus szimfó-
niák ill. szonáták gyors első tételeinek lassú bevezető szakaszai, különösen Beethoven művészetében,
lásd pl. az I., a II., a IV., vagy a VII. szimfóniát, vagy a „Pathétique” zongoraszonátát! – a ford.
szen mások, mint a zenében használatosak – ugyanakkor a feszültség és oldódás nagy ívű ritmusai összes-
ségében véve feltűnően hasonlóak. Azt feltételezzük, hogy mind a zene, mind a nyelv felhasználják azokat
az idealizált esemény-struktúrákat, amelyeken keresztül az ember értelmezni tudja a feszültség és feloldás
hosszú távú összefüggéseit az események között.
Röviden, a zene sok affektív tulajdonsága, valamint ezek nagyobb keretek közé való integrálhatósá-
44 ga közös aspektusa a zenének és számos más emberi tevékenységnek, élménynek. Ezeket félretéve, most
azon tényezők felé fordulunk, melyek minden bizonnyal nagyobb mértékben tekinthetők a zene specifi-
kus sajátosságának.

4.2. A zenére inkább jellemző affektív tulajdonságok


Hátra van még a zene területén az affektív kifejezéseknek egyfajta „magja”, amelyet most előzetes
jelleggel megvizsgálunk. Úgy gondoljuk, hogy a fent említett tényezőkön kívül a zenei affektus nagyrészt
a zenének a testtartás és a gesztus fizikai mintázataihoz való viszonyából ered. Azaz, a „zenei gesztus” ki-
fejezés használatát közvetlenül a zene fizikai gesztusokhoz való viszonya motiválta. (Ezt a nézetet Bier-
wisch, 1979 és Davies, 1994 is osztja; ugyanakkor nem értünk egyet Juslin és Laukka, 2003-as munkájával,
melyben azt állítják, hogy a zenei affektus kizárólag a vokális hangképzés affektusaihoz való hasonlóságá-
ból származik.) Egy ember testtartása és gesztusai erőteljes hatással vannak ránk, amikor affektust válta-
nak ki; irányításuk tudat alatti, és gyakran tudat alatt is fogjuk fel őket. Azonnal felfogjuk például, ha egy
olyan embert látunk egy szobában, aki összeroskadt, depresszív testtartásban ül, vagy aki egy örömteli
gesztust tesz.
A másokban jelen lévő affektus felismeréséhez szükséges jelek közül néhány nem függ attól, hogy
előtte egyénileg jellemeztük-e az illetőt, mint embert, majd utána formáltuk‑e meg véleményünket az
affektusáról. Sokkal inkább, a mozdulat jellege már önmagában is hordozhat affektust, ami aztán a moz-
gás jellemzéséhez vezet. Ezt az állítást látványosan szemlélteti Heider és Simmel (1944) jól ismert kísérleti
rajzfilmje25, melyben háromszögek mozognak olyan módon, hogy a nézők nem tudják megállni, hogy ne
szereplőkként lássák őket, akik pl. agresszíven vagy alattomosan viselkednek, s akik haragot, frusztrációt
vagy örömöt éreznek. Damasio (1999) és Bloom és Veres (1991) hasonló kísérletekről számolnak be. A ze-
nében lévő időbeli mintázatok hasonlóképp kiválthatják affektusok észlelését.
Ezen álláspont bizonyítéka a zene és a tánc mély kapcsolata. A tánc nem csak azt jelenti, hogy moz-
gásunkat a zene ütemére időzítjük. Az ember tökéletes időzítéssel keringőzhetne is akár egy indulóra, de
a keringő és az induló nem illik egymáshoz, mert a keringő‑mozdulatok kecsessége élesen szemben áll az
indulómuzsika merevségével és súlyosságával (lásd: Mitchell és Gallaher, 2001, és az általuk használt hi-
vatkozásokat ennek kísérleti bizonyítékaira). Személyes tapasztalataink is azt mutatják, hogy még a kis-
gyermekek is érzékelik ezeket a különbségeket a zene karakterében, s ezeknek megfelelően improvizál-
ják táncukat is (lásd Trehub 2003-as tanulmányát a kisgyermekek zenei affektusok iránti érzékenységével
kapcsolatban). Hasonlóképp, a zenekari karmesterek nem csak taktust ütnek: sokkal inkább, a testtartá-
suk és a gesztusaik hordozzák a zene affektív tartalmát. Egy karmester teljesen máshogy mozog egy ke-
ringő vagy egy induló vezénylésekor, és a zenészek is ennek megfelelően reagálnak. A táncosoknak az a
képessége, hogy a zenei formákat gesztusokká fordítsák le, valamint a karmestert követő zenekari zené-
szeknek az a képessége, hogy ennek a fordítottját tegyék meg, ösztönös (bár ez tanulással finomítható).
Ugyanilyen ösztönös a közönségnek az a képessége, hogy ezeket a kapcsolatokat spontán módon értel-
mezze. Úgy gondoljuk, hogy e képességek a zenei affektus jelenségének lényegi, szerves részei.
Hogy még egy részlettel gyarapítsuk e kapcsolat bizonyítékait, idézzük csak fel a leíró kifejezések
listáját, amelyeket a 4. fejezet elején hoztunk példának a zenei affektusokra: gyöngéd, erőteljes, esetlen,
nyers, kapkodó, statikus, komoly, kinyíló, lezáródó, misztikus, baljós, közvetlen és egyenes, nemes, tiszte-
letteljes, transzcendens, lágy, eksztatikus, szentimentális, vágyakozó, törekvő, elszánt, depresszív, játékos,
szellemes, ironikus, feszült, nyugtalan, hősies vagy vad. Ezek mindegyike használatos gesztusok, testtartá-
sok, arckifejezések, vagy ezek kombinációjának leírására.

25 A rajzfilm a YouTube-on is elérhető, például ezen a linken: https://www.youtube.com/watch?v=VT-


NmLt7QX8E – a ford., 2015. április.
Van még egy különbségtétel, amit meg kell tennünk. Eddig a más emberekben lévő affektusok ész-
leléséről beszéltünk. Néha az ilyen érzetekhez zenei affektus kapcsolódik: például a szellemes, misztikus A zenei képesség: mi az,
vagy baljós zene nem azt eredményezi, hogy a hallgató szellemesnek, misztikusnak vagy baljósnak érez- és mitől különleges?
ze magát, hanem inkább azt, mintha valakinek, valaminek a jelenlétében lenne, aki vagy ami szellemes,
misztikus vagy baljós. Ezt nevezhetjük akár reaktív affektusnak. Azonban, a zenei affektusok jelentősebb
részét az ember a gesztusok létrehozója iránti empátia és ráhangolódás útján éli meg: az ember nagyon 45
is boldognak, tiszteletteljesnek vagy nyugtalannak érezheti magát boldog, tiszteletteljes vagy nyugtalan
zene hallatán. Ezt empatikus affektusnak nevezhetjük (az „érzelmi fertőzés” kifejezés (angol megfelelője –
a ford.) néha használatos ebben a kontextusban). A táncot pedig így az empatikus affektus externalizáció-
jának, azaz testtartásokká és gesztusokká való átalakításának tekinthetjük. 26
Ha eddigi gondolatmenetünk helyes irányba tart, akkor ez alapján úgy tűnik, némileg félrevezető
lenne közvetlen kapcsolatot keresni zene és érzelem között. Maguk az affektusok, illetve a testtartással és
a gesztusokkal való kapcsolatuk az általános pszichológia tárgykörébe tartoznak. Ha önmagában csak a
zene pszichológiáját vesszük, akkor inkább három fő problémakört fogalmazhatunk meg: először, a ze-
nén belüli tulajdonságok hogyan korrelálnak az affektív testtartásokkal és gesztusokkal; másodszor, a re-
akciókon kívül hogyan kezeljük ezeket a tulajdonságokat empatikusan; és harmadszor, milyen agyi me-
chanizmusok felelősek ezekért a jelenségekért.
A zenei struktúrákon végzett elemzésünk lehetővé teszi, hogy a fenti kérdések közül legalább az el-
sővel foglalkozzunk. A zenének azon tulajdonságai, amelyek kapcsolatban állnak a testtartással és a gesz-
tussal, kétféle időbeli léptékben találhatók meg. A nagyobb időlépték, a makro-szint, a tempót, a ritmust,
az általános dinamikát, a dallam-kontúrt, valamint a melódiai és harmóniai viszonyokat érinti. Ez az a
szint, amelyen a 2. és 3. fejezetben tárgyalt struktúrák jelennek meg. Egy mű annyira válik emlékezetes,
egyedi alkotássá (Norwegian Wood, Happy Birthday, a Grieg-zongoraverseny), amennyire makroszinten
eltér más művektől. Egy kisebb léptékű időskálán, a mikro‑ (vagy nüansz‑) szinten, a zenei affektus az egyes
hangok amplitúdójának, indításának és befejezésének mikro-időzítéseivel manipulálható. Ezen effektu-
sok nagyrészt nincsenek lejegyezve (vagy, a klasszikus zenében, legfeljebb előadási utasítások formájában
kerülnek papírra, mint pl. dolce vagy risoluto), és többnyire az előadó belátására vannak bízva. A nyugati
klasszikus zene hagyományaiban a makro-szintet többnyire a zeneszerző határozza meg, a mikro-szintet
pedig az előadó. Az olyan stílusokban azonban, mint a jazz, az előadó hatásköre kiterjed a hangok megvá-
lasztására is, és sok más stílus alig tesz egyáltalán különbséget a zeneszerző és az előadó között.
A ritmust és a dallamot érintő gondolatmenetünk a makro-szint számos paraméterére világít rá.
Az alapvető tempó meglehetősen egyszerű eset: a gyors, a lassú, vagy a mérsékelt tempó gyors, lassú, vagy
mérsékelt mozgás érzetét kelti, ennélfogva ezeknek megfelelő arousal27-szinteket és ezeknek megfelelő
affektív lehetőségeket jelent. Ezen kívül, egy dallam ritmikai karaktere is szerepet játszik az affektusban
– például egy egyenletes hangsorozatot szembeállíthatunk pontozott ritmusokkal (váltakozó hosszú és
rövid hangokkal), vagy olyan hangsorral, amelyben különböző hosszúságú hangok követik egymást. Az
egyenletes hangsorozat legközelebbi megfelelője lehet az olyan motoros aktivitás, mint a sétálás vagy kala-
pálás. Egy változatos ritmikájú hangsorozat leginkább a kifejező beszéd megfelelője lehet, mely szünetek-
kel tarkított, változó hosszúságú szótagok csoportjaiból áll, de más esetekben megfelelője lehet egy hezi-
táló, határozatlan mozgásnak is. Ezek a mintázatok egy általános affektív tónust közvetíthetnek.
26 Az empatikus affektusok közé sorolhatjuk annak érzetét, hogy valaki ellenáll vagy megadja magát a
testére ható, külső erőknek, mint amikor áthalad egy nagy ellenállású közegen, vagy amikor az em-
ber útjába állnak; ezeket szintén előhívhatja zene is. Ez a gondolatmenet megmagyarázhatja azt a ko-
rábbi megfigyelésünket is, hogy a zene nem fejez ki undort: valakinek a kimutatott undorára nincs
„közmegegyezés szerinti” reakció, sem reaktív, sem empatikus. Kivy, (2001), miközben továbbira is
ragaszkodik ahhoz, hogy csak egyféle affektus létezik, csak a reaktív affektus létjogosultságát ismeri
el, az empatikusét nem.
Nehezen tudunk ellenállni annak, hogy ne feltételezzük a tükörneuronok lehetséges szerepét (Rizo-
latti, Fadiga, Gallese & Fogassi, 1996), amelyeket az empatikus affektus megtapasztalásának és ext-
ernalizációjának képességében játszhatnak, azonban az a benyomásunk, hogy jelenleg még nem tu-
dunk róluk eleget ahhoz, hogy a szükséges részletességgel beszámolhassunk a szerepükről.
27 A magyar szaknyelvben is használt arousal szó jelentése: a szervezet ill. a figyelem általános ébersége /
izgalmi állapota, aktiváltsága
A zenei struktúra és az affektív válasz között a fentieknél részletesebb a 3.5. alfejezetben tárgyalt ös�-
szefüggésrendszer, amely a dallamok által közvetített feszültséggel és oldódással kapcsolatos . A „feszült-
ség” és „oldódás” kifejezések elárulják az összefüggést: ezek elsősorban testi állapotokat írnak le, és csak
származtatott módon vonatkoztatjuk hangok sorozatára. Hasonlóképp testesül meg a melódiai vonzás
is, a melódiai feszültség kiegészítő aspektusa. Például, a vezetőhang (közvetlenül az alaphang alatti hang)
46 mintha ösztönzést érezne arra, hogy a felette fél lépésre lévő stabil alaphang felé mozduljon el: képletesen
szólva, oldódni „akar” az alaphangra. A vonzóerők ellenében mozgó dallammenetek pedig mintha önálló
akarattal bírnának, mintha élőlények lennének. Egy dallam hangjai, melyek a hangmagasság-térben mo-
zognak, úgy viselkednek, mint a háromszögek Heider és Simmel rajzfilmjében.
A feszültség és vonzódás időbeli változásai azok, melyek mindenek felett megadják a zene dinami-
kai minőségét. A zene nem csak statikus érzelmeket és affektusokat fejez ki, mint az elegancia vagy a ko-
morság. A feszültség és vonzódás kaleidoszkopikus mintázatain keresztül egyik állapotból a másikba lép
át, úgy, hogy ezt szavakkal megfelelően le sem lehet írni.
Eltérően a zenei affektusok számos tulajdonságától, amelyeket a fentiekben megtárgyaltunk, ez
utóbbi erősen függ attól, hogy a hallgató mennyire tudja az adott zenei stílus nyelvtanát felhasználni a fe-
szültség és a vonzás időbeli változásainak megkonstruálására. Így, ahogy Davies (1994) rámutat, a zenei
affektus ezen aspektusa részleteiben csak a gyakorlott zenehallgatók számára áll rendelkezésre, és nem
lesz elérhető az amuzikális hallgatók számára (Bharucha et al. Peretz.
A zenei kifejezés időbeli mikro-szintjén az előadó képes manipulálni az egyes hangok, illetve han-
gok közötti átmenetek megszólalásának részleteit, hogy kidomborítsa a makroszintű kifejezéseket (az
affektusnak e kiváltó tényezőit nem tárgyalja Davies, 1994; Raffman, 1993 némileg igen). Sloboda és Jus-
lin (2001) a Stern által 1985-ben bevezetett „életerő-affektusok” kifejezést használják, e mikro-szintű ma-
nipulációk affektív tulajdonságainak jellemzéséhez. Az ilyen affektív részletek nem csak a zene sajátjai:
megjelenhetnek bármely motoros aktivitás globális modulációjában, a tánctól a zenekar vezénylésén át a
hegedűvonó kezeléséig. Maguktól értetődőek, amikor az emberek egymás mozgását észlelik, és affektus-
kiváltó jelekként használják őket.
A zenei felszínnek ezt a modulációját kiválóan ismerik az előadóművészet mesterei, és ők képesek
arra is, hogy a darab mikroszintű jellegét kreatívan, hangról hangra változtassák, összhangban a feszült-
ség és a vonzás makroszintű változásaival. Az előadóknak olyan mikroszintű formálási lehetőségek állnak
rendelkezésükre, mint az intonáció (hangmagasság-finombeállítás), a vibrato, a hangerő-görbe és a hang-
szín, a hangmagasság fölfelé vagy lefelé csúsztatása (portamento), a tempó pillanatról pillanatra való vál-
toztatása, valamint az egyes hangok megszólalásának késleltetése vagy előre hozása (Clarke, 1999; Gab-
rielsson, 1999; Palmer, 1996; Repp, 1998, 2000; Sloboda & Lehmann, 2001; Windsor & Clarke, 1997). 28
Műfajonként változik, hogy melyek az elfogadhatónak vagy stílusosnak számító mikroszintű variációk.
Például, a romantika korszakából származó klasszikus zene sokkal szabadabb változtatásokat enged meg
tempóban (a mögöttes lüktetés sebességében), mint a barokk zene vagy a jazz, a jazz azonban bármely
klasszikus műfajhoz képest sokkal inkább megkívánja, hogy jóval nagyobb mértékű legyen a hangmagas-
ság-moduláció és vibrato, illetve az egyes hangok az ütemhez képest előbb vagy később szólaljanak meg,
A mikroszintű variációknak ezek a lehetőségei nem írhatók le pontos nyelvi kifejezésekkel, az sem, hogy
a különböző zenei stílusok ezeket hogyan használják: nincsenek rájuk szavak. Az ember utánzással és „in-
tuícióval” tanulja meg őket, és hagyomány útján öröklődnek tovább. A mikrostruktúra maniplulációihoz
szükséges megfelelő paraméterek kezelésének elsajátításától lehet igazán „ráérezni” egy zenei stílusra, s ez
az, ami az igazi, művészi szinten játszó előadót megkülönbözteti attól, aki csak „eljátssza a hangokat” (ele-
gendő manipuláció nélkül), vagy attól, aki „ízléstelenül” [túlzott mértékű (vagy oda nem illő irányú – a
ford.) manipulációval] játszik.
A végeredmény tehát az, hogy nem beszélhetünk egy zeneműnek „az” affektusáról. Ami a zenei ki-
fejezést sokkal inkább különlegessé teszi, a bonyolult és szakadatlanul változó affektusok ezerféle lehető-

28 Magától értetődő módon, a szabadon változtatható paraméterek eme listája a hangszer mibenlététől
is függ – a ford.)
sége, s ezerféle lehetősége annak, hogy az egymással a kölcsönhatásba lépő affektus-források hogyan erő-
sítik vagy gyengítik egymást, induljanak ki akár a keretekből, akár az általános halláspszichológiából, akár A zenei képesség: mi az,
az emlősök vokalizációjából, vagy a gesztusmintázatok által kódolt üzenetekből. . és mitől különleges?

5. Záró gondolatok 47

E tanulmányban kísérletet tettünk arra, hogy áttekintsük a zenei képesség teljes komplexitását. Kü-
lönösen az affektusról szóló, utolsó fejezetben, jóformán lehetetlennek bizonyult, hogy kellőképp elkülö-
nítsük egymástól azokat az alkotóelemeket, amelyek a szűk értelemben vett zenei képességhez tartoznak,
azoktól, amelyek más művészeti ágakkal közösek, illetve azoktól, amelyek az általános auditív észlelés je-
lenségköréhez, a vokális kommunikációhoz, vagy az általánosabb értelemben vett kognícióhoz tartoznak.
A legkevesebb azonban, amit bátran állíthatunk, az az, hogy a zenei képesség bizonyos részei specifikus-
nak bizonyulnak: ezek az időben szabályos metrikai rácsok, a tonális hangmagasság-terek és a dallamra
alapuló hierarchikus feszültség- és vonzásmenetek.
Ezek a specifikusan zenei sajátságok olyan gazdagon fonódnak össze sok más kognitív és affek-
tív mechanizmussal, hogy lehetetlen a zenére „modulként” tekinteni, ahogy Fodor (1983) elképzelte. A
Jackendoff (2002) szerinti, lazább értelemben vett modularitás, amely több kisebb, egymással kölcsönha-
tásban lévő modult feltételez, talán a Peretz és Coltheart (2003) által javasolt koncepció mentén elfogad-
ható lehet. Különösképp számítunk arra, hogy egyes területek átfedést mutatnak a nyelvvel, más terüle-
tek viszont tőle elkülönülnek, ahogy korábban láttuk (Patel, 2003; Peretz & Coltheart, 2003; Peretz &
Hyde, 2003).
Javasoltuk, hogy a zenei affektus azon tényezőit, melyek megkülönböztetik azt másfajta – nem
zenei forrásból származó – affektusoktól, ne önmagukban próbáljuk megragadni, hanem inkább a ze-
nei struktúra és a motorikus mintázatok közötti kölcsönhatások mentén, amelyek affektust váltanak ki.
Mindezeknek megfelelően az egyik fő kérdésnek annak kell lennie, hogy a hallás időbeli mintázatai ho-
gyan kapcsolódhatnak össze a testtartások és gesztusok időbeli mintázataival, s ezek pedig hogyan kap-
csolódnak az affektushoz. Ezek a kérdések önmagában a zenei kogniciónál nagyobb területet érintenek,
azonban a zene kiváló forrása lehet további bizonyítéknak.

Köszönetnyilvánítás

Hálásak vagyunk Peter Bloom-nak, Robert Ladd-nak, Louise Litterick-nek, Jacques Mehler-nek,
Caroline Palmer-nek, Isabelle Peretz-nek, David Temperley-nek, és két névtelen olvasónknak, cik-
künk megírása során nyújtott fontos javaslataikért. Kutatásunk részben a National Institutes of Health
(Nemzeti Egészségügyi Intézetek, USA) DC 03660-as jelű kutatástámogatási program segítségével
valósult meg (R. J.).
Bibliográfia

• Ashley, R. (2002). Do(n’t) change a hair for me: The art of jazz rubato. Music Perception, 19, 311–
332.
• Balzano, G. J. (1980). The group-theoretic description of 12-fold and microtonal pitch systems.
48 Computer Music Journal, 4(4), 66–84.
• Beckman, M., & Pierrehumbert, J. (1986). Intonational structure in Japanese and English. Phono-
logy Yearbook, 3, 15–70.
• Bernstein, L. (1976). The unanswered question. Cambridge, MA: Harvard University Press.
• Bharucha, J. J. (1984). Anchoring effects in music: The resolution of dissonance. Cognitive Psycho-
logy, 16,
• 485–518.
• Bharucha, J. J. (1996). Melodic anchoring. Music Perception, 13, 383–400.
• Bharucha, J. J., Curtis, M., & Paroo, K. (this issue) Varieties of musical experience, doi:10.1016/
• j.cognition.2005.11.008.
• Bierwisch, M. (1979). Musik und Sprache: UÅN berlegungen zu ihrer Struktur und Funktions-
weise. Jahrbuch
• Peters 1978, 9–102. Leipzig: Edition Peters.
• Binder, A. W. (1959). Biblical chant. New York: Philosophical Library.
• Bloom, P., & Veres, C. (1991). The perceived intentionality of groups. Cognition, 71, B1–B9.
• Bregman, A. S. (1990). Auditory scene analysis. Cambridge, MA: MIT Press.
• Browne, R. (1981). Tonal implications of the diatonic set. In Theory Only, 5, 3–21.
• Burling, R. (1966). The metrics of children’s verse: A cross-linguistic study. American Anthropolo-
gist, 68,1418–1441.
• Clarke, E. (1999). Rhythm and timing in music. In D. Deutsch (Ed.), The psychology of music
(2nd ed., pp. 473–500). New York: Academic Press.
• Clough, J., Engebretsen, N., & Kochavi, J. (1999). Scales, sets, and interval cycles. Music Theory
Spectrum, 10, 19–42.
• Cross, I. (2003). Music, cognition, culture, and evolution. In I. Peretz & R. Zatorre (Eds.), The cog-
nitive neuroscience of music. New York: Oxford University Press.
• Culicover, P. W. (1999). Syntactic nuts: Hard cases in syntax. Oxford: Oxford University Press.
• Culicover, P. W., & Jackendoff, R. (2005). Simpler syntax. Oxford: Oxford University Press.
• D’A mato, M. R. (1988). A search for tonal pattern perception in cebus monkeys: Why monkeys
can’t hum a tune. Music Perception, 5, 453–480.
• Damasio, A. (1999). The feeling of what happens: Body and emotion in the making of conscious-
ness. New York: Harcourt Brace.
• Davies, S. (1994). Musical meaning and expression. Ithaca and London: Cornell University Press.
• Davies, S. (2001). Philosophical perspectives on music’s expressiveness. In Juslin and Sloboda
(2001a), 23–44.
• Deliege, I. (1987). Grouping conditions in listening to music: An approach to Lerdahl and Jacken-
doff’s Grouping Preference Rules. Music Perception, 4, 325–360.
• Deutsch, D. (1999). The processing of pitch combinations. In D. Deutsch (Ed.), The psychology of
music. New York: Academic Press.
• Fodor, J. (1983). Modularity of mind. Cambridge, MA: MIT Press.
• Gabrielsson, A. (1999). The performance of music. In D. Deutsch (Ed.), The psychology of music.
New York: Academic Press.
• Gabrielsson, A., & LindstroÅNm, E. (2001). The influence of musical structure on emotional exp-
ression. In Juslin and Sloboda (2001a), 223–248.
• Gjerdingen, R. O. (1994). Apparent motion in music?. Music Perception 11, 335–370.
• Goffman, E. (1974). Frame analysis: An essay on the organization of experience. New York: Har-
per and Row. Boston: Northeastern University Press.
• Goldberg, A. (1995). Constructions: A construction grammar approach to argument structure.
Chicago: University of Chicago Press. A zenei képesség: mi az,
• Gould, S. J., & Lewontin, R. (1979). The spandrels of San Marco and the Panglossian Paradigm: A és mitől különleges?
critique of the adaptationist programme. Proceedings of the Royal Society, B205, 581–598.
• Halle, M., & Keyser, S. J. (1971). English stress: Its form, its growth, and its role in verse. New York:
Harper & Row. 49
• Handel, S. (1989). Listening: An introduction to the perception of auditory events. Cambridge,-
MA:MIT Press.
• Hauser, M. D. (2001). The sound and the fury: Primate vocalizations as reflections of emotion and
thought. In Wallin, Merker, & Brown (2001), 77–102.
• Hauser, M. D., Chomsky, N., & Fitch, W. T. (2002). The faculty of language: What is it, who has it,
and how did it evolve?. Science 298, 1569–1579.
• Hauser, M. D., & Fowler, C. (1991). Declination in fundamental frequency is not unique to human
speech: Evidence from nonhuman primates. Journal of the Acoustic Society of America, 91,
363–369.
• Hauser, M. D., & McDermott, J. (2003). The evolution of the music faculty: A comparative per-
spective. Nature Neuroscience, 6, 663–668.
• Heider, F., & Simmel, M. (1944). An experimental study of apparent behavior. American Journal
of Psychology, 57, 243–259.
• Helmholtz, H. (1885). On the sensations of tone. New York: Dover.
• Hindemith, P. (1952). A composer’s world. Garden City, NY: Doubleday.
• Huron, D. (1996). The melodic arch in Western folksongs’. Computing in Musicology, 10, 3–23.
• Huron, D. (2001). Tone and voice: A derivation of the rules of voice-leading from perceptual prin-
ciples. Music Perception, 19, 1–64.
• Huron, D. (2003). Is music an evolutionary adaptation?. In I. Peretz & R. Zatorre (Eds.) The cogni-
tive neuroscience of music. New York: Oxford University Press.
• Jackendoff, R. (1992). Musical parsing and musical affect. Music Perception, 9, 199–230. Also in
• Jackendoff, Languages of the mind, MIT Press, 1992.
• Jackendoff, R. (2002). Foundations of language. Oxford: Oxford University Press.
• Jackendoff, R. (2006). Language, culture, consciousness: Essays on mental structure. Cambridge,
MA: MIT Press.
• Janata, P., Birk, J., Van Horn, J. D., Leman, M., Tillmann, B., & Bharucha, J. J. (2003). The cortical
topography of tonal structures underlying Western music. Science, 298, 2167–2170.
• Juslin, P., & Laukka, P. (2003). Communication of emotions in vocal expression and music perfor-
mance: Different channels, same code?. Psychological Bulletin 129, 770–814.
• Juslin, P. N., & Sloboda, J. A. (Eds.). (2001a). Music and emotion: Theory and research. Oxford:
Oxford University Press.
• Juslin, P. N., & Sloboda, J. A. (2001b). Music and emotion: Introduction. In Juslin and Sloboda
(2001a), 3–20.
• Kivy, P. (2001). New essays on musical understanding. Oxford: Oxford University Press.
• Krumhansl, C. L. (1990). Cognitive foundations of musical pitch. New York: Oxford University
Press.
• Ladd, D. R. (1996). Intonational phonology. Cambridge: Cambridge University Press.
• Larson, S. (2004). Musical forces and melodic expectations: Comparing computer models and ex-
perimental results. Music Perception, 21, 457–498.
• Lecanuet, J. P. (1996). Prenatal auditory experience. In I. Delie`ge & J. Sloboda (Eds.), Musical
beginnings. Oxford: Oxford University Press.
• Lerdahl, F. (2001). Tonal pitch space. New York: Oxford University Press.
• Lerdahl, F. (2003). The sounds of poetry viewed as music. In I. Peretz & R. Zatorre (Eds.), The cog-
nitive neuroscience of music. New York: Oxford University Press.
• Lerdahl, F., & Jackendoff, R. (1983). A generative grammar of tonal music. Cambridge, MA: MIT
Press.
• Lerdahl, F., & Krumhansl, C. (2004). La teoría La de la tensión tonal y sus consecuencias para la in-
vestigación musical. In J. Martín Galán & C. Villar-Taboada (Eds.), Los últimos diez años en
la investigación musical. Valladolid: Servicio de Publicaciones de la Universidad de Vallado-
50 lid.
• Liberman, M., & Prince, A. (1977). On stress and linguistic rhythm. Linguistic Inquiry, 8, 249–
336.
• Locke, D. (1982). Principles of offbeat timing and cross-rhythm in southern Ewe dance drum-
ming. Ethnomusicology, 26, 217–246.
• McNeill, D. (1992). Hand and mind: What gestures reveal about thought. Chicago: University of
Chicago Press.
• Meyer, L. (1956). Emotion and meaning in music. Chicago: University of Chicago Press.
• Meyer, L. (1967). On rehearing music. In Meyer (Ed.), Music, the arts, and ideas. Chicago: Uni-
versity of Chicago Press.
• Mitchell, R. W., & Gallaher, M. C. (2001). Embodying music: Matching music and dance in me-
mory. Music Perception, 19, 65–85.
• Narmour, E. (1990). The analysis and cognition of basic melodic structures. Chicago: University
of Chicago Press.
• Nettl, B. (1960). Cheremis musical styles. Bloomington: Indiana University Press.
• Nettl, B. (1973). Folk and traditional music of the western continents (2nd ed.). Englewood Cliffs,
NJ: Prentice-Hall.
• Oehrle, R. (1989). Temporal structures in verse design. In P. Kiparsky & G. Youmans (Eds.), Pho-
netics and phonology: Rhythm and meter. New York: Academic Press.
• Palmer, C. (1996). Anatomy of a performance: Sources of musical expression. Music Perception,
13, 433–453.
• Paschen, E., & Mosby, R. P. (Eds.). (2001). Poetry speaks. Naperville, IL: Sourcebooks.
• Patel, A. D. (2003). Language, music, syntax, and the brain. Nature Neuroscience, 6, 674–681.
• Peretz, I. (2001). Music perception and recognition. In B. Rapp (Ed.), The handbook of cognitive
neuropsychology (pp. 519–540). Philadelphia: Psychology Press.
• Peretz, I. (2003). Brain specialization for music: New evidence from congenital amusia. In I. Pe-
retz & R. Zatorre (Eds.), The cognitive neuroscience of music. New York: Oxford Univers-
ity Press.
• Peretz, I. (this issue) The nature of music: A biological perspective.
• Peretz, I., & Coltheart, M. (2003). Modularity of music processing. Nature Neuroscience, 6, 688–
691.
• Peretz, I., & Hyde, K. L. (2003). What is specific to music processing? Insights from congenital
amusia.Trends in Cognitive Sciences, 7, 362–367.
• Pinker, S., & Jackendoff, R. (2005). The faculty of language: What’s special about it? Cognition 95,
201–236.
• Phillips-Silver, J., & Trainor, L. J. (2005). Feeling the beat: Movement influences infant rhythm per-
ception. Science, 308, 1430.
• Plomp, R., & Levelt, W. J. M. (1965). Tonal consonance and critical bandwidth. Journal of the
Acoustical Society of America, 38, 548–560.
• Pollard, C., & Sag, I. (1987). Information-based syntax and semantics. Stanford: CSLI.
• Pollard, C., & Sag, I. (1994). Head-driven phrase structure grammar. Chicago: University of Chi-
cago Press.
• Pressing, J. (1983). Cognitive isomorphisms between pitch and rhythm in world musics: West Af-
rica, the Balkans and western tonality. Studies in Music, 17, 38–61.
• Prince, A., & Smolensky, P. (1993). Optimality theory: Constraint interaction in generative gram-
mar. Piscataway, NJ: Rutgers University Center for Cognitive Science.
• Raffman, D. (1993). Language, music, and mind. Cambridge, MA: MIT Press.
• Rahn, J. (1983). A theory for all music: Problems and solutions in the analysis of non-Western for- A zenei képesség: mi az,
ms.Toronto: University of Toronto Press. és mitől különleges?
• Rahn, J. (1996). Perceptual aspects of tuning in a Balinese gamelan angklung for North American
students. Canadian University Music Review, 16.2, 1–43.
• Rameau, J.-P. (1737). GeÅLneÅLration harmonique. Paris: Prault fils. 51
• Repp, B. H. (1998). The detectability of local deviations from a typical expressive timing pattern.
MusicPerception, 15, 265–289.
• Repp, B. H. (2000). Pattern typicality and dimensional interactions in pianists’ imitation of expres-
sive timing and dynamics. Music Perception, 18, 173–211.
• Rizolatti, G., Fadiga, L., Gallese, V., & Fogassi, L. (1996). Premotor cortex and the recognition of
motor actions. Cognitive Brain Research, 3, 131–141.
• Rosch, E. (1975). Cognitive reference points. Cognitive Psychology, 7, 532–547.
• Sargent, W. (1964). Jazz: A history. New York: McGraw-Hill.
• Scharf, B., Quigley, S., Aoki, C., Peachery, N., & Reeves, A. (1987). Focused auditory attention and
frequency selectivity. Perception & Psychophysics, 42, 215–223.
• Schenker, H. (1935). Free composition. Tr. E. Oster. New York, Longman, 1979.
• Scherer, K. R., & Zentner, M. R. (2001). Emotional effects of music: Production rules. In Juslin &
Sloboda (2001), 361–392.
• Singer, A. (1974). The metrical structure of Macedonian dance. Ethnomusicology, 18, 379–404.
• Sloboda, J. A., & Juslin, P. N. (2001). Psychological perspectives on music and emotion. In Juslin &
Sloboda, 2001, 71–104.
• Sloboda, J. A., & Lehmann, A. C. (2001). Tracking performance correlates of changes in perceived
intensity of emotion during different interpretations of a Chopin piano prelude. Music Per-
ception, 19, 87–120.
• Smith, N., & Cuddy, L. (2003). Perceptions of musical dimensions in Beethoven’s Waldstein sona-
ta: An application of tonal pitch space theory. Musicae Scientiae, 7.1, 7–34.
• Spencer, A. (1996). Phonology. Oxford: Blackwell.
• Stern, D. (1985). The interpersonal world of the infant: A view from psychoanalysis and develop-
mental psychology. New York: Basic Books.
• Temperley, D. (2001). The cognition of basic musical structures. Cambridge, MA: MIT Press.
• Terhardt, E. (1974). Pitch, consonance, and harmony. Journal of the Acoustical Society of Ameri-
ca, 55, 1061–1069.
• Tomasello, M. (2003). Constructing a language: A usage-based theory of language acquisition.
Cambridge, MA: Harvard University Press.
• Trehub, S. E. (2003). The developmental origins of musicality. Nature Neuroscience, 6, 669–673.
• Trehub, S. E., & Hannon, E. E. (this volume). Infant music perception: Domain-general or doma-
inspecific mechanisms? Cognition.
• Wallin, N. L., Merker, B., & Brown, S. (Eds.). (2000). The origins of music. Cambridge, MA: MIT
Press.
• Wertheimer, M. (1923). Laws of organization in perceptual forms. Reprinted in W. D. Ellis (Ed.),
A source book of Gestalt Psychology (pp. 71–88). London: Routledge and Kegan Paul,
1938.
• Windsor, W. L., & Clarke, E. (1997). Expressive timing and dynamics in real and artificial musical
performances: Using an algorithm as an analytical tool. Music Perception, 15, 127–152.
• Wright, A. A., Rivera, J. J., Hulse, S. H., Shyan, M., & Neiworth, J. J. (2000). Music perception and
cctave generalization in rhesus monkeys. Journal of Experimental Psychology. General, 129,
291–307.
• Yip, M. (2002). Tone. Cambridge: Cambridge University Press.
52
Patrik N. Juslin
Fordította:
Bandi Szabolcs Ajtony

A zene kifejezőerejének öt 53

tényezője: a zenei előadásmód


a pszichológus szemszögéből
A zene kifejezőerejének
Absztrakt öt tényezője: a zenei
előadásmód a pszichológus
A cikk célja az, hogy egy olyan pszichológiai megközelítésmódot vázoljon fel a zenei előadásmód szemszögéből
témakörében, amely szilárd alapot tud biztosítani a kifejezőképesség fejlesztésében a zenepedagógiában.
Korábbi vizsgálatok alapján a szerző arra következtetett, hogy a zenei előadásmód kifejezőereje legjobban
egy több dimenziós, öt komponensű jelenségként ragadható meg, melynek elemei: (a) generatív szabá- 55
lyok, melyek célja a világos zenei struktúra kialakítása; (b) érzelmi kifejezés, melynek feladata, hogy a be-
fogadó számára közvetítse a kívánt érzelmeket.; (c) véletlenszerű variációk, melyek a tempótartás válto-
zatosságát és a motoros késleltetésekből adódó korlátokat tükrözik, (d) mozgásos alapelvek, amelyek azt
íráják elő, hogy az előadásmód néhány aspektusát (pl. időzítés) a biológiai mozgás mintázataival összhang-
ban kell kialakítani; és (e) váratlan stilisztikai fordulatok, amelyekhez az előadásmód konvencióitól való
aktuális eltérések tartoznak. Az előadásmód kifejezőerejének a fenti öt összetevő alapján végzett elemzé-
se – ezeket összefoglalóan GERMS modellnek nevezzük – fontos irányokat mutathat a zenei előadás to-
vábbi kutatása és oktatása számára.

Kulcsszavak:
komputációs modellezés, érzelem, kifejezőerő, zenepedagógia, zenei előadásmód

A vonót a hangszeréhez illesztette... aztán az első, határozott és szenvedélyes hangok betöltötték a


termet. Azonnal működött a varázslat. Ez valóban a hegedű muzsikája volt? Milyen nag ysze-
rűen folytak eg ymásba a hangok, micsoda tökéletes tisztaság! Aztán két húron játszott, harmo-
nikus hangokból álló futamok következtek, majd eg y hosszú futam, amely nég y oktávot ölelt át,
staccato-ban játszva, eg yetlen vonással... Majd eg y nemes, megindító téma következett, ami úg y
szólt, mintha valaki énekelt volna... Majd miután alábbhag yott a végtelennek tűnő taps, Paga-
nini nekifogott a második tételnek. Eg y adagio volt, amely a virtuózt eg y teljesen más szemszög-
ből mutatta meg. Nyoma sem volt azoknak az ördögi trükköknek, amelyek az első tétel alatt el-
kápráztatták a közönséget. Az elegancia és az eg yszerűség fenséges, ang yali éneke megérintette a
közönség szívét... A hangok úg y követték eg ymást, mintha a hangszerből nőttek volna ki, hihetet-
lennek tűnt... hog y ez a fából készült tárg y nem a zenésznek volt szerves része, hanem a lelke leg-
mélyének... A közönség bénultan ült, amíg eg y könnyed rondo meg nem változtatta a hangulatu-
kat... eg y végtelenül szelíd pizzicato kísérte a dallamot, amely aztán vidám tánczenévé alakult át.
(Farga, 1969: 171–2)

Ebben a leírásban, mely Nicolo Paganini 1828-as bécsi előadásáról szól, számos, a zenei kifejezőerőt
érintő, visszatérő elgondolás fedezhető fel: a magával ragadó élmény, bizonyos hangszerek énekhangszerű
jellege, az elgondolás, hogy a zene megváltoztathatja a befogadó hangulatát, a szoros kapcsolat a zene és az
érzelemkifejezés között, a feltevés, hogy a kifejezőerő akutsztikus paraméterekbe ágyazottan jelenik meg
az előadás során, az a gondolat, hogy a kifejezőerő, „az előadó lelkének mélyéből ered”, a zenei mű fontos-
ságának kérdése a benyomás kialakításában és az „ördögi praktikák”, amelyeket gyakran tulajdonítanak a
virtuóz zenészeknek. (1) Vajon remélhetik a kutatók, hogy valaha képesek lesznek megmagyarázni ezt a
lászólag megmagyarázhatatlan jelenséget? Néhány előadóművész véleménye alapján inkább azt gondol-
nánk, hogy nem (Dubal, 1985). Ahogy Sloboda (2000) fogalmaz, gyakran úgy tűnik, „a zenei világ naiv
pszichológiája úgy épül fel, hogy a válaszokat misztikus köd fedje el” (398. o.). Nos, én úgy vélem, hogy a
pszichológus számára nem csak lehetséges a zenei kifejezőerő sikeres vizsgálata, hanem kifejezetten köte-
lessége. Úgy vélem, a pszichológiai megközelítés elsődleges célja a zenei előadásmód kutatásában az kell
legyen, hogy magyarázó keretet tudjon biztosítani a zenei kifejezőerő értelmezésének, amely szilárd alap
lehet az oktatásba való átültetés folyamatában. Nehéz feladatnak tűnhet a zenei kifejezéserő magyaráza-
ta, de közel sem nehezebbnek, mint számos más probléma, amelyek értelmezésével a pszichológusok nap
mint nap szembesülnek (pl. a tudatosság fogalmának magyarázata). A kifejezőerőt érintő kérdésekben
már túlságosan is régóta alkalmazkodnak a pszichológusok a filozófusokhoz. Úgy vélem, itt az ideje, hogy
a pszichológusok visszatérjenek a kifejezőerő tanulmányozásához. Sok – ha nem az összes – a kifejezőerőt
érintő kérdés feldolgozható empirikus keretben is.
Miért a kifejezőerő kérdéskörét választottam központi témának? Mert ez az, ami a zenei előadást
valamirevalóvá teszi. A kifejezésmód az, ami miatt az emberek inkább sok fáradtságot és nehézséget vál-
56 lalva, más emberek által előadott zenét hallgatnak, szemben a komputerizált, fémízű zenével. A zenei ki-
fejezőerő teszi lehetővé ismerős darabok új és ötletes interpretációit, és ez az alapja annak is, hogy egyik
előadót jobban kedveljük a másiknál. Hovatovább, kérdőíves kutatások igazolják, hogy a legtöbb előadó
és zenetanár is a kifejezőerőt tekinti az előadói készségek között a legfontosabbnak (Lindström et al.,
megjelenés előtt; Laukka, 2003). A zenei kifejezőerőnek tulajdonított jelentős szerep ellenére kutatások
azt bizonyítják, hogy a kifejezőkészségek fejlesztése gyakran mellőzött terület az oktatásban. (pl. Persson,
1993; Rostwall és West, 2001; Tait, 1992). Ahogy azt már korábban jeleztem (pl. Juslin és Person, 2002),
ennek okai között szerepelhet az is, hogy a tanárok nem rendelkeznek megfelelő elméleti kerettel, amely
alapján az oktatás folyhatna. A helyzetet nehezíti, hogy a zenei kifejezőerő implict jellegű tudást feltéte-
lez, amit a tanár nehezen tud csak átadni a diákok számára. A kifejezőerő kutatása segítséget jelenthet ab-
ban, hogy az implicit tudást explicitté tegyük. Ahelyett, hogy a zenei tehetség nevében a kifejezőképes-
ségben megnyilvánuló egyéni különbségekből indulnánk ki, a zenei kifejezőerőt elméletalapú oktatással
közelítjük meg. Ebből adódóan a zenei kifejezőerő mögött húzódó mechanizmusok helytálló és tudo-
mányos alapú értelmezésének megvannak a tudományos, társadalmi és pedagógiai vonatkozásai is (Slo-
boda, 2000).
Jelen tanulmányomban az előadó szerepét tekintem át a zenei kifejezőerő tükrében. Arról kívá-
nom meggyőzni az olvasót, hogy a zenei kifejezőerő problémája empirikusan megközelíthető és feltárha-
tó, illetve hogy a pszichológiai elméleteknek kiemelt jelentőségük van az értelmezésében. Ha visszatekin-
tünk, megfigyelhetjük, hogy az előadásmód kifejezőerejének vizsgálatában a pszichológusok jellemzően
a zenei előadások különféle akusztikai változóinak mérésére szorítkoztak (pl. Gabrielsson, 1999, 2003).
Gyakran csak tisztán leíró jellegű megállapítások születtek, követve a Seashore (1938) és munkatársai ál-
tal megkezdett tradíciót. Ennek következtében a zenei kifejezőerő fogalmát meglehetősen szegényesen
írták körül (3). A zenei kifejezésmód kérdésköre túlnyomórészt akusztikai adatokat bemutató tábláza-
tokra és grafikonokra korlátozódott, míg arra a kérdésre, hogy ezek az információk valójában mit is mon-
danak el számunkra a zenei kifejezőerő eredetéről, valahogy elveszett a válasz. De talán a pszichológia az
egyetlen terület, amelyik alkalmas arra, hogy górcső alá vegye a kifejezőerő kérdését? Tulajdonképpen
már a kezdetektől fogva indokolt volt a pszichológusok részéről a pszichofiziológiai kapcsolatok vizsgá-
lata, amelyek a zenei kifejezőerő hátterében állhatnak (Leahey, 1987). Mostanra azonban vitathatatlanul
megállapítható, hogy a pszichológia tudománya egyelőre nem töltötte be a lehetséges szerepét a vizsgálati
terület elméleti megalapozásában. Véleményem szerint a zenei kifejezőerő pszichológiai kutatásának re-
flektálnia kell arra, hogy a zenei kifejezésben hogyan nyilvánulnak meg az alapvető humánspecifikus ké-
pességek és más tulajdonságok, amelyek nem szükségszerűen a zeneiség sajátjai. A jelen tanulmányunk-
ban áttekintett friss kutatási eredmények bizonyítani fogják ezt a nézetünket .
A cikk felépítése a következők szerint alakul: először munkadefiníciót adunk az interpretáció, ki-
fejezőerő és kommunikáció fogalmaira, majd megvizsgáljuk azokat a kifejezőerő kutatásában korábban
felmerült problémákat, amelyek megakadályozták a terület fejlődését. A második részben felvázolok egy
olyan modellt, amely a zenei kifejezés pszichológiai megközelítésében öt tényezőt különít el. Sajnálatos
módon meglehetősen csekély azon próbálkozások száma, amelyek integrálnák a fenti tényezőket, ezért
egy alternatív meta-elméletet vázolok fel, amely kísérletet tesz a kifejezőerő különböző tényezőinek in-
tegrációjára. Nem túl meglepő módon a jelen modellel végzett empirikus vizsgálatok eredményei azt su-
gallják, hogy az érzelmek jelentik a kifejezőerő egyik fő alkotóelemét. Ebből adódóan a zenei előadásmód
és az érzelmek viszonyának irodalmát is röviden áttekintem. Végül az előadáskutatás és a zenepedagógia
pszichológiai megközelítésmódjának különféle egyéb vonatkozásait tekintem át, illetve a megközelítés-
mód lehetséges korlátairól is szót ejtek.
A zene kifejezőerejének
Munkadefiníciók öt tényezője: a zenei
előadásmód a pszichológus
Az interpretáció, kifejezőerő és kommunikáció komplex fogalmak, és tulajdonképpen nem is szá- szemszögéből
mít, hogy a jelen cikkben mit mondunk el róluk, biztosak lehetünk benne, hogy nem az lesz a végszó a
kérdésben. Ugyanakkor praktikus okokból legalább előzetes munkadefiníciókat kell megfogalmaznunk
minden egyes fogalomra. Az interpretáció fogalma tipikusan arra vonatkozik, hogy az előadó az adott mű- 57
vet saját zenei ötletei alapján milyen egyéni módon képes megformálni (Palmer, 1997: 119). Ide tartozhat
az előadónak az a szándéka, hogy kifejezzen olyasvalamit (pl. egy gondolatot vagy érzelmet) ami a darab
zenei struktúráján túlmutat (Gabrielsson, 1999), de az ilyen jellegű érzelmeket a struktúra előadásának
módja fejezi ki (azaz ahog y a zenész azt előadja). Az interpretáció folyamata kevésbé kutatott terület (de
lásd pl. Hallam, 1995; Persson, 1993), de a vizsgálatok szerint hatással vannak rá „belső” tényezők (pl. érzel-
mek; valami személyes kifejezésének a szándéka) és „külső tényezők” (pl.: zenei stílus, a darab szerkezet, a
szerző szándéka) egyaránt (Lindström et al., szerk. alatt; Persson, 2001: 278-81).
A kifejezőerő megközelítésünk szerint olyan perceptuális tulajdonságok halmaza, amely a zene “ob-
jektív” tulajdonságai és a hallgató által észlelt „szubjektív” (vagy inkább objektív, ám részben személyiség-
függő) zenei benyomás közötti pszichofizikai kapcsolatot tükrözi. A kifejezőerő ugyanakkor nem csak
kizárólag a zene akusztikai tulajdonságaihoz kapcsolódik (különböző befogadók különböző kifejezési
élményt élhetnek meg), ám nem is kapcsolható kizárólagos módon a befogadó pszichikumához (az előa-
dásmódban megjelenő kifejezőerőről alkotott véleménye a befogadóknak általánosságban gyakran meg-
egyezik). A kifejezőerő mindkét fenti faktor függvénye, s egy szisztematikusan felépíthető, bár komplex
rendszert alkot, (Juslin, 2000). Az, ahogy a kifejező zenei előadásmódot észleljük arra emlékeztet ben-
nünket, ahogy az emberek a mindennapi életben kifejezik belső állapotaikat (különben miért használ-
nánk a „kifejezni” terminust mindkét esetben?). Valóban, a kifejezési formák jelemzésekor hajlamosak va-
gyunk arra, hogy még élettelen tárgyakat is emberi tulajdonságokkal írjunk le. (e.g. Eibl-Eibesfeldt, 1989).
Alkalmanként a kifejező előadásmód észlelése során érzelmek alakulnak ki a hallgatóban (amikor valaki
„meghatódik”, „elérzékenyül”), vagy akár esztétikai válaszok is (ami egy komplexebb és mélyebb reakciótí-
pus, amely tartalmaz érzelmi, kognitív és társas összetevőket egyaránt; Konecni, 1979) létrejöhetnek, de
ez a reakciótípus nem szükséges ahhoz, hogy a befogadó kifejezőnek hallja a zenét (Davies, 1994). A be-
fogadóban kialakult érzelmi állapot megegyezhet azzal, amit az előadó kifejez (az „érzelmek ragályossá-
ga” által; Juslin, 2001), vagy lehet kiegészítő érzelmi válasz (Juslin és Zentner, 2002). Ahogy Clynes (1977:
60) megjegyzi, amikor meggyőző kifejezőerővel találkozunk, azt az előadó „őszinteségének” könyveljük
el: ezért válik egyre könnyebbé a vele való együttérzés.
Ha a kifejezőerő általános fogalmát elfogadjuk, a következő kérdés merül fel: mi az, amit a zene ki-
fejez? A szakirodalmi áttekintés rengeteg lehetőséget vázol fel azzal kapcsolatban, hogy mi az, amit a zene
kifejezhet. A zenére érzelmek, fizikai jellegzetességek (mozgás, erő), feszültség és nyugalom, személyis-
égjegyek, szépség, események, tárgyak, zenei konvenciók, vallásos hit és társas viszonyok kifejezőjeként
is tekintenek (Gabrielsson és Juslin, 2003). Egy meglehetősen nagyvonalú nézet szerint a fenti felsorolás-
ból minden megnyilvánulhat a zene kifejezőerejében, ha vannak olyan egyedi befogadók, akik azt állít-
ják, hogy megtalálták a zenében őket. Ezzel a nagyvonalú nézettel az egyik probléma az, hogy önkényes
asszociációkat is megenged, amelyeket a befogadók a zenei előadásmóddal kapcsolatban kialakíthatnak
magukban. Ezáltal ez csupán a kondicionálás egyik egyszerű formájának tekinthető, amely nem sokban
kapcsolódik magához az előadásmódhoz: többet mond el a befogadóról mint a zenéről. Gyümölcsözőbb
megközelítés lehet, ha olyan tényezőket keresünk, amelyek a zene sajátosságaival állnak kapcsolatban, leg-
alábbis akkor, ha a célunk az előadásmód kifejezőerejének magyarázata.
Egy, a zenei kifejezés kutatása során gyakran alkalmazott, szigorúbb megközelítés szerint akkor
mondhatjuk, hogy a zene kifejez egy bizonyos minőséget, ha ebben a befogadók legalább egy minimá-
lis szinten eg yetértenek (feltételezhetően azért, mert van az adott előadásmódban valami, ami hasonló be-
fogadói percepciókat idéz elő). Például vélhetően egyetértünk abban, hogy Beethoven Eroica szimfóni-
ájának lassú tételei mondjuk szomorúságot fejeznek ki (bár a kifejezőerő a darab során természetesen
gyorsan megváltozhat). Az ilyen típusú interszubjektív eg yetértések esetében inkább hajlunk arra, hogy azt
mondjuk, „Ez a darab szomorkás hangulatú”. Ugyanakkor fontos megjegyeznünk, hogy a kifejezőerő (az
általunk használt meghatározás szerint) nem szükségesen tartalmaz kifejezési szándékot.
A kommunikáció fogalma (például érzelmek közlése) az előzőekkel ellentétben még tovább megy:
úgy vélem a pontos kommunikáció egyszerre igényeli, hogy az előadónak szándékában álljon, hogy egy
58 meghatározott gondolatát kifejeze, illetve azt, hogy a hallgató ezt a gondolatot felismerje. Talán furcsá-
nak tűnhet, hogy a kommunikáció pontosságáról beszélünk a zene területén. Mégis, számos előadó
vélhetően aggódik – vagy aggódnia kellene! – amiatt, hogy a zenei interpretációjukat a hallgatók tény-
legesen úgy észlelik-e, ahogy azt ők közölni szándékozták. (Mi értelme van a különleges és egyedi in-
terpretációknak, ha a hallgatók képtelenek befogadni őket?) Például az előadó egy olyan érzelmi karak-
tert szeretne kiemelni a darabban, amely a kompozícióban csak látens módon van jelen. Annak mértéke,
hogy az előadó és a befogadó mennyire ért egyet az előadásmód érzelmi kifejezőerejével, pragmatikusan
a zenei kommunikáció pontosságával jellemezhető. (Azt, hogy véleményem szerint pontosan mely per-
ceptuális tulajdonságok járulnak hozzá az előadásmód kifejezőerejéhez, később, a pszichológiai megkö-
zelítésmódnál tárgyaljuk meg.)

Az előadásmód kifejezőerejének kutatási problémái


Ahhoz hogy a zenei előadást egy olyan eseményként értelmezzük, amely meghatározott szemé-
lyek jelenlétében, adott időben és helyen jelentést hordoz (Small, 1999), egy, mindennapi életünket behá-
lózó, hatalmas kapcsolatrendszert is figyelembe kell vennünk. Hogy némi fogalmunk legyen arról, hogy
mennyi nehézséggel jár egy ilyen jellegű törekvés, nézzük meg azoknak a lehetséges tényezőknek a listá-
ját, amelyek – elviekben – befolyásolhatják a kifejezőerőt (1. sz. táblázat). Látható, hogy a táblázat számos
olyan tényezőt tartalmaz, amely a darabbal, hangszerrel, előadóval, befogadóval és az előadásmóddal kap-
csolatos (a további releváns tényezők szerepéről bővebben ld. Gabrielsson, 2003; Rink, 2003). Az összes
változó egyidejű modellezése kétségkívül lehetetlen. Hogy a probléma leegyszerűsödjön, a kutatók kény-
telenek voltak zárójelbe tenni az 1. sz. táblázatban felsorolt tényezők legtöbbjét, és inkább az előadásmód
azon központi szervezőelveire fókuszáltak, amelyek túlmutatnak az adott téren és időn (legalábbis a nyu-
gati világra vonatkozóan). A gyakorlatban ez azt jelentette, hogy a hangsúly áthelyeződött az előadásmód
mérésére, úgy, hogy alkalmanként megkísérelték a más tényezőkkel való kapcsolódásokat is megvizsgál-
ni (pl. kottakép, az előadó kifejezési szándéka, a hallgató percepciója stb.). Úgy tűnik azonban, még e szűk
fókuszú kutatások számára is komoly kihívást jelent a zenei előadásmód általános természetének leírása.
Mi okozhatja ezt?

1. sz. táblázat: Példák azokra a tényezőkre, amelyek a zenei előadásmód kifejezőerejét befolyásolhatják

Jellemző Példák a faktorokra


Zenei darabtól Maga a zenei kompozíció
függő A darab nem-tonális variációi
A szerző(k) írásos instrukcióihoz való viszonyulás
Zenei stílus/irányzat
Hangszertől Lehetséges akusztikai paraméterek
függő A hangszín, hangmagasság stb. hangszerspecifikus jellemzői
Az adott hangszer technikai nehézségei
Előadótól függő Az előadó szerkezeti interpretációja
Az előadónak azon kifejezési szándéka, mely reflektál a darab hangulatára
Az előadó érzelemkifejezési stílusa
Az előadó technikai képességei
Az előadó motoros pontossága
Az előadó hangulata játék közben
Az előadó interakciója további előadókkal
Az előadó képe/interakciója a közönségről/közönséggel
A zene kifejezőerejének
öt tényezője: a zenei
Befogadótól A befogadó zenei preferenciái
függő A befogadó műértésének szintje előadásmód a pszichológus
A befogadó személyisége szemszögéből
A befogadó aktuális hangulata
A befogadó figyelmi szintje
Kontextustól Akusztika 59
függő Hangtechnika
Zenehallgatás kontextusa (pl. felvételről, koncerten)
Mások jelenléte
Vizuális hatások
Tágabb kulturális és történelmi környezet
Születik-e az előadásról formális értékelés

Láthatóan számos problémával kell szembenéznie az előadásmód kutatóinak. Először is, rendszerint
nehézséget jelent nagy mintát szerezni professzionális zenészek előadásairól (ezzel ellentétben ld. Repp,
1998). Ez a probléma jelentős anyagi és időbeli befektetéssel részben kezelhető, valamint segítséget jelent-
het az is, ha a kutatásokat egyre inkább az előadók saját feltételei szerint végezzük. Másodszor, még ha si-
kerül is megfelelő nagyságú mintához jutnunk, nehéz és időigényes folyamat az összes releváns akusztikai
változó vizsgálata (Palmer, 1997). Folynak ígéretes fejlesztések olyan számítógépes algoritmusok létreho-
zására, amelyek automatikusan képesek kiszűrni a kívánt akusztikai változókat (pl. Friberg et al., 2002),
ez nagy segítséget jelenthet nagyobb minták gyorsabb elemzéséhez. Úgy tűnik ez a probléma hamarosan
megoldódhat. A legkomolyabb akadályt nem is igazából a nagy minta megszerzése jelenti, hanem inkább
az, hogy megtaláljuk, hogyan értelmezzük ezt a gazdag vizsgálati anyagot. (Gabrielsson és Juslin, 1996).
Itt van az a pont, ahol a pszichológiai elméletalkotás döntő jelentőségű hozzájárulást tehet ahhoz,
hogy hogyan is vélekedünk a kifejezőerő fogalmáról. Annak, hogy a kifejezőerő fogalmának magyaráza-
tában nem jutottunk előbbre, úgy vélem, leginkább az az általános tendencia az akadálya, hogy a kifejező-
erőt gyakran egyetlen fogalomnak, egy természetes, homogén kategóriának tekintik. Ha megnézzük, mi-
lyen viták vették körül a kifejezőerő fogalmát a történelem folyamán (Davies, 1994), talán már érthetővé
válik, hogy számos szerző miért hagyta definíció nélkül a fogalmat, vagy egyszerűen úgy „definiálta”, mint
a „kottától való eltérések összessége”. Aggasztóan sok azonban azoknak a tanulmányoknak a száma, ame-
lyek a kifejezőerőt valamiféle misztikus jellegzetességként kezelték, amelyből “több” vagy “kevesebb” van,
úgy, hogy nem határozták meg a specifikus jelentéstartamát (ezek alapján a kifejezőerő lehetett pl. „megfe-
lelő”, „túlzó” vagy „hiányos”). Nincsenek kidolgozott elképzelések arról, hogy mi az, ami kifejeződik és ho-
g yan válik kifejezővé, ami azt a látszatot kelti, hogy a kifejező előadásmódnak csupán egyetlen lehetséges
típusa van (a „megfelelő mértékű kifejezőerő”). Időnként már-már úgy tűnik, hogy a kifejezőerő fogalma
alatt értendő minden olyan jellegzetesség, amitől egy adott előadás jó lehet, de hogy mit is jelent pontosan
az, hogy jó, ez sem tisztázott. A kérdés nem is igazán az, hogy a „kifejezőerő” kifejezés használata mennyi-
ben hasznos, hanem inkább az, hogy az oktatás szempontjából – „Legyen kicsit kifejezőbb!” – vajon ez-e
a vizsgálódások leggyümölcsözőbb szintje. Empirikus alapokon állva elutasítom azt az álláspontot, hogy a
zene „általánosságban” kifejező lehet anélkül, hogy egy meghatározott módon ne lenne az, ugyanis minden
zenei előadás rendelkezik bizonyos akusztikai jegyekkel, amelyek kifejezésmódjukban megkülönböztetik
más akusztikai jellegzetességekkel bíró daraboktól. (Két ugyanannyira „kifejezőnek” és „érzelemtelinek”
ítélt előadás teljesen eltérő akusztikai paraméterekkel rendelkezhet, és jelentősen különböző hatást vált-
hatnak ki a hallgatóban annak fényében, hogy ezeket a tulajdonságokat hog yan fejezik ki.)
Még fontosabb, hogy zenei produkciókban a tipikusan fellelhető kifejezőerő-variánsok nem egy-
formák: nem ugyanarról a tőről fakadnak és ebből adódóan tanítani sem lehet őket ugyanúgy. Úgy látom,
a kifejezőerő „egyfaktoros megközelítése” jelentősen hozzájárult az előadásmód kutatásának jelen álla-
potban tapasztalható széttöredezettségéhez. Visszavetette az integratív kezdeményezések fejlődését még
azon kutatók között is, akik több dimenziós konstruktumként kezelték a kifejezőerőt. Úgy gondolom,
egy elfogadható modell nem hagyhatja figyelmen kívül a tényt, hogy a kifejezőerő egy több faktoros je-
lenség, amelyben az információkat különálló komponensek tartalmazzák. Az, hogy ezek a komponensek
pontosan mik, már elméleti és empirikus kérdés. A következőkben összefoglalom, hogy az eddigi kutatá-
sok mit tudtak elmondani nekünk a zenei előadásmód kérdéskörének problémáiról.
IP ™™ 3 IR(VR)
(hP) ™™ (h, xs)
(VR)

5 ID ™™
(xs) ™
Az IP
b™™
4 aelőadásmód kifejezőerejének pszichológiai megközelítése
a
# A legfőbb cél a zenei előadásmód
P 5
œ
3 kifejezőerejének kutatásában annak megértése, hogy az előadó
&
pontosan œmit „ad hozzá” többletként œœ a leírt darabhoz.
œ œközelebbrőlœmegvizsgálni, hogy
Tanulságos lehetœ
œ
ennek a törekvésnek œ
milyen következményei œ
lehetnek. œœ komplex min-
Az előadásmód kutatói a viselkedés
Bsn.
? # œ.találják szemben magukat,
tázataival œ. le kell írniuk œ
.œ és meg kell magyarázniuk, az akusztikai
. paraméterek
60 változatos és bonyolult mintázatainak természetét és eredetét, amelyek egy zenemű előadása során meg-
3
mutatkoznak. (ld. 1. sz. ábra).PA probléma az, hogy ™™ “ha csak konkrét
2 előadásokat vizsgálunk önmagukban,
4 ™
nehezen5 tudjuk elkülöníteni az egymással kombinálódó, de egyébként ™™pszichológiailag elkülönülő exp-
R
ID
resszív mozzanatok hatásait.” (Thompson et al., 1989: 64). Az előbbi gondolat jól szemlélteti, hogy a kife-
jezőerő vizsgálatának egytényezős koncepciója miért is olyan elterjedt.

%
40 ï
35 ZONGORISTA A ï
ï ï
30
25 ï
20 ï ï
15 ï
10 ï ï ï ï
5
ï ï
ï ï ï ï ï ï ï
ï ïï
ï ï ï ïï ï
0 ï ï ï ï ï
ïï ï ï ï ï
-5 ï ï ïï ïï ï ï ï
ï ï ïï
-10 ï ï ïï ï
ï ï ïï
-15 ï ï
-20 ï
ï ï
-25 ï ï
-30
# #M1 œ œ 2 j 4 œ œœ6
& # œ™ œœ J œ ™œœ œ œJ œ œ œ œJ œ œœ œJ œ™ œœ J œ ™œœ œ œJ œ œJ œ œJ œ œJ œ ‰
3 5 7 8

1. sz. ábra: A mechanikus előadásmódtól való időzítési eltérések Mozart A-dúr zongoraszonátája (K 331) előadása során,
Gabrielsson (1987) klasszikus tanulmánya nyomán (Meg jeg yzés: a folytonos vonal jelzi az első előadást, a pontozott annak
megismétlését – A Svéd Királyi Zeneakadémia engedélyével másodközölve.)

Addig, amíg a kifejezőerő tényezőit egy kalap alá vesszük a „az írott kottától való kifejező eltérés”
koncepciójával, nehéz túljutni az egytényezős elképzelésen. Az egyik heurisztikus eszköz lehet az, hogy
professzionális előadók véleményére hagyatkozunk, ahogy Sundberg és munkatársai (1988) megmutat-
ták. Az előadók azonban általában képtelenek magyarázattal szolgálni annak részleteiről, hogy miként al-
kalmazzák a kifejezőerő eszközeit (Sloboda, 1996). A pszichológusok korán felismerték az introspektív
eljárások korlátait a pszichológiai mechanizmusok magyarázatában (pl. Leahey, 1987), és számos, a zenei
előadásmód hátterében meghúzódó mechanizmus sem érhető el ezzel a módszerrel. Úgy gondolom –
amire véleményük szerint is szükség van –, az a kifejezőerő egy pszichológiai megalapozottságú elmélete.
Hogyan is nézne ki egy ilyen elmélet?
Először is, egy lélektani megközelítésnek kísérletet kell tennie arra, hogy túllépjen magán az előadás-
módon, és megvizsgálja az előadás mögött az előadó személyét. „Melyek az előadó viselkedésének közvetlen
kiváltó okai, és hogyan értelmezhetjük a viselkedését az alapján, amit az emberekről tudunk?” Másodszor
(részben az emberekről szerzett tudásunk alapján) ennek komponensalapú megközelítésnek kell lennie. Né-
hány kutató úgy véli, egy általános mechanizmus magyarázza az előadásmód kifejező erejét (pl. Todd, 1992),
bár úgy tűnik, ez az egy komponensű megközelítés nem képes megfelelően magyarázni a zenei előadásmód-
ban megfigyelhető változatosságot. Egy ilyen típusú modell több szempontból sem képes teljes magyaráza-
tot adni, ahogy azt néhány közelmúltbeli tanulmány is jelezte (Clarke és Windsor, 2000; Juslin, 2000; Repp;
1989; Van Oosten, 1993; Thompson et al., 1989). A szakirodalom alapos áttekintése után arra következtet-
A zene kifejezőerejének
hetünk, hogy az előadásmód kifejezőereje jobban magyarázható egy olyan multidimenzionális modellben, öt tényezője: a zenei
amely öt faktorból épül fel – ezt nevezzük általánosan a GERMS modellnek. Az öt faktorról a következő előadásmód a pszichológus
részben lesz részletesebben szó (további részletes áttekintésért ld. Gabrielsson, 1999; 2003). szemszögéből

Generatív szabályok (g)


az előadásmód kifejezőerejének egyik funkciója az lehet, hogy olyan világosan adja át a hallgatónak a ze- 61
nei struktúrát, amennyire ez csak lehetséges. Ez az úgynevezett generatív megközelítés alapja (Clarke,
1988). A kutatásoknak ez az irányzata a kifejezőerőt olyan szöveges skálaértékek szabályalapú transzfor-
mációinak tekinti, amelyek az előadó kognitív reprezentációinak hierarchikus rendszeréből származnak.
Az olyan akusztikus változók segítségével, mint az időzítés, dinamika és artikuláció, az előadó világossá
tudja tenni a csoporthatárokat (Gabrielsson, 1987), metrikus hangsúlyokat (Sloboda, 1983), illetve a har-
móniák strukturáját (Palmer, 1996). Az egyik legmarkánsabb eredmény az, hogy a tempó variabilitását
(rubato) tendenciaszerűen meghatározza a frázis szerkezete; a frázisok végének érzékeltetése gyakran a
tempo csökkenésével történik, és ennek a lassításnak a mértéke a hierarchikus struktúrába való beágya-
zottság mélységét tükrözi (Todd, 1985; ld. még 1. sz. ábra). Ez a kifejezőerő legtöbbet tanulmányozott
területe, és amilyen mértékben az előadó világossá kívánja tenni a szerkezetet, olyan mértékben magya-
rázhatjuk mi is az akusztikai jegyekben fellelhető variabilitás egy részét. Az előrejelzést azonban megne-
hezíti, hogy továbbra sincs egy olyan, általánosan elfogadott rendszer, amellyel strukturális analízist le-
hetne végezni. További szempont, hogy azok a szabályok, amelyekkel a generatív szerkezet kifejeződési
mintázatokba alakíthatók át, nagyban függnek az adott zenei stílus sajátos konvencióitól. A zenei előa-
dás kutatásának generatív megközelítése az 1990-es évekig domináns volt (Clarke, 1988, 1995 ezt kiváló-
an összefoglalta). A kifejezés azonban nyilvánvalóan több, mint a struktúra puszta átadása (Shaffer, 1992;
Rink, 2003. jelen szám).

Érzelmi kifejezés (e)

A zenei előadásmód kifejezőerejének második funkciója lehet az, hogy az előadás egy meghatáro-
zott érzelmet testesítsen meg. Ahogy Shaffer (1992) is megjegyzi „az előadó hű maradhat a struktúrához
úgy, hogy közben formálhatja annak hangulatát is” (265. o.). Egy, az 1990-es években született tanulmány-
sorozat alapján úgy tűnik, hogy a zenészek képesek különálló érzelmeket kommunikálni a befogadók szá-
mára. Ahhoz, hogy az előadók elérjék ezt a célt, nagy számú akusztikai változót használnak. Például, ha az
előadó g yengédséget szeretne kifejezni az előadásában, használhat lassú tempót, alacsony hangerőt, legato
jellegű artikulációt, lágy hangszínt, lassan felerősödő hangokat szabályos időzítést, kisebb különbségeket
a „hosszú” és a„rövid” hangjegyek között, illetve intenzív vibrátót – ezeket Juslin (2001) foglalja össze. A
kifejezőerőnek ez a komponense eddig a legkevesebb figyelmet kapta az előadásmód kutatása során, ám
mégis vélhetően a legfontosabb tényezők közé tartozhat az előadó és befogadó viszonyrendszerében (ld.
Lindström et al., szerk. alatt; Persson, 2001). A komponens viszonylagos elhanyagoltságának egyik oka az
lehet, hogy működéséből adódóan nem mindig mérhető, ami szükséges feltétel lenne az empirikus vizs-
gálatokhoz. (Az érzelmi komponensek szerepét a későbbiekben részletesebben ismertetjük.)

Véletlenszerű variációk (r)

az előadásmód kifejezőerejének harmadik aspektusát, a véletlenszerű variabilitást eddig leginkább a ze-


nén kívüli, más területeken vizsgálták. Általános egyetértés mutatkozik abban, hogy az emberi zenei előa-
dást nem egy teljesen determinált, motorikus rendszer irányítja (pl. Repp, 1997a; Yamada, 1998). Az előa-
dásmód mindig tartalmaz valamennyi véletlenszerű fluktuációt, még ha adott esetben rendkívül keveset
is. Mennyiben játszik szerepet ez a jellegzetesség a kifejezőerő értelmezésében, különösen ha figyelembe
vesszük, hogy a gyakorlás célja általában éppen a hibák csökkentése? Ha esztétikai nézőpontból nézzük,
ezektől a véletlenszerű variációktól még inkább„élővé” válik a zene – ezek adják azt a kiszámíthatatlan jel-
legét, amitől minden egyes előadás egyedi lesz. A humán szenzo-motoros képességek határait vizsgálva –
különösen az ujjak szabályos időközönként történő leütésének kérdésében – kiderült, hogy a véletlensze-
rű variabilitás tulajdonságai az alábbiak: (1) a véletlenszerű fluktuációk intenzitása a szakaszkezdő hangok
közötti időintervallumok (inter-onset interval) időtartalmával párhuzamosan növekszik, tehát a hosszabb
intervallumok általában nagyobb mértékű eltérésekkel járnak együtt (Wing és Kristofferson, 1973; ld.
62 még Repp, 1997a); (2) elsőrendű negatív összefüggés fedezhető fel a szakaszkezdő hangok közötti időtar-
tamok hosszúságai között: az átlagnál rövidebb intervallumot rendszerint egy, az átlagnál hosszabb inter-
vallum követi, így egy cikk-cakk-szerű mintázat alakul ki (Madison, 2000); (3) hosszabb távon megfigyel-
hető egy magasabb rendű pozitív összefüggés, vagy tempóváltozás (egy lineáris tendencia, ami a leütési
adatokból szűrhető ki; Maddison, 2000); illetve (4) a véletlenszerű fluktuáció sikeresen kiváltható két vé-
letlenszerűen változó tényezővel, az 1/f zaj és a fehérzaj kombinációjával (Gilden et al., 1995). Bár ezek a
véletlenszerű variációk finomak – legalábbis professzionális előadás esetén –, mégis nagyban hozzájárul-
nak a zenei előadás hangzásvilágához. Tehát ha az a szándékunk, hogy az előadásmód kifejezőerejét mo-
dellezük, nem hagyhatjuk figyelmen kívül ezt az összetevőt sem (Juslin et al., 2002).

Mozgásos alapelvek (m)

az előadásmód kifejezőerejének negyedik aspektusa a mozgás. Létezik egy általános feltevés, hogy a zene
és a mozgás szorosan összefügg egymással. Ugyanakkor ezt a hipotézist pontosítanunk kell ahhoz, hogy
használni tudjuk. Shove és Repp (1995) úgy véli, hogy „megfelelő kikötések nélkül az az elképzelés, hogy
a zenében megfigyelhető változások a mozgás érzetét keltik, igen csekély magyarázóerővel bír”(58. o.). A
hipotézis pontosításának egyik módja az, ha csak a mozgások egy speciális fajtájára, az úgynevezett bioló-
giai mozgásokra korlátozzuk (pl. Johnson, 1973). Ez a fogalom arra a dinamikus mozgásmintázatra utal,
amely egyedül az emberi mozgások sajátossága. Fontos megjegyeznünk, hogy ezek a mintázatok a zenei
előadásmódban kétfélék lehetnek. Először is, feltételezhetjük, hogy az előadó szándékosan (bár nem szük-
ségszerűn tudatosan) kívánja reprodukálni a mintázatot. Shove és Repp úgy véli, hogy egy esztétikailag
lenyűgöző előadás „kifejező mikrostruktúrája kielégíti a biológiai mozgás alapfeltételeit” (78. o.). Ennek
egyik példája lehet a darab végén a ritardando képzése. Friberg és Sundberg (1999) kimutatta, hogy a ze-
nei előadásokat lezáró ritardando egy olyan matematikai függvényt követ, amely hasonló ahhoz, amikor
a futók lassítanak. (A zenehallgatási tesztek során is ez volt az a ritartando funkció, amelyet a befogadók
kedveltek.) A biológiai mozgások második típusához a nem-intencionális variabilitási mintázatok tartoz-
nak, amelyek a test anatómiai korlátaiból adódnak, összefüggésben azzal, hogy az adott hangszer haszná-
latához milyen izomműködések szükségesek (pl. Penel és Drake, 1999).

Váratlan stilisztikai fordulatok (s)

egy másik módja annak, hogy az előadás kifejező legyen, az, hogy a zenei érzelmek sokszor olyankor je-
lennek meg, amikor a zenei elvárások valamilyen módon sérülnek. Meyer (1965) úgy véli, hogy a zenei
előadás különféle kifejezési módjai esztétikai funkciót láthatnak el azzal, hogy „késleltetnek egy már várt
feloldást” vagy pedig „pszichológiai feszültséget keltenek” (206. o.). Ez akkor történhet meg, amikor az
előadó eltér a darab adott részének előadására vonatkozó stilisztikai elvárásoktól. Például, elvárhatjuk az
előadótól, hogy meghatározott adott módon világossá tegye a darab szerkezetét (ld. generatív szabályok),
de ehhez képest ő valami teljesen más módon jár el. Ez pillanatnyi pszichológiai feszültséget szül, ami ak-
kor oldódhat fel, amikor a előadó visszatér az „elvárt játékmódhoz”. Ezen effektust ragadja meg az “olaszos
előadásmód” itt következő, 18. század eleji leírása.

Úg y játszotta a szakaszokat, hog y először tökéletesen összezavarta a hallgatóit, majd ezekkel a


szabálytalan hang jeg yekkel meg jiesztette és meglepte őket, s a közönség azonnal úg y érezte, hog y
az egész koncert eg y szörnyű disszonanciává korcsosul; s ezekkel olyannyira elárulta őket, hog y
A zene kifejezőerejének
már aggódni kezdtek a zenéért, úg y, hog y már azt érezték, a pusztulás szélére sodorja azt, majd öt tényezője: a zenei
váratlanul olyan szabályos kadenciákkal nyugtatta meg őket, hog y mindenki meglepve hallgatta előadásmód a pszichológus
a diszharmóniából kiemelkedő, újból felcsendülő harmóniákat, amelyek elkápráztató g yönyörű- szemszögéből
séggel g yőzték le az elpusztításukkal fenyegető disszonanciákat.

Ez vélhetően az eddig legkevésbé kutatott összetevő, ugyanakkor rendkívül fontos lehet az erede- 63
ti interpretációk kialakulásában. Például Repp (1997b) olyan professzionális előadásokat ismertet, ame-
lyekben merész és váratlan kifejező elemek jelennek meg. Eddig senki sem próbálkozott azzal, hogy ezt
a komponenst a kifejezésmód szabályaival leírja, talán éppen a benne rejlő ellentmondás – azaz, hogy mi-
lyen szabályokkal írható le a szabályok megszegésének tendenciája – és amiatt a nehézség miatt, hogy nem
dönthető el pontosan, az adott szabályszegés milyen alapokra vezethető vissza (mivel nem minden sza-
bályszegés eredményez zeneileg elfogadható eredményt).

Tovább az előadásmód kifejezőerejének elmélete felé: a germs modell

az eddigiekben elsősorban leíró jelleggel vázoltuk fel a kifejezőerő öt komponensét és az eddigi javasla-
tunkban még nem szerepelt más modellekel való integrációjuk. (A zenei előadásmód különböző modell-
jeinek áttekintése megtalálható itt: Gabrielsson, 1999, 2003.) Ezekből kiindulva előterjesztek egy olyan
kifejezőerő-modellt – a GERMS modellt –, amely a kifejezőerő különböző komponenseit integrálja (ld.
még Juslin et al., 2002). A feltevés az, hogy elvben öt külöböző összetevőre bonthatjuk a kifejezésmód
mintázatait (generatív szabályok, érzelmi kifejezés, véletlenszerű variációk, mozgásos alapelvek, váratlan
stilisztikai fordulatok). Továbbá feltételezzük, a kifejezőerő különböző összetevői:

1. eredetüket tekintve eltérőek


2. egymástól eltérő karakterisztikájú mintázatokra vonatkoznak
3. egymástól valamennyire elkülönülő agyi területek dolgozzák fel őket
4. eltérő módon hatnak a befogadó zenei percepciójára

Az itt említett utolsó kritérium azt is jelenti, hogy a GERMS minden egyes komponense egyedi
módon járul hozzá az adott előadás érzelmi és esztétikai hatásához. Bár a zenei előadás esztétikai hatásá-
nak témaköre igen komplex témakör, feltételezhetjük, hogy olyan általánosan elfogadott tulajdonságok
tartoznak hozzá, mint a szépség, befogadhatóság, szimmetria, feszültség/feloldás, arousal, rend, eredeti-
ség és személyes benyomás (Eibl-Eibesfeldt, 1989; North és Hargreaves, 1997).
Véleményem szerint még csak most kezdjük feltárni a különböző komponensek közötti eltérése-
ket, emiatt a különbségekkel kapcsolatos javaslataimat inkább hipotéziseknek, mintsem megalapozott
tényeknek kell tekinteni. A 2. sz. táblázat mutatja be az összetevők feltételezett tulajdonságait. A G-kom-
ponens a lejegyzett zenei struktúra generatív transzformációin alapszik és reflektál az emberi gondolkodás
olyan alapvető jellegzetességire, mint a kategoriális percepció és a Gestalt-törvények (Bregman, 1990).
Alkalmazza az embernek azt a képességét is, hogy szintaktikai szerkezeteket tud feldolgozni, amit a nyelv
használata során is igénybe veszünk. Egy pozitron-emissziós tomográfiai (PET) vizsgálat azt mutatta ki,
hogy zongorával történő blattolás során olyan agykérgi területek aktivitálódnak, amelyek bár eltérnek a
nyelvi működésért felelős területektől, de azokkal szomszédosak (Sergent et al., 1992), ami megfeleltet-
hető annak a feladatnak, hogy a kottában lejegyzett generatív struktúra átalakuljon kifejező struktúrá-
lis jelekké. A zeneészlelés magnetoenkefalográfiás vizsgálata azt mutatta, hogy a zenei szintaxist is a Bro-
ca-terület dolgozza fel, amely szintén részt vesz a beszédértés folyamatában, a szintaktikai feldolgozásban
(Maess et al., 2001). A generatív szabályok többnyire alulról-felfelé jellegűek (azaz a helyi struktúra által
meghatározottak), ugyanakkor a zene hierarchikus szerkezetét is tükrözik. A struktúra átadásával illetve
a koherencia és a rend megteremtésével, a generatív szabályok hozzájárulnak a zene szépségéhez. Van egy
további arousal-emelő hatásuk is, de ez elsősorban azért jelenik meg, mert képesek felerősíteni a struktú-
rából adódó érzelmi hatást.
Az E-komponens a vokális kifejeződés bizonyos jelzéseinek érzelem-specifikus mintázataiból ere-
deztethető (Juslin és Laukka, megjelenés előtt) és az embernek azt az evolúciós szempontból ősinek te-
kinthető képességét tükrözi, hogy képes az érzelmeket nem-verbálisan kifejezni. Ez számos probabiliszti-
kus (bizonytalan), ám részben redundáns jelzést tartalmaz amelyek összeadódnak és egymást kiegyenlítik
(egy adott jelzés bizonyos mértékig kiegyenlíthet egy másikat, ld. Juslin, 2000). Az E-komponens percep-
64 ciója lehet pillanatnyi jellegű (Peretz et al., 1994) és főleg a jobb agyféltekében zajló párhuzamos feldolgo-
zási mód jellemzi (Bryden et al., 1982), talán a bazális ganglionokban amelyek a vokális kifejeződésekben
kifejezett érzelmek percepciójában játszanak szerepet (Cohen et al., 1994). Az E-komponens főleg felül-
ről-lefelé jellegű (azaz a darab hangulatának holisztikus értelmezése befolyásolja a lokális akusztikai para-
métereit), és párhuzamos csatornát biztosít az affektív információknak, amely a megkomponált struktú-
ra kifejezőerejét még jobban támogatja, vagy ellentmondat neki. Az E-komponens hozzájárul a művészet
befogadásához, de szerepet játszik az arousal szintjének növelésében (Juslin, 2001) és a személyes kifeje-
zésmód alakulásában (Lindström et al., szerk. alatt). (4)
Az R-komponens egy hipotetikus „belső metronómon”, illetve a hozzá kapcsolódó motoros késlelte-
téseken alapszik (Gilden et al., 1995), és az ember szenzo-motoros pontosságának korlátait tükrözi. Kétfé-
le véletlenszerű mintázat tartozik ide: az 1/f zaj (olyan típusú zaj, amelyben fordított arányosság figyelhető
meg a teljesítménysűrűség és a frekvencia között), amely a belső metronómot tükrözi és a hangkezdetek
közötti időtartamok hosszúsága szerint változik, illetve a másik a nem korrelatív jellegű fehér zaj, amely
azokat a motoros késéseket tükrözi, amelyek a, hangkezdetek közötti különböző időtartamoktól függet-
lenül konstans értéket vesznek fel. Feltételezhetően a belső metronóm a laterális és középső kisagyi régi-
ókban helyezkedik el (ld. Ivry, et al., 1988). Ez a komponens a variabilitás akarattól független mintázatai-
ból épül fel, amely hozzájárul az előadásmód bizonyos egyenetlenségeihez, és a művészet újszerűségének
érzetét erősítheti.
Az M-komponens olyan (biológiai jellegű) humán mozgásmintákból eredeztethető, mint pl. a karok
gesztusai, amelyek az emberi test egyedi szerkezetét tükrözik (pl. az anatómiai arányok egyedi összetéte-
le, beleértve mind a geometriai dimenziókat, mind pedig a test különböző részei közötti súlyeloszlást). Az
M-komponens percepciója részben azt a humán képességüket tükrözi, hogy a hangmintázatok alapján
meg tudjuk különböztetni egymástól az élőlényeket az élettelen tárgyaktól, aminek jelentős szerepe lehet
a túlélésért folytatott küzdelemben. Olyan komplex, dinamikus és nem kompenzatorikus időbeli min-
tázatok tartoznak ide, amelyeket a bal agyfélteke dolgoz fel (Natale, 1977; Peretz, 1990), vélhetően kö-
zel azokhoz az agyi régiókhoz, amelyek a biológiai mozgás vizuális információinak elemzéséért felelősek,
mint pl. a superior temporális agybarázda (Allison et al., 2000). Az M-komponens hozzájárul ahhoz, hogy
felismerjük a művészetet – az emberi szándékokat jelekké alakítsuk – de az előadáshoz kiegyensúlyozott-
ságot és egyenletes gesztushasználatot is nyújt.
Az S-komponens azon alapul, hogy hajlamosak vagyunk olyan sematikus elvárások kialakítására,
amelyek a viselkedésünket irányítják, illetve ezek monitorozására, ezek következtében pedig növekedhet
az érzelmi arousal, ami azt jelezheti, hogy valami fontos történt. Ez az elgondolás a 20. század eleje óta vis�-
szatérő témája a pszichológiai érzelemelméleteknek (pl. Oatley, 1992). A zenei előadásmóddal kapcsolat-
ban azt feltételezzük, hogy az S-komponens az előadónak azt a tudatos szándékát tükrözi, hogy el kíván
térni az előadásmód stilisztikai konvencióitól annak érdekében, hogy feszültséget vigyen az előadásába és
kiszámíthatatlanná tegye azt. Az S-komponenshez olyan helyi kifejező jegyek tartoznak, amelyek a mű új-
szerűségéhez, eredetiségéhez és arousalnövelő hatásához járulnak hozzá. Az elvárások monitorozása fel-
tételezhetően az anterior cinguláris kéreg egyes részeiben történik (Ochsner és Feldman Barrett, 2001).
Hogyan kapcsolódik az S-komponens a többi összetevőhöz? A sejtésem az, hogy míg az első négy kom-
ponens ahhoz elegendő, hogy az előadás elfogadható legyen, addig az S-komponens az, ami az előadást iga-
zán különlegessé teszi. Így a művészi alkotómunka folyamatának jelentős része azzal a céllal történik, hogy
a GERM előadások GEMS jellegűvé alakujanak át. Azaz minimális legyen véletlenszerű fluktuáció, a ze-
nei interpretációk pedig eredetibbek legyenek.
A zene kifejezőerejének
Komponens
öt tényezője: a zenei
Jellemző előadásmód a pszichológus
G E R M S
szemszögéből
A mintázat eredete A zenei struktúra A vokális kifejeződés Az ember korlátait Biológiai mozgás: Eltérés az elvárt
generatív transzfor- akusztikai jegyeinek tükröző belső met- az emberi mozgásra előadói konven-
mációja érzelem specifikus ronóm és motoros tipikusan jellemző és cióktól
mintázatai késések egymástól elkülönü-
lő mintázatok
65

A mintázat Lokális kifejező Részben redundáns Az 1/f és fehér zaj Dinamikus, nem Lokális, a struktúrá-
természete jegyek a struktúra és kompenzatori- részben véletlenszerű kompenzatorikus ból nem jelezhető
interpretációjának kus, többszörösen mintázatai; alacsony mintázatok: egyenle- előre
viszonyrendszerében bizonytalan jegyek intenzitásúak, tes és átfogó
átfogó szintje szabálytalanok

Releváns agyi régiók Bal agyfélteke Jobb agyfélteke Laterális és mediális Bal agyfélteke Anterior cinguláris
(a Broca-terület (bazális ganglionok) kisagyi régiók + (a superior temporá- kéreg
mellett) motoros kéreg lis régió környéke)

Perceptuális hatások struktúra letisztítása; érzelmeket és „élő” és természetes Az emberi gesz- Megnövekedett
befolyásolja a darab hangulatot fejez ki jelleget alakít ki tusokhoz hasonló feszültség és
belső kifejező erejét (többnyire tágabb kifejezési formák
értelemben vett megjelenése
érzelmi kategóriákat)

Mennyiben tudás- Közepesen Kevéssé Egyáltalán nem Kevéssé Jelentősen


függő?

Esztétikai hatás Szépség, rend, Befogadás, arousal, Egyenetlenség, Egyensúly, egység, Újdonság, arousal
koherencia személyes benyomás újdonság felismerés

Tudatos kontroll Igen, többnyire Igen Nem Igen, részben Igen


alatt áll?

2. sz. táblázat: A GERMS modell öt fő komponensével összefüggő hipotézisek összefoglalása

Egy előzetes alkalmazhatósági vizsgálat

vajon egy ilyen jellegű pszichológiai elméletet hogyan lehetne a gyakorlatban is hasznosítani? Egy, a közel-
múltban végzett kutatásunkban első alkalommal tettünk kísérletet arra, hogy a komponensalapú megkö-
zelítést egy komputációs modellben, a GERMS modellben alkalmazzuk, amely a kifejezőerő különböző
aspektusait képes szimulálni (Juslin et al., 2002) (5). A modell a variabilitás lehetséges forrásának csupán
négy típusát tartalmazta (generatív szabályok, érzelmi kifejezés, véletlenszerű variációk, mozgásos alapel-
vek), mivel akkor még nem tudtuk, hogyan használjuk az ötödik komponenst, az S-t. A modell bemenet-
ként (a) a lejegyzett zenét és (b) az előadó interpretációját használja. Azt feltételezzük, hogy létezik struk-
turális interpretáció (pl. a zenei frázis struktúrája) és hangulati/érzelmi interpretáció (pl. „öröm”) is. Ezt
követően minden egyes modul számára rendelkezésre áll egy olyan modul, amely algoritmusok egy bizo-
nyos csoportját tartalmazza, ezek alakítják át a lejegyzett zenét a kifejezőerő mintázataivá. Hely hiányá-
ban a szabályok leírására nincs mód, de érdemes megjegyeznünk, hogy néhány a KTH szabályrendszerből
került be a vizsgálatba (ld. Friberg, 1995), míg a többi Juslin korábbi munkájából (2002). Egy előzetes kí-
sérletben a GERM modell szabályaiból néhányat kiválasztottunk, és ezek felhasználásával egy rövid zenei
darab kifejező előadásmódját szintetizáltuk. A kísérlet célja az volt, hogy megállapítsuk, (1) vajon a négy
komponens valóban befolyásolja-e befogadók előadásmódról alkotott ítéleteit a megjósolt módon és (2) a
négy komponens legalább részben független hatásokat vált-e ki, amelyek befolyásolják a hallgató ítéleteit
(a vizsgálat további részletei megtalálhatók itt: Juslin et al., 2002). Az alapelképzelés az volt, hogy egy fak-
toralapú rendszerben manipuláljuk a GERM modell négy komponensét: ezt úgy kiviteleztük, hogy lét-
rehoztuk az összes lehetséges (16) kombinációt úgy, hogy az egyes esetekben a komponensek jelenlétét
illetve hiányát kombináltuk. Például az egyik kísérleti elrendezésben az volt a feltétel, hogy csak a G-kom-
ponens volt jelen, míg a másik három hiányzott, így csak azok a szabályok működtek, amelyek a struktú-
rát közvetítették a hallgató számára. Arra kértünk zeneileg képzett vizsgálati személyeket, hogy mind a 16
előadást értékeljék olyan skálákon, amelyek feltételezéseink szerint a kifejezőerő különböző aspektusait
jellemzik (tiszta, szomorú, emberi, geszturális, muzikális, kifejező).
Az eredmények legelőször is azt mutatják, hogy a különböző komponensek valóban kiadják a befo-
gadó előadásmódról alkotott, előzetesen megjósolt értékelését. Például a G-komponens együtt járt a „tisz-
66 ta” skálán mutatott magasabb pontszámmal; az E-komponens a „szomorú” skála magasabb értékével; míg
az M-komponens magasabb értékeket mutatott a geszturális skálán. A többszörös regresszióanalízis kimu-
tatta, hogy a válaszadók általános kifejezőerővel kapcsolatos ítéleteit sikeresen megjósolja a GERM modell
elemeinek lineáris kombinációja; a modell valamennyi komponense különböző mértékben ugyan, de szig-
nifikáns magyarázóerővel jósolja meg a kifejezőerővel kapcsolatos ítéleteket; R = 0.77, F(4,184) = 66.143; p
< 0,0001, a magyarázóerő szerinti béta-értékek sorrendjében: érzelmi kifejezés, β = 0.64, p < 0,0001; moz-
gásos alapelvek, β = 0.32, p < 0,0001; generatív szabályok, β = 0.23, p < 0,0001; random variációk, β = 0.14, p
< 0.01. Természetesen a befogadók értékítéleteinek kialakításakor interakció is megfigyelhető volt a négy
komponens között néhány esetben. Ugyanakkor a lehetséges interakcióknak csupán 20%-a volt szignifi-
káns, és a hatáserejük minden esetben alacsonyabb volt, mint a főhatásé. Végezetül elmondható, hogy a
komponensek különböző módon, és legalábbis részben, egymástól függetlenül befolyásolták a befogadók
értékítéletét. Ezt a tendenciát azok a példák mutatják, amelyekben a négy komponens elkülönül egymás-
tól. Például az az előadás, amelyik csak a G-komponenst tartalmazta magas értéket mutatott a „tiszta” ská-
lán, de alacsony átlagértékeket a „szomorú”, „geszturális” és „emberi” skálákon (Juslin et al., 2002).

További kutatási irányok

milyen következtetéseket vonhatunk le ezekből az előzetes adatokból? Először is, a GERM modell azt
sugallja, hogy a kifejezőerő különböző aspektusai integrálhatók egy közös modellbe. Elépzelhető, hogy
az olvasó nem ért velem egyet a modell részleteit illetően, a lényeg azonban az, hogy a kifejezőerőnek kü-
lönböző összetevői vannak. Azt gyanítjuk, a korábbi vizsgálatok részben azért találhattak zavaros ered-
ményeket, mert úgy tekintették őket, mintha egyetlen faktort tükröznének. Ha nem ismerjük a zenei
előadásmód kifejezőerejének egymástól elkülönülő tényezőit, vagy figyelmen kívül hagyunk közülük né-
hányat, akkor nagy valószínűséggel összezavarnak bennünket az adatok, amelyek különböző viselkedés-
módok valamiféle ismeretlen keverékét tükrözik csak. Sőt, még a legkifinomultabb zenei előadásmód-szi-
muláló rendszerek némelyike – mint amilyen a Directos Musices (Friberg et al., 2000) – sem biztos, hogy
hatékonyan különválasztja a kifejezőerő jegyeinek különböző fajtáit. A Director Musices szabályrendsze-
rét azzal a céllal tervezték, hogy olyan zenei előadáokat szintetizáljanak, amelyek a lehető legjobban szól-
nak – mindezt anélkül, hogy bármilyen elméleti keret alapján csoportosították volna a kifejező jegyeket.
A szoftver technikai fejlesztésének szempontjából ez az eljárás teljesen elfogadható, ugyanakkor sajnála-
tos módon összekuszálja a kifejezőerő pszichológiai szempontból egymástól különböző komponense-
it. Az adott hangszer akusztikai jegyeit tükröző szabályok összekeverednek a struktúra átadásáért felelős
szabályokkal (Friberg, 1995), míg a struktúrák átadását szolgáló szabályok „kifordításával” fejezik ki az ér-
zelmeket (Bresin és Fribergm 2000). Az előadás kifejezőerejének pontos megértéséhez szükséges lehet,
hogy nagyobb gondot fordítsunk a kifejező jegyek különböző csoportjainak elkülönítésére. Azzal, hogy
a kifejezőerő egyes alkotóelemeit megkülönböztetjük egymástól, könnyebben megmagyarázhatjuk a
különböző előadók közötti egyéni különbségeket. A különböző előadók az alapján is kategorizálhatók,
hogy mekkora súlyt helyeznek a kifejezőerő különböző aspektusaira. (Lehet, hogy néhányan a pontossá-
got hangsúlyozzák, mások minden áron az érzelmi kifejezést, megint mások pedig a struktúra átadását.)
Továbbá a különböző zenei stílusok a kifejezőerő eltérő dimenzióira helyezhetik a hangsúlyt; a klasszi-
kus zongoristáknál a G-komponens kiemelt jelentőségű lehet, de kevésbé fontos például egy blues-gitá-
ros számára. Végezetül, a komponens-alapú megközelítés segíthet feloldani a korábbi szakirodalomban
közölt eredmények közötti ellentmondásokat. Például azt a jelenséget, hogy néhány tanulmányban a ta-
pasztaltabb zenehallgatók kifinomult képességeket mutattak a kifejezőerő jegyeinek detektálására, míg
más tanulmányokban ilyen eredményt nem találtak, azzal magyarázhatjuk, hogy a tanulmányok a kifeje-
zőerő különböző struktúráit vizsgálták (pl. generatív szabályok vs. érzelmi kifejezés).
A zene kifejezőerejének
Miként győződhetünk meg arról, hogy az általunk felételezett összetevők a helyesek? Végső so- öt tényezője: a zenei
ron ez egy empirikus kérdés, ami még messze van attól, hogy lezártnak tekintsük. Fenntartom a lehető- előadásmód a pszichológus
ségét annak, hogy komponensek más csoportja még egységesebb magyarázatot adhat. Amellett érvel- szemszögéből
tem azonban, hogy a pszichológiai elméletek a zenehallgatási kísérletek eredményeivel, zenei előadások
mérésével és az agyi képalkotó eljárások segítségével együttesen lehetnek segítségünkre a probléma meg-
oldásában. Az eddigiekből már világosnak kell lennie, hogy hipotézisem szerint a GERMS modell min- 67
den komponense a zenén kívüli humán jelenségekben gyökerezik. (Ebből a nézőpontból elhamarkodott
lenne, ha néhány összetevőt „zeneibbnek” tartanánk a többinél.) Így, a GERMS modell alkalmazásának
egyik lehetősége az, hogy zenei előadásmódra – Palmer (1997) felfogásával megegyező módon – úgy te-
kint, hogy az „a látszólag egyedi humán képesség, ami valójában a mögöttes kognitív mechanizmusok
szintjén közel sem egyedi” (134. o.). Távol álljon tőlünk, hogy alábecsüljük a zenei előadásmód értékét: ez
a megközelítés azt sugallja, hogy a zenei előadás egy olyan tevékenység, amely az emberi viselkedés számos
aspektusát csodálatos, gyönyörködtető módon egyszerre képes előhívni. Ez azt is jelenti, hogy az előadás
kifejezőerejének megértésében rendkívül nagy jelentősége lehet az emberi viselkedés különböző aspek-
tusait – mint például a nyelvhasználatot, az érzelmeket, a motoros koordinációt, a mozgást és az elváráso-
kat – leíró pszichológiai elméleteknek.

Zenepedagógiai lehetőségek

a GERMS modell jó példával szolgál arra, hogy a kutatás miként tud hozzájárulni a kifejezőerő „demisz-
tifikálódásához” az oktatás területén. Sőt, a kifejezőerővel kapcsolatos, elmúlt évtizedből származó kuta-
tási adataim alapján arra a következtetésre jutottam, hogy a kifejezőerőt bizonyos mítoszok övezik, ame-
lyek negatív hatással vannak a zenei nevelésre. (Ezen mítoszok részletesebb áttekintését ld. Juslin et al.,
megjelenés előtt.) Ilyen hiedelem például az, hogy „a kifejezőerő objektíven nem vizsgálható”.
Ez a hiedelem abból a nézetből ered, hogy a kifejezőerő teljesen szubjektív minőség, amely tudomá-
nyos terminológiával nem írható le. Ugyanakkor, ahogy azt a GERM vizsgálatok mutatják, az érzékelt ki-
fejezőerő akusztikai korrelátumait lehetséges könnyen manipulálni az előadás során és a befogadók értékí-
téleteit is lehetséges rendszerszerűen és megbízható módon összekapcsolni ezekkel a korrelátumokkal. Ez
kövezi ki számunkra az utat a kifejezőerő oktatásának egy elméletileg megalapozottabb megközelítéséhez.
Egy fontos következmény az, hogy a tanulás adott szakaszaiban a kifejezőerő meghatározott aspek-
tusait valószínűleg külön kell oktatni, mivel eltérőek a jellegzetességeik. A GERMS modell alapján a zenei
előadásnak (a) közvetítenie kell a zene struktúráját; (b) érzelmeket kell kifejeznie; (c) motorosan pontosnak
kell lennie; (d) szuggesztíven kell kimutatnia az emberi mozgást és gesztusokat; és (e) kreatív és esztétikailag
kellemes módon kell eltérnie a stilisztikai elvárásoktól. A struktúra átadása (G) kapja talán a legnagyobb fi-
gyelmet a zeneoktatásban, feltételezhetően azért, mert ez a legkézellfoghatóbb komponens: „a struktúra lát-
ható, hallható és bemutatható” (Epstein, 1995: 126). Az interpretáció kialakítása során a struktúra mélyreha-
tó értelmezése nyilvánvalóan nem elkerülhető folyamat. A kifejezőerő ezen aspektusa oktatható a szerkezet
elemzésével, a zeneszerző megjegyzéseinek megvitatásával és a kotta előadásmódbeli változóinak vizuális ta-
nulmányozásával. A mozgásos összetevő (M) fejleszthető néhány, a Davidson és Correia (2002: 246-7) által
felvázolt módszer használatával, például úgy, hogy a növendék irányítja a tanár játékának kifejezőerejét, illet-
ve fizikai gesztusokból nem-verbális narratívát dolgoz ki az egyes frázisokhoz. A váratlan stilisztikai fordula-
tok komponense (S) a zenei stílusok és konvenciók kiterjedt ismeretét igényli, és azt, hogy az előadó képes le-
gyen az előadás szerkezetét a zenei elvárások „narratívájában” értelmezni és azzal kreatív módon kísérletezni.
A kifejezőerőnek az a komponense, amelyik leginkább igényli a formalizált oktatási stratégiák létrehozását,
nem más, mint az érzelmek komponense (E). Ez azért sajnálatos, mert a GERM vizsgálatokban a befogadók
értékítéletét legnagyobb mértékben az érzelmi komponens magyarázta. Ebből az következik, hogy a zene-
pedagógiának sokkal nagyobb figyelmet kell szentelnie a kifejezőerő érzelmi vonatkozására. Így cikkünk
záró részében kifejezetten az érzelmek felé fordítjuk figyelmünket.
Érzelmek és kommunikáció

bár a zene és az érzelmek kapcsolata már az ókori görögök kora óta nagy érdeklődésnek örvendő terület
(Juslin és Sloboda, 2001; Sloboda és Juslin, megjelenés előtt), a zenei előadások és az érzelem kapcsolatá-
nak rendszeres kutatása az 1990-es évekig nem kezdődött meg. Ennek több oka is van: először is, a muzi-
68 kológia strukturalista megközelítése szűk határokat szabott a zenei kifejezőerő kutatása számára, egészen
az „új” muzikológia felemelkedéséig (ld. Cook és Dibben, 2001). Másodszor, a kutatók azt is érzékelhet-
ték, hogy „a zenészek körében megfigyelhető egy általános idegenkedés a zene tudományos kutatásával
kapcsolatban – különösen ha olyan aspektusokról van szó, mint érzelmek, kifejezőerő és esztétika’ (Woo-
dy, 2002: 214). Végül, bár az olvasó számára nyilvánvalónak tűnhet, hogy az érzelmek szoros összefüggés-
ben állnak a zenei kifejezőerővel, ezt az elképzelést több szerző is megkérdőjelezi. Milyen alapon állíthat-
juk azt, hogy a kifejezőerő az érzelmekről, vagy akár az érzelmek kommunikációjáról szól?
Egy három országból származó (Anglia, Olaszország, Svédország), 135 professzionális zenésszel ké-
szített kérdőíves tanulmány feltárta, hogy a zenészek nagy többsége a kifejezőerőt az „érzelmek kommu-
nikációjaként” és „érzelemteli játékmódként” határozták meg a kifejtős jellegű válaszaikban (Lindström
et al., szerk. alatt). Amikor közvetlen módon kérdezték meg a zenészeket, hogy a zene kifejez-e érzelme-
ket, 99%-uk igennel válaszolt. Számos előadó életrajzában és velük készített interjúkban is azt olvashatjuk,
hogy a kifejezőerőt az érzelmek és kommunikáció fogalmaival értelmezik (pl. Boyd és George-Warren,
1992; Carreras, 1992; Menuhin, 1996; King, 1996; Persson, 1993; Schumacher, 1995; ld. még Mills, 2003).
Néhány zeneszerző ugyan vélekedhet úgy, hogy a zene „abszolút jellegű” és „önmagán kívül semmit nem
fejez ki”, de ez egész egyszerűen nem egyezik azzal, ahogy a legtöbben vélekednek a zenéről.
Amikor Small (1999) meggyőzően úgy érvel, hogy a „musicking” gyökerei (ez a szakkifejezés, azt
emeli ki, hogy a zenélés mindenekelőtt egy tevékenység, az előadás pedig ennek lényege) olyan ősi gesztu-
sokból erednek, amelyekkel az emberi kapcsolatainkat nyilvánítjuk ki és fedezzük fel, akkor zavaróan hat,
hogy tagadja, hogy ez az aktus magába foglalná az érzelmek kommunikációját is, amely minden emberi
kapcsolat legmélyén található:

...számomra az, hog y a zenére.... mint érzelmek kommunikációjára gondoljak, semennyire sem
eg yeztethető össze a tapasztalataimmal. Nem emlékszem arra, hog y valaha is felvidított volna
eg y vidám zenemű, vag y szomorú lettem volna eg y szomorú darab miatt, és nem is vag yok biztos
abban, hog y meg tudom-e mondani, melyik mű melyik volt. “ (18. o.)

Ha így is van (bár biztos vagyok benne, hogy Small képes lenne megmondani, melyek a vidám és
melyek a szomorú darabok), nem hagyhatjuk figyelmen kívül azt, hogy úgy tűnik, a legtöbb előadó és
hallgató egyaránt úgy tekint a zenére, mint az érzelmek kommunikációjának egyik eszközére. Nem ál-
lítom azt, hogy a kommunikáció lenne az egyetlen vagy fő feladata a zenének, de egy kérdőíves vizsgá-
lat során zenész hallgatók 83%-a úgy vélte, hogy az előadásmódjukban „mindig” vagy „gyakran” egy-egy
bizonyos érzelmet próbálnak kifejezni (Lindström et al., szerk. alatt), és azt is tudjuk már, hogy a befoga-
dók képesek legalább bizonyos fajta érzelmeket felismerni, amelyeket az előadók kifejeznek (Juslin, 2001).
Ebből az következik, hogy a kommunikáció fogalma életképes a zene világában is, még ha nem is minden
eg yes zenei előadás szolgáltat példát erre a jelenségre. Vajon ténylegesen mennyire tudják a zenei előadók
az érzelmeket sikeresen kommunikálni a hallgatók számára?
Az előadásmódban megjelenő érzelemkifejezéssel foglalkozó eddigi legrészletesebb áttekintés-
ben (Juslin and Laukka, szerk. alatt), melyben a szerzők 41 tudományos közleményt dolgoztak fel, a kom-
munikációs pontosság metaanalízise azt mutatta ki, hogy a professzionális zenészek közel olyan haté-
konysággal képesek az alapérzelmek (öröm, szomorúság, düh, félelem, gyengédség) befogadó felé való
kommunikációjára, mint az arccal és/vagy beszédhanggal történő érzelemkifejezés esetén. Az érzelmek
dekódolásának pontossága π = 0,89 volt, amely megegyezik azzal a nyerspontszámmal (pc = 0,70), amit
egy öt válaszlehetőséget felkínáló, kényszerválasztásos feladatban mértek (azaz, azoknak az érzelmeknek
az átlagos száma, amelyeket a zenei előadásmódot vizsgáló tanulmányokban eddig kutattak). Az amatőr
zenészek kevéssé pontosan kommunikálják az érzelmeket és hajlamosabbak az akusztikai jellemzők kö-
A zene kifejezőerejének
vetkezetlen alkalmazására is (ld. Juslin és Laukka, 2000; Rhower, 2001). A rendelkezésre álló bizonyíté- öt tényezője: a zenei
kok azt jelzik, hogy a kommunikációs folyamat az érzelmi kategóriák aránylag széles skáláján működik, előadásmód a pszichológus
míg, az egyes kategóriákon belül a finomabb különbségeket már nehezebb közvetíteni (Juslin és Lind- szemszögéből
ström, 2003), legalábbis bizonyos kontextus nélkül (London, 2002; ld. még Juslin, 1997c). Ez nem azt je-
lenti, hogy, pl. a haragot és a féltékenységet kifejezni szándékozó zenei előadások hajszálpontosan ugyan-
úgy hangoznának, vagy hogy a befogadók nem képesek kihallani a különbségeket, hanem csak azt jelenti, 69
hogy nem képesek megmondani, hogy melyik előadás melyik érzelmet közvetítette. Egyes szerzők felte-
vései szerint az egymást követő érzelmek meghatározott sorrendje segítségünkre lehet a finom és komp-
lexebb érzelmi állapotok kommunikációjában (Levinson, 1990). Ez egy érdekesnek tűnő lehetőség, de
bizonyítása még várat magára. (Ezeknek a kutatási eredményeknek az áttekintésével nem azt kívánom
mondani, hogy értéktelenek lennének azok az előadások, amelyek nem közvetítenek megbízható módon
egy meghatározott érzelmet, mert ahogy azt ebben a cikkben is megpróbáltam bemutatni, a zenei kifeje-
zőerő az érzelmek kifejezésénél még sokkal többet jelent; és bizonyos esetekben a zenészek szándékosan
törekedhetnek az érzelmi bizonytalanság megteremtésére.)
Számos tanulmány próbálta megragadni azokat az akusztikai jegyeket, amelyeket a zenészek meg-
határozott érzelmek közvetítésére használnak (pl. Jansens et al., 1997); Juslin, 1997a; Juslin és Madison,
1999; Kotlyar és Morozov, 1976; Mergl et al., 1998). Ilyen jegyek például a tempóváltások, a hangerő, az
artikuláció, a hangszín, az időzítés, az intonáció, a vibrato mértéke és frekvenciája, bizonyos hangok hang-
súlyozása stb. A korábbi kutatások többnyire csak néhány érzelemre korlátozódtak. A 2. sz. ábra egy kö-
zelmúltban megjelent tanulmány alapján példákat hoz azokra az akusztikai jegyekre, amelyeket profes�-
szionális előadók használnak 12 érzelmi minőség kifejezésére (Juslin és Lindström, 2003). Mind az „alap”
(pl. szomorúság, düh, félelem) mind pedig a „komplex” (pl. féltékenység, szégyen, büszkeség) érzelmek
szerepeltek a kutatásban, hogy vizsgálhatóak legyenek a zenei kifejezés finom részletei is. A valóságban az
érzelmi kifejezés gyakran gyorsan változik a darabon, vagy akár egyetlen hangon belül is. Ebből kiindul-
va a közelmúltban valósidejű elemzéssel vizsgáltuk az érzelemkifejezés időbeli változásait (Friberg et al.,
2002). Empirikus adatok alapján programozott, szintetikus zenei előadásokkal igazolható, hogy valóban
a releváns akusztikai jegyeket írták-e le a korábbiakban. A megfelelő akusztikai tulajdonságokat produká-
ló számítógépes előadások képesek lehetnek arra, hogy olyan megbízhatóan közvetítsék az érzelmeket,
mint ahogy arra az emberi előadó képes (Juslin, 1997b), de kevésbé nyújtanak zeneileg kielégítő hangzást
(feltételezhetően azért, mert hiányzik belőlük a kifejezőerő többi komponense).
Fontos kérdésként kapcsolódik ide az előadók által használt akusztikai jegyek eredete. Néhány szer-
ző úgy véli, hogy a zenében kifejezett érzelmek nem mutatnak semmiféle rokonságot más kifejezési for-
mákkal: „A zenei érzéseknek saját karakterük van (…) a zene által formált érzelmek nem azonosak azok-
kal, amelyek a muzikalitáson kívüli élményekhez kapcsolódnak” (Lippman, 1953: 569). Elképesztően
nehéz lenne ilyen esetet találnunk. Egy 145 tanulmányt összefoglaló áttekintés (melyből 101 a beszéddel,
41 pedig a zenével foglalkozott) határozott módon jelzi, hogy azon zenei jegyek mintázatai, amelyeket a
különböző érzelmek közvetítésére használunk, többnyire a beszéddel történő érzelemkifejezés non-ver-
bális aspektusaiban eredeznek (Juslin és Laukka, szerk. alatt), ahogy azt Spencer (1857) is feltételezte. En-
nélfogva megállapítható, hogy a zenei érzelmek nem azért érintenek minket olyan mélyen, mert annyira
különböznek a mindennapi érzelmeinktől, hanem éppen azért, mert annyira hasonlóak hozzájuk. Ez ma-
gyarázhatja azt, hogy a zenét tanulók a muzikalitáson kívüli tapasztalatokat (pl. élethelyzetek) miért talál-
ják hasznosnak a kifejezőerő fejlesztésében (pl. Woody, 2000). Zenei frázisok eléneklése a hangszeres ze-
nészek számára azért lehet hasznos gyakorlási módszer (pl. Dubal, 1985: 221; ld. még Mills, 2003), mert
segíti az előadót, hogy ráhangolódjon a vokális érzelemkifejezés alapvető törvényszerűségeire.
-15
-15

-20
-20

-25
-25

(dB)
Hangerő(dB)
70
-30
-30

Hangerő
-35
-35

-40
-40

-45
-45

-50
-50

Méreg
Elégedettség
Kiváncsiság
Undor
Félelem
Boldogság
Féltékenység
Szeretet
Büszkeség
Szomorúság
Szégyen
Gyöngédség
Méreg
Elégedettség
Kiváncsiság
Undor
Félelem
Boldogság
Féltékenység
Szeretet
Büszkeség
Szomorúság
Szégyen
Gyöngédség
Átlag
Átlag
Szándékolt
Szándékolt érzelem
érzelem ±SD
±SD
88

77
(hangjegy/s)
Tempó(hangjegy/s)

66

55

44

33
Tempó

22

11

00
Méreg
Elégedettség
Kiváncsiság
Undor
Félelem
Boldogság
Féltékenység
Szeretet
Büszkeség
Szomorúság
Szégyen
Gyöngédség
Méreg
Elégedettség
Kiváncsiság
Undor
Félelem
Boldogság
Féltékenység
Szeretet
Büszkeség
Szomorúság
Szégyen
Gyöngédség

Átlag
Átlag
Szándékolt
Szándékolt érzelem
érzelem ±SD
±SD

2. sz. ábra: a hangerő és tempó mértéke (átlag és szórás) egy hivatásos zongorista előadásában, 12 érzelem alapján
Haydn egyik témájára (adaptálta Juslin és Lindström, 2003). Megjegyzés: a hangerőt decibelben határoztuk meg egy
önkényesen megválasztott referencia szint alapján

Bár csábítónak tűnhet összekapcsolni a zenei érzelemkifejezést a mozgással (Woody, 2002), egy el-
méleti szempontból megalapozottabb és gazdaságosabb megközelítés úgy tartja, hogy az érzelmi kompo-
nensek eredete az érzelmekhez kapcsolódó akaratlan és érzelemspecifikus fiziológiai változásokban keresendő,
amelyek nag ymértékben befolyásolják a beszédképzés különböző tényezőit (Juslin és Laukka, 2001; Scherer,
1986). A zenei előadás és az érzelmek vokális kifejezése között nemcsak a kód közös, hanem a kódolás is: az
A zene kifejezőerejének
érzelemkifejezésben felhasznált jegyek bizonytalan természetűek, de bizonyos mértékben redundánsak is öt tényezője: a zenei
– a lencsemodell értelmezése szerint (Juslin, 2000). Ez több érdekes jelenséget is megmagyaráz, például azt, előadásmód a pszichológus
hogy az érzelmek zenei kommunikációja általában sikeres, annak ellenére, hogy az akusztikai jegyek hasz- szemszögéből
nálatában az előadók és a befogadók körében is egyéni különbségek figyelhetők meg (Juslin, 2000), illet-
ve különböző hangszerekkel különböző akusztikai jegyek hozhatók létre (Juslin és Laukka, szerk. alatt).
Több fontos irányt is meghatározhatunk a további kutatások számára. Először is, szinte semmilyen 71
kutatási kezdeményezés nem volt annak kiderítésére, hogy egy adott előadás érzelemkifejezése hogyan
lép interakcióba a darab kifejezőerejével. Egy közelmúltbéli munkánkban a lencsemodell egy kiterjesztett
változatát használjuk, amelyben mind a komponált, mind pedig az előadott jegyek is szerepelnek (Juslin
és Lindström, 2003). Másodszor, fontos szempont, hogy az alapkutatások eredményeit az előadók a gya-
korlatban is hasznosítani tudják. Így jelenleg egy olyan szoftver fejlesztésén dolgozunk, amely részletes
visszajelzést adhat az előadó számára az előadásmódjáról (Juslin et al., megjelenés előtt). Végezetül pedig
mindenképpen szükséges feltárnunk, hogy az érzelmi komponens milyen módon áll interakcióban a töb-
bi komponenssel a kifejező előadásmód megvalósítása során, amit elméleti modellek segítségével tárha-
tunk fel (pl. a GERMS modell irányvonalai mentén).

A pszichológiai megközelítés korlátai

az előadók néha szkeptikusak a kifejezőerő kutatásának kérdésében, talán részben azért, mert az előadás-
mód kutatása érettség és kifinomultság terén messze elmarad a valós zenei előadás mögött (már amen�-
nyire ezek összehasonlíthatók). Ahogy az előadó, aki először megtanulja, hogyan játsszon a hangszeren,
majd az előadói tanulmányai az alapelvekkel kezdődően (pl. miként közvetíthető a frázis szerkezete?) ha-
lad tovább az egyre finomabb és egyedibb aspektusok (pl. mi teszi az előadást valóban különlegessé?) felé.
De az emberek már az idők kezdete óta zenélnek, míg a zenei előadás pszichológiai tanulmányozásával
csak egy évszázada foglalkoznak; talán ez alapján elnézhető a kutatóknak, hogy nem érték el ugyanazt a
színvonalat, mint az előadók?
A zenei kifejezőerő pszichológiai megközelítésének számos korlátja van. Az egyik ilyen korlát az,
hogy a pszichológiai kutatáshoz az összes releváns fogalmat formailag operacionalizálni kell ahhoz, hogy
pontosan meg lehessen őket mérni. Ez a követelmény súlyosan korlátozza azt, hogy egy bármilyen empírkus
kutatásban mennyire bonyolult jelenséget vizsgálhatunk. Így, a zenészek gyakran kritizálják a pszichológiai
tanulmányokat, mert azok egyszerűek. Nyilvánvaló, hogy a pszichológusoknak meg kell találniuk a komp-
lexitás megfelelő szintjét ahhoz, hogy a zenét tanulmányozhassák. Ugyanakkor a zenészeknek is el kell is-
merniük azokat a körülményeket, amelyek között az empirikus vizsgálatokat a pszichológusok végzik. A
látszólag „durva” modellek például inkább a kutatási körülmények korlátozottságát tükrözik mintsem azt,
hogy érzéketlenek lennének a bonyolult zenei jelenségekre. (A GERM modell például kétségkívül egysze-
rű, ha összehasonlítjuk az előadásmód kifejezőerejét befolyásoló tényezők hosszú listájával, amely az 1. sz.
táblázatban található. Ám még így is meglepetésként érhetett minket a GERM bonyolultsága!)
A pszichológiai megközelítés gyakorlati korlátjait talán ellensúlyozza az, hogy a kísérletek segítsé-
gével érvényes következtetéseket vonhatunk le ok-okozati összefüggésekről. Így a kifejezőerővel kapcso-
latos naiv elméletek helyére végül empirikusan ellenőrzött ismeretek kerülhetnek, vagy legalábbis a naiv
elméletek javíthatóak ezekkel a tudáselemekkel. Néhány előadó lelkesen üdvözli az ilyen irányú fejlemé-
nyeket (Dubal, 1985: 250), de nem mindenki ennyire elkötelezett. Általános vélekedés az, hogy a túl sok
tudás „tönkreteszi a zene varázsát” vagy legalábbis megzavarja a művészi folyamatokat (Dubal, 1985: 245).
Végső soron, mindez a tudósok és művészek igényei közötti különbségeket tükrözi. Máshol már
felvetettem, hogy meg kellene próbálni áthidalni a művészet és a tudomány közötti szándékot (Juslin és
Zentner, 2002; ld. még Rink, 2003, jelen szám), mert meggyőződésem, hogy a zenészek és a kutatók so-
kat tanulhatnak egymástól. A művészet és a tudomány számos tulajdonságukban megegyeznek: mind-
kettő a körülöttünk lévő világ felfedezésének érdekes módja; mindkettő kreativitást igényel; mindkettő
sajátos nézőpontot vagy látásmódot nyújt ahhoz, hogy miként szemléljük a világunkat. Ugyanakkor úgy
vélem, el kell fogadnunk, hogy mindig is lesz bizonyos fokú feszültség a tudomány és a művészet között,
mert a céljaik végső soron eltérőek. Így például, míg az előadásmód kifejezőerejének kutatása célul tűzhe-
ti ki, hogy általános modelleket alkosson (azaz egy meghatározott jelenség egyszerűsített leírásait és ma-
gyarázatait), addig az előadóművész gyakran arra törekszik, hogy valami egyedit és személyeset hozzon
létre. (A kutató rendszerint azon a ponton lép ki a folyamatból, amikor a zenész szerint a dolgok kezdené-
nek érdekesek lenni.) Nincs olyan eljárás, amely segítségével egy pszichológiai alapokon nyugvó általános
72 modell képes lenne a maga teljességében megragadni azt a gazdag, személyes és darabfüggő módszert,
amellyel a zenészek a művészi munkájukat végzik. Végső soron az a módszer, amelyik a leghasznosabb
az előadóművész számára, lehetséges, hogy nem a leghasznosabb az előadásmód kutatója számára, mi-
vel céljaik különböznek. De van egy fontos oka annak, ami miatt legalább meg kell próbálnunk kialakíta-
ni közös alapokat: az előadásmód kifejezőerejének oktatásában kézzelfogható előnyöket jelent a pontos
instrukciók használata és a kifejezőerővel kapcsolatos tudásanyag (Juslin et al., szerk. alatt; Woody, 1999).
Ezért javasoltam ebben az írásomban, hogy a zenei előadásmód pszichológiai megközelítésének elsődle-
ges célja a kifejezőerő természetének magyarázata, azért, hogy a zenepedagógiában a kifejező készségek
oktatásához stabil alapokat tudjon nyújtani. Azt majd később látjuk meg, hogy sikerül-e megfelelnünk
ennek a kihívásnak a következő években. De még ha ez nem is sikerül, biztos vagyok benne, hogy útköz-
ben fontos dolgokkal találkozunk még.

Köszönetnyílvánítás

ez az írás egy felkérésre összeállított konferenciaelőadás kibővített változata


(Investigating Music Performance, 2002. április 12-13, Royal College of Music,
London). A kutatást a The Bank of Sweden Tercentenary Foundation támogatta.
Hálás vagyok a gyümölcsöző együttműködésért a Feel-ME projekt tagjaink.

Jegyzetek

1. Néhány zenészt, beleértve Nicolo Paganinit és a blues énekes Robert Johnsont, azzal vádolták,
hogy „eladták a lelküket az ördögnek” különleges (zenei) képességeikért cserébe.
2. Ennek egyik megemlítendő oka az, hogy a filozófiai vizsgálatok nem alkalmazhatók könnyen
zenepedagógiai célokra. Csak hogy egy példát hozzunk erre: melyik zenetanár állíthatja komo-
lyan magáról, hogy jobb érzékkel tudná tanítani a kifejezőerővel kapcsolatos készségeket, miu-
tán elolvasta Scruton (1997) könyvében a zenei kifejezőerőről szóló bonyolult fejezetet?
3. Meyer (1956) jegyzi meg: „mivel Seashore nem kínál elméletet vagy magyarázatot az eltérések
és az affektív esztétikai élmények kapcsolatára, a nézőpontjából kimarad a lényeg és hiteltelen-
né válik” (203. o.)
4. Az olvasó megkérdezheti, hogy Clynes (1997) munkája miért nem szerepel itt. Ennek oka az,
hogy a Clyneshez köthető, “esszentikus formákkal” kapcsolatos, egymástól független vizsgá-
latok nem hoztak egyértelmű eredményeket (Gorman és Crain, 1974; Nettelback et al., 1989;
Trussoni et al., 1988).
5. A komputácós modell azt jelenti, hogy a releváns kapcsolatokat matematikai eljárásokkal fejez-
zük ki. A számításokat úgy végezzük, hogy a modellt egy programba építjük be, amely lehetővé
teszi a vizsgált jelenség szimulációját.
6. Rosenthal és Rubin hatáserő-indexe, a pi (π) lehetővé teszi a kutatók számára, hogy tetszőleges
számú válaszlehetőségből származtatott pontosságértékeket egy sztenderd dichotóm skálára
transzformálják, amelyen a 0,50 a nullérték és 1,00 felel meg a 100%-os helyes felismerésnek.
7. Érdemes feleleveníteni a vokális retorika használatának alapelveit a 18. századi zeneszerzők kö-
réből.
A zene kifejezőerejének
Bibliográfia öt tényezője: a zenei
előadásmód a pszichológus
• Allison, T., Puce, A. and McCarthy, G. (2000) ‘Social Perception from Visual Cues: Role of the szemszögéből
STS Region’, Trends in Cognitive Sciences 4: 267–78.
• Boyd, J. and George-Warren, H. (1992) Musicians in Tune: Seventy-Five Contemporary Musici-
ans Discuss the Creative Process. New York: Fireside. 73
• Bregman, A.S. (1990) Auditory Scene Analysis: The Perceptual Organization of Sound. Camb-
ridge, MA: MIT Press.
• Bresin, R. and Friberg, A. (2000) ‘Emotional Coloring of Computer-Controlled Music Perfor-
mance’, Computer Music Journal 24: 44–62.
• Bryden, M. P., Ley, R. and Sugerman, J. (1982) ‘A Left-Ear Advantage for Identifying the Emotio-
nal Quality of Tonal Sequences’, Neuropsychologia 20: 83–7.
• Carreras, J. (1992) Sjunga med själen (Singing with soul). Uddevalla: Vocalis.
• Clarke, E.F. (1988) ‘Generative Principles in Music Performance’, In J.A. Sloboda (ed.) Generative
Processes in Music: The Psychology of Performance, Improvisation, and Composition, pp.
1–26. Oxford: Clarendon Press.
• Clarke, E.F. (1995) ‘Expression in Performance: Generativity, Perception, and Semiosis’, In J. Rink
(ed.) The Practice of Performance: Studies in Musical Interpretation, pp. 21–54. Camb-
ridge: Cambridge University Press.
• Clarke, E.F. and Windsor, W.L. (2000) ‘Real and Simulated Expression: A Listening Study’, Music
Perception 17: 277–313.
• Clynes, M. (1977) Sentics: The Touch of Emotions. New York: Doubleday.
• Cohen, R.A., Riccio, C.A. and Flannery, A.M. (1994) ‘Expressive Aprosodia Following Stroke to
the Right Basal Ganglia: A Case Report’, Neuropsychology 8: 242–5.
• Cook, N. and Dibben, N. (2001) ‘Musicological Approaches to Emotion’, in P.N. Juslin and J.A.
Sloboda (eds) Music and Emotion: Theory and Research, pp. 45–70. New York: Oxford
University Press.
• Davidson, J.W. and Correia, J.S. (2002) ‘Body Movement’, in R. Parncuttand G.E.
• McPherson (eds) The Science and Psychology of Music Performance: Creative Strategies for Tea-
ching and Learning, pp. 237–50. New York: Oxford University Press.
• Davies, S. (1994) Musical Meaning and Expression. Ithaca, NY: Cornell University Press.
• Dubal, D. (1985) The World of the Concert Pianist: Conversations with 35 Internationally Celeb-
rated Pianists. London: Victor Gollancz.
• Eibl-Eibesfeldt, I. (1989) Human Ethology. New York: Aldine.
• Epstein, D. (1995) ‘A Curious Moment in Schumann’s Fourth Symphony: Structure as the Fusion
of Affect and Intuition’, in J. Rink (ed.) The Practice of Performance, pp. 126–49. Camb-
ridge: Cambridge University Press.
• Farga, F. (1969) Violins and Violinists, 2nd edn. London: The Cresset Press.
• Friberg, A. (1995) ‘A Quantitative Rule System for Musical Performance’, doctoral dissertation,
Royal Institute of Technology, Stockholm.
• Friberg, A. and Sundberg, J. (1999) ‘Does Music Performance Allude to Locomotion? A Mo-
del of Final Ritardandi Derived from Measurements of Stopping Runners’, Journal of the
Acoustical Society of America 105: 1469–84.
• Friberg, A., Colombo, V., Frydén, L. and Sundberg, J. (2000) ‘Generating Musical Performances
with Director Musices’, Computer Music Journal 24: 23–9.
• Friberg, A., Schoonderwaldt, E., Juslin, P.N. and Bresin, R. (2002) ‘Automatic Real- Time Extracti-
on of Musical Expression’, in Proceedings of the International Computer Music Conferen-
ce, Göteborg, 16–21 September 2002, pp. 365–7. San Francisco: International Computer
Music Association.
• Gabrielsson, A. (1987) ‘Once Again: The Theme from Mozart’s Piano Sonata in A Major: A
Comparison of Five Performances’, in A. Gabrielsson (ed.) Action and Perception in Rhyt-
hm and Music, publication no. 55, pp. 81–103. Stockholm: Royal Swedish Academy of Mu-
sic.
• Gabrielsson, A. (1999) ‘The Performance of Music’, in D. Deutsch (ed.) The Psychology of Music,
2nd edn, pp. 501–602. San Diego: Academic Press.
• Gabrielsson, A. (2003) ‘Music Performance Research at the Millennium’, Psychology of Music
74 31(3): 221–72.
• Gabrielsson, A. and Juslin, P.N. (1996) ‘Emotional Expression in Music Performance: Between
the Performer’s Intention and the Listener’s Experience’, Psychology of Music 24: 68–91.
• Gabrielsson, A. and Juslin, P.N. (2003) ‘Emotional Expression in Music’, in
• R.J. Davidson, H.H. Goldsmith and K.R. Scherer (eds) Handbook of Affective Sciences, pp. 503–
34. New York: Oxford University Press.
• Gilden, D.L., Thornton, T. and Mallon, M.W. (1995) ‘1/f Noise in Human Cognition’, Science
267: 1837–9.
• Gorman, B.S. and Crain, W.C. (1974) ‘Decoding of “sentograms”’, Perceptual and Motor Skills 39:
784–6.
• Hallam, S. (1995) ‘Professional Musicians’ Approaches to the Learning and Interpretation of Mu-
sic’, Psychology of Music 23: 111–28.
• Ivry, R.I., Keele, S.W. and Diener, H.C. (1988) ‘Dissociation of the Lateral and Medial Cerebellum
in Movement Timing and Movement Execution’, Experimental Brain Research 73: 167–80.
• Jansens, S., Bloothooft, G. and De Krom, G. (1997) ‘Perception and Acoustics of Emotions in Sin-
ging’, in Proceedings of the Fifth European Conference on Speech Communication and
Technology, Vol. IV, pp. 2155–8. Rhodes, Greece: ESCA.
• Johansson, G. (1973) ‘Visual Perception of Biological Motion and a Model for its Analysis’, Percep-
tion and Psychophysics 14: 201–11.
• Juslin, P.N. (1997a) ‘Emotional Communication in Music Performance: A Functionalist Perspec-
tive and Some Data’, Music Perception 14: 383–418.
• Juslin, P.N. (1997b) ‘Perceived Emotional Expression in Synthesized Performances of a Short Mel-
ody: Capturing the Listener’s Judgment Policy’, Musicae Scientiae 1: 225–56.
• Juslin, P.N. (1997c) ‘Can Results from Studies of Perceived Expression in Musical Performances
Be Generalized across Response Formats?’, Psychomusicology 16: 77–101.
• Juslin, P.N. (2000) ‘Cue Utilization in Communication of Emotion in Music Performance: Re-
lating Performance to Perception’, Journal of Experimental Psychology: Human Perception
and Performance 26: 1797–813.
• Juslin, P.N. (2001) ‘Communicating Emotion in Music Performance: A Review and a Theoretical
Framework’, in P.N. Juslin and J.A. Sloboda (eds) Music and Emotion: Theory and Resear-
ch, pp. 305–33. New York: Oxford University Press.
• Juslin, P.N. and Laukka, P. (2000) ‘Improving Emotional Communication in Music Performance
through Cognitive Feedback’, Musicae Scientiae 4: 151–83.
• Juslin, P.N. and Laukka, P. (2001) ‘Impact of Intended Emotion Intensity On Cue Utilization and
Decoding Accuracy in Vocal Expression of Emotion’, Emotion 1: 381–412.
• Juslin, P.N. and Laukka, P. (in press) ‘Communication of Emotions in Vocal Expression and Music
Performance: Different Channels, Same Code?’, Psychological Bulletin.
• Juslin, P.N. and Laukka, P. (in press) ‘Emotional Expression in Speech and Music: Evidence of
Cross-modal Similarities’, in P. Ekman (ed.) Annals of the New York Academy of Sciences.
New York: New York Academy of Sciences.
• Juslin, P.N. and Lindström, E. (2003) ‘Musical Expression of Emotions: Modeling Composed and
Performed Features’, manuscript in preparation.
• Juslin, P.N. and Madison, G. (1999) ‘The Role of Timing Patterns in Recognition of Emotional
Expression from Musical Performance’, Music Perception 17: 197–221.
• Juslin, P.N. and Persson, R.S. (2002) ‘Emotional Communication’, in R. Parncutt and
A zene kifejezőerejének
• G.E. McPherson (eds) The Science and Psychology of Music Performance: Creative Strategies for öt tényezője: a zenei
Teaching and Learning, pp. 219–36. New York: Oxford University Press. előadásmód a pszichológus
• Juslin, P.N. and Sloboda, J.A. (eds) (2001) Music and Emotion: Theory and Research. New York: szemszögéből
Oxford University Press.
• Juslin, P.N. and Zentner, M.R. (2002) ‘Current Trends in the Study of Music and Emotion: Over-
ture’, Musicae Scientiae (special issue 2001/2): 3–21. 75
• Juslin, P.N., Friberg, A. and Bresin, R. (2002) ‘Toward a Computational Model of Expression in
Music Performance: The GERM Model’, Musicae Scientiae (special Issue 2001/2): 63–122.
• Juslin, P.N., Friberg, A., Schoonderwaldt, E. and Karlsson, J. (in press) ‘Feedback- Learning of Mu-
sical Expressivity’, in A. Williamon (ed.) Enhancing Musical Performance: A Resource for
Performers, Teachers and Researchers. New York: Oxford University Press.
• King, B.B. (1996) Blues All Around Me. London: Hodder and Stoughton.
• Konecˆni, V.J. (1979) ‘Determinants of Aesthetic Preference and Effects of Exposure to Aesthetic
Stimuli: Social, Emotional, and Cognitive Factors’, in B.A. Maher (ed.) Progress in Experi-
mental Personality Research, Vol. 9, pp. 149–97. Orlando, FL: Academic Press.
• Kotlyar, G.M. and Morozov, V.P. (1976) ‘Acoustic Correlates of the Emotional Content of Vocali-
zed Speech’, Soviet Physics: Acoustics 22: 370–6.
• Laukka, P. (2003) ‘Instrumental Music Teachers’ Views on Expressivity: A Report from Music
Conservatories’, manuscript submitted for publication.
• Leahey, T.H. (1987) A History of Psychology: Main Currents in Psychological Thought. Eng-
lewood Cliffs, NJ: Prentice Hall.
• Levinson, J. (1990) Music, Art, and Metaphysics. Ithaca, NY: Cornell University Press.
• Lindström, E., Juslin, P.N., Bresin, R. and Williamon, A. (in press) ‘Expressivity Comes From Wit-
hin Your Soul: A Questionnaire Study of Music Students’ Perspectives on Expressivity’, Re-
search Studies in Music Education.
• Lippman, E.A. (1953) ‘Symbolism in Music’, Musical Quarterly 39: 554–75.
• London, J. (2002) ‘Some Theories of Emotion in Music and their Implications for Research in Mu-
sic Psychology’, Musicae Scientiae (special issue 2001/2): 23–36.
• Madison, G. (2000) ‘On the Nature of Variability in Isochronous Serial Interval Production’, in P.
Desain and W.L. Windsor (eds) Rhythm Perception and Production, pp. 95–113. Lisse, The
Netherlands: Swets and Zeitlinger.
• Maess, B., Koelsch, S., Gunter, T.C. and Friederici, A.D. (2001) ‘Musical Syntax is Processed in
Broca’s Area: A MEG Study’, Nature Neuroscience 4: 540–5.
• Menuhin, Y. (1996) Unfinished Journey. London: Methuen.
• Mergl, R., Piesbergen, C. and Tunner, W. (1998) ‘Musikalisch-improvisatorischer Ausdruck und
erkennen von gefühlsqualit.ten’, Musikpsychologie: Jahrbuch der Deutschen Gesellschaft
für Musikpsychologie 13: 69–81.
• Meyer, L.B. (1956) Emotion and Meaning in Music. Chicago: University of Chicago Press.
• Mills, J. (2003) ‘Musical Performance: Crux or Curse of Music Education’, Psychology of Music
31(3): 324–39.
• Natale, M. (1977) ‘Perception of Nonlinguistic Auditory Rhythms by the Speech Hemisphere’,
Brain and Language 4: 32–44.
• Nettelbeck, T., Henderson, C. and Willson, R. (1989) ‘Communicating Emotion through Sound:
An Evaluation of Clynes’ Theory of Sentics’, Australian Journal of Psychology 41: 17–24.
• North, A.C. and Hargreaves, D.J. (1997) ‘Experimental Aesthetics and Everyday Listening to Mu-
sic’, in D.J. Hargreaves and A.C. North (eds) The Social Psychology of Music, pp. 84–103.
Oxford: Oxford University Press.
• Oatley, K. (1992) Best Laid Schemes: The Psychology of Emotions. Cambridge, MA: Harvard
University Press.
• Ochsner, K.N. and Feldman Barrett, L. (2001) ‘A Multiprocess Perspective on the Neuroscien-
ce of Emotion’, in T.J. Mayne and G.A. Bonnano (eds) Emotions: Current Issues and Future
Directions, pp. 38–81. New York: Guilford Press.
• Palmer, C. (1996) ‘Anatomy of a Performance: Sources of Musical Expression’, Music Perception
13: 433–53.
76 • Palmer, C. (1997) ‘Music Performance’, Annual Review of Psychology 48: 115–38.
• Penel, A. and Drake, C. (1999) ‘Seeking “One” Explanation for Expressive Timing’, in
• S.W. Yi (ed.) Music, Mind, and Science, pp. 271–97. Seoul: Seoul National University Press.
• Peretz, I. (1990) ‘Processing of Local and Global Musical Information by Unilateral Brain-Da-
maged Patients’, Brain 113: 1185–205.
• Peretz, I., Gagnon, L. and Bouchard, B. (1998) ‘Music and Emotion: Perceptual Determinants,
Immediacy, and Isolation after Brain Damage’, Cognition 68: 111–41.
• Persson, R.S. (1993) ‘The Subjectivity of Musical Performance: An Exploratory Music-Psycholo-
gical Real World Enquiry into the Determinants and Education of Musical Reality’, unpub-
lished doctoral dissertation, Huddersfield University, UK.
• Persson, R.S. (2001) ‘The Subjective World of the Performer’, in P.N. Juslin and J.A. Sloboda (eds)
Music and Emotion: Theory and Research. New York: Oxford University Press.
• Repp, B.H. (1989) ‘Expressive Microstructure in Music: A Preliminary Perceptual Assessment of
Four Composers’ “pulses”’, Music Perception 6: 243–74.
• Repp, B.H. (1997a) ‘Variability of Timing in Expressive Piano Performance Increases with Interval
Duration’, Psychonomic Bulletin and Review 4: 530–4.
• Repp, B.H. (1997b) ‘The Aesthetic Quality of a Quantitatively Average Music Performance: Two
Preliminary Experiments’, Music Perception 14: 419–44.
• Repp, B.H. (1998) ‘A Microcosm of Musical Expression: I. Quantitative Analyses of Pianists’ Ti-
ming in the Initial Measures of Chopin’s Etude in E major’, Journal of the Acoustical Soci-
ety of America 104: 1085–100.
• Rink, J. (2003) ‘In Respect of Performance: The View from Musicology’, Psychology of Music
31(3): 303–23.
• Rohwer, D. (2001) ‘Instrumental Music Students’ Cognitive and Performance Understanding of
Musical Expression’, Journal of Band Research 37: 17–28.
• Rostwall, A.-L. and West, T. (2001) ‘Interaktion och kunskapsutveckling (Interaction and Lear-
ning: A Study of Music Instrument Teaching), doctoral dissertation (with a summary in
English), Stockholm University.
• Scherer, K.R. (1986) ‘Vocal Affect Expression: A Review and a Model for Future Research’, Psy-
chological Bulletin 99: 143–65.
• Scruton, R. (1997) The Aesthetics of Music. Oxford: Oxford University Press.
• Schumacher, M. (1995) Crossroads: The Life and Music of Eric Clapton. New York: Hyperion.
• Seashore, C.E. (1938) Psychology of Music. New York: McGraw-Hill.
• Sergent, J., Zuck, E., Tenial, S. and MacDonall, B. (1992) ‘Distributed Neural Network Underly-
ing Musical Sight-Reading and Keyboard Performance’, Science 257: 106–9.
• Shaffer, L.H. (1992) ‘How to Interpret Music’, in M.R. Jones and S. Holleran (eds) Cognitive Bases
of Musical Communication, pp. 263–78. Washington, DC: American Psychological Asso-
ciation (APA).
• Shove, P. and Repp, B.H. (1995) ‘Musical Motion and Performance: Theoretical and Empirical
Perspectives’, in J. Rink (ed.) The Practice of Performance: Studies in Musical Interpretation,
pp. 55–83. Cambridge: Cambridge University Press.
• Sloboda, J.A. (1983) ‘The Communication of Musical Metre in Piano Performance’, Quarterly
Journal of Experimental Psychology 35: 377–96.
• Sloboda, J.A. (1996) ‘The Acquisition of Musical Performance Expertise: Deconstructing the
‘Talent’ Account of Individual Differences in Musical Expressivity’, in K.A. Ericsson (ed.)
The Road to Excellence, pp. 107–26. Mahwah, NJ: Erlbaum.
A zene kifejezőerejének
• Sloboda, J.A. (2000) ‘Individual Differences in Music Performance’, Trends in Cognitive Sciences öt tényezője: a zenei
4: 397–403. előadásmód a pszichológus
• Sloboda, J.A. and Juslin, P.N. (in press) ‘A ffektive Prozesse: Emotion, Gefallen und Präferenzen szemszögéből
(Affective Processes in Music: Emotion, Liking, and Preference)’, in T.H. Stoffer and R.
Oerter (eds) Enzyklopädie der Psychologie, Musikpsychologie, Bd.1. Allgemeine Musik-
psychologie. Göttingen: Hogrefe. 77
• Small, C. (1999) ‘Musicking: The Meanings of Performance and Listening: A Lecture’, Music
Education Research 1: 9–21.
• Spencer, H. (1857) ‘The Origin and Function of Music’, Fraser’s Magazine 56: 396–408.
• Sundberg, J. (1988) ‘Computer Synthesis of Music Performance’, in J.A. Sloboda (ed.) Generative
Processes in Music: The Psychology of Performance, Improvisation, and Composition, pp.
52–69. Oxford: Clarendon Press.
• Tait, M. (1992) ‘Teaching Strategies and Styles’, in R. Colwell (ed.) Handbook of Research on Mu-
sic Teaching and Learning, pp. 525–34. New York: Schirmer Books.
• Thompson, W.F., Sundberg, J., Friberg, A. and Frydén, L. (1989) ‘The Use of Rules for Expression
in the Performance of Melodies’, Psychology of Music 17: 63–82.
• Todd, N. (1985) ‘A Model of Expressive Timing in Tonal Music’, Music Perception 3: 33–58.
• Todd, N. (1992) ‘The Dynamics of Dynamics: A Model of Musical Expression’, Journal of the
Acoustical Society of America 91: 3540–50.
• Trussoni, S.J., O’Malley, A. and Barton, A. (1988) ‘Human Emotion Communication by Touch:
A Modified Replication of an Experiment by Manfred Clynes’, Perceptual and Motor Skills
66: 419–24.
• Van Oosten, P. (1993) ‘Critical Study of Sundberg’s Rules for Expression in the Performance of
Melodies’, Contemporary Music Review 9: 267–74.
• Wing, A. and Kristofferson, A.B. (1973) ‘Response Delays and the Timing of Discrete Motor Res-
ponses’, Perception & Psychophysics 14: 5–12.
• Woody, R.H. (1999) ‘The Relationship between Explicit Planning and Expressive Performance of
Dynamic Variations in an Aural Modeling Task’, Journal of Research in Music Education
47: 331–42.
• Woody, R.H. (2000) ‘Learning Expressivity in Music Performance: An Exploratory Study’, Re-
search Studies in Music Education 14: 14–23.
• Woody, R.H. (2002) ‘Emotion, Imagery and Metaphor in the Acquisition of Musical Performan-
ce Skill’, Music Education Research 4: 213–24.
• Yamada, M. (1998) ‘Temporal Fluctuations in Musical Performances: Fluctuations Caused by the
Limitations of Performers’ Controllability and by Artistic Expression’, in S.W. Yi (ed.) Proce-
edings of the Fifth International Conference on Music Perception and Cognition, pp. 353–
63. Seoul: Seoul National University

• Patrik N. Juslin docens az Uppsala Egyetem Pszichológiai Tanszékén Svédországban, ahol előadá-
sokat tart az érzelmekről, percepcióról, és zenepszichológiáról. Igazgatója a Feedback-Lear-
ning of Musical Expressivity (Feel-ME) interdiszciplináris kutatási porgramnak. (http://
www.psyk.uu.se/hemsidor/musicpsy/) Tagja az Érzelmek Kutatása Nemzetközi Szerveze-
tének (ISRE). 1996-ban elnyerte az ESCOM Fiatal Kutató díjját. John Slobodával társszer-
zője a 2001-ben az Oxford University Press kiadásában megjelent Music and Emotion című
könyvnek. Nemzetközi turnékon mint blues/jazz gitáros szerepelt a közelmúltig.
78
Ian Cross
Fordította:
dr. Holics László

Zenei analízis és zenei 79

percepció
Bevezetés
Zenei analízis
Az analízisről szóló, a The New Grove lexikonban megjelent cikkében Ian Bent a következőt állít- és zenei percepció
ja: „Az elemzés, mint tevékenység minden aspektusa mögött az elme és a zenei hang alapvető találkozá-
si pontja áll, mely nem más, mint a zenei percepció” (Bent 1980, 341. o.). Ha ezt az állítást elfogadjuk (s ez
igencsak kézenfekvőnek látszik), akkor a zenei analízissel foglalkozó közösség számára, úgy tűnik, a zenei 81
percepció természetének vizsgálata központi törekvés kell, hogy legyen. Úgy tűnik azonban, hogy eddig
csak kevés elemző szentelt jelentős figyelmet percepció kérdéseinek, s a legtöbb elemzési és elméleti szak-
irodalom csak alkalomszerűen és meglehetősen szerteágazó információkkal szolgáltak a témával kapcso-
latban. A rendelkezésre álló eredmények ugyanakkor lehetővé teszik, hogy kikövetkeztessük, az elemzők
többségének álláspontja alapján mi lehet a zenei percepció fogalma.
Úgy tűnik, léteznek bizonyos feltételezések, hiedelmek, amelyek az alábbiakhoz hasonló megálla-
pításokból kitűnnek:
i. A különböző mintázatok meghallásakor az irányultság és a tetőpont érzetére csak az tud magya-
rázatot adni, hogy elismerjük, a hallgató a priori döntést hoz, hogy meghallja a darabban az adott
mintázatot. (Smith, 1981, 157. oldal)
ii. Próbáljunk meg meghallgatni egy dodekafon művet majd, nemcsak önmagában, hanem az ala-
pul vett hangsorának ismeretében s ahhoz viszonyítva, valamint a dodekafon rendszer működé-
sének tükrében! (Hyde 1993, 63. oldal)
iii. Az egész kérdés, hogy eldöntsük, „mit hall az ember”, problematikus. Végül is, képes vagyok „hal-
lani” a legképtelenebb analitikai összefüggéseket, ha akarom; csak döntés kérdése, hogy mit aka-
rok hallani. (Cook 1987a, 57. oldal)
A fentiekben az az elképzelés a közös, hogy a zenei percepció valami olyasmi, ami alapvetően tuda-
tos és akaratlagos – csakugyan, jóformán semmilyen tényező sem korlátozza az analitikus tudás által ve-
zérelt egyéni akaraton kívül.
Visszautalva a jelen cikket megnyitó idézetre, itt be kell vallanom, hogy nem teljes egészében idéz-
tem. Hiánytalanul így szól:
Az elemzés, mint tevékenység minden aspektusa mögött az elme és a zenei hang alapvető találkozá-
si pontja áll, mely nem más, mint a zenei percepció (lásd a Zenepszichológia szócikket).

Más szóval, a fentiek a következő utalást rejtik magukban: ahhoz, hogy megfelelően számot adjunk
a zenei percepcióról, szükségszerűen fel kell használnunk a zenepszichológia empirikus és tudományos
eredményeit. Ez azonnal fölveti a kérdést, hogy a percepció, abban a formában, ahogy meglátásom szerint
sok elemző vélekedik róla, vajon összhangban van-e azzal, ahogy a percepciót a zenepszichológia berkein
belül írják le. Az egyszerű válasz erre az, hogy e két megközelítésmód alapvetően nem egyeztethető ös�-
sze; mivel a percepció igen messze van a tudatostól és a szándékostól, a zenepszichológia eredményei azt
látszanak alátámasztani, hogy a zene bizonyos aspektusainak percepciója többé-kevésbé önkéntelen vagy
„reflexszerű” lehet, és gyakran az is, s hogy szükségszerűen magában foglal nem-tudatos folyamatokat.
Mi lehet az oka ennek az eltérésnek? Lehet például – ahogy Cook (1994) érvel –, hogy a percepció,
ahogy a zenepszichológia világában tanulmányozzák azt, valójában muzikológiai percepció – vagyis, hogy
a zene pszichológiájának empirikus vizsgálata oly mértékben egyszerű zenetudományi fogalmakon ala-
pul, hogy a zenei percepciót már nem tudja megmagyarázni. Legalább két ok van azonban arra, hogy ezt a
nézetet vitassuk. Míg Cook kritikája a „teorizmusról” (azaz az, hogy a priori úgy tekintünk a zeneelméle-
ti fogalmakra, hogy azok kognitív kategóriákból és fogalmakból állnak, vagy közvetlenül megfeleltethe-
tőek azoknak) felhozható lehet bizonyos zenei kognícióval kapcsolatos írásokkal szemben, vádjai nem áll-
nak meg a zenei kogníció természetéről szóló összes tanulmány ellen. Annyi azonban elmondható, hogy
amikor a zenei jelenségek értelmezéséhez kereteket állítunk fel, a zeneelmélet segédeszközöket nyújt a ze-
nei kogníció tanulmányozásához oly módon, hogy alapot szolgáltathat a zenei élmény kategóriáiról szó-
ló kezdeti hipotézisek megfogalmazásához, s ezeket a hipotéziseket később empirikusan értékeléhetjük.
Sőt! Aligha vitatható, hogy az a számos kísérleti kutatás, amely zeneileg képzetlen zenehallgató kísérleti
alanyokkal dolgozik – s mely azt kéri az alanyoktól, hogy olyan ítéleteket alkossanak a hallott zenéről, me-
lyek nem támaszkodnak semmilyen zenetudományi koncepcióra vagy szakszóra a válaszadáskor – abba
a hibába esik, melyet Cook elítél. Példának hozhatunk olyan tanulmányokat, mint pl. Slobodáé és Parke-
ré (1985), és Ouráé és Hatanoé (1988), melyek a memóriából való felidézés természetét vizsgálták rövid
zeneművek esetében úgy, hogy egyszerűen megkértek zenében jártas és nem jártas alanyokat egyaránt,
hogy a korábban hallott zenét énekeljék vagy dúdolják el; továbbá, számos új tanulmányt, mint pl. a Deli-
82 ége, Mélen, Stammers és Cross (1996) által írt, melyben azokat a képességeket és stratégiákat vizsgálták,
amelyekkel a zenében jártas és nem jártas alanyok élnek zenei konstrukciós feladatoknál, kizárólag hang-
zó anyagok használatával.

A zene „naiv pszichológiája”

Az ember azzal próbálhatja megkerülni ezt a kérdést, hogy elkezdi firtatni, vajon a percepció zenea-
nalitikai fogalma összhangban van-e azzal, ahogy a percepciót a kognitív pszichológia szélesebb körében
értelmezik. De az ellentmondás itt is fennáll: az az elképzelés, hogy a percepció önkéntelen és nem-tu-
datos folyamatokat is magában foglal, gyakorlatilag minden pszichológiai jelenség sajátja. A percepció
zenetudományi megközelítése ugyanakkor nem képes a kognitív-tudományos megközelítéshez úgy il-
leszkedni, hogy legalábbis definiálható lenne a kognitív tudomány szemszögéből. A percepció „analitikai
fogalma” tekinthető úgy, hogy az részben a zene „naiv pszichológiája”, vagy pedig a zenei analízisé, ahhoz
hasonlóan, ahogy különbséget teszünk a hétköznapi viselkedés kognitív-tudományos megközelítésű, il-
letve a józan ésszel történő leírása között. A „naiv pszichológia”, Jerome Bruner szavaival (1990, 35. oldal),
„többé-kevésbé normatív leírások halmaza arról, hogy az emberek hogyan ’ketyegnek’, milyen a saját el-
ménk és másoké, egy bizonyos helyzetben milyen cselekvés várható valakitől, milyen lehetséges életmó-
dok vannak, és az ember hogyan kötelezi el magát nekik”. A zeneanalízisnek ebben a „naiv pszichológiájá-
ban” a percepció aktusát szándékosan, akaratlagosan befolyásoljuk, és különböző kategóriák, amelyekbe
az élmények sorolhatók – qualia –, az elemző vizsgálódásának fényében tudatosan formálhatóak és újra-
alkothatóak lehetnek (legalábbis az elemző számára).
Azonban ha ez valóban naiv pszichológia, akkor csak egy igen korlátozott területen használjuk,
amely nagyon messze áll a mindennapi élettől. Bruner szerint, „korán tanuljuk meg az ilyen naiv pszicho-
lógiát; úgy tanuljuk meg, ahogy anyanyelvünket is elsajátítjuk; illetve ahogy a közösségi lét által megkí-
vánt társas interakciók lebonyolítását is megtanuljuk”. A zenei elemzők naiv pszichológiáját azonban arra
használják, hogy igen sajátos meglátásokat tegyenek közzé egy szakmai közösségben. Számos indok adó-
dik azonban arra, hogy ezt kifogásoljuk. A percepciós folyamatoknak ez a köznyelvi magyarázata, mely-
nek természetét nyilvávalóan még nem vizsgálták, nem illeszkedik ahhoz a részletességhez és mély kont-
extualizáltsághoz, ami a zenei elemzés aktusát jellemzi. Sőt: míg a zenei analízisben alkalmazott „naiv
pszichológia” a komplex zenei jelenségek élményének tárgyalásakor nagyon is jól jellemezheti a zenetu-
dós zenehallgatási folyamatait. Az, hogy e komplex zenei jelenségek minden bizonnyal hiányoznak az át-
lagos zenehallgatók tudatából (akik attól még természetesen élvezhetik a zenét), igencsak megnehezíti,
hogy a zenei elemzések eredményeit az „átlagosan művelt”, ám zeneileg képzetlen hallgató zenei élménye-
ire vonatkoztassuk (kivéve, ha egyszerűen azt állítjuk, hogy a zenetudósok és a képzetlen zenehallgatók
percepciói különbözőek lesznek). További adalék ez utóbbi gondolathoz, hogy a kognitív tudomány né-
hány, zenei percepcióról szóló kísérleti eredménye azt látszik kimutatni, hogy valószínűleg kevés kvalitatív
különbség létezik a zeneileg képzetlen és a zeneileg magasan képzett hallgatók percepciói között (lásd pl.
Bigand tanulmányát (1993), melyben zeneileg képzett és képzetlen hallgatók figyelemre méltóan hasonló
érzékenységet mutattak az általános tonális-funkciós struktúrára, dallamok hallgatása során).
Így, ha a zenei percepciónak ez a „naiv pszichológiája” részleges, nem vizsgált és potenciálisan el-
lent mond a „tudományos” pszichológia eredményeinek, talán Bent javaslatára kellene odafigyelnünk, és
a zene pszichológiáját arra kellene használnunk, hogy alátámasszuk vele az analízis struktúráit és módsze-
reit. Talán, ahogy Erickson (1982) javaslatából látszik, egyszer akár eljöhet az idő, amikor a zenei analízisre
úgy tekintünk, mint a zenei kogníció tanulmányozásának az egyik részterületére.
Úgy képzelem, hogy egy ilyen nézet – beleértve azt is, amit Cook (1987a, 223. oldal) úgy hív, hogy
„a hallgató, mint szabad cselekvő eltörlése” – kevés helyeslésre találna a zenei elemzők közösségében. Sőt: Zenei analízis
a zenei analízis hermeneutikai és kritikai dimenziói, melyekhez Cook és mások, mint pl. Treitler (1980), és zenei percepció
Tomlinson (1984) és Kerman (1985) ragaszkodtak, úgy tűnik, immunissá tehetik a zenei analízist a „po-
zitivisztikus” vagy „redukcionista” kognitív-tudományos fejtegetésekkel szemben, azáltal, hogy határo-
zottan a „mítoszalkotás” kulturális területére helyezik azt. Azonban egy ilyen védekezés tarthatatlannak 83
tűnik a tudományos vizsgálat modern megközelítéseinek fényében, amelyek azt hangsúlyozzák, hogy a
kutatómunka nem kizárólag annak a pozitivizmusnak a jegyében határozható meg, amely alapján koráb-
ban megkülönböztettük azt a vizsgálódás más formáitól, és amelyek következtében a tudományos vizs-
gálatra, mint a pozitivizmusnak a gondolkodás és viselkedés általánosabb keretrendszerén belül elfoglalt
helyének eredményeként tekintsünk (lásd Brown 1977). Feyerabend (1981, 7. oldal) azt javasolja, hogy a
magyarázatalkotás hermeneutikus módszerei (melyeket ő „historikus tradícióknak” nevez) és a tudomá-
nyos magyarázatok (melyeket „absztrakt tradícióknak” hív) közötti különbségtétel valójában illuzórikus;
javaslata szerint:
„az absztrakt (azaz tudományos) tradíciók nem alternatívái a historikus tradícióknak, hanem speci-
ális részei azoknak. A struktúrák, melyeket tartalmaznak, az absztrakt elképzelések, képzetek, melyek e
struktúrákba ágyazódnak, csak azért megtanulhatók, megérthetők és új esetekre, helyzetekre adaptálha-
tók, mert e struktúrák részét képezik egy mindennek alapjául szolgáló historikus közegnek, amely megtá-
masztja őket, értelemmel ruházza fel őket és megmutatja, hogyan lehet őket alkalmazni.”
Még olyanok is, mint Lakatos (lásd például, Lakatos 1970), akik nemigen állnak beszélő viszonyban
azzal a „konvencionalista” tudomány-szemlélettel, melyet Feyerabend állítása látszólag implicit módon
magában hordoz, a tudományos tevékenységnek szintén tulajdonítottak egy történeti dimenziót, amely
hozzáköti azt ahhoz az időszakhoz és kultúrához, melyben a tudományos tevékenységet végzik.
Így a zenei analízis „kulturális elhelyezettsége” semmilyen védelmet nem biztosít a tudományos im-
perializmussal szemben, és semmilyen meggyőző érvet nem szolgáltat, amely megakadályozná a tudo-
mányt abban, hogy némi szerepet játsszon a zenei analitikai törekvésekben. Bár nehéz érvelni amellett,
hogy a zenei analízist a zenei kogníció területéhez soroljuk, nagyon is elfogadhatónak tűnik az az érv, hogy
a zenei analízist legalább alátámasszák a percepció tudományos eredményei, s így a percepcióval kapcso-
latos, analitikus, „naiv pszichológiai” nézeteket felváltsák a kognitív tudományban gyökerező elméletek,
amennyiben ezek pontosabbnak, általánosíthatóbbnak és eredményesebbnek bizonyulnak. S valóban, a
„naiv pszichológia” kifejezést olyan kognitív tudósok hozták be a közbeszédbe, mint Stich (1983) vagy
Churchland (1984), akik jellemezni kívánták a „mindennapi konceptuális sémákat, melyek a saját cselek-
véseink magyarázatára szolgálnak a hiteink, vágyaink stb. fényében” (Greenwood, 1991, 7. oldal) – s ame-
lyeket a kognitív tudomány eredményeivel ki lehetne magyarázni, s helyettesíteni lehetne. Ahhoz, hogy
teszteljük azt az indítványt, miszerint a „naiv pszichológiát” helyettesíteni kellene a kognitív tudománnyal,
helyénvalónak tűnik áttekinteni a két legfejlettebb, legkifinomultabb zenei analitikai módszert, mely azt
állítja magáról, hogy kognitív tudományos talajon áll: nevezetesen Lerdahl és Jackendoff, valamint Nar-
mour munkáját. Ezeket a módszereket később egy Mozart-zeneműrészlet – a K. V. 311-es zongoraszoná-
ta második tételének első négy üteme – rövid elemzésének kontextusában tárgyaljuk.

Lerdahl és Jackendoff – egy generatív elmélet

Első látásra, Lerdahl és Jackendoff elmélete (1983), mely „magyarázatot kíván adni a hallgató zenei
megérzéseiről, melyet egy adott zenei stíluson belül tapasztal”, a pszicholingvisztika és a schenkeri elmé-
let ötvözetének tűnik. Rá kíván világítani a tonális zene számos perceptuális jellegzetességére – szegmen-
táció, periodicitás, egy zenerészlet vagy mű különböző komponenseinek tulajdonítható, különböző szin-
tű hangsúlyok, a feszültség és az oldódás hullámzása egy mű kibontakozása során – négy, többé-kevésbé
különálló analitikai szint alkalmazásával, mely szintek mindegyike saját, többé-kevésbé formális analitikai
alapelvvel, vagy produkciós szabályrendszerrel rendelkezik. E produkciós szabályok, más néven a „jó for-
ma” szabályai, meghatározzák, hogy mely analitikai struktúrák formálódhatnak a négy analitikai terület
mindegyikében – milyen analitikai struktúrák lehetségesek – egy adott zenei kompozíció alapján. Mind-
egyik területnek van egy preferenciaszabály-együttese is, amely választ a lehetséges analitikai struktúrák
között, hogy elérjen egyetlen „preferált” analízist mindegyik területen.
A négy területet – metrikai, csoportosításbeli, időtávbeli és prolongációs1 – részlegesen kölcsönö-
sen egymástól függő területekként értelmezik, amelyek ugyanakkor a hallgató zenei intuícióinak külön-
84 böző aspektusait is modellezik. Így a csoportosítás területén helyet foglaló struktúrát nagy mértékben a
zenei felszínen zajló eseményekre alapozzák, a metrikai terület a kéttagú és háromtagú hierarchia elveire
alapul (bár szigorúan korlátozódik azon szintek szabályainak megfelelően, melyekre a hierarchia kiterjed-
het), az időtávbeli terület alapja részben a csoportosításbeli és metrikai struktúrák, de a tonális-harmóniai
alapelvek is, míg a prolongációs terület nagy mértékben a tonális-harmóniai viszonyokra és részben az idő-
távbeli struktúrákra alapul. Ennélfogva a csoportosításbeli és metrikai területek nagymértékben a zenei fel-
színből származnak, s jól formáltsági szabályaik látszólag azokat az alapelveket modellezik, amelyek a zenei
események közötti közvetlen relációk „nyers” percepciója során működnek – míg az időtávbeli és prolongá-
ciós területek, bár figyelembe veszik a másik két terület produktumait is, a stilisztikai és „muziko-szeman-
tikai” tudás alkalmazását modellezik, amely a percepciós ciklus részeként zajlik le.
Egyszerűnek tűnik a szerzők elméletének alkalmazása Mozart K.V. 311-es zongoraszonátája 2. té-
telének első négy ütemére. A metrikai analízis, melyet a kotta alatti pontok mutatnak az 1(a) ábrán, ma-
gától értetődőnek tűnik, olyan jól formáltsági szabályokból származik, mint például, hogy „Mindegyik
hangsúlyos pontnak kötődnie kell egy (metrumbeli) ütéshez, a darabban azon a ponton jelenlévő a legki-
sebb metrikai szinten” (bár a legalacsonyabb szint, a tizenhatodoké, nincs feltüntetve az ábrán), vagy, hogy
„Mindegyik metrikai szinten az erős ütések két vagy három ütésnyi távolságra állnak egymástól”, stb. Eze-
ket a jól formáltsági szabályokat olyan preferencia-szabályok egészítik ki, melyek azt sugallják, hogy előny-
ben kell részesíteni például „az olyan metrikai struktúrákat, amelyekben egy csoportban a legerősebb ütés
egy viszonylag korai ponton jelenik meg a csoporton belül”, vagy „olyan metrikai struktúrákat, melyekben
az erős ütések egybeesnek a hangmagasság változásaival”, stb.

# 2 j .
& 4 œ œ œ™ œ œ œ œ œ œ œ œ œ œœ œœ œœ ≈ œœ œ œ œ œ œœ œœ œ œ œ™ œ
j
Trumpet in C
. .
p f p

˙œ œ. œ. œ. œ œ
? # 2 œ̇ œ œ œ œ œ œ œ ≈ œ œ œ̇
Bassoon 4
6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6
6 6 6 6 6 6 6 6 6
6 6 6 6 6
6 6 6
6 6

(b) Késleltetési Analízis


1 Angolul prolongational. A prolongation a Schenker-féle elemzési módszerben az a jelenség, hogy egy
hang, hangköz
Erős vagy akkord egy bizonyos időbeli
W szakaszon képes uralkodó, formáló, vezérlő elvként
működni a zenei anyag számára
késleltetések Gyenge akkor is, ha fizikailag nem szól folyamatosan. Ez az adott hangzás
képzeletbeli/szellemi „meghosszabbítása”,
késleltetések „elnyújtása”, „kiterítése”. – a ford.)

R
R
W R R

# j
œ œ™ œ œ œ œ œ. œ œ j
œ œ™
6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6
6 6 6 6 6 6 6 6 6
6 6 6 6 6
6 6 6
6 6

(b) Késleltetési Analízis Zenei analízis


és zenei percepció
Erős W
késleltetések Gyenge
késleltetések
85
R
R
W R R

# j .
& œ œ œ™ œ œ œ œ œ œ œ œ œ œœ œœ œœ ≈ œœ œ œ œ œ œœ œ œ œœ™ œ
j
C Tpt.
. . œ

œ. œ. œ.
p f p
˙œ
Bsn.
? # œ̇ œ œ œ œ œ œ œ ≈œ œ œ œ œ̇

1. ábra.
Mozart K.V. 311-es zongoraszonátájának második tétele, első nég y ütem:
elemzés Lerdahl és Jackendoff nyomán (1983)
(b) (a) Metrikai elemzés,(d) (d)
csoportszerkezet (b)
és időtáv-analízis (b)
IP ™™ P ID P(VR) (b) Prolongációs
(VR) analízis
IP P Erős prolongációk (strong....) 2 IP ID
# Gyenge prolongációk. (weak....)
& œ œ™ œ œ œ
j
œ œ œ œ œ œ œ œœ œœ œœ ≈ œœ œ œ œ œ œœ œœ œ œj œ™ œ
ì . fölött
.
C Tpt.
ì
A csoportosításbeli struktúra, amelyet kotta kapcsok ì
jeleznek az 1(a) ábrán,ì hasonlóan magá-
ì ì
œ. œP. jól œformáltsági
p f p ì ì „Egy mű egy
˙œ
tól értetődőnek tűnik. Olyan, látszólag közhelyszerű . 4 szabályokon alapul, mint
œ œannakœa kisebb csoportnak
? # œ̇ alkot”,œ„Haœegy csoport œ œegy kisebb csoportot ì œ̇ is minden
ì ì ì
Bsn.
csoportot œ œ œtartalmaz, ≈ œ
részét tartalmaznia kell (ezzel biztosítható a szigorúan egymásba ágyazódó hierarchia). A preferenciasza-
bályok itt olyan
2 kérdésekben
P mutatnak irányt, mintP a csoporthatárok meghatározása (melyeknek hang-
IP
magasságbeli és időbeli területen lévő tagolási pontokon kell előfordulniuk), a csoportstruktúrában az is-
métlődésekre való következtetés feltételei, stb. Így jön létre egy csoporthatár a 2. ütem végén, ill. a 3. ütem
elején, egyrésztIP ™ az első négy 3ütem szimmetrikus
azért, hogy biztosítsa PIP felosztását (e négyütemes csoport

maga részben azért tekinthető csoportnak, IP mert az 1. ütem kezdete megismétlődik az 5. ütemben), más-
œ a G ésœa C közötti œœ œ különbség œ a legnagyobb
& pedig, (œ) hangmagasságbeli œ œœ hangköz, œœ œ amely a darab
(œ) œ
ì Jérdekes
részt mivel
C Tpt.
felső szólamában addigì a pillanatig előfordult. ì Talán az egyetlen J mozzanat
(a) ìa
b a csoportosítás analí-
zisében a 3. ütem harmadik ì nyolcada IP és az ütem ì utolsó3 ì
tizenhatoda
R(VR) között meghúzódóì határvonal, me-
œ̇
lyet a két esemény közötti ì œ̇ időbeliœtávolság hozott ì œ létre œ(megintì csak, a œlegnagyobb ilyen intervallum,
ì
œÓ mely
Bsn.
? # œ œ
a darabban addig a pontig előfordult). Itt a csoportstruktúra œ œ œ
és a metrikai struktúra nem kongruens, így
a feszültség egy olyan pillanata keletkezik
™™ a zenei felszínen, amely csak a következő csoport elején oldó-
IP 3 IR(VR)
dik fel az 5. ütemben.
(hP) ™
™ (h, xs)
(VR) melyet egy fa-struktúraként jelöltünk a kotta felett az 1(a) ábrán, azt a célt szol-
Az időtáv-analízis,
gálja, hogy megjelenítse az események relatív hangsúlyát, fontosságát, a csoportokon belül, ill. azok kö-
zött. A csoportszerkezet egyfajta táptalajként szolgál az időtáv-analízis számára; a jól formáltság pedig
5 ID
(xs) a csoportok és az időtávok közti ™™
azzal uralja ezt a területet, hogy nagyrészt ™ ™ viszonyokat formalizálja. A
b ™™
4 a IP a
preferenciaszabályok azt sugallják, hogy a metrikailag és harmóniailag stabil eseményeket kell kiválaszta-
ni az#időtávok
P
œ
3 5
& œ „fejének” – e œœ
kritériumok alkalmazásának
œ
eredménye az
œ
ábrán látható,œjól érthető struktú-
C Tpt. œ
ra. Ez világosan megmutatja mindegyik csoportban vagy időtávban a legfontosabb esemény metrikai po-
œœ œ œ a 2. és 3. ütemek hangsúlytalan negyedeiig, œœ
? #
zícióbeli eltolódását, az 1. ütem hangsúlyos ütésétől s a 4. ütem
Bsn. .
hangsúlytalan nyolcadáig. .œ œ
. œ .
A3 prolongációs analízisben is evidensnek mondható ™™ egy ehhez hasonló, az 1(b) ábrán látható struk-
P 2
túra, mely
4 a feszültség felépülését, Rmajd oldódását illusztrálja, ahogy egy ™™ tonális darab kibontakozik. A
prolongációs
5 analízis részben az időtáv-analízisből származik, ID de elsősorban a harmóniai viszonyokon
alapszik, melyeket a jól formáltsági és preferencia-szabályok vagy prolongációként (feszültségkeltésként
vagy – fenntartásként), vagy progresszióként (feszültség-elengedésként, oldódásként) határoznak meg. A
prolongációs analízis, mely e zenerészletből keletkezik, úgy tűnik, azokat a tulajdonságokat és struktúrá-
kat hangsúlyozza, amelyeket a részlet schenkeri analízise eredményezne (lásd, például, a Salzer által elvég-
zettet, 1962) – ezzel talán valamennyire meghazudtolva az elmélet „származását”.
86 Lerdahl és Jackendoff elmélete egy kompetencia-elmélet a szó szoros értelmében, azaz egy olyan
elmélet, melynek célja, hogy pontosan megfogalmazza azokat a szabályokat és folyamatokat, amelyek a
tonális zeneművek hallgatóinak élményei mögött meghúzódnak. Mint ilyen, az elmélet több hézagot is
mutat, melyek némelyikét maguk a szerzők is elismerték, míg másokat a munkájuk véleményezői, bírá-
lói azonosítottak, különösképpen Peel és Slawson (1984), Rosner (1984) és Clarke (1986). Azon hézagok
között, melyeket Lerdahl és Jackendoff maguk is azonosítottak és melyekkel később külön írásokban is
foglalkoztak, leírták például az elméletnek azt a hiányosságát, hogy nem ad részletes, formális magyará-
zatot a tonális-harmóniai viszonyokról, valamint, hogy elhanyagolja a zenei élmény időbeliségét. Lerdahl
1988-ban körvonalaz egy, a tonális-harmóniai hangmagasság-viszonyokról szóló elméletet, mely sok kö-
zös vonást tartalmaz a Krumhansl (1990) által előterjesztett harmónia-térrel – ez egyébként Schönberg
„hangnemrégió-táblázataihoz” (1954/1969) kötődik – s továbbfejleszti azt egy, Mozart K. V. 282-es szon-
átájának kezdetét feldolgozó analízis kontextusában (Lerdahl 1996).
Jackendoffot inkább a folyamatos zenei élmény természetének megragadása érdekli. 1987-es tanul-
mányában az időben változó zenei élmény természetét vizsgálja, egy olyan tudat-elmélet kifejlesztésének
kontextusában, amely kitüntetett figyelmet szentel az általa „fonológiai”-nak nevezett szintnek (ez a kog-
nitív reprezentációnak az a szintje, amely közvetlenül kapcsolódik az ingerek „felszínéhez”), úgy, hogy az
csak közvetett kapcsolódásokat tartalmaz a komplexebb struktúrák sematikus reprezentációihoz (mint
pl. tonális-harmóniai viszonyok, szemantikus hálózatok stb.). Jackendoff 1991-es tanulmányában egy pár-
huzamos, többszörös analízises modellt javasol, amely erőteljesen támaszkodik azokra a tudat alatt elér-
hető, párhuzamosan működő, elemző mechanizmusokra, amelyekből tudatos élmény formájában csak-
is a kiválasztott és összesített kimenet (output) érhető el. Jackendoff nem tesz mást, mint hogy felvázolja
ezt a párhuzamos, többszörös analízises modelljét, mely a zene időbeli élményének mindeddig nem tesz-
telt, csupán előzetesnek tekinthető leírását alkotja. Sőt, sem Lerdahl, sem Jackendoff nem törekedett arra,
hogy kiterjesszék elméletüket oly módon, hogy az magyarázatot tudjon adni a valóban kontrapunktikus
zenei textúrák által kiváltott zenei élményekre. Mindezek ellenére, legutóbbi időkig az ő elméletük volt
az egyetlen, a teljesség igényével fellépő próbálkozás, amely megpróbálta a zenei percepcióról alkotott je-
lenlegi felfogásunkat összekapcsolni a zenei analízis világával.

Narmour – kogníció és analízis

Eugene Narmour (1990, 1992) nemrég egy még teljesebb körű elméletet hozott létre, mely azt bo-
csátja előre, hogy magyarázatot kell szolgáltatni a zenei élmény időbeli alakulására, s mindezt úgy valósítja
meg, hogy specifikusan a melodikus vonalak percepciójára összpontosít. Narmour elmélete formálisabb-
nak és explicitebbnek tűnik, mint Lerdahlé és Jackendoffé; s ezzel együtt sokkal határozottabb különb-
ségeket tesz a stílusfüggő faktorok és a „kognitív primitívek” (ősi kognitív funkció-elemek – a ford.) mű-
ködésének analitikai következményei között; elméletének formális természete (ha nem explicitsége)
elsősorban az utóbbi területen érvényesül. Úgy vélekedik ezekről a kognitív primitívekről – melyek célja,
hogy a „velünk született, ‘hardveresen’ huzalozott” kognitív alapelvek (Fodor, 1983 nyomán) működését
tükrözzék, és melyeknek működése nagyban a Gestalt-pszichológia (alaklélektan) törvényszerűségeiből
ered – mint a zenei struktúra meghatározó elemeiről a kogníció során. Elmélete az egyes hangjegyek kö-
zötti viszonyok közeli vizsgálatával kezdődik, melyeket aszerint sorol típusokba, hogy e viszonyok milyen
fokig hasonlóak vagy különbözőek, s így megjósolhatóak vagy váratlanok. Így a struktúrák, melyeket el-
mélete leír, a zenei felszín időbeli kibontakozását hivatottak feltérképezni a zenehallgatás folyamata során.
Narmour sokkal inkább tudatában van annak, hogy a hallgatót nehéz jellemezni, mint ahogy – úgy tűnik
– Lerdahl és Jackendoff; ugyanakkor elmélete ismét csak egy kompetenciaelméletként fogható fel, amely
modulárisan épül fel, hogy legalábbis látszólag képes legyen kimutatni a különböző fokú stílusismerettel
rendelkező hallgatók közti különbségeket. Mindezekkel együtt úgy képzeli el az elméletében szereplő Zenei analízis
kognitív primitíveket, hogy azok az említett stílusismeret teljes hiányában is funkcionálnak. és zenei percepció
Bár lehetetlen, hogy ehelyütt akár csak egy vázlatos áttekintést adjak Narmour komplex elméleté-
ről, megpróbálok legalább egy ízelítőt adni belőle. Nagy vonalakban azt mondhatjuk, hogy a közvetlen
egymás utáni hangközökből álló hangköz-párok két kategóriába sorolhatók: vagy a folyamatot reprezen- 87
tálják (amennyiben hasonlóak), vagy az irányváltást (amennyiben különbözőek); a kis hangközök inkább
a folytonosság, az előrehaladás érzetét ketik, a nagyok pedig inkább az irányváltásét, a különbözőségét. A
hasonlóság vagy különbség egyaránt megtalálható a hangköz nagyságának, valamint a hangközlépés irá-
nyának (emelkedő vagy ereszkedő) a területén. A hasonlóság vagy különbség kérdései kvantitatív szabá-
lyok alkalmazásával dőlnek el (ezek Narmour „szintaktikai skálái”). Például, különbözőnek ítél két egy-
mást követő hangközt, ha azok között egy nagy terc a különbség, vagy annál is nagyobb, bár a Narmour
által alkalmazott különbség definíciója érzékeny a kontextusra (például, ha két, egymást követő hangköz
esetén megfordul a hangközlépési irány, akkor már egy kis tercnyi – vagy annál nagyobb – különbség ese-
tén is különbözőnek minősülnek).
Ezek az alapvető szabályok lehetővé teszik, hogy kategorizáljuk az egymást követő hangok által alko-
tott csoportokat, így például egy fölfelé tartó, C-D-E-F menet folyamatot alkot (F betűvel jelöljük), egy föl-
le irányváltást tévő, egy nagy után egy kis hangközlépést tartalmazó C-G-F dallamrészlet irányváltást (V
betűvel jelöljük), egy C’-E’-C’ figuráció pedig egy hangköz-duplikációt (HD) alkot stb. A kategorizálás bo-
nyolultabb fajtái is megjelennek, amikor a kezdeti hangközlépés által hordozott érzet a következő hangköz-
lépésben az ellenkezőjére fordul: egy fölfelé, majd lefelé tartó dallamrészlet, mint pl. a C’-D’-H, egy hang-
köz-folyamatot (HF) alkot, míg egy B-Fisz’-G föl-le tartó figuráció visszafordulást a hangközlépésben stb.
Az egymást követő hangközökből álló struktúrák csoportosításakor ritmikai, metrikai, harmóni-
ai és stilisztikai tényezőket is figyelembe lehet venni, hogy elnyomják vag y a „nem-bezáródó” (implikatív),
vag y a „bezáródó” (nem-implikatív) tulajdonságokat, melyekkel ezek a mintázatok rendelkezhetnek, s így
olyan mintázatok alakulnak ki, amelyek a zenei felszínen kombinálódnak, láncba kapcsolódnak az őket
megelőző vagy az őket követő mintázatokkal, vagy éppen elválasztódnak tőlük. A különálló, vagy egy-
mással kombinált mintázatoknak a záró elemeiről Narmour úgy véli, hogy azok a hierarchia magasabb
szintjén működnek, s így lehetővé teszik, hogy Narmour elmélete nem szomszédos hangjegyek közötti
viszonyokat is ábrázoljon, s hogy ezen az alapon a zene folyamatosságának egy többszintű reprezentáció-
ját konstruálja meg. Megjegyzendő, hogy a mintázatot nem mindig jelzi előre Narmour elmélete; előfor-
dulhat, hogy helyenként kétértelmű a kontextus, ezért egy adott mintázat csak visszatekintve határozha-
tó meg (az ilyen retrospektív mintázatokat Narmour az analitikai jelölési rendszerében úgy jelzi, hogy a
szimbólumokat zárójelek közé teszi).
Mindezeket szem előtt tartva, térjünk most rá Narmour (a jelen cikk számára kis mértékben módo-
sított) analízisére, mely a K.V. 311-es szonáta második tételének első négy üteméről készült! A betűk (HF,
F, stb.) a csoportokat jelző zárójelek között a szóban forgó mintázatokat jelzik, míg a (b) és (d) zárójeles je-
lölések a felső kottasor fölött a metrum és az időtartam befolyását jelölik. Első látásra a legszembetűnőbb
talán a különböző szólamokról készített különálló, független analízisek megléte lehet, és az, hogy a skála-
beli (szekund-) lépés nem kap kitüntetett státuszt az analízisben (változó stilisztikai tényezőnek tekinti). A
három egymás alatti kottasor megmutatja, hogy fokozatosan miként „transzformálódnak” a hangmagas-
ságok egyre magasabb hierarchiai szintekre – s itt megjegyzendő, hogy ennek lépései nem eredményeznek
egy olyan szépen építkező hierarchiát, amilyet Lerdahl és Jackendoff elmélete nyújt. Mondhatjuk, ez abból
fakad, hogy Narmour egy területre szorítkozó analízise egyesíti azoknak a faktoroknak a működését, ame-
lyek Lerdahl és Jackendoff elméletében több, egymástól független területen funkcionálnának.
A két elemzés egymáshoz képest abban mutat jelentős eltérést, hogy a második ütem utolsó ütésé-
nél Narmour nem szerepeltet semmilyen eseményt a legmagasabb hierarchiai szinten. A H és G dallam-
béli tizenhatodok – mindkettő lehetséges jelölt –a „hangköz-duplikáció – folyamat – retrospektív regisztrá-
lis visszafordulás” lánc részeivé válnak, így egyikük sem töltheti be a mintázatban a végponti elem szerepét,
ezért a legalacsonyabb szinten maradnak a hierarchiában. Narmour eredeti elemzéséhez csak egy apró
részletet tettem hozzá: zárójelben odaírtam az „fm” betűket a második ütem H tizenhatodja fölé, hogy
W

# j .
& œ œ œ™ œ œ œ œ œ œ œ œ œ œœ œœ œœ ≈ œœ œ œ œ œ œœ œ œ œœ™ œ
j
C Tpt.
. . œ

œ. œ. œ.
p f p
˙œ œ
valamiœ̇ œ œ
? # olyasmit jelöljek, œ œ
amit Narmour œ œ ≈viszontœamelyœ nincsœjelen az œ̇ő jelen zenerész-
elméleteœmegenged,
Bsn.
letről szóló saját elemzésében – nevezetesen annak a lehetőségét, hogy egy hang „formációsan” viselked-
het, szemben a „transzformációs” viselkedéssel, vagyis, kilátásba helyezhet, kivetíthet egy transzformációt
egy magasabb hierarchiai szintre, de valójában nem éri el azt.
(b) (d) (d) (b) (b)
88
IP ™™ P ID P(VR) (VR)
IP P 2 IP ID
# j .
& œ œ œ™ œ œ œ œ œ œ œ œ œ œœ œœ œœ ≈ œœ œ œ œ œ œœ œœ œ œj œ™ œ
ì . .
C Tpt.
ì ì ì
ì ìf P
œ. œ. œ.
p p ì ì
˙
4
? # œ̇ œ œ
ì œ œ œ
ì
œ œ œ ≈ œ ì œ œ œ ì œ̇
Bsn.

2 P IP P

IP ™ 3 PIP

#
IP
œ œœ œ œ œ
& œ œ œ œ œ œœ œœ œ
ìJ J
C Tpt. ( )
( )
ì ì (a) b ì a
ì IP ì 3 ì
R(VR) ì
ì œ̇ ìœ œ ì ì
Bsn.
? # œ̇ œ œ œ œ œ œ œ œÓ

IP ™™™ 3 IR(VR)
(hP) ™™ (h, xs)
(VR)

5 ID ™™
(xs)
™ ™
b ™™
4 a IP a
#
P
œ
3 5
C Tpt. & œ œœ œ œœ œ
œœ œ œ œ
Bsn.
?# . .œ .œ œ .œ
3 P ™™ 2
4 R ™ ™™
5 ID
2. ábra.
Mozart K.V. 311-es zongoraszonátájának második tétele, első nég y ütem:
elemzés Narmour nyomán (1990, 1992)
ã 1992, The University of Chicago. Újraközölve a következőből: Eugene Narmour 10.5-ös példája, The Analysis and
Cognition of Melodic Complexity (1992), a University of Chicago Press engedélyével

Narmour elemzése így e részletet nem egy tonikáról a dominánsra tartó folyamatként értelmezi
(ahogy Salzeré (1962) teszi), hanem egy I–IV–V struktúraként. Ahogy állítja: „Salzer elemzése (melyet
Narmour archetipikusan schenkerinek tart) olyannak mutatja e részletet, mint a tonalitás egyik újabb
példáját és megerősítését, ezzel szemben az implikációs-realizációs modell egy olyan példaként ábrázol-
ja, melyben a tonika prolongációjának melódiai, metrikai és hosszúságbeli meggyengülése történik. (Na-
rmour 1992, 221. oldal). Narmour elemzésének végső szintje tulajdonképpen nem is különbözik annyira
a Lerdahl és Jackendoff-féle elmélet alkalmazásával létrejövő prolongációs struktúrától (azzal a kivétellel,
hogy az ő elméletük egy gyenge tonikai prolongációt feltételez a második ütemben).
Naiv pszichológia „vs.” tudományos pszichológia
Zenei analízis
Most, hogy röviden áttekintettük e két elmélet működését, könnyebben meg tudjuk ítélni, hogy és zenei percepció
hozott-e bármilyen hasznot az, hogy a zeneanalízis „naiv pszichológiáját” látszólagosan felcseréltük a per-
cepció specifikus és tudományos magyarázataival. Analitikai szemszögből nézve az eredmény vitatható.
Mindkét elmélet explicit módon nyilatkozik az analitikai döntéseik alapjairól, és számot tud adni a struk- 89
túra olyan aspektusairól, melyek nem tűnnek olyan koherens módon kifejthetőnek a „konvencionálisabb”
megközelítések keretei között. Ezzel szemben viszont, mindkét elmélet nyersnek tűnhet a tonális-harmó-
niai viszonyokkal vagy a zenei textúra komplexitásaival kapcsolatos magyarázataikban, részben épp emi-
att az explicitség miatt; még Lerdahl saját fejlesztésű, tonális-harmóniai viszonyokról szóló, kifinomult
és formális elmélete is kritizálható azon az alapon, hogy a harmóniákról szóló „ahistorikus” magyaráza-
ta alkalmatlanná teszi az érzékeny analitikai felhasználásra (ezt a kritikát Cook (1987b) fogalmazta meg
egy nagyon hasonló modellel szemben, melyet Krumhansl javasolt). Sőt, az analízisnek ez a megközelíté-
se, melyre ezek az elméletek példát szolgáltatnak, valószínűleg teljes egészében elfogadhatatlannak tűnik
sok elemző számára. Ahogy Cumming (1992) javasolja Narmour második könyvéről szóló beszámoló-
jában, úgy tűnik, a kognitív alapú megközelítések a „hallgató én”-t a „kogníciót végző agyra” cserélik ki,
majdnem hogy „kizárva” az elemzőt, mint cselekvőt, az elemzés folyamatából. Bár – különösképp – Nar-
mour világosan kimondja, hogy teret kell hagyni az analitikai ítéletalkotás gyakorlatának, mégis úgy tűn-
het, hogy a kognitív alapú elméletek valami olyasmit kínálnak, mint amit Nagel (1986) úgy hív: „kilátás a
semmiből”.
Az analitika szemszögéből nézve az e két teória sikeréről hozható ítélet legjobb esetben is ennek tű-
nik: „nem bizonyított”. Talán ez a szemszög nem a legmegfelelőbb arra, hogy megítéljük ezen elméletek
erényeit, vagy bármi mást velük kapcsolatban; helytállóbb lehet inkább úgy tekinteni rájuk, mint a kogni-
tív tudomány zenére való alkalmazásának példáira, és nem mint „elsősorban és mindenekelőtt” alkalma-
zandó analitikai módszerekre. E két elmélet eredményei azonban még innen nézve is vitathatóak azáltal,
hogy amire alapulnak, nem “igazságtevő” magyarázatai a zenehallgatás élményének, hanem többé-kevés-
bé formális elméletek ezekről az élményekről, s ezek az elméletek maguk is a percepció természetéről al-
kotott, támadható nézeteken alapulnak, melyeket kísérletileg igazolni kell (ahogy Clarke (1989) javasolta
Lardahl és Jackendoff-al kapcsolatban). A kognitív tudomány szemszögéből nézve, talán ezeknek az el-
méleteknek explicitségük a legjobb tulajdonságuk. Amit nyújtanak, azok nem annyira teljesen kidolgo-
zott rendszerek, melyek a percepció pontos magyarázatával elősegítenék az analízis folyamatait, hanem
inkább kérdések rendezett együttesei – meglehetősen egyértelműen megfogalmazott hipotézisek a zenei
percepció elemeiről, s arról, hogy ezek miképp gyakorolhatnak hatást az analízis folyamataira – amelyek
nyitottak a kísérleti vizsgálatokra, s talán, cáfolatra. Valójában Narmour elméletét Schellenberg (1996) kí-
sérleti úton kiterjedten tesztelte, s azt találta, hogy Narmour elméletének egy egyszerűsített változata job-
ban illeszkedik az eredményeihez.
Míg a kognitív tudomány ítélete pozitívabb, úgy tűnik, adós marad a végső döntéssel. Az ennek
okaira utaló nyomok mindkét elmélet bizonyos aspektusaiban fellelhetők; ezek – bár nem szembeszökő-
en magától értetődőek az általuk előterjesztett elemzésekben –, erősen befolyásolják az elemzések jel-
legét. Narmour elmélete szigorúan megkülönbözteti a zenehallgatási folyamat azon aspektusait, ame-
lyeket „elkerülhetetlen”, biológiailag „hardveresen huzalozott”, veleszületett perceptuális folyamatok
irányítanak, illetve azokat az aspektusokat, amelyek kulturális tényezőktől – bizonyos stílusok ismereté-
től, vagy egyszerűen csak hatásától – függnek. E megkülönböztetés alapja egyfajta „biológiai determiniz-
musnak” tűnhet, aminek következtében a percepció „tényei” a neurofiziológiai tényekkel magyarázhatók,
illetve azokra korátozódnak. Ebben az olvasatban csak a biológiailag huzalozott, veleszületett perceptuá-
lis folyamatok lehetnek alkalmasak a tudományos kutatás számára, lévén az ismeretszerzésnek ez a fajtá-
ja képtelen a percepció kulturálisan meghatározott jellemzőinek magyarázatára. Bár ugyanez a biológiai
determinizmus nincs ilyen egyértelműen jelen Lerdahl és Jackendoff elméletében, elméletük sok helyen
törekszik egy bizonyos fokú általánosságra – például, amikor előre bocsátják, hogy a jól formáltsági és pre-
ferencia-szabályaik többsége univerzálisan alkalmazható –, amit nehéz összeegyeztetni a tudományos-
ság alapeszméjével – különösen a kognitív tudományéval – ha figyelembe vesszük, hogy azok kultúrától
függő szabályok (lásd még: Clarke, 1986). Mindkét állásfoglalás hadilábon áll azzal a fentiekben felvázolt
érvrendszerrel, hogy a tudomány valamennyire meg tudja magyarázni a hermeneutikai tevékenységeket,
azaz annak gondolatával, hogy a tudomány maga is egy „külön része” annak a történelmi hagyománynak,
amely a kultúrából ered és bontakozik ki.
Ez az ellentmondás azzal oldható fel, hogy megszabadulunk a biológiai determinizmustól és az uni-
90 verzális alkalmazhatóság követelményétől annak a gondolatnak a jegyében, hogy a kogníció működé-
sét és szerkezetét legalább akkora mértékben a kultúra határozza meg, mint a biológia, valamint, hogy
elfogadjuk azt az alapvetést, hogy a kognitív-tudományos elméletek általánosíthatóságát pontosan meg
kell határozni. Míg sok szerző próbálkozott azzal, hogy az elme működéséről a neurobiológia keretei kö-
zött adjon magyarázatot – vagy még inkább a neurális struktúrák és funkciók számítástudományi elmé-
leteinek keretei között (lásd, például, Churchland, 1986) – néhány újabb elmélet azt javasolja, hogy bár a
biológia nyilvánvaló kötöttségeket jelent, a kogníció természetének elsődleges meghatározója a kultúra.
Bruner (1990, 20. oldal) azt állítja, hogy „a biológiai szubsztrátum (…) nem az oka a cselekvésnek, hanem
legfeljebb korlátozója, vagy feltétele”, s folytatásképp ezt javasolja:
A kultúra, és nem a biológia az, amely formálja az emberi életet és az emberi elmét; amely értel-
met ad a cselekvésnek azáltal, hog y annak háttérben meghúzódó szándékait értelmezési keretek
közé helyezi. A kultúra mindezt úg y éri el, hog y a szimbólum-rendszereinek belső mintázatait
kivetíti – a nyelvi és társalgási formáit, a logikai és narratív mag yarázatalkotási formákat, és az
emberek eg ymástól való függésének mintázatait a közösségi életben . (Bruner, 1990, 34. oldal)
A zene és a zenei percepció területén a kulturális erők meghatározó szerepét az elvégzett néhány
kultúraközi kutatás igazolja (például, Castellano, Bharucha és Krumhansl 1984; Arom 1991; Stobart és
Cross 1994). Ezek azt jelzik, hogy a zene és a zenei élmény természetét egy adott kultúrán belül nagy va-
lószínűséggel elsősorban az adott kultúra dinamikájára specifikusan jellemző tényezők határozzák meg,
miközben általános kognitív alapelvek korlátozó hatása alatt marad.
Így az az „uniformitariánus” (vagyis egységesség-párti) elv, amely lehetővé tenné a zenei percepció
univerzálisan alkalmazható elméleteinek a feltételezését, magabiztossággal nem tartható, miközben az
uniformitarianizmusnak ez az előfeltevése – miszerint a múltbéli események csak a jelenben ható és meg-
figyelhető okok, „mozgatórugók” fényében magyarázhatók – alkotja a tudomány egyik legalapvetőbb ta-
nát, azt, mely talán az összes közül a legtöbb magyarázóképességet nyújtja. És Brunernek még ha csak fé-
lig is igaza van, és a tudat elsősorban a kultúra mátrixában formálódik, akkor a biológiai determinizmus
sem lesz elégséges ahhoz, hogy általánosítható és örökérvényű elméleteket szolgáltasson számunkra a ze-
nei percepcióról.
Így az a kérdés, hogy a zenei percepció tudományos magyarázata a zenei percepcióról szóló analiti-
kus naiv pszichológia helyébe léphet-e, továbbra is megoldatlan marad, bár most már nyitva áll a vita szá-
mára. Talán helytállóbb, ha azt vizsgáljuk, hogy vajon szükséges-e egyáltalán, hogy a zenei percepció tudo-
mányos magyarázata a naiv pszichológiai magyarázat helyébe lépjen. Ha a kérdést ilyen módon tesszük fel,
akkor úgy tűnik, a válasz az, hogy nem szükséges; mivelhogy nincs meggyőző ok arra, hogy a tudomány ne
játsszon szerepet a hermeneutikai tevékenységek megvilágításában. Úgy látszik, nincs meggyőző okunk
arra sem, hogy elvárjuk, hogy a kognitív tudományos leírások – ahogy mai formájukban értelmezzük őket
– leváltsák az analitikus vagy hermeneutikai leírásokat. Járhatóbbnak tűnik, ha azt várjuk el, hogy a kogni-
tív zenetudomány inkább próbálja meg megmag yarázni a zenei percepció analitikus „naiv pszichológiáját”
ahelyett, hogy leváltani igyekezne azt.
Végül is, a zeneelemzők „naiv pszichológiája” pontosan tükrözheti az ő saját percepcióikat és intuí-
cióikat; vagy pedig a használata egyszerűen a legmegfelelőbb stratégia lehet az elemző számára, hogy em-
patikusan nézzen szembe az analízis tárgyával, vagy akár magával az analízis tevékenységével. Lehetséges,
hogy a zenei percepció „naiv pszichológiája” ugyanabba a kategóriába tartozik, mint a többi interpretációs
eszköz, melyet az elemző használ ahhoz, hogy kapcsolatba lépjen a zenével. Ez persze nem jelenti azt, hogy
ennek teljes eszköztára fiktív lenne, hanem egyszerűen azt, hogy hatékonyságuk nem feltétlenül ítélhető
meg ugyanazon kritériumok alapján, mint amelyek egy tudományos módszer helytállóságának megíté-
lésénél lennének használatosak; a tudomány kultúrán belül elfoglalt helye ellenére, a tudomány általános
okokra és általánosítható eljárásokra irányuló fókusza azt a célt szolgálja, hogy a reprodukálhatóságnak és
az előrejelzési képességnek egy olyan szintjét nyújtsa, amely megkülönbözteti eljárásait az egyedi elemzé- Zenei analízis
si tevékenységtől. és zenei percepció
Az előbbiekből semmit nem úgy értettem, hogy az a kognitív tudomány – bármilyen szempont-
ból is értett – hatékonysága ellen szólna a zenei percepcióval kapcsolatban. Sőt, úgy tűnik, a zenei per-
cepciónak vannak olyan aspektusai, amelyeket semmilyen más módszer nem tud megragadni, csak a 91
kognitív-tudományos módszer és elmélet. Különösen azoknak a zenehallgatóknak percepcióját kell fel-
térképezni, akik esetében az analitikusok „naiv pszichológiai” percepciós magyarázatai használhatat-
lannak bizonyulnak – tehát akik zeneileg képzetlenek –, és úgy tűnik, a kognitív tudomány módszerei
nyújtják a legmegfelelőbb kutatási módszereket, melyek arra irányulnak, hogy pontosan meghatározzák
azokat a tényezőket, amelyek közvetítő szerepet töltenek be a tapasztalataink, illetve a cselekvési, társalgá-
si és interakciós kereteink között, amelyekben ezeknek a tapasztalatainknak jelentést tulajdonítunk. Sőt,
a kognitív tudománynak az a képessége, hogy kifejezze az ösztönös megérzés által megragadhatatlant, azt
jelenti, hogy valószínűleg van valamilyen magyarázatalkotó képessége, még akár a zenetudósok percepci-
óira nézve is, mert ha megfelelően alkalmazzuk a kognitív-tudományos módszert, képes lehet a percepci-
ós folyamat olyan területeinek a felfedésére is, amelyeket tudatos introspekcióval nem vizsgálhatunk meg.
A kognitív zenetudománynak tehát nem azt kell célul kitűznie, hogy felváltsa a naiv pszichológiá-
kat, melyek használhatók lehetnek az analitikus értelmezések kifejtésére irányuló törekvésekben. Ha en-
nek van bármilyen értéke is a zene megértésében, akkor az az, hogy képes áthidalni a szakadékot aközött,
hogy milyen érzés a zene hallgatása – megtapasztalásának “mintázatai” – és a nyelv között, amelyet a zene
leírására és tanítására használunk. Pontosabban, a kognitív tudomány zenére való alkalmazásának segíte-
nie kell áthidalni azt a hézagot, amely egyrészt a hallgatók és a gyakorló zenészek zenével kapcsolatos ta-
pasztalatai, másrészt a diskurzus azon racionális keretrendszerei között húzódik, amelyeket a zene és a ze-
nei élmény leírására és definíciójára hagyományosan használnak. „Kutatási programjának” (lásd: Lakatos,
1970) azon az úton kell járnia, hogy megpróbál a zenei élményről olyan magyarázatot nyújtani, amely ös�-
szecseng megtestesülésének korlátaival és jellegzetességeivel, a számítógépes logika elméleteivel, (lásd:
Johnson-Laird 1983), illetve a zenei percepcióról, előadásról és alkotásról gyűjtött kísérleti bizonyítékok-
kal. Ugyanakkor a gyakorlatának annak a kulturális közegnek az elmélyült ismeretéből kell táplálkoznia,
amelyben alkalmazzák, illetve azokból a jelentéstartalmakból, amelyeket a kutatási anyagai, módszerei és
adatai közvetíthetnek.

Következtetések

E cikkben a zenei percepció zenei analízisbeli „naiv pszichológiájának” létezését feltételeztem. Java-
soltam, hogy az effajta „naiv pszichológiát” váltsa fel a tudományos pszichológia, a percepció kognitív-tu-
dományos magyarázata. Áttekintettem a két, nemrég keletkezett zenei analízis-elméletet, amelyek, úgy
tűnik, éppen ezt a célt tűzik ki. Arra a következtetésre jutottam, hogy egyik rendszer sem tudja teljes mér-
tékben felváltani a zenepercepció analitikai naiv pszichológiáját egy tudományosan megalapozott elmé-
lettel és felvetettem, hogy egy ilyen törekvés félreértés áldozatává válhat – mivel a kognitív zenetudomány
egyik feladata nem az, hogy leváltsa a zenei percepció naiv pszichológiai leírásait, hanem az, hogy megma-
g yarázza azokat.
Következésképp azt kell mondanunk, úgy tűnik, hogy az adott elemzőn múlik, hogy naiv pszicho-
lógiai elméletet, vagy kognitív-tudományos elméletet alkalmaz-e vizsgálatai során. Az egyetlen következ-
tetés, mely egyértelműnek tűnik az e cikkben tárgyaltak alapján az, hogy az elemzőnek tudatában kell len-
nie, épp melyik fajta elméletet alkalmazza. Mivelhogy a naiv pszichológiák nem örökérvényűek, (még ha a
kognitív tudomány nem is feltétlen törekszik a leváltásukra,) változáson mehetnek keresztül, s a kognitív
tudomány bizonyos elemei beszivároghatnak a jövőbeli naiv pszichológiáinkba.
Attól tartok, ezek a “következtetés nélküli következtetések” nagyon könnyen felmenthetnek ben-
nünket a válaszadás kötelezettsége alól, és visszautalják a jelen oldalakon fölvetett problémák megválaszo-
lásának terhét a zenei elemzőkre. Tudományos szemszögből nézve azonban ez teljesen elfogadható ered-
ménynek tűnik; elvégre, ahogy az egyik tudós megfogalmazta (idézi: Feyerabend, 1981, 83. oldal):
Azok a külső feltételek, amelyek (a tudós számára) adottak (...) nem teszik lehetővé számára, hog y
92 engedje magát túlságosan korlátok közé szorítani saját fogalmi világának fölépítésében, azzal,
hog y eg y episztemológiai (ismeretelméleti) rendszerhez ragaszkodik. Ezért eg y szisztematikus
episztemológus szemében olyannak kell tűnnie, mint eg yfajta gátlástalan opportunistának...
Ez a tudós Albert Einstein volt.
Hivatkozások
Zenei analízis
• Arom, S., 1991: African Polyphony and Polyrhythm (Cambridge: Cambridge University Press). és zenei percepció
• Bent, I., 1980: ‘Analysis’, in S. Sadie (ed.), The New Grove Dictionary of Music and Musicians (Lon-
don: Macmillan), vol. l, pp.340-88.
• Bigand, E., 1993: ‘The Influence of Implicit Harmony, Rhythm, and Musical Training on the Ab- 93
straction of “Tension-Relaxation” Schemas in a Tonal Phrase’, Contemporary Music Review,
9, pp. 128-39.
• Brown, H. I., 1977: Perception, Theory and Commitment (Chicago: University of Chicago Press).
• Bruner, J.,1990: Acts of Meaning (London: Harvard University Press).
• Castellano, M. A., Bharucha, J. J. and Krumhansl, C. L.,1984: ‘Tonal Hierarchies in the Music of
North India’ ,Journal of Experimental Psycholog y: General,113, pp.394-412.
• Churchland, Paul M., 1984: Matter and Consciousness: A Contemporary Introduction to the Philo-
sophy of Mind (Cambridge, MA: MIT Press).
• Churchland, Patricia Smith, 1986: Neurophilosophy: Toward a Unified Science of the Mind-Brain
(Cambridge, MA: MIT Press).
• Clarke, E. F., 1986: ‘Theory, Analysis and the Psychology of Music: A Critical Evaluation of Ler-
dahl, F. and Jackendoff, R., A Generative Theory of Tonal Music’, Psycholog y of Music, 14 /i,
pp.3-17.
1989: ‘Mind the Gap: Formal Structures and Psychological Processes in Music’, Contempo-
rary Music Review, 3/i, pp. l-14.
• Cook, N., 1987a: A Guide to Music Analysis (London: Dent).
• 1987b: Review of vols. 1-2 of Diana Deutsch (ed.), Music Perception, in Music Analysis, 6, pp. l69-79.
1994: ‘Perception: A Perspective from Music Theory’, in R. Aiello with J. Sloboda (eds.),
Musical Perceptions (Oxford: Oxford University Press).
• Cumming, N., 1992: ‘Eugene Narmour’s Theory of Melody’, Music Analysis, 11/ ii-iii, pp. 354-74.
• Deliege, I., Melen, M., Stammers, D. and Cross, I., 1996: ‘Musical Schemata in Real Time Liste-
ning to a Piece of Music’, Music Perception, 14/ii, pp. l l 7-60.
• Erickson, R., 1982: ‘New Music and Psychology’, in D. Deutsch (ed.), The Psycholog y of Music
(London: Academic Press).
• Feyerabend, P., 1981: Problems of Empiricism, vol. 2 (Cambridge: Cambridge University Press).
• Fodor, J., 1983: The Modularity of Mind (Cambridge,M A: MIT Press).
• Greenwood, J. D., 1991: The Future of Folk Psycholog y (Cambridge: Cambridge University Press).
• Hyde, M., 1993: ‘Dodecaphony: Schoenberg’, in J. Dunsby (ed.), Models of Musical Analysis: Early
Twentieth-Century Music (Oxford: Blackwell).
• Johnson-Laird, P. N., 1983: Mental Models (Cambridge: Cambridge University Press).
• Kerman, J., 1985: Musicolog y ( London: Fontana).
• Lakatos, I., 1970: ‘Falsification and the Methodology of Scientific Research Programmes’, in I. La-
katos and A. Musgrave (eds.), Criticism and the Growth of Knowledge (Cambridge: Camb-
ridge University P ress).
• Lerdahl, F. and Jackendoff, R., 1983: A Generative Theory of Tonal Music (Cambridge, MA: MIT
Press).
• Nagel,T., 1986: The View from Nowhere (Oxford: Oxford University Press).
• Narmour, E., 1990: The Analysis and Cognition of Basic Melodic Structures: The Implication-Reali-
zation Model (Chicago: University of Chicago Press).
1992: The Analysis and Cognition of Melodic Complexity: The Implication-Realization Model
(Chicago: University of Chicago Press).
• Oura,Y. and Hatano, G., 1988: ‘Memory for Melodies among Subjects Differing in Age and Ex-
perience in Music’, Psycholog y of Music, 16 /ii, pp. 91-109.
• Peel,J. and Slawson, W., 1984: Review of F. Lerdahl and R. Jackendoff, A Generative Theory of To-
nal Music, in gournal of Music Theory, 28/ii, pp. 271-94.
• Rosner, B., 1984: Review of F. Lerdahl and R. Jackendoff, A Generative Theory of Tonal Music, in
Music Perception, 21ii,p p. 275-90.
• Salzer, F., 1962: Structural Hearing (New York: Dover).
• Schellenberg, E. G., 1996: ‘Expectancy in Melody: Tests of the Implication-Realization Model’,
Cognition, 58, pp. 75-125.
94 • Schoenberg, A., 1954/1969: Structural Functions of Harmony (London: Ernest Benn)
• Sloboda, J. A. and Parker, D. H. H., 1985: ‘Immediate Recall of Melodies’, in P. Howell, I. Cross
and R. West (eds.), Musical Structure and Cognition (London: Academic Press).
• Smith, C. R., 1981: ‘Prolongations and Progressions as Musical Syntax’, in R. Browne (ed.), Music
Theory: Special Topics (London: Academic Press).
• Stich, S. P., 1983: From Folk Psycholog y to Cognitive Science: The Case Against Belief (Cambridge,
MA: MIT Press).
• Stobart, H. and Cross, I., 1994: ‘Aspects of Rhythmic Structure and Perceptionin the Music of
Northern Potosi, Bolivia’, in Proceedings of the 3rd ICMPC, Liege, Belgium.
• Tomlinson, G., 1984: ‘The Web of Culture’, 19th-Century Music, 8, pp. 350-62
• Treitler, L., 1980: ‘History, Criticism, and Beethoven’s Ninth Symphony’, 19th- Century Music, 3,
pp. 193-210.
Peter Johnson
Fordította:
dr. Holics László

Illúzió és aura a klasszikus 95

hangfelvételen
Bár a technika segítségével rendkívül hatékonyan tudjuk a zenei hangokat alakítani – miképp ezt Illúzió és aura a klasszikus
George Martin is oly hatékonyan kihasználta úttörő jelentőségű Beatles-felvételein – a „klasszikus” felvé- hangfelvételen
telkészítés hagyományosan arra használja a technológiát, hogy az élő előadás torzítás nélküli rögzítésének 2003
az illúzióját keltse. (1) Ehhez az szükségeltetik, hogy a rögzítés folyamatai átláthatónak tűnjenek a hallga-
tó számára, még akkor is, ha épp ezek teszik lehetővé az illúzió létrejöttét. A tájékozott hallgatót ez nem
téveszti meg; ehelyett azonban kis időre félre kell tennie kétkedését, ugyanúgy, mint amikor élvezni sze- 97
retnénk egy filmet vagy egy regényt. (2)
A klasszikus felvétel illúziókeltő természetét jól illusztrálja az, hogy a végleges anyagot több felvé-
telből állítják össze, amelyeket azután észrevehetetlenül illesztenek egymáshoz, s így egy egybefüggő élő
előadás látszatát keltik. Ha bármilyen módon hallható, hogy a felvételt így állították össze, akkor a termék
hibás kivitelezésűnek számít. A klasszikus zenei felvétel esztétikai alapelvei tehát nagyon különböznek a
film- vagy könnyűzenei felvételekétől, és éppen ez az, amivel Walter Benjamin adós maradt rendkívül be-
folyásos tanulmányában, „A művészeti alkotás a mechanikai reprodukció korszakában” (The Work of Art
in the Age of Mechanical Reproduction) címmel. (3) Benjamin üdvözli a film, fotográfia és hangfelvétel
akkoriban új művészeti formáit, mert azok kihasználják a technika erejét, hogy megkerüljék a naturaliz-
must, vagy pedig – ahogy ő nevezte – az „aurát”; ez a hagyományos művészeti alkotásnak az az illuzórikus
tulajdonsága, mely által látszólag azonnali, közvetlen élményt kínál a nézőjének, olvasójának vagy hallga-
tójának. A hangfelvétel technológiáját ugyanakkor következetesen arra fejlesztették ki, hogy ne rombolja
le az előadott zene auráját, hanem épp ellenkezőleg: ápolja azt, s olyan élményt nyújtson a hallgató számá-
ra, amely legalább ekvivalens az élő koncertével.
Ez a fejezet három részből áll. Az elsőben áttekintem a klasszikus zenei hangfelvétellel szemben fel-
hozott főbb kifogásokat, szót ejtve arról, hogy milyen mértékben keverik össze az illúziót a megtévesztés-
sel („csalással”) ezekben az etikai alapú fejtegetésekben. A másodikban párhuzamokat vonok a felvétel és
a hagyományos műalkotás között – nem amelletti érvként, hogy a felvételeket ugyanolyan kulturális stá-
tusszal kellene felruházni, mint a műalkotásokat, hanem, hogy megvilágítsam a klasszikus felvételgyár-
tásnak az alapvetően esztétikai természetű ideáljait. Végül, közelebbről is megvizsgálom Benjamin érve-
it: definícióját és okfejtését az auráról, egy olyan fogalomról, mely elméleti és kísérletileg is elfogadható
megalapozást nyújt a művészi illúzió alapelvei számára; Benjamin kritikáját, melyben az auratikus művé-
szetet lényegében véve anakronisztikusnak nevezi, s képtelennek a művészet kortárs funkciójának, a társa-
dalomkritikai feladatnak az ellátására; s végül a széles körben idézett megjegyzését, miszerint az aura „el-
sorvad a mechanikai reprodukció korszakában”, melyet helytelenül alkalmaz közvetlenül a hangfelvételre.
Egy Benjaminnal szembeni kritika más kérdéseket is feszeget, melyeket ebben a fejezetben nem tudunk
megfelelően feldolgozni, viszont érdemes említést tenni róluk: ha a technika elősegítheti az aurát, akkor ezek-
ben a modern időkben miért tudott az „auratikus” hangfelvétel médiuma nem csak túlélni, hanem egyenesen
virágozni, mint a zenei produkció médiuma? – és ha Benjaminnak nincs igaza az auratikus művészet bukásával
kapcsolatban, akkor mi lehet a funkciója egy ilyen művészetnek a mi kortárs, médiaközpontú, posztmodern vi-
lágunkban? Szolgálhatja-e épp azt a kritikai funkciót, melyet Benjamin a modern gyártási folyamatoktól remélt?

I.

A felvétel vagy élő előadás?


Egy szélsőséges vélekedés szerint egy előadásnak még a vágatlan felvétele is hamis, hiszen semmi-
lyen felvétel nem tudja hitelesen megragadni a pontos hangképet. (4) Ez csak az egyik érv, amelyet arra
használnak, hogy a hangfelvételnek rossz hírét keltsék, s hogy elriasszák az embereket tőle, és léteznek
még más érvek is: hogy a hangfelvétel a felületes zenehallgatást segíti elő; hogy az élő előadás vizuális és
egyéb tényezői a muzsikálás szervesen hozzátartozó részei; hogy az előadó és a hallgató közötti visszajel-
zés az élő előadás lényegi része, amely elvész a hangfelvétel esetében; s hogy a felvétel az élő‑ség elveszését
képviseli: elveszítjük azt a bizonyos tudást, hogy tudjuk, mi az, aminek még kell történnie az előadás során,
de még nem történt meg. Ebben a részben amellett érvelek, hogy az előbb felsoroltak egyike sem megfe-
lelő érv a felvételekkel szemben, akár a létrehozóinak szándékát, akár a közönségük elvárásait, akár a mai
világunkban betöltött kulturális jelentőségüket tekintjük.
Az első állítás, miszerint a felvétel nem ragadja meg az élő előadás autentikus hang-képét, már vá-
laszt is ad arra a kérdésre, hogy ugyan miért is várnánk el egy hangfelvételtől, hogy minden részletében
megfeleljen egy élő előadásnak, s hogy ne csak a hiteles előadás illúziójának tűnjön, hanem eg y az eg yben
magának az előadásnak. De azt is előre feltételezi, hogy az élő előadás egyetlen olyan hangjelet generál,
melyet autentikusnak csak akkor nevezhetünk, ha az előadók hangjai rendszertelenül szóródnak szét a
98 hangtérben, mégpedig úgy, hogy nincs olyan, hogy csak egyetlen hiteles hallgatói pozíció létezne. Lehet-
séges persze, hogy létezik egy olyan szék a koncertteremben, amely az optimális pozíciót kínálja a zene-
hallgatáshoz, de legalább ennyire valószínű, hogy a legjobb pozíció a nézőtér fölött található, olyan helyen,
amely csak a mikrofonok számára érhető el. A gyakorlatban rutinszerűen használják a többcsatornás be-
meneteket, hogy a legteljesebb mértékben tudják szabályozni a hangminőséget és a balanszt, és hogy ha a
gyártók vagy hangmérnökök néha tévesztenek is, a konkrét hangfelvétellel vagy felvételi móddal szembe-
ni jogos kritika sem csökkenti a hanghordozó értékét vagy lehetőségeit.
Az élő előadásokkal szembeni ellenkezést jól illusztrálja Britten hangfelvételek elleni kirohanása,
melyet az Aspen-díj díjátadó ünnepségén elmondott beszédében fogalmazott meg: a felvételek hallgatása
„nem része az igazi zenei élménynek... Amennyiben mégis annak tekintik, akkor csupán egy pótlék, és ve-
szélyes, mert csalóka”. (5) Britten azt feltételezi, hogy az emberek csak felületesen hallgatnak felvételeket,
anélkül a felkészülés vagy elmélyülés nélkül, amit az ő „élő” közönségétől vár. Így figyelmen kívül hagyja
azokat a lehetőségeket, amiket a felvételek nyújtanak az elmélyült zenehallgatáshoz, ami akár koncertre
való felkészülés, akár a koncert utáni további tanulmányozás céljából történik, és lehetőséget nyújt annak
a sok embernek is, akik nem jutnak el a világ jelentős koncerttermeibe és operaházaiba. S adós marad an-
nak az elismerésével, hogy egy felvétel egyedi zenehallgatási élményt nyújthat, amely nem azért értékes,
mert megfelelően reprodukálja az élő előadást, hanem mert képes olyan zenét kínálni, melynek gyakorlati
kivitelezése jóformán lehetetlen egy koncertteremben vagy színházban. John Clushaw Ring-ciklusa, me-
lyet a Decca számára vett fel 1958 és 1965 között, híres példája egy stúdióban összeállított „előadásnak”.
(6) Culshaw a nemzetközi rangú művészeknek olyan pompázatos arzenálját állítja össze, amelyet lehetet-
len lett volna összehozni egy helyen és egy időben, és messzemenően kihasználja a sztereofónia és a szer-
kesztési technikák lehetőségeit, s így olyan zenehallgatási élményt alakít ki, amelyről állítható, hogy köz-
vetlenebb és „jelenléttel” jobban átitatott, mint amennyire egy színházban lehetséges.
Az élő előadások melletti érvelés harmadik szála a láthatóságot és az élő esemény szélesebb kontex-
tusát érinti. (7) Az is kiderül, hogy bizonyos világosan azonosítható műfajokat kivéve – mint pl. a színpadi
zene, a klasszikus zenei élő előadás – ezek a tulajdonságok nem lényegesek, és nem is mindig informatívak
zenei szempontból. Egy jelentős társadalmi esemény külsőséges csillogása nem tudja helyrehozni a zenei
hangzás szempontjából gyengének ítélt előadást. A koncert-előadók általában nem koreografálják meg a
fizikai mozdulataikat, és bár némely gesztusnak zeneileg magyarázó ereje lehet (8], sok másik mozdulat
pusztán abból áll, ami az énekhang vagy a hangszer megfelelő kezeléséhez szükséges. A televíziós közel-
képek túlságosan is gyakran mutatják, hogy amit a zenészek csinálnak a hangszerükkel vagy a testükkel,
az gyakran zeneileg irreleváns, zavaró és esztétikailag sem kimondottan vonzó. Egy élő előadás közönség-
beli hallgatói és kritikusai egyaránt rendszeresen hagyatkoznak az esemény hangzására, mint a zene mi-
benlétét adó tényezőre – a vizuális és egyéb kontextuális tényezőkre pedig, mint pl. a koncerttermi díszí-
tőelemek, kosztümök, gesztusok és programfüzetek, legjobb esetben is csak, mint az esemény kereteire.
Az egyik probléma, ami felmerül a hangfelvételek lejátszásakor az az, hogy az első hang megszólalá-
sának pillanatáig nem tudjuk, mikor kezdődik el a zene, mert hiányzik a kezdeti taps és az utána követke-
ző szünet, amelyek keretező funkciót látnak el. (9) Más szempontból azonban, egy hangfelvétel lejátszásá-
nak a körülményei megteremtik saját, önálló kontextusukat, általában annak az előnyével, hogy a lejátszás
a hallgató szoros irányítása alatt áll. A hangfelvétel rajongói nagyra becsülik a zenei hang tisztaságát épp-
úgy, ahogy a koncertközönség kifinomultabb tagjai állítják, hogy a zene elevenebbé válik, „közelebb ke-
rül”, ha becsukják a szemeiket – egy aspektusa az élő koncerthallgatásnak, amely témaként kínálkozhat az
empirikus kutatások számára.
Azt, hogy szükséges-e látni az előadókat játék közben, az a számos eset is kétségbe vonja, amikor a
zenészek majdnemhogy láthatatlanok a közönség számára. A kóruskarzatokon, orgonakarzatokon „el-
bújt” templomi zenészek, vagy Wagner egész zenekara a zenekari árokba temetve Bayreuthban, zeneileg
nem lesznek hatástalanok csak amiatt, hogy nem láthatóak, és ha a zenészek „láthatatlansága” bizonyos Illúzió és aura a klasszikus
„jelentésekben” szándékos is (a templomi zenészeket és Wagnert is érdekelte a láthatatlan forrásból jövő hangfelvételen
zene „spiritualitásának” kiaknázása, és a világi „klasszikus” repertoár nagy része lassan szintén szert tett 2003
arra, hogy egy ezekkel összehasonlítható szintű spirituális légkört teremtsen), akkor az ilyen jelentéseket
a láthatatlan előadás felerősíti. Tehát, sok minden, ami az élő koncerten történik, nem feltétlenül látható a
közönség számára. A karmester gesztusainak és arckifejezéseinek nagy része csak a zenészeknek szól, mi- 99
közben valószínűtlen, hogy egy nagyzenekar tagjai külön-külön láthatóak lennének minden egyes néző
számára, még a jelentős szólók esetében is. A zenekari muzsikusok gyakorlottak abban, hogy kiemeljék
hangszerük hangját, s elegendő erővel játsszanak ahhoz, hogy kizárólag a hangjukkal magukhoz ragad-
ják a hallgató figyelmét. Ennek egyik híres példája az az oboaszóló, amely Beethoven V. szimfóniája első
tételének végéhez közel szólal meg: az oboista nem feltételezheti, hogy bárki is láthatja őt a közönségből.
Az élő előadás esetében még fontosabb az a visszajelzés, amely az előadó és a közönség között le-
hetséges. A zenébe mélyen belemerült hallgatóság figyelme hallható jeleket generálhat (például inten-
zív csöndet), melyekre az előadók pozitívan reagálhatnak. Anthony Rooley visszacsatolási hurokként írja
le ezt a folyamatot. (10) A jelenség egyébként a bensőségesebb természetű előadásokon figyelhető meg
leginkább, mint például Rooley saját lant-estjein, s ennek jelentősége a nagyszabású koncerteken lecsök-
kenhet a méretbeli tényezők miatt. Azonban a zenészek a hangstúdióban a producer intenzív figyelmét
és közvetlen rekcióját élvezik [a producer a stúdiózenész első számú hallgatósága (magyarul inkább zenei
rendezőnek hívják – a ford.)], így a felvétel már önmagában a visszajelzés terméke. Ennek természete más,
mint egy koncertközönségé, de intenzitása olyan fokú, hogy azt képtelenség lenne koncertteremben vagy
színházban reprodukálni. És ha egy “elmélyült” állapotban lévő és figyelmes közönségnek az egyik hatása
az előadói környezetben létrejövő kivételes mértékű csönd, nos, ez amúgy is biztosított bármely működő-
képes hangfelvételi környezetben, amelynek köszönhetően a hangfelvétel olyan finomságú és részletes-
ségű megmunkálást tesz lehetővé, amely nem mindig lehetséges egy élő előadás során.
Az élő előadás egyik megkérdőjelezhetetlen zenei fontossággal bíró aspektusa az esemény valós
időben lejátszódó mivolta, s így az előadók “sérülékenysége”. Az, hogy nincs második esély, amely minden
művész számára megadatik az előadóművészt kivéve kulcsfontosságúvá válik olyan virtuóz szakaszok-
ban, ahol a hiba lehetősége biztosítja az esemény “extremitását”, Edward Said saját értelmezése szerint. (11]

Az élő előadás pontosságával szemben támasztott mai követelmények, illetve a virtuozitásnak már
a konzervatóriumi képzés végére történő mesteri elsajátítása gyakorlatilag elmossa a különbségeket az élő
előadás és a szerkesztett felvétel között, olyannyira, hogy jogosnak bizonyul Jacques Attali panasza, misze-
rint az élő előadás megközelíti a professzionális hangfelvétel idealizált körülményeit. (12]
Talán Stan Godlovichnak is igaza van abban, hogy a zenei előadást az előadó és a közönség együt-
tes jelenlétével definiálja, mivel a felvételek ugyanúgy fixek, mint az autográf irodalmi alkotások, festmé-
nyek és szobrok. (13) Talán lehet némi jelentősége annak, hogy a londoni központú Typewriter and Gra-
mophone Company (a „T&G”, a későbbi HMV) hanglemezkiadó társaság az 1900-as évek elején egy olyan
logót használt, melyen egy kerubszerű angyal egy hanglemezen ül, és egy óriási lúdtollal ír rá. Ezzel azt
érzékeltették, hogy a belevésett zene egy magasabb, transzcendentális erő műve, mely mentes a pusztán
emberi mivoltú zenészek tökéletlenségeitől. (14) A tökéletes hangrögzítés képzete a klasszikus hangfelvé-
tel-gyártás esztétikájának egy fontos aspektusát ragadja meg, annak kezdeti szárnypróbálgatásaitól nap-
jainkig; azonban a társaság már 1909-ben egy ettől nagyban különböző esztétikai „kiáltványt” fogalma-
zott meg azzal, hogy Nipper kutya híres képét kezdték használni. Nipper, aki nem egy tökéletes felvételt
hallgat, hanem a gazdájának meggyőző hangját (15), arra emlékeztet bennünket, hogy bármilyen felvétel
lejátszásának megvan a saját, önálló „jelenléte térben és időben”. (16) Az analóg és a digitális médiumok
kódolási módját, mint rögzítési formákat, nem szabad összekeverni azzal, hogy a lejátszott hang múlan-
dó – ez utóbbit bizonyos szempontból hasonlíthatjuk az írott szöveg szóbeli megszólaltatásához, vagy az
élő zenei előadáshoz.
Míg az élő előadás és a felvétel közötti különbségek jelentősek, az utóbbi egyértelmű hátrányait je-
lentős előnyök kompenzálják. Mivel a zenei rendező célja szinte mindig az, hogy a zenész ideálját, az opti-
malizált előadását segítse megvalósulni, a felvételek megbízható rálátást nyújtanak a zenész előadói gya-
korlatára és felfogására. (17) De a koncertterem zavaró és torzító körülményeitől mentesen, a felvételek
elmélyült meghallgatását is lehetővé teszik, és olyan közvetlen zenei élményt nyújthatnak, amelyekben
nemcsak gyönyörködhet a hallgató, hanem hasznos lehet zeneszerzők, előadók, zenetudósok és a széle-
sebb zenehallgató közönség számára is. Amennyiben – ahogy Stan Godlovitch fogalmaz – az emberek
azért járnak koncertre, hogy „valami meghassa, gyönyörködtesse, tanítsa, elvarázsolja, szórakoztassa és
100 messze repítse őket” (18), akkor a klasszikus hangfelvételek ugyanezeket az előnyöket kínálják. A szőr-
szálhasogatókat leszámítva csak akkor okoznak a hallgató számára csalódást, ha nem sikerül bennünket
„megindítaniuk” a fent felsoroltak közül legalább néhány módon.

II.

A klasszikus hangfelvétel, mint szándékos illúzió


Most rátérek a klasszikus hangfelvétel illuzórikus aspektusaira. Említettem, hogy a klasszikus fel-
vétel egyik alapelve, legalábbis a magnófelvétel megjelenése óta, hogy azt tárjuk a hallgató elé, amit pél-
daértékűnek és szépséghibáktól mentes előadásnak ítélünk. Még a korábbi gramofonlemez-technológia
esetén is, a producerek a legkiválóbb előadókat keresték meg, és rendszeresen válogattak több felvétel-ver-
zióból mindegyik lemezoldal számára. Az elektronikus felvétel 1925-ös bevezetésével, illetve a ‘40-es évek
során egyre kifinomultabbá vált szerkesztési technikákkal és egyéb technológiai beavatkozásokkal úgy
tűnt, megvalósítható a virtuális, de „tökéletes” előadás álma – a felvételek hatásosan fenn tudták tartani az
élő előadás illúzióját, sőt, felül is tudták múlni az élő eseményt. Walter Legge, aki az EMI producere volt
az 1950-es években, új mércék fölállítását igényelte olyan felvételek gyártásával, „amelyek alapján a nyilvá-
nos előadások és a jövő művészei megítélhetőek lesznek – hogy a kor legjobb előadásaiból egy óriási gyűj-
teményt hagyjunk magunk után” (19)
A háború utáni felvételek kiváló minősége ezzel együtt az általuk hordozott zenék “tárgyiasulását”
is elősegítette: a zenemű vagy annak előadása egy tárggyá válik, melyet becsben lehet tartani, vagy hasz-
nálatba lehet venni. Michael Chanan szerint, a zene „technifikációja” emellett „újraformálta a zenehallga-
tás folyamatát (...) azzal, hogy beszállt ismét a küzdőtérbe, mivel a könnyű másolás következtében a zene
megkerülheti a piaci ellenőrzést, és új formákat is felfedezhet.”(20) A felvételek lehetővé teszik a zene szá-
mára, hogy „megtestesületlen” hangként értékeljék és élvezzék azt, ennélfogva egy olyan absztrakt létező-
ként, melyben még az előadás is áttekinthetőnek tűnhet. Ahelyett, hogy a zenét abban az értelemben pro-
pagálnák, hogy élő zenészek hozzák létre, úgy tűnik, a felvételek néha egy „zárt” produktumot kínálnak,
mely szándékosan tökéletes – a technológia győzelme, melyben az emberi részvétel kockázati tényezőit
kiküszöbölték. Chanan számára, aki e szavaival Benjamint fogalmazza újra, ez „a művészeti alkotás ha-
gyományos aurájának (...) a lerombolásához” vezet (21), melyet a felvett előadás „tárgyiasultságának” kép-
zete vált fel, s melyben a felvétel magát a művet mutatja be, vagy pedig szépséghibától mentes, idealizált
előadásként.
A marketingstratégiák gyakran azzal segítik elő a tárgyiasításnak ezt a tendenciáját, hogy a zene-
szerzők neveit és a művek címeit vastagabb betűvel és feltűnőbb helyen tüntetik fel, mint az előadók ne-
veit. (22) Ez volt a szabványos formátum az 1920-as évek elejétől az 1950-es évek elejéig – mint például
a klasszikus zeneműveket tartalmazó vaskos Shellac lemezkötetek, melyek a könyvtári katalóguscímzé-
sekhez hasonló módon voltak csomagolva. Újabban a Naxos kiadó vitte sikerre klasszikus zenei lemezeit
olyan marketinggel, amely szinte kizárólag a zeneszerzőre és a műre épített, s ezzel azt igazolta, hogy elér-
hető áron az emberek még mindig vásárolnak felvételeket, de elsősorban inkább a műért, mint az előadó-
ért. Bárhogy is legyen, az előadások azért vannak, hogy bárki, akinek megvan a hajlandósága és készsége
hozzá, meghallgathassa őket, és nem maguknak a felvételeknek a külalakja az, ami meghatározza, hogy
az emberek hogyan hallgatják őket, hanem a neveltetésükből, olvasottságukból, mindenfajta, zenéléssel
kapcsolatos ismeretükből, hajlandóságukból, és mindenekelőtt a zenehallgatás szándékából adódó, széle-
sebb értelemben vett kulturális tényezők határozák meg.
Az első probléma Chanan érvével az, hogy a jó felvételek önmagukban nem takarják el az előadók
hallás útján érzékelt „jelenlétét”, még ha bizonyos zenehallgatók meg is tanulták figyelmen kívül hagyni
az előadást, hogy a kompozícióra koncentráljanak: a felvételeket úgy lehet érzékelni, egyszerűen és nyer- Illúzió és aura a klasszikus
sen fogalmazva, mint „a zenét”, de a figyelmesebb, jobb érzékű hallgatók mindig is tudatában lesznek az hangfelvételen
előadásnak. Azonban még kritikusabb az a feltételezése, hogy a dolgokat előbb látni kell ahhoz, hogy el- 2003
higgyük őket. Nos, a mindennapi életben egy hanginger lehet az első jele valamilyen fizikai objektum je-
lenlétének vagy megnyilvánulásnak. Egy oroszlán ordítása vagy egy vízesés zúgása – vagy, manapság, egy
bicikli gurulása vagy a szomszéd hifijének a hangja – nem valaminek a hiányáról, hanem a jelenlétéről árul- 101
kodnak. A felvett hangok ugyanolyan erőteljesen képesek valaminek a jelenlétét képviselni, mint az úgy-
nevezett természeti hangok, még akkor is, ha tudjuk, hogy a hangot előidéző fizikai objektumok jelenléte
illuzórikus: mind azon múlik, hogy a képzeletünk hogyan értelmezi a hangszóróink által sugárzott, tel-
jesen valóságos hangokat. Beethoven IX. szimfóniájában az énekhangok belépése (Chanan példája) nem
csak szimbolikus, mivel ez még a felvételen is vokális megtestesültséget, s ezáltal különleges emberi jelen-
létet hoz be a szimfóniába. A művészet egész világa az emberi képzeletnek arra a képességére épül, hogy
jelentést tudunk tulajdonítani valami olyasminek, amiről tudjuk, hogy nem valóságos (23], így ha a hall-
gatók elképzelnek egy kórust, mely ténylegesen a hangszórók mögött énekel, akkor csupán azt a jogukat
gyakorolják, amit a hallgatónak kijáró alapjognak lehetne nevezni. A hangfelvételek egyedül azzal stimu-
lálják a hangok értelmezéséért felelős, velünk született képességeinket, hogy egy olyan hangvilágot “va-
rázsolnak” elénk, melynek fizikai forrásait esetleg nem látjuk. Elviekben ez nem mond se többet, se ke-
vesebbet, vagy nem etikusabb vagy etikátlanabb, mint amikor egy történész felidéz egy jelenetet olyan
szereplőkkel, akik már nincsenek közöttünk.

A tökéletes felvétel
Jacques Attali számára a hangfelvétel azért művészietlen, mert a „tökéletes” előadást tárja elénk. A
felvétel „kizárja a hibát, a bizonytalanságot, a zajt. Kiüldözi a műből az ünnepélyességet és a látványos-
ságot; formálisan rekonstruálja, manipulálja azt, absztrakt tökéletességgé teszi”. (24) Minden bizonnyal
egyetértett volna Adornoval, aki egyik híres mondatában azzal vádolta Toscaninit, hogy olyan élő előadá-
sokat vezényel, amelyek úgy szólnak, mint a saját fonográf-felvételei. (25) Adorno számára Toscanini „per-
fekciója” a „hibátlanul működő, fémesen csillogó gépezet” formáját öltötte, „amelyben minden fogaskerék
olyan tökéletesen illeszkedik egymáshoz, hogy a legcsekélyebb hézag sem marad nyitva, ami megkérdője-
lezné az egész értelmét”; (26) magát a műalkotást a gördülékenyen működő gépezetté redukálja, és ebből
fakadóan művészetellenes. Attali azt állítja, hogy a hangfelvétel általában a tökéletesség kultúráját élteti, a
zenélés „természetesebb” megközelítéseinek kárára.
Ami még feladatunk itt, az az ideális kép felé való művészi törekvés, illetve a tökéletesség, mint ér-
tékmérő kritérium közötti különbség megfogalmazása. (27) Az előbbit számos említésre méltó törekvés
tűzte ki céljául, s ide tartozik a kompozíció és előadás, illetve a felvétel gyártásának és a kritikaírásnak a leg-
több formája, míg az utóbbi igaztalan módon lekicsinyíti a művészetet objektíve definiálható célok hal-
mazára. Adorno úgy látja, hogy a tökéletesség hajszolása korunk egyik félelmének tünete: a technológiai
terméknek nehogy sikerüljön beváltani magának a technológiának az ígéretét. Egy kereskedelmi forga-
lomba hozott felvételen, egy kisebb szépséghiba már eleve a rendszer hibájának a jele – hibás termék – és
a felvételkészítési technológia fejlődése Jean Baudriallard általánosabb észrevételét illusztrálja, miszerint a
kereskedelmi termékek hibája már önmagában is arra ösztönzi az ipart, hogy új és „jobb” technológiákat
fejlesszen ki, miközben fokozatosan eltávolítja a fogyasztóit az igazi, természetes világtól. „Harcolnunk
kell”, írja „a világ bűnös tökéletlenségéért”. (28) Azok, akik a mai felvételeket túlzottan sterilnek találják,
szívből egyetértenének ezzel. És mégis, a modern CD és a mosógép közötti nyilvánvaló párhuzamok elle-
nére, a legünnepeltebb klasszikus felvételek ezáltal semmit sem veszítenek művészi értékükből. Túl kön�-
nyű a mai művészeti termékeket összemosni a szigorúan használati célú termékekkel pusztán azért, mert
mindkettő létrejötte magában foglal gyártási és a marketing-technológiákat. Egy klasszikus felvétel ab-
ban különbözik egy mosógéptől, hogy olyan élményt kínál, amely a művészet általános kategóriájához
tartozik. Ahhoz, hogy a művészi érték nehezen megfogható fogalmát megértsük, az egyik lehetőség az
aura benjamini fogalma, melyre ezúton térek rá.
III.

Aura
A Walter Benjamin által életre hívott „aura” és „auratikus” szavak olyan kifejezések, amelyek a szép
vagy költői minőségű tárgyak, vagy hagyományos műalkotások különleges esztétikai tulajdonságaira utal-
102 nak. Az utóbbiakra vonatkozóan e kifejezések hasznos módon irányítják át a figyelmünket a tárgy objektív
jellemzőiről, ám nem kizárólag szemlélőinek szubjektív válaszaira, hanem az objektum és szubjektum kö-
zött létrejövő térre is, amelyet a találkozás megnyitott. Benjamin számára e kapcsolódás párbeszédszerű,
mintha a szemlélő és a tárgy egymást közelítené meg az auratikus szemlélődés virtuális terében.
Chanan a hiteles műalkotást annak integritása alapján határozza meg, mely úgy értendő, mint egy
„bensőséges egység az előadás helyével és idejével”, (29) azonban Benjamin számára nem ez, ami az au-
rát definiálja: az objektum egyrészt a történelembe és tradíciókba való beágyazottsága révén válik aurati-
kussá, másrészt a megkülönböztetett jelleg és a bensőségesség jegyében létrejött kapcsolat révén, melyet
a szemlélő vagy hallgató képes vele kialakítani. Az aura tehát nem valamilyen lényegi tulajdonsága magá-
nak a dolognak, és nem is az egyesült szubjektum és objektum hégeli mítoszán alapszik; (30) a szubjek-
tum és objektum közötti távolság valós marad, mégis felülemelkedünk rajta az egy-ség illúziójában, annak
érzetében, hogy az énünk elmerül a szemlélődés tárgyában. Az auratikus művészet a produktum abbéli
erejétől függ, hogy egy bizonyos fajta választ váltson ki a szemlélőjéből, valamit, ami az ámulattal rokon,
és a szemlélő arra való képességétől, hogy aktívan, résztvevőként reagáljon, amit Hans-George Gadamer
„ön-feledtség”-ként ír le. (31)1
Gadamer úgy érvel, hogy az „ön-feledtség” az egyik első előfeltétele annak, hogy elmélyüljünk a
művészeti tárgyakban és a játékokban. (32) Mindkettő a kritikai gondolkodás két szintjét követeli meg: a
kezdetit, mely megengedi, hogy egy ilyen elfoglaltság érdemes ill. kivitelezhető lehet, és a másodikat, a re-
flektív szakaszt, melyben az elfoglaltság minőségét vizsgáljuk meg. Annak megítélésében, hogy egy tárgy
művészi‑e, auratikus‑e, a kritikus a tárggyal való találkozásának minőségére reflektál, és nem kizárólag an-
nak objektív tulajdonságaira. (33) Hasonló kritériumok érvényesek a klasszikus hangfelvételek kritikai fo-
gadtatására is. Abban a pillanatban, amikor valami nem jól sikerül – egy botlás az előadó részéről, vagy egy
kevésbé kifejező részlet egy kompozícióban, egy hallható vágás, vagy nem megfelelő hangszínbeállítások
– a kritikusok csapata úgy lendül akcióba, mint az örökké éber gardedám (régi korokban a fiatal hölgyek
szüzessége felett őrködő, nála idősebb kísérő hölgy – a ford.). (34) A kritikus hallgatónak a hangfelvétel
minőségéről alkotott végső megítélése ugyanakkor magára az élményre való reflexiójától függ, és ha ki-
sebb hibák miatt átmenetileg nem is sikerült elmélyülnie, ez még nem feltétlenül végzetes a produktum
sikerére nézve.
Az én ugyanakkor érintetlen marad, és Benjamin hasznos módon fejti ki, hogy a művészeti alkotás
aurájára egyaránt jellemző a bensőségesség és a historikus-kulturális távolság: az aura a távolság függvénye
és – úgymond – az interpretáció kritikus mozzanatai „engedélyezik”.

Az aura a „Másik (fél)” „jelenlétének” egyfajta fokmérője, aki mindezek mellett paradox módon to-
vábbra is hiányzik vagy távol van; az aurát úgy érzékeljük, mint az objektum „hívó szavát”, vagy ahogy Ben-
jamin fogalmaz, a „megválaszolhatóságát” (35]. Terry Eagleton úgy írja le az auratikust, mint „a másik-ság
és a bensőségesség rejtelmes összjátékát” (36]. Benjamin az objektum auráját a „hitelességével” is társítja,
melyet így értelmez: „az esszenciája mindennek, amely a saját kezdetétől fogva közvetíthető, a tényleges
élettartamától kezdve annak a történelemnek a tanúságáig, melyet átélt”. (37] De ha mindez egyenesen al-
kalmazható a történelmi hangfelvételre, miért állítja Benjamin azt, hogy az aura „elsorvad a mechanikai
reprodukció korszakában”?

1 (Az angolban ez egy mesterségesen létrehozott szó az „ön-” és a „feledékenység” szavak összetételével;
magyarra fordítása több, mint kézenfekvően adná magát, hiszen nekünk már megvan erre a nagyon
hasonló értelmű hagyományos szavunk. Ezt azonban ehelyütt nem csupán pozitív hangulati leírás-
ként, hanem tényleg a szó szoros értelmében kell venni: az „önmagunk létezéséről való megfeledke-
zés”-ként, ill. az erre való, ideiglenesen fennálló hajlamosságként. – a ford.)
Benjamin értékeli a filmet és a fotográfiát, és hozzájuk társítja a hangfelvételt is, pontosan azért, mert Illúzió és aura a klasszikus
úgy hiszi, hogy felül tudnak emelkedni az auratikuson, és így kiritizálni tudják mai csúnya világunkat. hangfelvételen
Benjaminnak kétségtelenül igaza van, amikor azokra az új jelentésekre hívja fel a figyelmet, amelyek a fil- 2003
mkészítés és fotográfia eljárásainak köszönhetően lehetségesek, de elsiklik a figyelme afelett a nyilvánva-
ló tény felett, hogy a régi filmek és fotográfiák ugyanolyan erőteljesen képesek „aurát” fölvenni, mint a régi
festmények. Az „auratikus” és a „nem-auratikus” közötti különbséget tehát nem az elkészítés módja hatá- 103
rozza meg, hanem az, hogy a tárgy ellenáll-e az auratikusság bűvkörének, „megtagadja”-e azt. Az aurati-
kus szándékos megtagadása eléggé jól ismert a mai világban, de sokkal gyakrabban találkozhatunk velük
a posztmodern és konceptuális művészetben és az azokat kísérő kritikai diskurzusokban, mint a tradicio-
nálisabb értelemben vett művészfilmekben és fotográfiákban.
Visszatérve a hangfelvételre, a vágási és szerkesztési folyamatok bizonyos szempontokból összeha-
sonlíthatóak a filmvágással és -szerkesztéssel, azonban van néhány fontos különbség. Ahogy Benjamin fo-
galmaz, az operatőr képsorai „rengeteg töredékből állnak, melyeket egy új törvényszerűségnek megfele-
lően illesztenek egymáshoz” (38], de a stúdiófelvétel során összegyűjtött rengeteg töredéket továbbra is a
zenei folytonosság régi, „természetes” törvénye alapján kell összeállítani. A hangrögzítés csak akkor kez-
dené el utánozni a hagyományos film „analitikus” vágási és zoomolási technikáit, vagy a pop- és rockzené-
ben ünnepelt „nem-természetes” hangokat, ha a szándékolt végeredmény egy alapvetően nem-természe-
tes kollázs. Ezek a technikák idegenek a klasszikus felvétel számára, de szerves részei az elektronikus vagy
elektroakusztikus zeneszerzésnek.
Benjamin védelmezői helyesen hangsúlyozták bizalmatlanságát azzal a tendenciával szemben, hogy
a műalkotást autentikusként vagy autonómként fogjuk fel. (39) Egy másik esszében Benjamin a hallgató
„ellenállhatatlan vágyáról” beszél, hogy „a kiszámíthatatlannak és az “Itt és Most”-nak az apró szikrája után
kutasson, amellyel a valóság, mondhatni, megbélyegezte a tárgyat”. (40) A művészeti alkotás aurájának
benjamini definíciója szempontjából ez egy olyan kritikus választ fejez ki, melynek értelmében a szemlélő
nem csupán elmozdul a tárgy „felé”, avagy elfogadja azt olyannak, amilyennek tűnik, hanem azokat a tüne-
teket keresi benne, amelyeket Terry Eagleton úgy hív: „valóság, melynek vibrálnak a szélei”. (41) A hangfel-
vétel-producerek (zenei rendezők) és a kritikusok nagy valószínűséggel elutasítanak bármilyen felvételt,
amelyben az ilyen „vibrálás” nincs nyilvánvalóan jelen. Benjamin rámutat arra, amit Adorno a műalkotás
„kettős jellegének” nevez, azaz, kívülről az állandóságot és a tökéletességet mutatja, miközben sohasem
rejt el teljesen egy sötétebb, természetes „rejtett áramlatot”, melyet Adorno a mű „borzongató” mivoltá-
nak (Erschütterung) nevez. (42) S ha a műalkotás „valami olyasmi, ami elhatárolódik a tapasztalati valóság-
tól és ennélfogva a társadalom funkcionális kontextusától, s közben mégis része a tapasztalati valóságnak
és a társadalom funkcionális kontextusának”, (43) akkor, a sikeres klasszikus zenei hangfelvétel is az. Ador-
no újragondolja a műalkotás auratikus jellemzőit, a „két tendencia közötti közvetítés” koncepciója alapján,
melynek egyik oldalán a bálványozás áll, másik oldalán pedig olyan társasági-társadalmi használati lehető-
ségek megkeresése, melyek egészen mások is lehetnek, mint az eredetileg szándékolt művészeti funkció.
A hangfelvételek fogadtatásának története azt mutatja, hogy a klasszikus felvételeket milyen kön�-
nyedén bálványozták autonóm alkotásként, használták megalázó módon bevásárlóközpontokban hátt-
érzeneként, szűkítették funkciójukat a filmzenéhez vagy hirdetéséhez, vagy értékelték művészeti pro-
dukcióként. De ezek közül a felhasználási módok közül csak az utolsó teszi lehetővé a „a másik-ság és a
bensőségesség rejtelmes összjátékát”.
A hivatalos kutatáson és mindennapi szórakozáson kívül csak ez ad értelmet annak, hogy időnket
klasszikus felvételek hallgatásával töltsük.

Hogyan hallgatunk hangfelvételeket?


Mostanában anakronisztikusnak tűnhet, ha az ember az auratikus élmény vagy az elmélyült zene-
hallgatás esztétikáját próbálja hirdetni. Van ebben némi irónia, mert a mai etnográfiai kutatás számára ren-
delkezésre álló egyik legerősebb módszertani eszköz az az, hogy kvalitatív jellegű kapcsolatba lépünk igazi
emberekkel, (44) s ha ezt a módszert a hangfelvételek tanulmányozása során alkalmazzuk, akkor a hagyo-
mányos esztétika alapelvei, ahogy az előző fejezetben tárgyaltuk őket, kulcsfontosságú tényezőkként me-
rülnek fel a felvételek gyártásával, kritikáival és a nagyközönség általi „fogyasztásával” kapcsolatban. A
legerősebb bizonyíték a felvételek esztétikai megközelítésének helyessége mellett az az, hogy ugyanolyan
elmélyültséggel és koncentrációval történő zenehallgatást tesznek lehetővé, mint az élő koncert – vagy,
ahogy egyesek érvelhetnek, még annál is nagyobb elmélyültséggel, köszönhetően annak, hogy a szemé-
lyesen ellenőrzött hallgatói környezetben kevesebb a zavaró tényező.
Hiányoznak azok az empirikus kutatások, amelyek azt vizsgálják, hogy az emberek ténylegesen ho-
104 gyan hallgatják a klasszikus felvételeket, (45) de a producerek ideáljai és szándékai minden kétséget kizáró-
an azok, hogy elmélyült hallgatásra szánják a termékeiket. Olyan hírességek, mint Fred Gaisberg, Walter
Legge, John Culshaw és Andrew Keener következetesen és sikeresen ellenálltak a kereskedelmi szemlé-
letmód és a „fazonra igazítás” méricskélő-„szintbelövő”, művészetellenes, aura-ellenes tendenciáinak, az-
zal, hogy szenvedélyes elkötelezettjei a művészi kiválóságnak. Felvételeiket a komoly hallgatók számára
készítik, akiknek nemcsak az a szándékuk, hogy tanuljanak belőlük, vagy háttérzenének használják őket,
hanem az, hogy a zene élményét a lehető legmagasabb minőségben tapasztalják meg.
A fent tárgyaltakból az tűnik ki, hogy a hangfelvétel egy központibb szerepet feltételez a nyuga-
ti műzene kulturális gyakorlatában, mint amit általában a róla szóló tudományos diskurzusokban meg-
engednek neki. Azzal, hogy inkább a zene hangjának hatóerejét hangsúlyozza az előadásának társadalmi
kontextusa helyett, a klasszikus felvétel szoros összhangban van az autonómia esztétikájával – azzal, mely
az utóbbi évszázad nyugati műzenéjének alkotói gyakorlatát és elméleteit egyaránt jellemzi. Különösképp
a felvétel oly módon képes a tökéletes termék illúziójának megteremtésére, ahogy egy élő előadás mindig
csak kompromisszumok árán tudja azt elérni. Benjamin kifogásai ellenére a perfekció ideálja továbbra is
érvényes lehet a mai világban, nem utolsósorban azért, mert a perfekció manapság a korunk populáris mé-
diáját átitató posztmodern értékek kritikájaként funkcionálhat. Benjaminnek az elképzelése, hogy a tradi-
cionális művészet nem tud kritikus lenni azokkal a társadalmakkal, amelyek megpróbálják megőrizni azt,
túlzottan leegyszerűsítőnek tűnik. Ezzel nem azt akarom feltételezni, hogy a klasszikus felvétel mai tech-
nikái mindig a legjobb eredményt produkálják, vagy hogy nincs tér a kísérletezés számára, akár épp a kor-
társ rock- és pop-felvételek technikáit követve. Mégis, az egyre világosabban látszik, hogy azok, akik kifo-
gásolják a klasszikus felvétellel kapcsolatos, uralkodó nézeteket, mint például azt, hogy támogatni kell a
tökéletességet és az előadást, mint autentikus eredetit, hasznosabb lenne, ha kritikájukat afelé a kulturális
környezet felé irányítanák, amely érzéketlenné vált az illúzió erejére. (46]
Egy, a 1960-as évekből való, „Az interpretáció ellen” címmel íródott esszében, Susan Sontag már ak-
kor észreveszi a fölösleges mennyiségeket, a kortárs kultúra túltermelését és az ebből fakadó tendenciát,
hogy elveszítjük a érzéki tapasztalataink „élességét”, de az ő általa javasolt megoldás nem a „kapituláció”,
hanem az, hogy „regeneráljuk, élesítsük vissza az érzékeinket. Meg kell tanulnunk jobban látni, jobban
hallani, jobban érezni...” (47], más szóval, megtapasztalni az auratikus minőségeket, melyek abból fakad-
nak, hogy a felvett zenével, amely egyaránt jelenlévő és távollévő, kapcsolatba lépünk. A hangfelvételek
arra hívnak bennünket, hogy kritikusan hallgassuk őket és így, remélhetőleg aktív részvétellel teli zene-
hallgatásba bocsátkozzunk, melyben a felvétel azzá válhat, aminek az előadói és a producere szánta: olyan
eszközzé, mely az embert egy lenyűgöző, csodálatos zenehallgatási élményhez juttatja. Természetesen, az
élő koncertnek továbbra is szüksége van az aktív és erőteljes támogatásra; az élő előadás és a felvétel már
hosszú egymást kölcsönösen támogató tevékenységként létezik az előadók és hallgatók számára egyaránt,
s mi csak remélhetjük, hogy ez továbbra is így lesz az elkövetkező időkben.
Illúzió és aura a klasszikus
Bibliográfia hangfelvételen
2003
• Adorno, Theodor W. Aesthetic Theory (Ästhetische Theorie, 1973, trans. Robert Hullot-Kentnor),
London: The Athlone Press, 1997.
• Adorno, Theodor W. ‘On the Fetish Character of Music and the Regression of Listening’ (‘Über 105
den Fetischcharakter in der Musik und die Regression des Hörens’ (1938)), in Theodor
W.Adorno: The Culture Industry, ed. J.M.Bernstein, London and New York, Routledge,
1991.
• Attali, Jacques Noise (trans. Brian Massumi), Manchester University Press, 1989 (1977).
• Baudrilliard, Jean, The Vital Illusion, New York, Columbia University Press, 2000.
• Benjamin, Walter, ‘The work of Art in the Age of Mechanical Reproduction’ in Illuminations
(trans.Harry Zohn, 1936), London, Fontana Books, 1973.
• Britten, Benjamin, Address on Receiving the First Aspen Award, London, Faber and Faber, 1964.
• Andrew Bowie, From Romanticism to Critical Theory: The Philosophy of German Literary Theory,
London, Routledge, 1997.
• Chanan, Michael, Repeated Takes: A Short History of Recording and its Effects on Music, London
& New York, Verso, 1995
• Cook, Nicholas, Music, Imagination and Culture, Oxford University Press, 1990.
• Cook, Nicholas, ‘Between Process and Product: Music and/as Performance’, in Music Theory On-
line, Volume 7, Number 2, April 2001.
• Culshaw, John, Ring Resounding: the Recording of Der Ring des Nibelungen, London, Secker &
Warburg,1967.
• Eagleton, Terry, Walter Benjamin: Or Towards a Revolutionary Criticism, London, New York,
Verso, 1981.
• Gadamer, Hans-George, Truth and Method (Wehrheit und Methode, 1960), London, Sheld and
Ward, 1975.
• Godlovitch, Stan, 1998. Musical Performance: A Philosophical Study, London and New York,
Routledge.
• Goodman, Nelson, 1968, Languages of Art, Oxford: Oxford University Press, 1968.
• Goehr, Lydia, The Imaginary Museum of Musical Works: an Essay in the Philosophy of Music, Ox-
ford, Clarendon Press, 1992.
• Hamilton, Andy (2003), The Art of Recording and the Aesthetics of Perfection, British Journal of
Aesthetics, Vol. 43 pp. 345-362.
• Johnson, Peter, ‘Performance and the Listening Experience: Bach’s “Erbarme Dich”’ in Cook, N.,
Johnson P., Zender, H. (eds.), Theory into Practice: Composition, Performance and the Liste-
ning Experience, Leuven University Press, 1999.
• Johnson, Peter, ‘The Legacy of Recordings’ in Rink, John (ed.) Musical Performance: A Guide to
Understanding, pp.197-211, Cambridge University Press, 2002.
• Moore, Jerrold Northrop, Sound Revolutions: a Biography of Fred Gaisberg, Founding Father of
Commercial Sound Recording, Trowbridge, Wiltshire, Sanctuary Publishing Co., 1999.
• Rooley, Anthony, Performance: Revealing the Orpheus Within, Longmead, Dorset, Element
Books, 1990.
• Sontag, Susan, Against Interpretation, London, Vintage 1994 (1966).
Végjegyzetek; hivatkozott, ill. megjegyzésekkel ellátott bibliográfia

1. A “klasszikus” az az átfogó kifejezés, ahogy a nyugati zeneművészeti alkotásokról készült felvé-


teleket nevezzük. Kizárom ebből az amatőr produkciókat, illetve azt, amikor a felvételt
gyakorlásra használják, de mondanivalóm nagy része érvényes lesz más műfajokra is, me-
106 lyekben az “akusztikus” előadás illúzióját próbálják érvényesíteni. Az elektronikus és elekt-
roakusztikus zenei felvételek, melyeknél a kompozíciós folyamat része a technikai feldol-
gozás is, nem tartoznak az e fejezetben vizsgált területhez.
2. A mértékadó írás az illúzió művészetben betöltött szerepéről: Ernst Gombrich, Art and Illusion: A
Study of the Psycholog y of Pictorial Representation, London, Phaidon, 1960; lásd még: Ken-
dall L. Walton, Mimesis as Make-Believe: On the Foundations of the Representational Arts,
Cambridge, Mass, Harvard University Press.
3. Benjamin, Walter, ‘The work of Art in the Age of Mechanical Reproduction’ in Illuminations
(trans. Harry Zohn, 1936), London, Fontana Books, 1973.
4. Stan Godlovitch, Musical Performance: A Philosophical Study, London and New York, Routledge,
1998, p. 27.
5. Benjamin Britten, Address on Receiving the First Aspen Award, London, Faber and Faber, 1964, p.
20 (a kiemelés tőle származik).
6. John Culshaw egy részletes, személyes beszámolót ad itt: Ring Resounding: the Recording of ‘Der
Ring des Nibelungen’, London, Secker and Warburg, 1967.
7. Nicholas Cook, ‘Between Process and Product: Music and/as Performance’, in Music Theory On-
line, Volume 7, Number 2, April 2001.
8. Empirikus tanulmány készült arról, hogy az előadó mozdulatai milyen hatással vannak a közönség
által észlelt zenei kifejezésre. Megtekintéséhez lásd: Jane Davidson (ed.), The Music Prac-
titioner: Research for the Music Performer, Teacher and Listener, Aldershot: Ashgate, 2004.
Ez még egy stúdiófelvételen is megoldható, mégpedig úgy, hogy nézőtéri tapsot helyeznek
a zene kezdete elé – ezt az eszközt gyakran használják a pop-felvételeken –, vagy egy rövid
szóbeli bevezetéssel, mint amilyennek annak idején próbálkoztak is némely nagyon korai
Shellac felvételen; az, hogy mindez szükségtelennek tűnik, azokról az idealisztikus tulaj-
donságokról tanúskodik, melyeket mostanra elvárunk a klasszikus felvételektől
9. Rooley, Anthony, Performance: Revealing the Orpheus Within. Longmead, Dorset, Element Books
1990, p. 45.
10. Edward Said, Musical Elaborations, Vintage 1991, p. 17.
11. Jacques Attali, Noise (trans. Brian Massumi), Manchester: Manchester University Press 1989
(1977), p. 89.
12. Godlovitch, Musical Performance, passim. Nelson Goodman, in Languages of Art Oxford Uni-
versity Press, 1968, p. 113, megkülönbözteti az “autografikus” művészetet az “allografi-
kus”‑tól – az első olyan produktumokból áll, melyek elkészülte teljes mértékben a szerző-
ik felelőssége, míg a második azt igényli, hogy az absztrakt “művet” más művészi cselekvők
valósítsák meg vagy tegyék teljessé; egy autografikus művészeti termék szerzőjéhez hason-
lóan, a felvétel zenei rendezője felelős a kész felvételért. A felvétel megszólalásának variáci-
ói, eltérési lehetőségei, melyet a lejátszóberendezések, ill. a különböző zenehallgatási kör-
nyezetek okoznak, körülbelül hasonlíthatók azokhoz a változó körülményekhez, melyek
között pl. egy képet kiállíthatnak.
13. Roland Gellatt, Roland, The Fabulous Phonograph 1877 – 1977, second revised ed., New York,
London, Collier Books.
14. Peter Johnson, ‘The Legacy of Recordings’ in Rink, John (ed.) Musical Performance: A Guide to
Understanding, Cambridge, Cambridge University Press 2002, p. 197.
15. Benjamin, The Work of Art, p. 214.
16. Az előadók, legalábbis szólistaként vagy együttes-vezetőként, általában elvárják, hogy konzultál- Illúzió és aura a klasszikus
janak velük a legjobb felvételek kiválasztásakor, s hogy legalább vétójoguk legyen a felvétel hangfelvételen
kiadásával kapcsolatban. 2003
17. Godlovitch, Musical Performance, p. 143.
18. Walter Legge, ‘An Autobiography’, in Elizabeth Schwartzkopf, On and Off the Record: A Memoir
of Walter Legge. London, Faber and Faber, 1982, p.16. 107
19. Chanan, Repeated Takes, p. 22.
20. Ibid., p. 119.
21. A zenei rendező nevét csak az utóbbi évtizedekben kezdték feltüntetni a felvételek borítóján, de
mindig csak nagyon kis betűmérettel, feltételezhetően azért, hogy ne sérüljön a közvetlen
előadás illúziója.
22. Theodor W. Adorno, Aesthetic Theory (Ästhetische Theorie, 1973), trans. Robert Hullot-Kentnor,
London: The Athlone Press 1997, p. 107.
23. Attali, Noise, p. 106.
24. Theodor W. Adorno, ‘On the Fetish Character of Music and the Regression of Listening’ (‘Über
den Fetischcharakter in der Musik und die Regression des Hörens’, Zeitschrift für Sozial-
forschung 7, 1938), in Theoder W.Adorno: The Culture Industry, ed. J. M. Bernstein, London
and New York, Routledge 1991, p. 44.
25. Adorno, ‘On The Fetish Character of Music’, p. 44.
26. Az egymásnak ellentmondó “tökéletességekről”, melyekkel az előadó szembesül, lásd: Lydia Goe-
hr, The Quest for Voice: On Music, Politics, and the Limits of Philosophy, Oxford: Clarendon
Press 1998, pp. 140ff.
27. Jean Baudrilliard, The Vital Illusion, New York, Columbia University Press 2000, p. 74.
28. Chanan, Repeated Takes, p. 18.
29. Adorno úgy írja le a hégeli Erlebnis-t, mint azt a “vészjósló tapasztalati élményt, (...) melynek föl
kell hoznia az összes titkot egy varázspálca suhintásával, és valóban megnyitnia egy kaput a
tárgyba”, Aesthetic Theory, p. 346.
30. Hans-George Gadamer azt írja, hogy “nézőnek lenni annyit tesz, hogy az ember átadja magát az
önfeledségnek azzal kapcsolatban, amit néz”, Truth and Method (Wehrheit und Metho-
de, 1960), Sheld and Ward, 1975, p. 126. A téma további tárgyalásához lásd: Peter Johnson,
‘Performance and the Listening Experience: Bach’s “Erbarme Dich”’ in Cook, N., Johnson
P., Zender, H. (eds.), Theory into Practice: Composition, Performance and the Listening Ex-
perience, Leuven, Leuven University Press, 1999, pp. 84-85.
31. Gadamer, Truth and Method, p. 126.
32. Benjamin, The Work of Art, p. 216.
33. Nicholas Cook, Music, Imagination and Culture, Oxford, Oxford University Press 1990, pp. 152ff.
34. Benjamin The Work of Art, p. 217. A “megválaszolhatóság”-gal kapcsolatban lásd még: George
Steiner, Real Presences, Faber & Faber 1989, p. 8.
35. Terry Eagleton, Walter Benjamin: Or Towards a Revolutionary Criticism, London, New York, Ver-
so, 1981, p. 39.
36. Benjamin The Work of Art, p. 215.
37. Ibid., p. 227.
38. Ibid., p. 223.
39. Cited in Eagleton, Walter Benjamin, p. 33.
40. Eagleton, loc.cit.
41. Adorno, Aesthetic Theory p. 244 (Ästhetische Theorie, p. 363].
42. ibid., p. 252.
43. Cook, Between Process and Product, ¶ 27-8.
44. Bizonyos párhuzam vonható a televíziónézéssel, melyben az én-tudat elvesztésével járó, hason-
ló fokú elmélyülés általánosnak mondható. Számos példát szolgáltat erre Nicholas Aber-
cormbie and Brian Longhurst, Audiences: A Sociological Theory of Performance and Imagi-
nation, Sage Publications, London, 1998.
45. A klasszikus felvételek sorsának időszakos változásai ma is folytatódnak. Úgy tűnik, hogy a CD-pi-
ac nemrégiben történt összeomlását lassan kezdi kompenzálni a klasszikus zene internet-
ről való letöltésének növekedése.
108 46. Susan Sontag, Against Interpretation, London, Vintage 1994 (1966], p. 14, a dőlt betűvel jelölt rész.
Illúzió és aura a klasszikus
hangfelvételen
2003

109
Európai Szociális
Alap

%()(.7(7e6$-g9ė%(

You might also like