Professional Documents
Culture Documents
A Hallási Objektumok Észlelése - Hol És Mi
A Hallási Objektumok Észlelése - Hol És Mi
Az IIK esetében a hallórendszer valójában a két fülbe érkező hang fázisai közötti különbséget
dolgozza fel. Az alacsony frekvenciájú hangok esetében nincs is semmi probléma, a
fáziskülönbség hatékonyan jelzi a hangforrás irányát. A magas frekvenciájú hangoknál viszont
a hullámhossz túl kicsi lesz, azaz kisebb, mint a fej mérete. Ha a hangok hullámhossza kisebb,
mint a két fül közötti távolság (azaz kb. 20 cm), akkor a két fül között a hanghullám több
periódust is leír. Több periódus esetén viszont nem egyértelmű, hogy a fáziskülönbség miből
származik, mivel önmagában csak a fázis nem mondja meg, hogy hány periódus telt el. Ezért
van az, hogy a magas frekvenciájú hangoknál az IIK nem nyújt egyértelmű információt a hang
lokalizációjával kapcsolatban.
● A binaurális lokalizáció duplexelmélete
Mind az IHK, mind az IIK rendelkezik egy olyan korláttal, amely esetében már nem nyújt
hatékony információt a hangok lokalizációjával kapcsolatban. Az IHK esetében ez a mély
hangoknál van így, az IIK-nál viszont a magas hangoknál. Eszerint a mély hangok esetében
inkább az IIK-t tudjuk használni, a magas hangok esetében viszont az IHK-t. Úgy tűnik
ugyanakkor, hogy van egy olyan frekvenciatartomány, amelyben egyik jelzőmozzanat sem
működik megfelelően, vagyis a lokalizáció pontatlan. Stevens és Newman (1934) klasszikus
kísérletükben empirikusan is alátámasztották ezt. Az elméletet azóta a hallási lokalizáció
duplexelméletének nevezték el. Ez az elmélet mára sok és sokféle módszert alkalmazó
vizsgálatban nyert megerősítést.
A hallási lokalizáció kapcsán tehát a duplexelmélet egy újabb hibalehetőséget vet fel: a 2000-
4000 Hz-es hangok esetében az IHK és IIK nem teszi lehetővé a megfelelő lokalizációt. Egy
másik problémával már korábban találkoztunk. Láttuk, hogy mind az IHK, mind az IIK esetében
léteznek a hallási térnek olyan pontjai, amelyek nem teszik lehetővé az egyértelmű
lokalizációt. Ezek együttesét neveztük tévesztési kúpnak. Hogyan lehetséges, hogy mindezek
ellenére a hangok lokalizációja mégis jól működik? Három megoldás is létezik ezzel
kapcsolatban.
Egyrészt a hétköznapi életben a legtöbb esetben nem tiszta, hanem komplex hangokkal
találkozunk. Ez azt jelenti, hogy a hangok több frekvencia-összetevőt is tartalmaznak. Mivel a
komplex hangok egynél több frekvenciát tartalmaznak, ezért ezek között valószínűleg van
olyan, amelynél jól működik a lokalizáció.
A másik megoldás az, hogy a laboratóriumtól eltérően a hétköznapokban mozgatjuk a
fejünket. A fejmozgás úgy hat a lokalizációra, hogy megváltoztatja a korábban mozdulatlan
hangforrást jellemző interaurális különbségek mintázatát, és ezáltal eloszlatja a hangforrás
helyével kapcsolatos bizonytalanságot.
A monaurális lokalizáció
Attól függően, hogy nyitva vagy csukva van a szemünk, más a cserének az észlelésben
megragadható következménye. Ha csukva van a szemünk, akkor felcseréljük az irányokat,
mivel a pszeudofon mindkét irányból az ellenkező oldali fülbe vezeti a hangot. Ha azonban
nyitva van, és látjuk a hang forrását, akkor a hangot a megfelelő oldalra fogjuk lokalizálni.
● Elsőbbségi hatás
A hangok komplex interakcióban állnak a környezettel: bizonyos tárgyak elnyelik, mások
visszaverik őket.
Fontos kiemelnünk, hogy az elsőbbségi hatás nem azt jelenti, hogy a visszhangokat teljesen
elnyomja az első hang, ugyanis képesek vagyunk meghallani a különbséget a visszhanggal
együtt hangzó és a visszhang nélküli hangok között. Vagyis a visszhang nem azzal jár, hogy két
különálló hangot hallunk, hanem egyetlen, de a visszhang nélkülitől eltérő minőségű hangot
észlelünk. Úgy is értelmezhetjük mindezt, hogy a hallórendszer elnyomja a visszhangot: arra
következtet, hogy a visszhang ugyanannak a hangnak a visszaverődése, és ezért nem kell
figyelembe venni a visszaverődés irányát.
● Binaurális elfedés
A hanglokalizáció mellett egy másik szerepe is van a binaurális hallásnak: segít elkülöníteni az
egyes hangokat a zajos környezet többi hangjától. A hangoknak a zajos környezettől való
elkülönítését néha koktélparti-jelenségnek is szokták hívni. A jelenség a nevét annak a
helyzetnek az alapján kapta, amilyen egy zajos parti. Itt általában sok ember beszél egyszerre,
és nekünk ebből a háttérzajból ki kell tudnunk választani beszélgetőpartnerünk hangját ahhoz,
hogy arra figyelhessünk, amit mond. A legtöbb esetben erre természetesen képesek vagyunk,
annak ellenére, hogy a többiek beszélgetéséből keletkező zaj akár hangosabb is lehet, mint
partnerünk hangja.
Hallási mintázatok és objektumok észlelése
A hallási tárgyak azonosításának legfontosabb problémája, hogy a legtöbb esetben nagyon sok
hang szól egyszerre, és nekünk ezekből kell kiválasztanunk azt, amelyik számunkra valamilyen
okból fontos.
A hallási színtérelemzés
Képzeljük el, hogy egy könnyűzenei koncerten veszünk részt egy koncertteremben: villódznak
a fények, dübörög a zene az óriási hangszórókból, legalább négy hangszer szól egyszerre, és a
többiek körülöttünk együtt énekelnek az énekessel. Ekkor barátunk fülünkbe kiabálva felhívja
a figyelmünket arra, hogy mennyire fantasztikus volt az a gitárszóló, amit a gitáros a refrén
előtt játszott.
Valószínűleg mindenki képes az itt leírt feladatok megvalósítására: tudjuk követni az egész
zenekar játékát, mégpedig a közönség zaja ellenére, tudjuk követni az egyik hangszer hangját
a többi ellenére, sőt bizonyos mértékig még beszélgetni is tudunk, háttérbe szorítva az összes
többi hangot. Ráadásul mindez nem is igazán okoz nehézséget, hanem valójában egy nagyon
is élvezetes tevékenységnek találjuk.
A spektrogram a hangok ábrázolásának egy olyan módja, amely az idő függvényében tünteti
fel a hangok frekvenciáját. A spektogram az idő függvényében ábrázolja az egyes
frekvenciatartományokban található hangenergia mennyiségét, amelyet a söté- tebb és
világosabb foltok fejeznek ki. Minél sötétebb a folt, annál több energiát tartalmaz egy adott
tartomány. Vagyis a spektrogram a hang mindhárom fizikai tulajdonságát képes egyszerre
ábrázolni: a hangerőt, a frekvenciát és az idői lefutást. (A spektogramot szonográf hozza létre.)
A hallási láncok
A hallási tárgyak helyett a továbbiakban a hallási lánc kifejezést fogjuk használni a hallási
észlelés alapegységének megjelölésére. A „tárgy” szó ugyanis nagyon erősen kötődik a vizuális
észleléshez, és ezért félrevezető lehet a hallás tanulmányozásakor.
A hallási láncok tehát a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli
megfelelői. Azokhoz hasonlóan bizonyos összetartozó tulajdonságok csoportját
reprezentálják. Vagyis mindaz a jellemző, amit a hallórendszer feldolgoz (hangerő,
hangmagasság, hangszín, lokalizáció), végül a hallási láncokhoz rendelődik hozzá.
A hallási láncok szekvenciális szerveződése
● Az idő és a frekvencia szerepe a hallási láncok kialakulásában
A láncra bontás jelenségét laboratóriumi körülmények között az alábbi, azóta klasszikussá vált
kísérlettel vizsgálták (Bregman-Campbell 1971). A kísérleti személyeknek egy tiszta hangokból
álló hangsort játszottak le, amely 3 mély és 3 magas hangot tartalmazott. A hangokat úgy
mutatták be, hogy váltogatták a mély és magas hangokat, például 1-4-2-5-3-6 sorrendben (az
1, 2, 3 a mély, a 4, 5, 6 a magas hangokat jelöli). A hangok közötti idői távolságot változtatták,
és azt az eredményt kapták, hogy ennek függvényében megváltozott a hangsor észlelése. Ha
a hangokat nagy idői távolsággal, vagyis lassan játszották le, akkor a személyek az eredeti
sorrendben hallották a hangokat, vagyis a mély és magas hangok váltakozását észlelték. Ha
azonban egyre kisebbre állították az idői távolságot, vagyis egyre gyorsabban játszották le a
hangokat, akkor ez az észlelet megváltozott: már nem váltakozó mély és magas hangokat
hallottak a személyek, hanem egy csak mély hangokat tartalmazó dallamot és egy ezzel
párhuzamosan hallható, csak magas hangokat tartalmazó dallamot. Vagyis az eredeti 1-4-2-5-
3-6 sorrend helyett az 1-2-3 és 4-5-6 észleléséről számoltak be (10.14. ábra). A két
párhuzamosan hallható hallási lánc kialakulása valójában illúzió: két láncot hallunk, holott
csak egy hangforrás szólt. Ezt a jelenséget ezért illuzórikus láncra bontásnak nevezzük,
elkülönítve ezzel a láncra bontásnak attól az általános jelenségétől, amellyel a hallási tárgyakat
elkülönítjük.
Vannak ugyanakkor bizonyos határok, amelyek korlátozzák ezt a választási lehetőséget. Azt a
határt, ami felett a hangokat már nem lehet egy hallási áramlatba szerveződőnek hallani, idői
koherenciahatárnak (IKH), azt a határt pedig, ami alatt nem lehet az egymást követő hangokat
külön áramlatban hallani, hasadási határnak (HH) nevezzük.
A két határt a következőképpen kell értelmeznünk: az idői koherenciahatár azt a határt jelzi,
ahonnan kezdve a hallórendszer mindenképpen a hangsor két láncra bontására kényszerül,
vagyis, akármennyire is szeretnénk, nem vagyunk képesek egy láncba tartozónak hallani a
hangokat. A hasadási határ viszont azt a korlátot jelzi, ami alatt már nem tudjuk a hangsort két
láncra bomlónak hallani, vagyis a hangok mindenképpen egy láncba tartozónak hallatszanak.
● Figura-háttér hatás a láncra bomlásban
Ha létrejönnek a hallási láncok, akkor az az érdekes dolog történik, hogy a két lánc közül csak
az egyikre tudunk figyelni, a másik mintegy a háttérben marad. Ez szintén ismerős jelenség: a
látás esetében a figura-háttér hatásnál találkoztunk már azzal, hogy egyszerre csak egy tárgyra
figyelünk, és minden más a háttérben marad. A láncra bomlásnál is megvalósítható az, hogy
hol az egyik, hol a másik láncra figyeljünk. A nem figyelt lánc kevésbé jól hallható, és kevésbé
vesszük észre, ha valamilyen változás történik benne.
● Egyéb tényezők szerepe a hallási láncok kialakulásában
A hallási láncok szekvenciális szerveződésének célja, hogy az egy hangforráshoz tartozó
hangsorokat csoportosítsa. Láttuk, hogy a csoportosítást a hasonlóság és közelség
szerveződési elvei alapján végezzük el, és elsősorban a hangok közötti idői és frekvenciabeli
távolságot vesszük figyelembe. Ugyanakkor azt, hogy több hang egy hangforráshoz tartozik-e,
egyéb jellemzők is alátámaszthatják. Így például feltételezhető, hogy az azonos téri irányú,
hangosságú vagy hangszínű hangok ugyanabból a forrásból származnak, vagyis egyetlen
akusztikus esemény részei. Nézzük meg, hogy ezek a jellemzők hogyan befolyásolják a láncra
bomlást.
1. Lokalizáció. Ha hangforrások szétválasztásáról beszélünk, akkor azt gondolhatnánk,
hogy ennek leghatékonyabb módja, hogy a hangokat a téri irányuk, vagyis a
lokalizációjuk alapján választjuk el egymástól. Azok a hangok tartoznának egy láncba,
amelyek azonos helyről származnak. Valóban vannak bizonyítékok arra, hogy a hallási
láncra bontásban felhasználjuk a téri információt, de úgy tűnik, hogy nem ez a
legerősebb kulcs. Ez azt jelenti, hogy ha a téri lokalizáció valami miatt konfliktusba
kerül egy másik típusú információval (például a hangok frekvenciájával), akkor nem a
lokalizáció alapján fogjuk a hangokat csoportosítani.
2. Hangosság. A lokalizációhoz hasonlóan a hangosságot is ki tudjuk használni annak
érdekében, hogy csoportosítsuk a feltételezhetően egy hangforrásból származó
hangokat. Egyes vizsgálatok szerint 3-4 dB-es különbség elég ahhoz, hogy a hangokat
külön hallási láncra bontsuk. Ugyanakkor a hangossággal kapcsolatban is azt kell
elmondanunk, mint a lokalizációnál: ez a frekvenciánál gyengébb észlelési kulcs, vagyis,
ha esetleg a hangosság és a frekvencia ellentmond egymásnak, akkor a frekvencia
alapján történő csoportosítás kerül ki győztesen.
3. Hangszín. A lokalizációtól és a hangosságtól eltérően a hangszín nagyon is fontos
jellemző a szekvenciális csoportosításban. A hangok felismerését a hangszín teszi
lehetővé, ez az a jellemző, ami elkülöníti egymástól az azonos hangmagasságon és
hangosságon megszólaló hangszerek hangját. Feltételezhető tehát, hogy lényeges a
szerepe a hangok csoportosításában.
A hallási láncok spektrális szerveződése
A hallási láncok spektrális szerveződése esetén tehát az a kérdés, hogy hogyan bontjuk
részekre az egy időben szóló hangokat. Tudjuk, hogy a komplex hangok alaphangból és
felharmonikusokból állnak. Ha több komplex hang egyszerre szól, akkor egy adott
időpillanatban nagyon sok harmonikus (és több alaphang is) található egyszerre a
hangingerben, és ezek átfedésben vannak egymással. A hallási színtérelemzés feladata ebben
a helyzetben az, hogy ezeket az átfedésben lévő, összekeveredett harmonikusokat
szétválogassa, vagyis megállapítsa azt, hogy melyek járnak együtt, melyek származnak egy
forrásból.
● Az idő és a frekvencia szerepe a spektrális szerveződésben
A kísérlet eredménye szerint az A és B hang akkor került egy láncba, és jött létre két
párhuzamos hallási lánc, ha frekvenciájuk nagyon hasonló volt. Ez ugyanaz az elv, amit az
előzőekben a szekvenciális csoportosításnál láttunk: a hallórendszer azokat a hangokat véli
egy forrásból eredőknek, amelyek hasonló frekvenciával rendelkeznek. Ezzel szemben a B és
C hang akkor került egy láncba, és következésképpen akkor jött létre a kettő kombinációjával
a komplex hang, ha a két hang kezdete – és lehetőség szerint a vége is – egybeesett, vagy más
szóval szinkronban volt. A későbbiekben látni fogjuk, hogy a spektrális szerveződésnél a
harmonikusok időbeli egybeesése játssza az egyik legfontosabb szerepet.
● Egyéb elvek a spektrális szerveződésben
o „Régi plusz új” szabály
Eszerint, ha az éppen hallható frekvenciakomponensek között van egy olyan csoport,
amelyik valamilyen okból egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor
érdemes ezeket egy láncba csoportosítani. A megmaradó komponenseket pedig egy vagy
több másik lánc létrehozására lehet felhasználni.
o Harmonikussági alapelv
Eszerint a hallórendszer hajlamos azokat a harmonikusokat csoportosítani, amelyek
feltételezhetően egy alaphanghoz tartoznak. Tudjuk, hogy a harmonikusok frekvenciája az
alaphang frekvenciájának egész számú többszöröse.
o Közös sors elve
Azt mondja ki, hogy az észlelőrendszer azokat a hangokat fogja csoportosítani, amelyek
egyszerre változnak meg.
o Zártság
A zártság elve a hallás esetében akkor érvényesül, ha a hangokat időlegesen más hangok
elfedik, és emiatt azokról nem áll rendelkezésre szenzoros információ. Ekkor az elfedett hang
mégis folyamatosan hallhatónak tűnik. A zártság elve felelős a folytonosság illúziójáért.
o Kizáró allokáció (hozzátartozóság)
Ezt az elvet azért nevezik hozzátartozóságnak, mert egy hangot, illetve komponenst egyszerre
csak egy tárgyhoz, vagyis hangforráshoz lehet hozzárendelni. A kizáró allokáció viszont arra a
tulajdonságra utal, hogy ha egy hangot egyszer már felhasználtunk egy adott hallási lánc
csoportosítására, akkor azt több lánchoz nem rendelhetjük hozzá. A kizáró allokáció valójában
egy nagyon általános elv, ami a többi csoportosítási elvvel együtt hat: ha egyszer már valamely
másik elv alapján létrejött a csoportosítás, akkor a kizáró allokáció valósítja meg azt, hogy az
egyes hangok ne tartozzanak több lánchoz.
o Hangok téri iránya
Egy szimfonikus zenekar esetében a különböző hangszerek hangjai viszonylag eltérő irányból
származnak. Ez nagymértékben elősegíti a hangszerek hangjának szétválasztását. Ahhoz
azonban, hogy a lokalizáció alapján szét tudjuk választani a hangokat, az szükséges, hogy
minden egyes spektrális komponensnek külön-külön rendelkezésre álljon a téri iránya. Ezen a
feldolgozási szinten ugyanis még nincsenek teljes hangok, vagyis nem tudunk a hangokhoz téri
minőséget rendelni, hiszen éppen azon dolgozunk, hogy ezek a teljes hangok létrejöjjenek.
Szerencsére úgy tűnik, hogy a hallórendszer képes arra, hogy a komplex hangokat felépítő
frekvenciakomponensekhez külön-külön téri irányokat rendeljen, és ha ez megtörtént, akkor
a komponensek téri jellemzőit felhasználhatjuk azok csoportosításában.
ÖSSZEFOGLALÁS
1. A hallási észlelés feladata a világ értelmes, jelentéssel bíró egységekre bontása. Ehhez
egyrészt meg kell határoznunk, hogy hol található a tárgy (lokalizáció), másrészt pedig
meg kell határoznunk, hogy mi az (azonosítás).
2. A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok
forrásának helyét és távolságát megállapítjuk. Mivel a hallási információ nem tartalmaz
egyértelmű téri információkat, a lokalizáció következtetés révén valósul meg. A
lokalizációban binaurális (két füllel észlelhető) vagy monaurális (egy füllel észlelhető)
információkat használunk fel.
3. A binaurális lokalizáció az interaurális hangerőkülönbségen (IHK) és az interaurális idői
különbségen (IIK) alapul. Az IHK a fej árnyékoló hatása miatt, az IIK pedig amiatt jön létre,
hogy a hang a két fület eltérő időben éri el. Mindkét jelzőmozzanat esetében találunk
olyan téri pontokat, amelyek lokalizációja nem egyértelmű. Ezt nevezzük tévesztési
kúpnak. A lokalizáció duplexelmélete szerint a két jelzőmozzanaton alapuló lokalizáció
eltérő frekvenciájú hangok esetében működik jól: a mély hangok esetében inkább az IIK,
a magas hangok esetében viszont az IHK. Valamint van egy olyan frekvenciatartomány
(2000-4000 Hz között), amelyben egyik jelzőmozzanat sem működik megfelelően. Az IIK
esetében ismert a lokalizáció idegi háttere, melyet a késleltetési vonal elmélete ír le.
4. A monaurális lokalizáció a fülkagyló formáján alapul, és elsősorban a függőleges irányú
lokalizációt segíti. A lokalizációban a fülkagyló tekervényeiről visszaverődő hang spektrális
megváltozását használjuk fel, amelyet a fejhez kötött átviteli függvény ír le.
5. A pszeudofonnal végzett vizsgálatok rámutattak arra, hogy a látási információ alapján
történő lokalizáció képes befolyásolni a hallási lokalizációt.
6. A lokalizáció során képesek vagyunk kiszűrni a hangok visszaverődéséből származó
információkat. Ezt kísérletileg az elsőbbségi hatásnak nevezett jelenséggel vizsgálják,
amely szerint, ha a két hang között elég rövid idő telik el, akkor azok összeolvadnak, és
egyetlen hangot hallunk. Az összeolvadt hang lokalizációját az első hang iránya határozza
meg, függetlenül attól, hogy a második hang milyen irányból jött.
7. A binaurális hallás a hanglokalizáció mellett segít elkülöníteni az egyes hangokat a zajos
környezet többi hangjától. A binaurális felfedés jelensége arra vonatkozik, hogy az egyik
fülbe adott zaj csak akkor fedi el a hangot, ha azokat egy forrásba tartozóknak tartjuk.
8. A hangok azonosításához az egyszerre a fülünkbe érkező hangokat különálló hallási
objektumokba, úgynevezett hallási láncokba kell csoportosítanunk. Ezt a hallási
színtérelemzés folyamata valósítja meg. A hallási láncok a hallási észlelés alapegységéül
szolgálnak, és így a tárgyak hallásbeli megfelelői.
9. A hallási színtérelemzés során a perceptuális csoportosítás Gestalt-elvei használjuk fel,
amelyek a hallási információ kétféle szerveződését valósítják meg: a szekvenciális
(horizontális) és a spektrális (vertikális) szerveződést.
10. A szekvenciális szerveződés során az egymást követő hangok összetartozását kell
eldöntenünk. Ez elsősorban a hangok közötti idői és frekvenciatávolságon alapul, de
ezenkívül a hangok lokalizációját, hangosságát és hangszínét is fel tudjuk használni a
hallási láncok csoportosításához.
11. A spektrális szerveződés esetén az a kérdés, hogy hogyan bontjuk részekre az egy időben
szóló hangokat. Ebben szintén az idői és a frekvenciatávolságot használjuk ki, valamint
olyan elveket, mint a „régi plusz új” szabály (ha az éppen hallható frekvenciakomponensek
között van olyan, amely egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor
érdemes ezeket egy láncba csoportosítani), a harmonikussági alapelv (azokat a
harmonikusokat csoportosítjuk egybe, amelyek feltételezhetően egy alaphanghoz
tartoznak) és a közös sors elve (azokat a hangokat csoportosítjuk egybe, amelyek
egyszerre változnak meg).
KULCSFOGALMAK
binaurális felfedés, elsőbbségi hatás, fejhez kötött átviteli függvény, hallási láncok, hallási
színtérelemzés, inte- raurális hangerőkülönbség, interaurális idői különbség, lokalizáció
duplexelmélete, pszeudofon, tévesztési kúp