A Hallási Objektumok Észlelése - Hol És Mi

10.
A hallási objektumok észlelése – hol és mi

(Csépe p. 307.)
Halláslokalizáció
A binaurális lokalizáció
● Az interaurális hangerőkülönbség
● Az interaurális időkülönbség
● A binaurális lokalizáció duplexelmélete
A monaurális lokalizáció
A baniurális lokalizáció speciális esetei
● A hallási és látási lokalizáció interakciója

● Elsőbbségi hatás
● Binaurális elfedés
Hallási mintázatok és objektumok észlelése
A hallási színtérelemzés
A hallási láncok
A hallási láncok szekvenciális szerveződése
● Az idő és a frekvencia szerepe a hallási láncok kialakulásában
● Figura-háttér hatás a láncra bomlásban
● Egyéb tényezők szerepe a hallási láncok kialakulásában
A hallási láncok spektrális szerveződése
● Az idő és a frekvencia szerepe a spektrális szerveződésben
● Egyéb elvek a spektrális szerveződésben
Halláslokalizáció
A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok forrásának

helyét és távolságát megállapítjuk. A hanglokalizáció képessége egyértelmű evolúciós
haszonnal jár, hiszen segít a hangot kiadó tárgyak vagy élőlények megközelítésében (vadászat)
vagy elkerülésében (menekülés). Tudjuk ugyanakkor, hogy mindezt a vizuális rendszer is képes
megvalósítani, sőt azzal az előnnyel is rendelkezik, hogy passzív, vagyis hangokat ki nem
bocsátó tárgyak vagy élőlények helyét is azonosítani tudjuk a segítségével. Emiatt
természetesen a legtöbb esetben a vizuális információt használjuk fel a tárgyak helyének és
távolságának megállapítására, vagyis a látás viszonylagos dominanciával rendelkezik a
hallás felett. A hallás eszerint elsősorban kiegészítő szerepet játszik a lokalizációban, azaz
elsősorban olyan tárgyak helyének megállapítására használjuk, amelyeket nem látunk. Ezért a
hallás alapján történő lokalizáció szerepe elsősorban az, hogy a hangokat kibocsátó tárgyak
helyzetét nagyjából beazonosítsa, és a vizuális figyelmet odairányítsa.
Természetes körülmények között a látás jól ismert dominanciája ellenére is viszonylag
pontosan meg tudjuk határozni a hangforrások helyét és irányát. A hallási lokalizációban a
kulcsszó tehát a következtetés lesz. Míg a látás esetében a tárgyak egymáshoz viszonyított
helyzetének megállapítása nem kíván következtetést, hiszen mindez az információ benne van
a retinán kialakuló képben, addig a hallás esetében különböző következtetési folyamatok
szükségesek, amelyek segítségével rekonstruálható, hogy a tér mely pontjáról származik az
adott hang.
Mielőtt belefognánk annak tanulmányozásába, hogy hogyan is valósul meg a hangforrás
helyének meghatározása, tisztáznunk kell még két alapfogalmat. Az egyik arra vonatkozik,
hogy milyen információt használunk fel a lokalizációban: csak az egyik fülbe érkezőt, vagy
mindkét fülbe érkezőt. Az előbbit monaurális, az utóbbit pedig binaurális észlelésnek
nevezzük. Látni fogjuk, hogy a lokalizációban elsősorban a binaurális, vagyis két- füles
észlelésre támaszkodunk, de monaurális, vagyis egyfüles módon is viszonylag jól működhet
a tárgyak helyének meghatározása.
A másik tisztázandó alapfogalom a hallási térrel kapcsolatos. Annak érdekében, hogy
egyértelműen tudjunk beszélni a hallási térről és a különböző téri helyekről származó
hangokról, érdemes bevezetnünk egy speciális koordináta-rendszert (10.1. ábra). A hallási tér
koordináta-rendszerét a hallgató fejéhez viszonyítjuk, ez kerül a középpontba, és a fejhez
képest három síkot határozunk meg. A horizontális síka fül hallójáratát és a szemet metszi,
és lényegében ez határozza meg az elöl-hátul dimenziót. A frontális sík erre merőleges, és a
fejtetőn halad keresztül, szintén metszve a hallójáratot. A frontális síkon értelmezzük a fent-
lent irányokat. Végül a mediális sík mind a horizontális, mind a frontális síkokra merőleges, és
a fej középvonalán halad át, vagyis mindkét fültől azonos távolságra található. A három sík
metszéspontja nagyjából a fej közepében van, és ez a középpont az egész rendszer
kiindulópontja, minden irányt ehhez viszonyítunk.
A binaurális lokalizáció
Ahogy a bevezetőben már említettük, a hangok lokalizációja úgy működik a legjobban, ha
felhasználjuk a mindkét fülünkbe érkező hallási információt. Két kérdésre kell válaszolnunk,
ha meg akarjuk érteni a lokalizációt: 1. milyen információt használunk fel, és 2. hogyan tesszük
ezt?
Tudjuk, hogy minden hang három alapvető fizikai paraméterrel rendelkezik: hangerővel,
frekvenciával és időtartammal. Ezek közül a hallórendszer a lokalizáció céljára a hangerőt és
az időt használja fel, a frekvencia pedig elsősorban a hallási tárgyak azonosításában játszik
fontos szerepet. A hangok terjedésének fizikai jellemzői miatt, ha egy hang valamilyen
irányban eltér a mediális síktól, például közelebb van a jobb fülhöz, mint a balhoz, akkor két
jellemzőben is változás történik. Egyrészt a hangforráshoz közelebbi fülbe előbb ér el a hang,
másrészt ebben a fülben hangosabb lesz. A két fülbe érkező hang hangerejének eltérését
interaurális hangerőkülönbségnek (IHK), azt a jelenséget pedig, hogy a hangok eltérő
időpillanatban érik el a két fület, interaurális időkülönbségnek (IIK) nevezzük. Fontos
leszögeznünk, hogy annak ellenére, hogy a két fülbe eltérő fizikai jellemzőkkel rendelkező
hangok érkeznek, soha nem két különálló hangot hallunk, hanem mindig csak egyetlen, de
meghatározott téri minőséggel rendelkező hangot.
● Az interaurális hangerőkülönbség
A fülek közötti (interaurális) hangerőkülönbség elsősorban a fej árnyékoló hatásának
köszönhető, mivel a hangforrással ellenkező oldali fülbe érkező hangnak át kell haladnia a
fejen. Az észlelőrendszer a két fülbe érkező inger hangerejének különbségéből következtet
a hangforrás pozíciójára. A helyzet azonban nem ennyire egyszerű: az alacsony frekvenciájú
hangokat ugyanis a koponya nem tudja leárnyékolni.
Az alacsony frekvenciájú hangok esetében a hullámhossz egyre nagyobb lesz, 1000 Hz alatt
már körülbelül 40 cm. Ez tehát azt jelenti, hogy egy 1000 Hz-es hang esetében a hanghullám
két csúcsa között kb. 40 cm van, vagyis ez elég ahhoz, hogy a kb. 20 cm széles emberi
koponyát mintegy „átugorja”. Azaz a fej az 1000 Hz alatti hangokat nem tudja leárnyékolni,
mégpedig azért, mert nem elég nagy ahhoz, hogy a hangok útjába álljon.
Az IHK különböző módszerekkel pontosan meghatározható. Shaw (1974) például úgy mérte
meg, hogy egy mesterséges emberi fejen a fülek helyére mikrofonokat szerelt, majd pedig egy
hangforrást a fej horizontális síkja mentén mozgatott, és a mikrofonokkal rögzítette a
hangforrás által kibocsátott hangokat. Ezt a mérést több frekvenciával is megismételték, és
valóban azt kapták, hogy kb. 500 Hz alatti hangok esetében nem volt lényeges eltérés az IHK-
ban, viszont egy 6000 Hz-es hang esetében az IHK akár a 20 dB-t is elérhette. Vagyis ez a
binaurális jelzőmozzanat elsősorban a magas hangok irányának meghatározását segíti, és ezek
esetében nagyon hatékonyan működik.
● Az interaurális időkülönbség
A hang lokalizációjának másik binaurális jelzőmozzanata az IIK. Ahogy említettük, az IIK abból
az egyszerű tényből származik, hogy a hangforráshoz közelebb lévő fület a hang előbb éri el,
mint az ellenoldali fület. Tudjuk, hogy a fénnyel összehasonlítva a hang viszonylag lassan
terjed (340 m/s a levegőben), és ez vezet ahhoz, hogy a két fül közötti mintegy 20 cm távolság
az érzékelőrendszer számára feldolgozható idői eltérést eredményez.
Az IIK esetében a hallórendszer valójában a két fülbe érkező hang fázisai közötti különbséget
dolgozza fel. Az alacsony frekvenciájú hangok esetében nincs is semmi probléma, a
fáziskülönbség hatékonyan jelzi a hangforrás irányát. A magas frekvenciájú hangoknál viszont
a hullámhossz túl kicsi lesz, azaz kisebb, mint a fej mérete. Ha a hangok hullámhossza kisebb,
mint a két fül közötti távolság (azaz kb. 20 cm), akkor a két fül között a hanghullám több
periódust is leír. Több periódus esetén viszont nem egyértelmű, hogy a fáziskülönbség miből
származik, mivel önmagában csak a fázis nem mondja meg, hogy hány periódus telt el. Ezért
van az, hogy a magas frekvenciájú hangoknál az IIK nem nyújt egyértelmű információt a hang
lokalizációjával kapcsolatban.
● A binaurális lokalizáció duplexelmélete
Mind az IHK, mind az IIK rendelkezik egy olyan korláttal, amely esetében már nem nyújt
hatékony információt a hangok lokalizációjával kapcsolatban. Az IHK esetében ez a mély
hangoknál van így, az IIK-nál viszont a magas hangoknál. Eszerint a mély hangok esetében
inkább az IIK-t tudjuk használni, a magas hangok esetében viszont az IHK-t. Úgy tűnik
ugyanakkor, hogy van egy olyan frekvenciatartomány, amelyben egyik jelzőmozzanat sem
működik megfelelően, vagyis a lokalizáció pontatlan. Stevens és Newman (1934) klasszikus
kísérletükben empirikusan is alátámasztották ezt. Az elméletet azóta a hallási lokalizáció
duplexelméletének nevezték el. Ez az elmélet mára sok és sokféle módszert alkalmazó
vizsgálatban nyert megerősítést.
A hallási lokalizáció kapcsán tehát a duplexelmélet egy újabb hibalehetőséget vet fel: a 2000-
4000 Hz-es hangok esetében az IHK és IIK nem teszi lehetővé a megfelelő lokalizációt. Egy
másik problémával már korábban találkoztunk. Láttuk, hogy mind az IHK, mind az IIK esetében
léteznek a hallási térnek olyan pontjai, amelyek nem teszik lehetővé az egyértelmű
lokalizációt. Ezek együttesét neveztük tévesztési kúpnak. Hogyan lehetséges, hogy mindezek
ellenére a hangok lokalizációja mégis jól működik? Három megoldás is létezik ezzel
kapcsolatban.
Egyrészt a hétköznapi életben a legtöbb esetben nem tiszta, hanem komplex hangokkal
találkozunk. Ez azt jelenti, hogy a hangok több frekvencia-összetevőt is tartalmaznak. Mivel a
komplex hangok egynél több frekvenciát tartalmaznak, ezért ezek között valószínűleg van
olyan, amelynél jól működik a lokalizáció.
A másik megoldás az, hogy a laboratóriumtól eltérően a hétköznapokban mozgatjuk a
fejünket. A fejmozgás úgy hat a lokalizációra, hogy megváltoztatja a korábban mozdulatlan
hangforrást jellemző interaurális különbségek mintázatát, és ezáltal eloszlatja a hangforrás
helyével kapcsolatos bizonytalanságot.
Végül a harmadik megoldás az lehet, hogy a hangok lokalizációjában felhasználjuk az

egyetlen fülből származó téri jelzőmozzanatokat, azaz a monaurális lokalizációt.
A monaurális lokalizáció
A monaurális lokalizáció a fülkagyló formáján alapul. A fülkagyló elsősorban a függőleges,

vagyis frontális síkban való lokalizációt segíti. Az utóbbi évek kutatásai kiderítették, hogy a
lokalizációban ki tudjuk használni azt a jelenséget, hogy a fülkagyló speciális tekervényein a
hang a hallójáratba való lépése előtt ide-oda verődik. Ezeknek a visszaverődéseknek a
mintázata megváltozik attól függően, hogy a hang milyen irányból származik, így ennek
figyelembevételével következtetni lehet a hangforrás helyére.
A fülkagyló hatása egyfajta szűrőként értelmezhető: bizonyos frekvenciák felerősödnek,

mások viszont halkabbak lesznek, vagyis a hang spektrális tartalma kismértékben megváltozik.
A hang spektrális tartalmának megváltozása a fülkagyló, a fej és a hang irányának komplex
interakciójából származik. Ezek hatását összefoglalóan fejhez kötött átviteli függvénynek
(FKÁF) nevezzük.
Az FKÁF-nek többszörös funkciója van. Egyrészt, lehetővé teszi a hangok lokalizációját. A
hangok ugyanis téri irányuktól függően eltérő FKÁF-fel rendelkeznek, mivel az eltérő irányból
származó hangok eltérő visszaverődési mintázatot hoznak létre. Másrészt, az FKÁF jelenléte
utal arra, hogy a hang valóban a külvilágból érkezett. Mivel a fülkagyló és a tekervények alakja
egyénenként változik, ebből következően az FKÁF is mindenkinél más, és egyfajta, az
ujjlenyomat analógiájaként „füllenyomatnak” nevezett mintázattal jellemezhető. A kísérleti
eredmények arra is utalnak, hogy a hallási tárgyak helyének észlelése tanult: az évek során
megtanuljuk, hogy hogyan alkalmazzuk a fülkagyló speciális spektrális aláírását a hangok
lokalizációjában. Ha viszont az FKÁF lokalizációban való felhasználása tanult, akkor
feltételezhetjük, hogy akár újra is tanulható.
A binaurális lokalizáció speciális esetei
● A hallási és látási lokalizáció interakciója
Az ezzel kapcsolatos bizonyítékok elsősorban olyan szituációkból származnak, amelyekben a

hallási és látási információ ellentmond egymásnak. Erre egy hétköznapi példa lehet a mozi
esete. A mozikban még a mai modern hangrendszerek korában sem lehet maradéktalanul
megvalósítani azt, hogy a hangok a mozivászon közepéről származzanak. Ennek ellenére a
főhős beszédét mindig úgy halljuk, mintha az a szájából eredne. Vagyis a méregdrága
hangrendszer sajnos nem tudja becsapni az észlelőrendszerünket, és a látás minden esetben
„felülírja” a hallást.
A látás téri lokalizációban mutatott dominanciáját a pszeudofonnal végzett klasszikus kísérlet
(Young 1928) bizonyította. A kísérletben egy olyan, pszeudofonnak (álmikrofon) nevezett
eszközt alkalmaztak, amely összecseréli a két fülbe jutó hallási bemenetet. Vagyis a jobb
oldalról érkező hangokat a bal fülbe, a bal oldalról érkezőket pedig a jobba vezeti.
Attól függően, hogy nyitva vagy csukva van a szemünk, más a cserének az észlelésben
megragadható következménye. Ha csukva van a szemünk, akkor felcseréljük az irányokat,
mivel a pszeudofon mindkét irányból az ellenkező oldali fülbe vezeti a hangot. Ha azonban
nyitva van, és látjuk a hang forrását, akkor a hangot a megfelelő oldalra fogjuk lokalizálni.
● Elsőbbségi hatás
A hangok komplex interakcióban állnak a környezettel: bizonyos tárgyak elnyelik, mások
visszaverik őket.
Fontos kiemelnünk, hogy az elsőbbségi hatás nem azt jelenti, hogy a visszhangokat teljesen
elnyomja az első hang, ugyanis képesek vagyunk meghallani a különbséget a visszhanggal
együtt hangzó és a visszhang nélküli hangok között. Vagyis a visszhang nem azzal jár, hogy két
különálló hangot hallunk, hanem egyetlen, de a visszhang nélkülitől eltérő minőségű hangot
észlelünk. Úgy is értelmezhetjük mindezt, hogy a hallórendszer elnyomja a visszhangot: arra
következtet, hogy a visszhang ugyanannak a hangnak a visszaverődése, és ezért nem kell
figyelembe venni a visszaverődés irányát.
● Binaurális elfedés
A hanglokalizáció mellett egy másik szerepe is van a binaurális hallásnak: segít elkülöníteni az
egyes hangokat a zajos környezet többi hangjától. A hangoknak a zajos környezettől való
elkülönítését néha koktélparti-jelenségnek is szokták hívni. A jelenség a nevét annak a
helyzetnek az alapján kapta, amilyen egy zajos parti. Itt általában sok ember beszél egyszerre,
és nekünk ebből a háttérzajból ki kell tudnunk választani beszélgetőpartnerünk hangját ahhoz,
hogy arra figyelhessünk, amit mond. A legtöbb esetben erre természetesen képesek vagyunk,
annak ellenére, hogy a többiek beszélgetéséből keletkező zaj akár hangosabb is lehet, mint
partnerünk hangja.
Hallási mintázatok és objektumok észlelése
A hallási tárgyak azonosításának legfontosabb problémája, hogy a legtöbb esetben nagyon sok
hang szól egyszerre, és nekünk ezekből kell kiválasztanunk azt, amelyik számunkra valamilyen
okból fontos.
A hallási színtérelemzés
Képzeljük el, hogy egy könnyűzenei koncerten veszünk részt egy koncertteremben: villódznak
a fények, dübörög a zene az óriási hangszórókból, legalább négy hangszer szól egyszerre, és a
többiek körülöttünk együtt énekelnek az énekessel. Ekkor barátunk fülünkbe kiabálva felhívja
a figyelmünket arra, hogy mennyire fantasztikus volt az a gitárszóló, amit a gitáros a refrén
előtt játszott.
Valószínűleg mindenki képes az itt leírt feladatok megvalósítására: tudjuk követni az egész
zenekar játékát, mégpedig a közönség zaja ellenére, tudjuk követni az egyik hangszer hangját
a többi ellenére, sőt bizonyos mértékig még beszélgetni is tudunk, háttérbe szorítva az összes
többi hangot. Ráadásul mindez nem is igazán okoz nehézséget, hanem valójában egy nagyon
is élvezetes tevékenységnek találjuk.
A spektrogram a hangok ábrázolásának egy olyan módja, amely az idő függvényében tünteti
fel a hangok frekvenciáját. A spektogram az idő függvényében ábrázolja az egyes
frekvenciatartományokban található hangenergia mennyiségét, amelyet a söté- tebb és
világosabb foltok fejeznek ki. Minél sötétebb a folt, annál több energiát tartalmaz egy adott
tartomány. Vagyis a spektrogram a hang mindhárom fizikai tulajdonságát képes egyszerre
ábrázolni: a hangerőt, a frekvenciát és az idői lefutást. (A spektogramot szonográf hozza létre.)
A hallási láncok
A hallási tárgyak helyett a továbbiakban a hallási lánc kifejezést fogjuk használni a hallási
észlelés alapegységének megjelölésére. A „tárgy” szó ugyanis nagyon erősen kötődik a vizuális
észleléshez, és ezért félrevezető lehet a hallás tanulmányozásakor.
A hallási láncok tehát a hallási észlelés alapegységéül szolgálnak, és így a tárgyak hallásbeli
megfelelői. Azokhoz hasonlóan bizonyos összetartozó tulajdonságok csoportját
reprezentálják. Vagyis mindaz a jellemző, amit a hallórendszer feldolgoz (hangerő,
hangmagasság, hangszín, lokalizáció), végül a hallási láncokhoz rendelődik hozzá.
A hallási láncok szekvenciális szerveződése
● Az idő és a frekvencia szerepe a hallási láncok kialakulásában
Azt a folyamatot, amelynek során az észlelőrendszer az egyes láncokat egymástól elválasztja,

hallási láncra bontásnak nevezzük.
A láncra bontás jelenségét laboratóriumi körülmények között az alábbi, azóta klasszikussá vált
kísérlettel vizsgálták (Bregman-Campbell 1971). A kísérleti személyeknek egy tiszta hangokból
álló hangsort játszottak le, amely 3 mély és 3 magas hangot tartalmazott. A hangokat úgy
mutatták be, hogy váltogatták a mély és magas hangokat, például 1-4-2-5-3-6 sorrendben (az
1, 2, 3 a mély, a 4, 5, 6 a magas hangokat jelöli). A hangok közötti idői távolságot változtatták,
és azt az eredményt kapták, hogy ennek függvényében megváltozott a hangsor észlelése. Ha
a hangokat nagy idői távolsággal, vagyis lassan játszották le, akkor a személyek az eredeti
sorrendben hallották a hangokat, vagyis a mély és magas hangok váltakozását észlelték. Ha
azonban egyre kisebbre állították az idői távolságot, vagyis egyre gyorsabban játszották le a
hangokat, akkor ez az észlelet megváltozott: már nem váltakozó mély és magas hangokat
hallottak a személyek, hanem egy csak mély hangokat tartalmazó dallamot és egy ezzel
párhuzamosan hallható, csak magas hangokat tartalmazó dallamot. Vagyis az eredeti 1-4-2-5-
3-6 sorrend helyett az 1-2-3 és 4-5-6 észleléséről számoltak be (10.14. ábra). A két
párhuzamosan hallható hallási lánc kialakulása valójában illúzió: két láncot hallunk, holott
csak egy hangforrás szólt. Ezt a jelenséget ezért illuzórikus láncra bontásnak nevezzük,
elkülönítve ezzel a láncra bontásnak attól az általános jelenségétől, amellyel a hallási tárgyakat
elkülönítjük.
Az illuzórikus láncra bomlásnál a láncok kialakulását két tényező befolyásolta: egyrészt a

hangok frekvenciája, másrészt pedig a közöttük lévő idői távolság. Ez a két tényező egyszerre
határozza meg, hogy az egymást követő hangok egy láncba tartoznak-e (egybeolvadás), vagy
szétválnak két külön láncra (szétválás). A szétváláshoz ugyanis nem elég, ha megfelelő
gyorsasággal játsszuk le a hangokat, az is szükséges, hogy közöttük elég nagy frekvenciabeli
eltérés legyen. Egyfajta kompromisszum valósul meg a frekvencia és idő között: minél
nagyobb a frekvenciabeli távolság, annál kevésbé kell gyorsan lejátszani a hangokat a
szétváláshoz, és minél kisebb a frekvenciabeli távolság, annál gyorsabban kell lejátszani őket.
Vannak ugyanakkor bizonyos határok, amelyek korlátozzák ezt a választási lehetőséget. Azt a
határt, ami felett a hangokat már nem lehet egy hallási áramlatba szerveződőnek hallani, idői
koherenciahatárnak (IKH), azt a határt pedig, ami alatt nem lehet az egymást követő hangokat
külön áramlatban hallani, hasadási határnak (HH) nevezzük.
A két határt a következőképpen kell értelmeznünk: az idői koherenciahatár azt a határt jelzi,
ahonnan kezdve a hallórendszer mindenképpen a hangsor két láncra bontására kényszerül,
vagyis, akármennyire is szeretnénk, nem vagyunk képesek egy láncba tartozónak hallani a
hangokat. A hasadási határ viszont azt a korlátot jelzi, ami alatt már nem tudjuk a hangsort két
láncra bomlónak hallani, vagyis a hangok mindenképpen egy láncba tartozónak hallatszanak.
● Figura-háttér hatás a láncra bomlásban
Ha létrejönnek a hallási láncok, akkor az az érdekes dolog történik, hogy a két lánc közül csak
az egyikre tudunk figyelni, a másik mintegy a háttérben marad. Ez szintén ismerős jelenség: a
látás esetében a figura-háttér hatásnál találkoztunk már azzal, hogy egyszerre csak egy tárgyra
figyelünk, és minden más a háttérben marad. A láncra bomlásnál is megvalósítható az, hogy
hol az egyik, hol a másik láncra figyeljünk. A nem figyelt lánc kevésbé jól hallható, és kevésbé
vesszük észre, ha valamilyen változás történik benne.
● Egyéb tényezők szerepe a hallási láncok kialakulásában
A hallási láncok szekvenciális szerveződésének célja, hogy az egy hangforráshoz tartozó
hangsorokat csoportosítsa. Láttuk, hogy a csoportosítást a hasonlóság és közelség
szerveződési elvei alapján végezzük el, és elsősorban a hangok közötti idői és frekvenciabeli
távolságot vesszük figyelembe. Ugyanakkor azt, hogy több hang egy hangforráshoz tartozik-e,
egyéb jellemzők is alátámaszthatják. Így például feltételezhető, hogy az azonos téri irányú,
hangosságú vagy hangszínű hangok ugyanabból a forrásból származnak, vagyis egyetlen
akusztikus esemény részei. Nézzük meg, hogy ezek a jellemzők hogyan befolyásolják a láncra
bomlást.
1. Lokalizáció. Ha hangforrások szétválasztásáról beszélünk, akkor azt gondolhatnánk,
hogy ennek leghatékonyabb módja, hogy a hangokat a téri irányuk, vagyis a
lokalizációjuk alapján választjuk el egymástól. Azok a hangok tartoznának egy láncba,
amelyek azonos helyről származnak. Valóban vannak bizonyítékok arra, hogy a hallási
láncra bontásban felhasználjuk a téri információt, de úgy tűnik, hogy nem ez a
legerősebb kulcs. Ez azt jelenti, hogy ha a téri lokalizáció valami miatt konfliktusba
kerül egy másik típusú információval (például a hangok frekvenciájával), akkor nem a
lokalizáció alapján fogjuk a hangokat csoportosítani.
2. Hangosság. A lokalizációhoz hasonlóan a hangosságot is ki tudjuk használni annak
érdekében, hogy csoportosítsuk a feltételezhetően egy hangforrásból származó
hangokat. Egyes vizsgálatok szerint 3-4 dB-es különbség elég ahhoz, hogy a hangokat
külön hallási láncra bontsuk. Ugyanakkor a hangossággal kapcsolatban is azt kell
elmondanunk, mint a lokalizációnál: ez a frekvenciánál gyengébb észlelési kulcs, vagyis,
ha esetleg a hangosság és a frekvencia ellentmond egymásnak, akkor a frekvencia
alapján történő csoportosítás kerül ki győztesen.
3. Hangszín. A lokalizációtól és a hangosságtól eltérően a hangszín nagyon is fontos
jellemző a szekvenciális csoportosításban. A hangok felismerését a hangszín teszi
lehetővé, ez az a jellemző, ami elkülöníti egymástól az azonos hangmagasságon és
hangosságon megszólaló hangszerek hangját. Feltételezhető tehát, hogy lényeges a
szerepe a hangok csoportosításában.
A hallási láncok spektrális szerveződése
A hallási láncok spektrális szerveződése esetén tehát az a kérdés, hogy hogyan bontjuk
részekre az egy időben szóló hangokat. Tudjuk, hogy a komplex hangok alaphangból és
felharmonikusokból állnak. Ha több komplex hang egyszerre szól, akkor egy adott
időpillanatban nagyon sok harmonikus (és több alaphang is) található egyszerre a
hangingerben, és ezek átfedésben vannak egymással. A hallási színtérelemzés feladata ebben
a helyzetben az, hogy ezeket az átfedésben lévő, összekeveredett harmonikusokat
szétválogassa, vagyis megállapítsa azt, hogy melyek járnak együtt, melyek származnak egy
forrásból.
● Az idő és a frekvencia szerepe a spektrális szerveződésben
Bregman és Pinker (1978) a következő kísérletet végezték el a spektrális tartalom

csoportosításának szabályszerűségeit feltárandó. A kísérleti személyeknek három különböző
frekvenciájú tiszta hangot mutattak be. A hangokat sokszor ismételték. Ez az ingerminta
kétféle észlelethez vezethet: egyrészt hallhatunk egy tiszta hangot (A), amelyet egy két
frekvenciakomponensből (B és C) álló komplex hang követ.
A kísérlet eredménye szerint az A és B hang akkor került egy láncba, és jött létre két
párhuzamos hallási lánc, ha frekvenciájuk nagyon hasonló volt. Ez ugyanaz az elv, amit az
előzőekben a szekvenciális csoportosításnál láttunk: a hallórendszer azokat a hangokat véli
egy forrásból eredőknek, amelyek hasonló frekvenciával rendelkeznek. Ezzel szemben a B és
C hang akkor került egy láncba, és következésképpen akkor jött létre a kettő kombinációjával
a komplex hang, ha a két hang kezdete – és lehetőség szerint a vége is – egybeesett, vagy más
szóval szinkronban volt. A későbbiekben látni fogjuk, hogy a spektrális szerveződésnél a
harmonikusok időbeli egybeesése játssza az egyik legfontosabb szerepet.
● Egyéb elvek a spektrális szerveződésben
o „Régi plusz új” szabály
Eszerint, ha az éppen hallható frekvenciakomponensek között van egy olyan csoport,
amelyik valamilyen okból egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor
érdemes ezeket egy láncba csoportosítani. A megmaradó komponenseket pedig egy vagy
több másik lánc létrehozására lehet felhasználni.
o Harmonikussági alapelv
Eszerint a hallórendszer hajlamos azokat a harmonikusokat csoportosítani, amelyek
feltételezhetően egy alaphanghoz tartoznak. Tudjuk, hogy a harmonikusok frekvenciája az
alaphang frekvenciájának egész számú többszöröse.
o Közös sors elve
Azt mondja ki, hogy az észlelőrendszer azokat a hangokat fogja csoportosítani, amelyek
egyszerre változnak meg.
o Zártság
A zártság elve a hallás esetében akkor érvényesül, ha a hangokat időlegesen más hangok
elfedik, és emiatt azokról nem áll rendelkezésre szenzoros információ. Ekkor az elfedett hang
mégis folyamatosan hallhatónak tűnik. A zártság elve felelős a folytonosság illúziójáért.
o Kizáró allokáció (hozzátartozóság)
Ezt az elvet azért nevezik hozzátartozóságnak, mert egy hangot, illetve komponenst egyszerre
csak egy tárgyhoz, vagyis hangforráshoz lehet hozzárendelni. A kizáró allokáció viszont arra a
tulajdonságra utal, hogy ha egy hangot egyszer már felhasználtunk egy adott hallási lánc
csoportosítására, akkor azt több lánchoz nem rendelhetjük hozzá. A kizáró allokáció valójában
egy nagyon általános elv, ami a többi csoportosítási elvvel együtt hat: ha egyszer már valamely
másik elv alapján létrejött a csoportosítás, akkor a kizáró allokáció valósítja meg azt, hogy az
egyes hangok ne tartozzanak több lánchoz.
o Hangok téri iránya
Egy szimfonikus zenekar esetében a különböző hangszerek hangjai viszonylag eltérő irányból
származnak. Ez nagymértékben elősegíti a hangszerek hangjának szétválasztását. Ahhoz
azonban, hogy a lokalizáció alapján szét tudjuk választani a hangokat, az szükséges, hogy
minden egyes spektrális komponensnek külön-külön rendelkezésre álljon a téri iránya. Ezen a
feldolgozási szinten ugyanis még nincsenek teljes hangok, vagyis nem tudunk a hangokhoz téri
minőséget rendelni, hiszen éppen azon dolgozunk, hogy ezek a teljes hangok létrejöjjenek.
Szerencsére úgy tűnik, hogy a hallórendszer képes arra, hogy a komplex hangokat felépítő
frekvenciakomponensekhez külön-külön téri irányokat rendeljen, és ha ez megtörtént, akkor
a komponensek téri jellemzőit felhasználhatjuk azok csoportosításában.
ÖSSZEFOGLALÁS
1. A hallási észlelés feladata a világ értelmes, jelentéssel bíró egységekre bontása. Ehhez
egyrészt meg kell határoznunk, hogy hol található a tárgy (lokalizáció), másrészt pedig
meg kell határoznunk, hogy mi az (azonosítás).
2. A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok
forrásának helyét és távolságát megállapítjuk. Mivel a hallási információ nem tartalmaz
egyértelmű téri információkat, a lokalizáció következtetés révén valósul meg. A
lokalizációban binaurális (két füllel észlelhető) vagy monaurális (egy füllel észlelhető)
információkat használunk fel.
3. A binaurális lokalizáció az interaurális hangerőkülönbségen (IHK) és az interaurális idői
különbségen (IIK) alapul. Az IHK a fej árnyékoló hatása miatt, az IIK pedig amiatt jön létre,
hogy a hang a két fület eltérő időben éri el. Mindkét jelzőmozzanat esetében találunk
olyan téri pontokat, amelyek lokalizációja nem egyértelmű. Ezt nevezzük tévesztési
kúpnak. A lokalizáció duplexelmélete szerint a két jelzőmozzanaton alapuló lokalizáció
eltérő frekvenciájú hangok esetében működik jól: a mély hangok esetében inkább az IIK,
a magas hangok esetében viszont az IHK. Valamint van egy olyan frekvenciatartomány
(2000-4000 Hz között), amelyben egyik jelzőmozzanat sem működik megfelelően. Az IIK
esetében ismert a lokalizáció idegi háttere, melyet a késleltetési vonal elmélete ír le.
4. A monaurális lokalizáció a fülkagyló formáján alapul, és elsősorban a függőleges irányú
lokalizációt segíti. A lokalizációban a fülkagyló tekervényeiről visszaverődő hang spektrális
megváltozását használjuk fel, amelyet a fejhez kötött átviteli függvény ír le.
5. A pszeudofonnal végzett vizsgálatok rámutattak arra, hogy a látási információ alapján
történő lokalizáció képes befolyásolni a hallási lokalizációt.
6. A lokalizáció során képesek vagyunk kiszűrni a hangok visszaverődéséből származó
információkat. Ezt kísérletileg az elsőbbségi hatásnak nevezett jelenséggel vizsgálják,
amely szerint, ha a két hang között elég rövid idő telik el, akkor azok összeolvadnak, és
egyetlen hangot hallunk. Az összeolvadt hang lokalizációját az első hang iránya határozza
meg, függetlenül attól, hogy a második hang milyen irányból jött.
7. A binaurális hallás a hanglokalizáció mellett segít elkülöníteni az egyes hangokat a zajos
környezet többi hangjától. A binaurális felfedés jelensége arra vonatkozik, hogy az egyik
fülbe adott zaj csak akkor fedi el a hangot, ha azokat egy forrásba tartozóknak tartjuk.
8. A hangok azonosításához az egyszerre a fülünkbe érkező hangokat különálló hallási
objektumokba, úgynevezett hallási láncokba kell csoportosítanunk. Ezt a hallási
színtérelemzés folyamata valósítja meg. A hallási láncok a hallási észlelés alapegységéül
szolgálnak, és így a tárgyak hallásbeli megfelelői.
9. A hallási színtérelemzés során a perceptuális csoportosítás Gestalt-elvei használjuk fel,
amelyek a hallási információ kétféle szerveződését valósítják meg: a szekvenciális
(horizontális) és a spektrális (vertikális) szerveződést.
10. A szekvenciális szerveződés során az egymást követő hangok összetartozását kell
eldöntenünk. Ez elsősorban a hangok közötti idői és frekvenciatávolságon alapul, de
ezenkívül a hangok lokalizációját, hangosságát és hangszínét is fel tudjuk használni a
hallási láncok csoportosításához.
11. A spektrális szerveződés esetén az a kérdés, hogy hogyan bontjuk részekre az egy időben
szóló hangokat. Ebben szintén az idői és a frekvenciatávolságot használjuk ki, valamint
olyan elveket, mint a „régi plusz új” szabály (ha az éppen hallható frekvenciakomponensek
között van olyan, amely egy előzőleg elhangzott hang jó folytatásának tekinthető, akkor
érdemes ezeket egy láncba csoportosítani), a harmonikussági alapelv (azokat a
harmonikusokat csoportosítjuk egybe, amelyek feltételezhetően egy alaphanghoz
tartoznak) és a közös sors elve (azokat a hangokat csoportosítjuk egybe, amelyek
egyszerre változnak meg).
KULCSFOGALMAK
binaurális felfedés, elsőbbségi hatás, fejhez kötött átviteli függvény, hallási láncok, hallási
színtérelemzés, inte- raurális hangerőkülönbség, interaurális idői különbség, lokalizáció
duplexelmélete, pszeudofon, tévesztési kúp

A Hallási Objektumok Észlelése - Hol És Mi

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

A Hallási Objektumok Észlelése - Hol És Mi

Uploaded by

Copyright:

Available Formats

10.

A hallási objektumok észlelése – hol és mi

● A hallási és látási lokalizáció interakciója

A hanglokalizáció az a folyamat, amelynek során a környezetből származó hangok forrásának

Végül a harmadik megoldás az lehet, hogy a hangok lokalizációjában felhasználjuk az

A monaurális lokalizáció a fülkagyló formáján alapul. A fülkagyló elsősorban a függőleges,

A fülkagyló hatása egyfajta szűrőként értelmezhető: bizonyos frekvenciák felerősödnek,

Az ezzel kapcsolatos bizonyítékok elsősorban olyan szituációkból származnak, amelyekben a

Azt a folyamatot, amelynek során az észlelőrendszer az egyes láncokat egymástól elválasztja,

Az illuzórikus láncra bomlásnál a láncok kialakulását két tényező befolyásolta: egyrészt a

Bregman és Pinker (1978) a következő kísérletet végezték el a spektrális tartalom

You might also like