Csak 2 fülünk van(?)

2011/05/22 21:22 Giczy Gergő

Épp a minap olvashattuk az Indexen, hogy a legújabb TV szabvány - a jelentősen megnövelt felbontás mellett - 24 csatornás hangot biztosít.
Kérdés megint: minek ennyi hangszóró, ha úgyis csak 2 fülünk van? A válasz egyszerű, de azért nem annyira: közérthető magyarázat következik.


Pontosan hány fülünk van?

Mielőtt bárki is azt gondolná vagy szájára venne érte, hogy ezt miért én és most kezdem feszegetni, előrebocsátom, hogy a kérdés nem újkeletű. Annyira nem, hogy valahányszor - persze 2-n, tehát stereo-n felül - emelkedett a rendelkezésre álló hangcsatornák száma, annyiszor bizonygatta valaki, hogy ez bizony fölösleges. És - megmondom őszintén - egy 2000. januári Chip Magazin-os hangkártya tesztet (Giczy Gergő: Hanghatár - kivonata Spiller László jóvoltából blogján olvasható - melyben már szerepeltek többcsatornás darabok is) követően először, majd tíz év múltán a mostani Index-cikk nyomán másodszor én is ezért kezdtem el ezt (ismét) átgondolni.

Mert csak 2 fülünk van. Vagy mégsem? Erről szól ez a cikk, a teljesség igénye nélkül, a közérthetőséget előtérbe helyezve. Tehát senki ne vesse a szememre, hogy ez vagy az kimaradt, mert nem keményvonalas szakszöveg, hanem mese következik arról, hogyan és miért lett 1-ből 2, majd 4-5-6, 7, 9-10-12 (plusz 1-2), végül - úgy tűnik - nemsokára 22 plusz 2 fülünk a két (szép) szemünk mellé.

Dupla élvezet

Kezdetben volt 1 hangcsatorna, irány nélküli és/vagy körbe sugárzó, mely egyidős a diszkrét hangforrással. Vagyis mióta hangvezető közeg (például levegő) és hangfelfogó/-értelmező lényezet (például ember, de persze bizonyos állatok is) létezik, azóta van mono (monaural) hang. Bár csak azóta hívják így, mióta 1857-ben bizonyos Édouard-Léon Scott de Martinville megalkotta az első hangrögzítő/-lejátszó szerkezetet, a phonautograph nevű készüléket. Kifejezetten pedig azóta különböztetik meg az egy csatornás hangot, mióta - mily meglepő - ennél több hangcsatorna is rendelkezésre áll.


Phonautograph Az első hangrögzítő/-lejátszó szerkezet és feltalálója

A 2 hangcsatorna, tehát stereo (stereophonic) mint fogalom 1927 óta létezik. Az 1930-as években már alkalmazásai is voltak - az első fennmaradt stereo felvétel 1932-ből való, Alexander Scriabin Prometheus: Poem of Fire című művének rögzített változata. (Ugyanebben az időben voltak kísérletek 3, később még plusz további csatornás stereo hanggal és egyéb különlegességekkel is, de most ez itt nem téma - a Wikipedia Stereophonic sound szócikkében utána lehet nézni.) De a technológia széleskörű elterjedésére még az 1950-60-as évekig várni kellett, a technikai feltételek, úgymint a rögzítés-továbbítás-lejátszás trió összetevőinek egyaránt való duplázásának megvalósulásáig. (Ennek megoldása szintén itt nem téma, ámbár technikatörténetileg ugyancsak érdekes, akármelyik elemét is nézzük az említett triónak - gondoljunk csak a hagyományos lemezjátszó 1 tűvel 2 hangsáv "szedésének" bravúrjára, vagy az áthallás nélküli rádiófrekvenciás továbbítás megoldandó nehézségeire, vagy akár arra a triviális dologra, hogy minden valamirevaló lejátszónál immár 2 hangszóróval és persze 2 csatornás meghajtásukkal kellett foglalkozni.)


Grundig RR 650/660 Stereo
A "kijelző" jobb oldalán a hangolást és a stereo lejátszást jelző LED

A mono-stereo közötti különbséget nem lehet elég jól szavakkal kifejezni.
A hétköznapokban leginkább akkor érthetjük meg, ha egy olyan rádióadót hallgatunk, amelyet legalább két oldali hangszóróból hallható vevőkészülékünk (hordozható-fülhallgatós, autórádió stb.) nem "fog" teljesen jól. Ilyenkor a mai rádióvevők mono üzemmódra váltanak, és amikor mégis egyszercsak rendesen "bejön" az adás, és a stereo jel (OO) kigyullad, hirtelen kitágul a tér körülöttünk.

2 fül

Eddig a pontig megegyezik a hangcsatornák és a fülek száma - ennyi bevezető után az érdekesség itt kezdődik.
Tehát minek ennyi hangszóró, ha úgyis csak 2 fülünk van? Közelítsük meg a másik oldalról a kérdést: Ha csak 2 fülünk van, hogyan tudnak nemcsak bal-jobb, hanem elöl-hátul, sőt fent-lent irányokat is megkülönböztetni? A válasz tényleg egyszerű: sehogy.
És paradox módon pont ez az oka, hogy a 2 fül - 2 hangszóró kombóból sohasem lesz igazi térbeli hangérzékelés.

Mert a fül - bármily csodálatos szerv is - hallás szempontból kizárólag a hang felfogására alkalmas, miközben annak valódi érzékelése - hasonlóan a látáshoz, de több dolog miatt sem ugyanúgy (az eltérő közeg mellett más metódus is) - végső soron az agyban történik meg. Mivel nem vagyok anatómus (vagyis a testemet én csak vezetem, de hogy mitől megy, nem tudom), e szervek pontos működésén "csöndben" lépjünk túl, és tekintsünk feldolgozási szempontból a folyamatra.

Szóval a füleken beérkeznek a mindenfelől jövő hangok. (A fülön kívül érzékelt hangoktól most tekintsünk el, de hamarosan - éppen a hangszórók kapcsán - lesz róluk szó.)
Ezek a hallójáratokban, de legkésőbb a dobhártyák belső oldalán már egyetlen (azaz két fülön összesen kettő) eredő hanghullámként jelentkeznek. Vagyis a hallójáratokba bejutó hang már tartalmazza azokat az információkat, amelyekből majd az agy vissza tudja fejteni az egyszerre jelen lévő egyes komponensek (például élőszó, vonatzakatolás, harangozás stb.) forrásának irányát és/vagy sebességét. (Ugyancsak itt nem téma, hogy pontosan a hang mely jellemzői mutatják a térbeliséget - a legmarkánsabbak a fülek közötti hangerő- és fáziskülönbségek.)

És pont ebből adódik a kérdés, immár bővebben:
Ha a 2 fülön beérkező, a valós környezet által "feldolgozott" igazi térbeli hang végül is csak 2 hallójáraton átjutva rezegteti meg a 2 dobhártyát, akkor e felfogó szerveket miért is nem lehet egy leképezett környezet szerint virtuálisan térbelivé elő-feldolgozott hangot kibocsátó 2 hangszóróval "meghajtani"?
A válasz pedig:

A fülkagyló

A virtuálisan tárbelivé elő-feldolgozott hanggal az a probléma, hogy az adott leképezett környezet szerint - tökéletes. Erről az ASP/DSP (Audio/Digital Signal Processing) áramkörök és/vagy szoftverek gondoskodnak, amelyek hiba, vagyis az élőlények érzékelését befolyásoló tényezők nélkül állítják elő a kívánt eredő hullámformát.
Igen ám, de mihez képest, még inkább kinek a számára tökéletes? Nekem? Önnek? A Kölyköknek a hátsó udvarból?

És itt jön a képbe az "emberi tényező".
Sajnos (vagy szerencsére) nincs két egyforma ember, sőt így két egyforma fülkagyló sem, a teljes hallórendszerről (fül-agy) nem is beszélve. Márpedig a hallott térbeliséget az egészséges élőlények azért többé-kevésbé egyformán érzékelik - jó közelítéssel ugyanúgy meg tudják határozni az egyes hangforrások irányát. Ha viszont a beérkező hang egyforma és az érzékelés is egyforma, de az anatómiai felépítés különböző, akkor ez utóbbi valahogy bizony kompenzálódik az egyedeknél. Tehát a fül által felfogott tényleges hang egyedenkénti különbözőségét az agynak le kell fordítania a helyes érzékeléshez az adott egyed, ezáltal a szervei különbözősége hatásának kiküszöbölése érdekében.
E kompenzáció módját és mértékét az egyed egész élete során folyamatosan tanulja illetve változó anatómiai adottságaihoz tökéletesíti. Ez azonban azt (is) jelenti, hogy bármilyen hangot ugyanígy kompenzálni fog. Még az adott leképezett környezet szerint tökéletes virtuálisan térbeli hangot is, ami pedig így már távolról sem lesz tökéletes. Vagyis ha már a fülbe jutás előtt - számítástechnikai eszközökkel - elvégezzük az agyban - akarattól függetlenül - újra elvégzett feladatot, akkor az egyenként tökéletes eredmény együttesen meglehetősen tökéletlen lesz, lévén túlkompenzálódik.


Többcsatornás fejhallgató Ez sem az igazi

Tehát úgy tűnik, hogy az élőlényeket nem lehet egyenhanggal teljesen "becsapni" (még annyira sem, mint a 3D-s látással, ami ugyancsak nem egyszerű, de kevesebb és jobban kezelhető az anatómiai tényező, mint például a szemek távolságának különbözősége) - a hallott hangokat meg kell élniük és saját magukhoz képest kell érzékelniük a valódiság érdekében.

Így a térhangzáshoz kénytelenek vagyunk valódi térbeli környezetet előállítani, hogy a hallgató a saját maga tanult módján tudja azt érzékelni. Ez pedig bizony semmilyen más módon nem oldható meg, mint a hangszórók fizikai kihelyezésével, hogy a hang tényleg onnan érkezzen, ahonnan hallani kell.

A több jobb?

A probléma ezzel a felbontásra, vagyis a hangszórók számára korlátozódik. Ami a kép- és video-feldolgozásnál - a képpontok (pixelek) számát illetően - nem is kérdés, a hang esetében komoly fejtörést okoz.
Mert itt nem olyan egyszerű a helyzet.

A hangszórók számát X.Y formátumban szokták megadni. Ez X darab magas- (satellite) plusz Y darab mélysugárzót (subwoofer) jelent.
Azért vannak ezek különválasztva, mert az emberi füllel hallható hang ~20-20.000 Hz-es (másodpercenkénti rezgések száma) spektrumából a ~120-200 Hz alatti - mély - hangok irányát nem nagyon vagyunk képesek érzékelni, miáltal fölösleges is több irányból sugározni őket. Sőt, a mély hangokat nem is csak fülünkkel halljuk, hanem a külső csontos részeken (például koponya) keresztül is érezzük. Figyelembe véve, hogy a tisztességes mélysugárzók mérete - a fizikai szükségletek miatt - a magassugárzók többszöröse, az irányfüggetlen érzékelés nem is akkora baj, hiszen így nem kell bőrönd méretű ládákkal körbepakolni a megfigyelő-helyet, hanem ebből kevesebb és elrejtve is elég, miközben látható (hang-átvitel szempontból akadálymentes) helyen többszörözve csak söröskorsó méretű dobozok is megfelelnek.


Többcsatornás rendszer Nem kell mindenhova láda

A mono elrendezés eszerint 1.0, a klasszikus stereo 2.0 jelölésű. Utóbbi - jóval - később külön mélysugárzóval 2.1 lett, de ez csak hiánypótló fejlesztés volt, hiszen e visszamenőleges kiterjesztés idején már 5.1 rendszerek is léteztek.
Érdekesség, hogy az első 3.0 (mélysugárzóval 3.1) rendszer még nem első-középső, hanem hátsó-középső hangszórót jelentett: ez volt a Dolby cég 1982-ben, még bőven a VHS (Beta) korszakban bemutatkozott Surround / Pro Logic rendszere. Itt a rögzítés 3, de a tárolás csak 2 csatornás volt, ám ebbe egy algoritmussal belekódoltak egy további csatornát, amelyet aztán egy dekóder különválasztott, és mehetett a hátsó hangszóró(k)ra. Ugyancsak a Dolby nevéhez fűződik a kiterjesztés 4.0 (további bal-hátsó, jobb-hátsó hangszórók) illetve 5.0-ig (további első-középső hangszóró) (mélysugárzóval 4.1 illetve 5.1), Quadrophonic illetve Digital/DTS néven. Az első 5.1 Dolby Digital hanggal rendelkező filmet - a Batman Visszatér-t (Batman Returns) - 1992-ben mutatták be.

Az igazsághoz hozzátartozik, hogy e a jelölések némelyike többféle hangszóró-konfigurációt is takar: a 4.1 lehet első-középső és hátsó-középső vagy lehet bal-hátsó és jobb-hátsó hangszóróval, az 5.1 lehet bal-középső és jobb-középső vagy lehet bal-hátsó és jobb-hátsó hangszóróval, a 7.1 lehet első-középső-bal és első-középső-jobb vagy lehet bal-középső és jobb-középső hangszóróval.
Itt inkább a kvázi-szabványként elterjedt konfigurációt értem az egyes elnevezések alatt.

Hamar kiderült azonban, hogy a hallgató érzékelését nem csak szemből, hanem oldalról és hátulról is nehezebb becsapni, mint gondolták. "Probléma" ugyanis, hogy az egy bizonyos irányból (például oldalról) érkező hangot nem lehet két másik irány (például az adott oldali első és hátsó) eredőjeként (egyforma hangerő és fázis) megjeleníteni, mert ezzel "megoldással" a hallgató a diszkrét hangforrást bizony nem a kívánt pontszerűnek, hanem "függönyként" fogja érzékelni, más szóval az irány nem egyetlen körsugárként, hanem körcikk-ként jelenik meg számára. Eredetileg éppen ennek kiküszöbölése érdekében jött létre az első-középső csatorna. De ez nem volt elég.

Innentől kezdve "elszabadultak" a csatornák. Az előbbi megállapítás ugyanis bármilyen olyan megjelenítendő irányra igaz, amely felé pontosan épp nincs egy hangszóró. Mert ez esetben az irányt "kénytelenek" a legközelebbi hangszórók együttesen eredőként kijelölni, és megint csak körcikk- és nem körsugár-irányú hangot fogunk hallani.
Ha pedig netalán fent-lent irányok is kívánatosak, még nagyobb a gond, hiszen kör helyett már rögtön gömbről beszélünk.

Jól látható, hogy az ideális állapot minden olyan helyre egy külön hangszóró, amely irányból hangot akarunk megjeleníteni. De ez - logikusan - lehetetlen.
Viszont megválaszolja a több-jobb kérdést: "hangos" IGEN - határozottan, mint az anyakönyv-vezetőnek.

Ezért nincs mit csodálkozni a hangcsatornák elszaporodásán.
Találni kellett azonban egy kompromisszumos megoldást az egy és a végtelen között, figyelembe véve a rögzítési-tárolási-lejátszási feltételeket kontra lehetőségeket.
Így lett a klasszikus 5.1-ből (bal-első, jobb-első, első-középső, bal-hátsó, jobb-hátsó hangszórók) 6.1 (további hátsó-középső hangszóró), majd inkább - mivel oldalról fontosabb volt a pontosabb irány - 7.1 (további oldalsó-középső hangszórók). Ma ez mondható a házimozi-szintnek, miközben egy ma kapható átlagos PC-s alaplap "tudja" az 5.1-et, az integrált Realtek ALC66X ASP/DSP chipnek (utódja, az ALC88X már 7.1-es) köszönhetően. De - az évtizedes 3D-sként való hirdetés ellenére is - geometriailag ez még mindig csak 2 dimenzió (2D).


Hamasaki 22.2 rendszer Elöl-Hátul, Balra-Jobbra, Fent-Lent

A 9.1-gyel (további oldalsó-középső-felső hangszórók) mutatkozott be az eddigi vízszintes tengelyek mellé a függőleges tengely megjelenítése is, és innentől tényleg nincs határ, mert a 3. dimenzió bevezetése hatványozza az eddigi 2 dimenzió elvárásait. A 3 dimenziós (3D) élmény tökéletesítéséhez tehát az út a hangforrások számának növelése, 10.2 és 12.2, majd - a küszöbön - 22.2 Hamasaki rendszerekkel, amely már függőleges rétegekre is oszlik: 9 fölső, 10 középső, 5 (3+2) alsó hangszóróval.

A bejegyzés trackback címe:

https://technoir.blog.hu/api/trackback/id/tr902920763

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása