186669. lajstromszámú szabadalom • Eljárás és készülék képinformáció hanginformációvá alakítására, előnyösen vakok számára
1 186 669 2 Az 1. ábrán látható, hogy a képinformációt természetes észlelés esetén magában foglaló 11 fénynyaláb a 12 szembe jut, amely a képinformációkat átalakítja idegi impulzusokká, ahonnan a 13 agyba jutnak. Ugyanez a folyamat hanginformációvá transzponálás esetén (2. ábra) úgy megy végbe, hogy a 12 fénynyaláb a képinformációt hangfrekvenciás villamos jelekre moduláló 24 berendezésbe jut, majd a 24 berendezéssel csatolt elektroakusztikus 25 átalakító kisugározza a hanginformációt, azt a 22 fül észleli és idegi impulzusokká átalakítja, amelyek onnan a 23 agyba jutnak. Közismert, hogy az érzékszervek születéskor még nem rendelkeznek a feldolgozó képességgel, csak annak fiziológiai feltételeivel, az észlelt információk tudattá alakulását az agy megfelelő részei „megtanulják”. A térlátás agyi folyamat, tapasztalatból tudjuk, mekkora méretűek a mindennapi életben észlelt tárgyak (ház, asztal, ceruza), ennek megfelelően érzékeli az agy (és nem a szem) a kapott elemi információk alapján a távolságukat, méretarányaikat. Ismeretes pl., hogy ezen jelenség hasznosul az óriás—törpe filmek készítésekor, amikor a környező tárgyakra vonatkozó képinformációkat arányosan kicsinyítjük (óriás-ábrázolás), illetve nagyítjuk (törpeábrázolás). A filmtechnika analógiája azt is jól szemlélteti az agynak a látásba vitt szerepét illetően, hogy a kétdimenziós kép esetén is felépülhet a háromdimenziós tér struktúráját reprezentáló képérzet az agyban, holott a közvetlen érzékelő, a szem — megfelelően több elemi információval -- sík képre vonatkozó információkat továbbít az agy felé. A veleszületett érzékszervi biológiai eszközökön túlmenően tehát az embernél a látóképesség kifejlődése jelentős mértékű tanulást foglal magában, az agyba az érzékszerv útján eljutott idegi impulzusok minősítésére vonatkozóan. Ebből következik, hogy a képek agyi rekonstrukciójának alapvető feltétele: a képelemeket reprezentáló idegi impulzusok beérkezése az agyba és az agyba már betárolt olyan értékelő mechanizmus, amely az impulzusok minősítése alapján rekonstruálja a képet. Az idegi impulzusok bármely érzékszervtől származhatnak, ha azok jelentését az agy már kellően memorizálta. Ez az alapja annak, hogy a vakok tapintás alapján is rekonstruálnak képet a megtapintható tárgyak alakjáról, amibe beleértendő pl. a betűk alakjának tapintáson alapuló érzékelése (Brili-írás). A tapintáson alapuló képalkotás a vakoknál igen elterjedt és sokrétű, a tapintásos információszállítás azonban csak igen korlátozott teljesítményű, becslés szerint kb. a néhányszáz bit/s nagyságrendjébe esik, ezért a képalkotás terjedelmében is, de különösen annak sebességét tekintve a tapintásos észlelés lehetőségei igen korlátozottak. Míg az emberi agy mind a szem, mind a fül révén észlelt információk alapján igen széles terjedelmű és gyorsan változó képek rekonstruálására képes, a tapintásos érzékelés alapján az információáramlás kis terjedelmére és lassúságára való tekintettel már a sokelemes kép rekonstruálása is nehézségbe ütközik a mozgó kép, illetve változó kép követésére pedig az agy tapintásos információk alapján nem képes. A hallás teljesítőképessége is messze elmarad a látás teljesítőképességétől, de messze meghaladja a tapintásos érzékelés teljesítőképességét, ezért jelentős haladás érhető el annak révén, hogy a hiányzó látást nem a tapintás, hanem a hallás hasznosításával pótoljuk a találmány szerint. Alkalmasan választott hangmoduláció esetén tehát a látható képek a hallás hasznosításával is továbbíthatók az agyba és ott — a logikai tartalom kiértékeléshez szükséges igazságtáblázatok megfelelő memorizálása utár. — ezekből is rekonstruálódik a látható kép érzete. A 2. ábrán mutatott 24 berendezés és elektroakusztikai 25 átalakító tulajdonképpen annak az embernek a tevékenységét mechanizálják, aki szavakban elmondja a vaknak, milyen képet lát, s a látó embertől érkező ezen beszédinformációk kiváltotta idegi impulzusok alapján jön létre a vak ember agyában a látható kép érzete. Ennek a nem-mechanikus módszernek egyik hátránya, hog / szükség van egy másik emberre és azt le is kötjük ezzel, ugyanakkor igen bonyolult módon jön így létre a rekonstrukció, hiszen a logikai tartalom kiértékeléséhez szüliséges memória hiányában minden egyes alkalommal sok redundáns információ szükséges a képérzet kialakításához; ha az ember elbeszélését mechanizálnánk is, ez a re dundáns információközlés nem alkalmazható a látás pofására. Egy ismert megoldás szerint a vak ember fejére egy vagy több fényérzékeny elemet helyeznek, amelyek a fej hely zctétől függően más-más térpontból érkező információt észlelnek és ezt az információt a fényerősségnek megfelelő hang alakjában adja ki a fényérzékeny elemekkel csatolt fejhallgató. Ennek az ismert megoldásnak olyan változata is van, amelynél nem a fényerősséget, hanem ultrahangos radar segítségével a tárgy távolságát tükrözi a kiadott hanginformáció. Ez a megoldás alkalmai arra, hogy tereptárgyak jelenlétét és azoktól való távolságot lehessen érzékelni (a vak ember botjától megkívánt információt szolgáltatja nagyobb — akár tetszőleges — távolságra is), de ilyen módon összefüggő komplex képinformáció nem nyerhető. A találmány szerinti eljárás viszont a látható képet elég jó felbontással szolgáltatja hanginformációk alakjában. Ennek jobb követhetősége érdekében előbb egydimenziós, egyenes menti felbontás szerint mutatjuk be i fényjelek hangjelekkénti megjelenítését, majd megírni atjuk, hogyan terjeszthető ki a találmány szerinti képfelbontás alapvető műveletét képező egydimenziós felt ontás kétdimenziós kép felbontásává. Képzeljük el, hogy átlátszatlan nagyméretű kerítés mögött lévő eseményt kell megfigyelnünk. A kerítésben van egy hosszú függőleges rés. A kerítés mögötti eseményekből tehát mindenkor csak a kép egyetlen függőleges menti komponenseinek összetevőjét észlelhetjük. Ha mort a résen átnéző szemünk irányát a szemgolyó elforgatásával változtatjuk, vagy a kerítést vízszintes irányban elmozdítjuk, akkor az elsőként észlelt vonali információk után sorrendben egymásután további vonali információkat is észlelünk és a TV ismert képfelbontásához hasonlóan (megfelelő készség birtokában) az egymást követően észlelt vonali információkból összeáll a kétdimenziós teljes kép. A képfelbontásnak ezt az ismert módszerét most a kép-hang átalakításnál is hasznosítjuk. Bontsuk fel a kép kiválasztott függőleges képsávját egy mlő részekre. A képsáv szélessége (mint képpontszélesség) legyen egységnyi, a képsáv hossza 60 egységnyi így a függőleges képsáv 60 képpontból áll. Feleltessünk meg minden képpontnak egy hangmagasságot, pl. legyen a legalsó képpont minimum frekvenciájú, a legfelső képpont maximum frekvenciájú hallható hanggal leképezve, mimellett a mindenkori hang intenzitása feleljen meg a fényintenzitásnak. Gyakorlatilag a 400— 5 10 15 20 25 30 35 40 45 50 55 60 65 3