186669. lajstromszámú szabadalom • Eljárás és készülék képinformáció hanginformációvá alakítására, előnyösen vakok számára

1 186 669 2 Az 1. ábrán látható, hogy a képinformációt termé­szetes észlelés esetén magában foglaló 11 fénynyaláb a 12 szembe jut, amely a képinformációkat átalakítja idegi impulzusokká, ahonnan a 13 agyba jutnak. Ugyan­ez a folyamat hanginformációvá transzponálás esetén (2. ábra) úgy megy végbe, hogy a 12 fénynyaláb a kép­­információt hangfrekvenciás villamos jelekre moduláló 24 berendezésbe jut, majd a 24 berendezéssel csatolt elektroakusztikus 25 átalakító kisugározza a hang­­információt, azt a 22 fül észleli és idegi impulzusokká átalakítja, amelyek onnan a 23 agyba jutnak. Közismert, hogy az érzékszervek születéskor még nem rendelkeznek a feldolgozó képességgel, csak annak fizio­lógiai feltételeivel, az észlelt információk tudattá alaku­lását az agy megfelelő részei „megtanulják”. A térlátás agyi folyamat, tapasztalatból tudjuk, mekkora méretűek a mindennapi életben észlelt tárgyak (ház, asztal, ce­ruza), ennek megfelelően érzékeli az agy (és nem a szem) a kapott elemi információk alapján a távolságukat, méretarányaikat. Ismeretes pl., hogy ezen jelenség hasz­nosul az óriás—törpe filmek készítésekor, amikor a kör­nyező tárgyakra vonatkozó képinformációkat arányo­san kicsinyítjük (óriás-ábrázolás), illetve nagyítjuk (törpe­ábrázolás). A filmtechnika analógiája azt is jól szemlél­teti az agynak a látásba vitt szerepét illetően, hogy a két­dimenziós kép esetén is felépülhet a háromdimenziós tér struktúráját reprezentáló képérzet az agyban, holott a közvetlen érzékelő, a szem — megfelelően több elemi információval -- sík képre vonatkozó információkat továbbít az agy felé. A veleszületett érzékszervi biológiai eszközökön túl­menően tehát az embernél a látóképesség kifejlődése jelentős mértékű tanulást foglal magában, az agyba az érzékszerv útján eljutott idegi impulzusok minősítésére vonatkozóan. Ebből következik, hogy a képek agyi re­konstrukciójának alapvető feltétele: a képelemeket reprezentáló idegi impulzusok beérkezése az agyba és az agyba már betárolt olyan értékelő mechanizmus, amely az impulzusok minősítése alapján rekonstruálja a képet. Az idegi impulzusok bármely érzékszervtől szár­mazhatnak, ha azok jelentését az agy már kellően memo­rizálta. Ez az alapja annak, hogy a vakok tapintás alapján is rekonstruálnak képet a megtapintható tárgyak alakjá­ról, amibe beleértendő pl. a betűk alakjának tapintáson alapuló érzékelése (Brili-írás). A tapintáson alapuló kép­alkotás a vakoknál igen elterjedt és sokrétű, a tapintásos információszállítás azonban csak igen korlátozott telje­sítményű, becslés szerint kb. a néhányszáz bit/s nagyság­rendjébe esik, ezért a képalkotás terjedelmében is, de különösen annak sebességét tekintve a tapintásos észlelés lehetőségei igen korlátozottak. Míg az emberi agy mind a szem, mind a fül révén észlelt információk alapján igen széles terjedelmű és gyorsan változó képek rekonstruálá­sára képes, a tapintásos érzékelés alapján az információ­­áramlás kis terjedelmére és lassúságára való tekintettel már a sokelemes kép rekonstruálása is nehézségbe ütkö­zik a mozgó kép, illetve változó kép követésére pedig az agy tapintásos információk alapján nem képes. A hallás teljesítőképessége is messze elmarad a látás teljesítőképességétől, de messze meghaladja a tapintásos érzékelés teljesítőképességét, ezért jelentős haladás ér­hető el annak révén, hogy a hiányzó látást nem a tapin­tás, hanem a hallás hasznosításával pótoljuk a találmány szerint. Alkalmasan választott hangmoduláció esetén tehát a látható képek a hallás hasznosításával is továb­bíthatók az agyba és ott — a logikai tartalom kiértékelés­hez szükséges igazságtáblázatok megfelelő memorizálása utár. — ezekből is rekonstruálódik a látható kép érzete. A 2. ábrán mutatott 24 berendezés és elektroakuszti­kai 25 átalakító tulajdonképpen annak az embernek a tevékenységét mechanizálják, aki szavakban elmondja a vaknak, milyen képet lát, s a látó embertől érkező ezen beszédinformációk kiváltotta idegi impulzusok alapján jön létre a vak ember agyában a látható kép érzete. Ennek a nem-mechanikus módszernek egyik hátránya, hog / szükség van egy másik emberre és azt le is kötjük ezzel, ugyanakkor igen bonyolult módon jön így létre a rekonstrukció, hiszen a logikai tartalom kiértékeléséhez szüliséges memória hiányában minden egyes alkalommal sok redundáns információ szükséges a képérzet kialakí­tásához; ha az ember elbeszélését mechanizálnánk is, ez a re dundáns információközlés nem alkalmazható a látás pofására. Egy ismert megoldás szerint a vak ember fejére egy vagy több fényérzékeny elemet helyeznek, amelyek a fej hely zctétől függően más-más térpontból érkező infor­mációt észlelnek és ezt az információt a fényerősségnek megfelelő hang alakjában adja ki a fényérzékeny elemek­kel csatolt fejhallgató. Ennek az ismert megoldásnak olyan változata is van, amelynél nem a fényerősséget, hanem ultrahangos radar segítségével a tárgy távolságát tükrözi a kiadott hanginformáció. Ez a megoldás alkal­mai arra, hogy tereptárgyak jelenlétét és azoktól való távolságot lehessen érzékelni (a vak ember botjától meg­kívánt információt szolgáltatja nagyobb — akár tetsző­leges — távolságra is), de ilyen módon összefüggő komp­lex képinformáció nem nyerhető. A találmány szerinti eljárás viszont a látható képet elég jó felbontással szolgáltatja hanginformációk alakjá­ban. Ennek jobb követhetősége érdekében előbb egy­dimenziós, egyenes menti felbontás szerint mutatjuk be i fényjelek hangjelekkénti megjelenítését, majd meg­írni atjuk, hogyan terjeszthető ki a találmány szerinti képfelbontás alapvető műveletét képező egydimenziós felt ontás kétdimenziós kép felbontásává. Képzeljük el, hogy átlátszatlan nagyméretű kerítés mögött lévő eseményt kell megfigyelnünk. A kerítésben van egy hosszú függőleges rés. A kerítés mögötti esemé­nyekből tehát mindenkor csak a kép egyetlen függőleges menti komponenseinek összetevőjét észlelhetjük. Ha mort a résen átnéző szemünk irányát a szemgolyó elfor­gatásával változtatjuk, vagy a kerítést vízszintes irány­ban elmozdítjuk, akkor az elsőként észlelt vonali infor­mációk után sorrendben egymásután további vonali információkat is észlelünk és a TV ismert képfelbontá­sához hasonlóan (megfelelő készség birtokában) az egy­mást követően észlelt vonali információkból összeáll a kétdimenziós teljes kép. A képfelbontásnak ezt az ismert módszerét most a kép-hang átalakításnál is hasznosítjuk. Bontsuk fel a kép kiválasztott függőleges képsávját egy mlő részekre. A képsáv szélessége (mint képpont­szélesség) legyen egységnyi, a képsáv hossza 60 egység­nyi így a függőleges képsáv 60 képpontból áll. Feleltes­sünk meg minden képpontnak egy hangmagasságot, pl. legyen a legalsó képpont minimum frekvenciájú, a leg­felső képpont maximum frekvenciájú hallható hanggal leképezve, mimellett a mindenkori hang intenzitása felel­jen meg a fényintenzitásnak. Gyakorlatilag a 400— 5 10 15 20 25 30 35 40 45 50 55 60 65 3

Next

/
Oldalképek
Tartalom