166544. lajstromszámú szabadalom • Eljárás és berendezés villamos jelek feldolgozására, különösen hangvisszaadás céljára

11 166544 12 szalagból bizonyos darabokat kivágtunk volna, majd a szalagot összeragasztva visszajátszanánk normál se­bességgel. A jel részei helyes frekvenciával hallhatók, de az információátvitel rövidebb időt igényel (ha c >• 1). A beszéd eredeti hosszának 1/c-szeresére lett kompri­málva. Az I. táblázatban megadott értékeket 3 (a) ábrán vettük fel. Bármely adott kompressziós viszony esetén az időmintát a Tout görbe, és a tömb hosszát T in görbe mutatja. E két görbe közötti,különbség a kirekesztett hányad, ami a minta végén a végkésleltetéssel egyenlő [3 (a) ábra példáján 6 ms]. Bármely • kompressziós viszonnyal kezdjük a görbét, pl. c =5, a 3 (a) ábrán azonnal láthatók a tömb és a kirekesztett idők, ami­kor a szalagsebesség c-szerese a rögzítés sebességének, és ezeket az értékeket az időtengelyre vetítve a megfelelő tömb és kirekesztett részekhez tartozó eredeti rögzítési idő olvasható le. Amint már jeleztük, a tömb 1,5 ms, a kirekesztett 6 ms hosszú, és ezek 7,5 ms rögzített és reprodukált, valamint 30 ms kirekesztett információt jelentenek. Utóbbi értéket a 3 (a) ábrán szintén meg­található c • ATmax jelzi. A 333 Hz legkisebb frekvenciát tartalmazó beszédjel periódusideje 3 ms, 1,5 ms tömb hossz, ha c = 5, meg­felel 7,5 ms rögzített időnek, ami is a 333 Hz-es jel 2,5 ciklusát tartalmazza. Bármely ennél magasabb frek­venciakomponensből többet foglal magába az 1,5 ms-os tömb. A tömb hosszának meg kell haladnia az átviendő legalacsonyabb frekvencia periódushosszát (vagyis mi­nimum 1 teljes ciklust kell tartalmaznia), különben nem nyerhető kielégítő kompresszió. Amint 3 (a) ábra mu­tatja, az időtengely alatt 3 ms-nál, a 333 Hz ha 3 ms-hoz közeli minta periódusokkal dolgozzuk fel, a minták összegyűjtése után nagyon gyenge minőségű komprimált kimenetet biztosítana csupán, mivel a mintavételezés egyesíthetetlen megszakítottságot eredményezne a fel­dolgozott 333 Hz-es jel majdnem minden egyes ciklu­sában. 3 ms-nál kisebb minta periódusok egyetlen ciklus kompletté tételét sem engednék meg, így az eredő ösz­szegyűjtött kimenet nemcsak az említett megszakításo­kat tartalmazná, de vágással hullámforma komprimá­lást, és ezzel hamis frekvenciák előállítását okozva, lényeges frekvencia karakterisztika változást hozna létre. Mivel ezek a feltételek nem felelnek meg a valóságnak, lévén a beszéd különböző hullámformák halmaza, a vezérelv maradjon, hogy a beszédjel legkisebb frekvencia összetevőjének periódusidejénél rövidebb mintaperió­dusok nem adnak helyes kompressziót. A legalacsonyabb frekvenciájú hullám perióduside­jénél hosszabb mintaperiódusok kompressziót okoznak, és egy megszakított intervallum létezik attól kezdve, ahol a mintaperiódus csak kissé nagyobb a legalacso­nyabb frekvenciájú hullám periódusidejénél, amint 3 (a) ábra időtengelyén bejelöltük a 3 ms és 6 ms idő­pontok között. Ezen megszakításos periódusból nyert eredmény torz expandált hullám lesz, ahol a minták az egyetlen ciklusponthoz közeledve a találkozási pon­tokban nagymértékben elkerülik egymást, de ez meg­szűnik, minél több ciklust tartalmaz a minta. Jó gyakor­lati értékként két és fél ciklus mintánként a kívánatos érték 3 (a) ábrán, de általában minél több ciklust tar­talmaz a minta, annál kevesebb lesz a zavaró tényező. Azért, hogy elkerülhessük azokat az extrém torzító hatásokat, amit a minta periódusnál hosszabb hullám­hosszak okoznának, ezeket az alacsonyabb frekvenciá­kat ki kell szűrni, mielőtt a beszédjel belépne a késlel­tető vonalba. A szűrés nélkül ezek a nem találkozó és nagymértékben torzított hullámok a vonalon tovább­haladva és keresztmodulációba lépve az átvinni kívánt 5 jellel, a rendszer teljesítményét súlyosan károsítanák. Ac— 5-nél kisebb kompressziós értékek esetén és Tmax = 6 ms-ot megtartva, a tömb hossza növekszik, ami azzal jár, hogy a tényleges időminta 7,5 ms-nál nagyobbá válik, így több mint a legalacsonyabb frek-10 venciaösszetevő megkívánta ciklus lesz jelen a tömbben, így a felhasználó szabadon választhat, hogy a vonalat ATmax = 6 ms-nál kisebb késleltetéssel működtesse, ez­által csökkentve a kirekesztett mennyiséget. A minta kirekesztett részét állandó 6 ms-nak véve 15 a komprimált szalag visszajátszásakor, a tényleges in­formációveszteség egyenlő kompresszió viszony és a 6 ms szorzatával, így c = 5 esetében a rögzítési időből mintánként kirekesztett információ 30 ms. Amint a 3. ábra időtengelyén látható, ez az intervallum 7,5 ms— 20 37,5 ms közé esik, és ezen információveszteség kapcso­latát a reprodukált beszédjel érthetőségével meg kell vizsgálni. Általánosságban az emberi beszéd, hangok viszony­lag korlátozott halmazának roppant összetett kódolását 25 tartalmazza, ezt beszédhangnak hívjuk, és ez kiegészül a beszédkód különböző járulékaival a zöngés és zön­gétlen komponensekkel, hangterjedelemmel, domináns frekvenciákkal a hangenergia által képviselt hangminta folytonosságával (illetve ennek hiányával). Ha ehhez 30 hozzávesszük a csak időszakosan jelenlevő össze­tevők közötti valamennyi fontosabb átmenetet, akkor végtelen változatosságú és verzatilitású akusztikus fo­lyamatot kapunk. Az emberi fül ilyen akusztikus üze­netvevő képessége és a fül—agy alkotta rendszer üzenet 35 dekódoló képessége még egyáltalán nem ismeretes, mivel úgy tűnik, hogy az információ kiértékelési sebes­sége messze meghaladja a fülnek mint vevőkészüléknek puszta akusztikus—válasz karakterisztikáját. Szerencsére a fül—agy rendszer emberi beszédjelek 40 által hordozott üzenetértelmező képessége elég jó ah­hoz, hogy a tényleges akusztikus halmazból nagyobb részek is elveszhessenek, vagyakirekesztés sorsára juthas­sanak anélkül, hogy az akusztikus jelüzenet információ­tartalmának vétele és értelmezése jelentékenyen káro-45 sodna. Mivel az üzenet tartalmának értelmezése sok­kal gyorsabban csökken az egyes szavak érthetőségénél, amint az üzenet prezentációs sebessége a hallgató szá­mára nő, adott jelfolyam kirekesztett hányadával össze­kapcsolt probléma az érthetőség javára oldható meg, 50 kevesebb figyelmet szentelve annak a pontnak, ahol már az egyes szavak érthetősége is megszűnik. Utóbbi akkor következik be, amikor a veszteség vagy az átme­netekben bekövetkezett változások vagy azok a momen­tumok, amelyek a magán- és mássalhangzó közötti kap-55 csőlátót reprezentálnák, a kirekesztés folyamányaként ténylegesen elvesznek, egy adott típusú vagy több ilyen kapcsolatban sok esetben vagy mindig, és ezáltal az összefűzött, egymással érintkező tömbök valódi infor­mációtartalmát megváltoztatják. Még mielőtt elérnénk 60 az abszolút érthetetlenséget, a tartós hallgatás tűrhetet­lenné válik a természetellenes hangok és az intenzív koncentráció okozta fáradtság eredményeként, amit az okoz, hogy megkíséreljük az információtartalmat az idő nagymértékű lerövidítése esetén is kinyerni. 65 Beszédkompresszió esetén az érthetőség veszteség a 6

Next

/
Thumbnails
Contents