197135. lajstromszámú szabadalom • Eljárás hangjelek átvitelére
1 197 135 2 A találmány tárgya eljárás hangjel átvitelére, amelynek során az analóg jelet digitális jellé átalakítjuk, digitális alakban átvisszük, majd ismét analógjellé alakítjuk, az analóg jelet az átvitel előtt rövididejű spektrumjellé alakítjuk, ezen spektrumjel részeit az átviendő digitális jel kódolása során eltérően súlyozzuk olymódon, hogy a nagy spektrumértékeket nagy pontossággal képezzük le, a nagy spektrumértékekkel szomszédos frekvenciájú spektrumértékeket vagy a kis spektrumértékeket kisebb pontossággal képezzük le. Ilyen eljárást ismertet a 35 06 912 számú DE- OS. Ismeretes, hogy egy hangjel átvitelénél, például rádióátvitelnél, kábclátvitcinél, műholdátvitelnél és rögzítőkészülékeknél, az analóg hangjelet meghatározott felbontással (bit/letapogatási érték) digitális hangjellé alakítják, ebben az alakban átviszik, és a hangvisszaadáskor ismét analóg jellé alakítják. A digitális átvitel révén különösen a hangvisszaadáskor, nagyobb zaj távolságot lehet elérni. Egy ilyen jelnek az átviteléhez szükséges sávszélességet lényegében az időegység alatt átviendő letapogatási értékek száma, valamint a felbontás mértéke (letapogatási értékenkénti bit érték) határozza meg. A gyakorlatban az átvitellel szemben az a követelmény, hogy a szükséges sávszélességet lehető kis értéken tartsák, annak érdekében, hogy lehető keskenysávú csatorna elegendő legyen, vagy hogy egy meglevő csatornán egyidejűleg lehető sok hangjelet lehessen átvinni. A szükséges sávszélességet lehet csökkenteni olymódon, hogy a letapogatási értékeket vagy a letapogatási értékekhez tartozó bitek számát csökkentik. Ezek az intézkedések azonban rendszerint a hangvisszaadás minőségének romlását vonják maguk után. A letapogatási értékekhez tartozó közepes bitszámának a hangvisszaadáskor nem érzékelhető csökkentése a következő intézkedésekkel érhető el: a digitális hangjelet az időtartományba képezzük le, ilymódon az analóg jel egyes letapogatási értékeit időben egymás után állítjuk elő, az időben egymás után következő metszeteket rövididejű spektrummá transzformáljuk, amelyek minden rövid időszakra, például 20 msec-ra, a jel spektrális komponenseit alkotják. A rövididejű spektrumban pszichoakusztikai felismerések alapján, a hallgató személy által nem érzékelhető általános komponenseket, vagyis, amelyek az átviteltechnikai szempontból közömbösek, könnyebben fel lehet ismerni, mint az időtartományban. Ennélfogva ezeket a komponenseket a találmány szerint az átvitel során kisebb mértékben súlyozzuk, vagy teljesen elhagyjuk. Ezzel az intézkedéssel az átvitel során az átviendő bitek számának jelentős része elhagyható, így egy letapogatási értékez tartozó közepes bitszám jelentősen csökkenthető. A spektrumban az ilyen közömbös komponensek például azok a komponensek, amelyek a spektrumban egy maximális amplitúdóhoz közel esnek, és ehhez a maximális amplitúdóhoz képest egy meghatározott amplitúdó-értéket nem haladnak meg. Az ilyen komponensek az átvitel során a hangvisszaadás minőségének észrevehető befolyásolása nélkül előnyösen elhagyhatók. Az ilyen komponensek ugyanis pszichoakusztikai törvényszerűségek alapján egy un. fedési effektus következtében a hallgató személy által nem érzékelhetők. Az ilyen fedési effektus szempontjából jelentőséggel bír az egyes komponensek közötti időkülönbség, valamint egymáshoz képesti frekvencia- és amplitúdóhelyzetük. Mivel a fedési effektus szempontjából bizonyos időállandók meghatározók, a jelet egy „időablakka!” (window) időben egymás után következő, 20 msec nagyságrendbe eső időtartamú blokkokba osztjuk, mivel ilyen időtartományokon belül a fedési küszöbök vagy együtfhallási küszöbök nem maradnak el jelentősen. Mindenegyes ilyen blokknak a jelét rövididejű spektrummá transzformáljuk, és a kódolásnál a közömbös részek szempontjából a jelet megvizsgáljuk. A hallóérzék frekvenciasávokat képez, ún. csoportokat, amelyek a fedési effektus szempontj ából lényeges szerepet játszanak. A frekvenciacsoportok felosztása és a fedési effektus ismert, amelyet részletesen ismertet az E. Zwicker, Psychoakustik, Springer- Verlag, Berlin, Heidelberg, New York, 1982. című mű46. oldalától. Mindenegyes ilyen frekvenciacsoportot a kódolásnál egyenként kiértékelünk, és a közömbös komponensek szempontjából megviszgáljuk. Ennek során a frekvencia-felbontás olyan finom, hogy a legkeskenyebb frekvenciacsoportban mintegy 100 Hz szélességet még érzékelünk. A jelnek az időtartományból a frekvenciatartományba történő átalakításához előnyösen Fourier transzformációt, például egy ún. gyors-Fourier transzformációt alkalmazunk. A találmány elé célul tűztük ki az amplitúdó-értékeknek a frekvencia-értékekben történő súlyozásának továbbjavítását, a hirtelen hangváltozások érzékelésének javítását, és a pszichoakusztikai szempontoknak az átviteli eljárásnál történő jobb figyelembevételét. A kitűzött feladatot a bevezetőben körülírt eljárással a találmány szerint úgy értük el, hogy a frekvenciaspektrumban eltolható küszöböket állítunk elő, amely alatt a spektrumértékeket kisebb pontossággal képezzük le, vagy G-vá teszük, és/vagy a spektrumértékeket frekvenciaszelektíven kiemeljük. Egy előnyös foganatosítási mód szerint a küszöböt, amely alatt egy frekvenciacsoportban az értékeket nullává tesszük, adaptív módon toljuk cl. Ezt az eltolást lehetséges módon —30 és —50 dB között végezzük. Az analóg jelet az eljárás során időablakokkal blokkokba osztjuk, és az alsó frekvenciatartományt kiszűijük. Előnyösen a frekvenciaspektrumot frekvenciacsoportokra osztjuk, és minden egyes csoporthoz egy hallásküszöböt rendelünk. A hallásküszöböt célszerűen egy maximumhoz (Xm„) egy előre meghatározott távolságra határozzuk meg. A hallásküszöböt előnyösen csak egy ütközőig toljuk el. Az ütköző egy abszolút maximumhoz (X^^) képest mintegy —128 dB távolságra állítjuk be. Az a küszöb tehát, amely alatt egy csoportban az értékeket nullává tesszük, nem lesz a csoportmaximum alatt —30 dB értéken rögzítve, hanem azt adaptív niődon —50 dß-ig cl kell tolni. Ez akkor szükséges, ha a csoportban egy kifejezett csúcsérték van jelen, mivel ekkor ebben a nagy dinamika-tartományban a spektrumértékek egyértelmű lineáris fiiggősé-5 10 15 20 25 30 35 40 45 50 55 60 65 2