197135. lajstromszámú szabadalom • Eljárás hangjelek átvitelére

1 197 135 2 A találmány tárgya eljárás hangjel átvitelére, amelynek során az analóg jelet digitális jellé átalakít­juk, digitális alakban átvisszük, majd ismét analógjel­lé alakítjuk, az analóg jelet az átvitel előtt rövididejű spektrumjellé alakítjuk, ezen spektrumjel részeit az átviendő digitális jel kódolása során eltérően súlyoz­zuk olymódon, hogy a nagy spektrumértékeket nagy pontossággal képezzük le, a nagy spektrumértékek­­kel szomszédos frekvenciájú spektrumértékeket vagy a kis spektrumértékeket kisebb pontossággal képez­zük le. Ilyen eljárást ismertet a 35 06 912 számú DE- OS. Ismeretes, hogy egy hangjel átvitelénél, például rá­dióátvitelnél, kábclátvitcinél, műholdátvitelnél és rögzítőkészülékeknél, az analóg hangjelet meghatá­rozott felbontással (bit/letapogatási érték) digitális hangjellé alakítják, ebben az alakban átviszik, és a hangvisszaadáskor ismét analóg jellé alakítják. A di­gitális átvitel révén különösen a hangvisszaadáskor, nagyobb zaj távolságot lehet elérni. Egy ilyen jelnek az átviteléhez szükséges sávszéles­séget lényegében az időegység alatt átviendő letapo­gatási értékek száma, valamint a felbontás mértéke (letapogatási értékenkénti bit érték) határozza meg. A gyakorlatban az átvitellel szemben az a követel­mény, hogy a szükséges sávszélességet lehető kis érté­ken tartsák, annak érdekében, hogy lehető keskeny­sávú csatorna elegendő legyen, vagy hogy egy megle­vő csatornán egyidejűleg lehető sok hangjelet lehes­sen átvinni. A szükséges sávszélességet lehet csökkenteni olymódon, hogy a letapogatási értékeket vagy a letapogatási értékekhez tartozó bitek számát csökkentik. Ezek az intézkedések azonban rendsze­rint a hangvisszaadás minőségének romlását vonják maguk után. A letapogatási értékekhez tartozó közepes bitszá­mának a hangvisszaadáskor nem érzékelhető csökkentése a következő intézkedésekkel érhető el: a digitális hangjelet az időtartományba képezzük le, ilymódon az analóg jel egyes letapogatási értékeit időben egymás után állítjuk elő, az időben egymás után következő metszeteket rövididejű spektrummá transzformáljuk, amelyek minden rövid időszakra, például 20 msec-ra, a jel spektrális komponenseit al­kotják. A rövididejű spektrumban pszichoakusztikai felismerések alapján, a hallgató személy által nem ér­zékelhető általános komponenseket, vagyis, amelyek az átviteltechnikai szempontból közömbösek, könnyebben fel lehet ismerni, mint az időtartomány­ban. Ennélfogva ezeket a komponenseket a talál­mány szerint az átvitel során kisebb mértékben sú­lyozzuk, vagy teljesen elhagyjuk. Ezzel az intézkedés­sel az átvitel során az átviendő bitek számának jelen­tős része elhagyható, így egy letapogatási értékez tar­tozó közepes bitszám jelentősen csökkenthető. A spektrumban az ilyen közömbös komponensek például azok a komponensek, amelyek a spektrum­ban egy maximális amplitúdóhoz közel esnek, és eh­hez a maximális amplitúdóhoz képest egy meghatá­rozott amplitúdó-értéket nem haladnak meg. Az ilyen komponensek az átvitel során a hangvisszaadás minőségének észrevehető befolyásolása nélkül elő­nyösen elhagyhatók. Az ilyen komponensek ugyanis pszichoakusztikai törvényszerűségek alapján egy un. fedési effektus következtében a hallgató személy által nem érzékelhetők. Az ilyen fedési effektus szem­pontjából jelentőséggel bír az egyes komponensek közötti időkülönbség, valamint egymáshoz képesti frekvencia- és amplitúdóhelyzetük. Mivel a fedési effektus szempontjából bizonyos időállandók meghatározók, a jelet egy „időablakka!” (window) időben egymás után következő, 20 msec nagyságrendbe eső időtartamú blokkokba osztjuk, mivel ilyen időtartományokon belül a fedési küszöbök vagy együtfhallási küszöbök nem marad­nak el jelentősen. Mindenegyes ilyen blokknak a jelét rövididejű spektrummá transzformáljuk, és a kódo­lásnál a közömbös részek szempontjából a jelet meg­vizsgáljuk. A hallóérzék frekvenciasávokat képez, ún. csopor­tokat, amelyek a fedési effektus szempontj ából lénye­ges szerepet játszanak. A frekvenciacsoportok fel­osztása és a fedési effektus ismert, amelyet részlete­sen ismertet az E. Zwicker, Psychoakustik, Springer- Verlag, Berlin, Heidelberg, New York, 1982. című mű46. oldalától. Mindenegyes ilyen frekvenciacso­portot a kódolásnál egyenként kiértékelünk, és a közömbös komponensek szempontjából megviszgál­­juk. Ennek során a frekvencia-felbontás olyan finom, hogy a legkeskenyebb frekvenciacsoportban mintegy 100 Hz szélességet még érzékelünk. A jelnek az idő­­tartományból a frekvenciatartományba történő át­alakításához előnyösen Fourier transzformációt, pél­dául egy ún. gyors-Fourier transzformációt alkalma­zunk. A találmány elé célul tűztük ki az amplitúdó-érté­keknek a frekvencia-értékekben történő súlyozásá­nak továbbjavítását, a hirtelen hangváltozások érzé­kelésének javítását, és a pszichoakusztikai szempon­toknak az átviteli eljárásnál történő jobb figyelembe­vételét. A kitűzött feladatot a bevezetőben körülírt eljárás­sal a találmány szerint úgy értük el, hogy a frekven­ciaspektrumban eltolható küszöböket állítunk elő, amely alatt a spektrumértékeket kisebb pontossággal képezzük le, vagy G-vá teszük, és/vagy a spektrumér­tékeket frekvenciaszelektíven kiemeljük. Egy előnyös foganatosítási mód szerint a küszöböt, amely alatt egy frekvenciacsoportban az értékeket nullává tesszük, adaptív módon toljuk cl. Ezt az elto­lást lehetséges módon —30 és —50 dB között végez­zük. Az analóg jelet az eljárás során időablakokkal blokkokba osztjuk, és az alsó frekvenciatartományt kiszűijük. Előnyösen a frekvenciaspektrumot frekvenciacso­portokra osztjuk, és minden egyes csoporthoz egy hallásküszöböt rendelünk. A hallásküszöböt célsze­rűen egy maximumhoz (Xm„) egy előre meghatáro­zott távolságra határozzuk meg. A hallásküszöböt előnyösen csak egy ütközőig toljuk el. Az ütköző egy abszolút maximumhoz (X^^) képest mintegy —128 dB távolságra állítjuk be. Az a küszöb tehát, amely alatt egy csoportban az értékeket nullává tesszük, nem lesz a csoportmaxi­mum alatt —30 dB értéken rögzítve, hanem azt adap­tív niődon —50 dß-ig cl kell tolni. Ez akkor szüksé­ges, ha a csoportban egy kifejezett csúcsérték van je­len, mivel ekkor ebben a nagy dinamika-tartomány­ban a spektrumértékek egyértelmű lineáris fiiggősé-5 10 15 20 25 30 35 40 45 50 55 60 65 2

Next

/
Oldalképek
Tartalom