166544. lajstromszámú szabadalom • Eljárás és berendezés villamos jelek feldolgozására, különösen hangvisszaadás céljára
11 166544 12 szalagból bizonyos darabokat kivágtunk volna, majd a szalagot összeragasztva visszajátszanánk normál sebességgel. A jel részei helyes frekvenciával hallhatók, de az információátvitel rövidebb időt igényel (ha c >• 1). A beszéd eredeti hosszának 1/c-szeresére lett komprimálva. Az I. táblázatban megadott értékeket 3 (a) ábrán vettük fel. Bármely adott kompressziós viszony esetén az időmintát a Tout görbe, és a tömb hosszát T in görbe mutatja. E két görbe közötti,különbség a kirekesztett hányad, ami a minta végén a végkésleltetéssel egyenlő [3 (a) ábra példáján 6 ms]. Bármely • kompressziós viszonnyal kezdjük a görbét, pl. c =5, a 3 (a) ábrán azonnal láthatók a tömb és a kirekesztett idők, amikor a szalagsebesség c-szerese a rögzítés sebességének, és ezeket az értékeket az időtengelyre vetítve a megfelelő tömb és kirekesztett részekhez tartozó eredeti rögzítési idő olvasható le. Amint már jeleztük, a tömb 1,5 ms, a kirekesztett 6 ms hosszú, és ezek 7,5 ms rögzített és reprodukált, valamint 30 ms kirekesztett információt jelentenek. Utóbbi értéket a 3 (a) ábrán szintén megtalálható c • ATmax jelzi. A 333 Hz legkisebb frekvenciát tartalmazó beszédjel periódusideje 3 ms, 1,5 ms tömb hossz, ha c = 5, megfelel 7,5 ms rögzített időnek, ami is a 333 Hz-es jel 2,5 ciklusát tartalmazza. Bármely ennél magasabb frekvenciakomponensből többet foglal magába az 1,5 ms-os tömb. A tömb hosszának meg kell haladnia az átviendő legalacsonyabb frekvencia periódushosszát (vagyis minimum 1 teljes ciklust kell tartalmaznia), különben nem nyerhető kielégítő kompresszió. Amint 3 (a) ábra mutatja, az időtengely alatt 3 ms-nál, a 333 Hz ha 3 ms-hoz közeli minta periódusokkal dolgozzuk fel, a minták összegyűjtése után nagyon gyenge minőségű komprimált kimenetet biztosítana csupán, mivel a mintavételezés egyesíthetetlen megszakítottságot eredményezne a feldolgozott 333 Hz-es jel majdnem minden egyes ciklusában. 3 ms-nál kisebb minta periódusok egyetlen ciklus kompletté tételét sem engednék meg, így az eredő öszszegyűjtött kimenet nemcsak az említett megszakításokat tartalmazná, de vágással hullámforma komprimálást, és ezzel hamis frekvenciák előállítását okozva, lényeges frekvencia karakterisztika változást hozna létre. Mivel ezek a feltételek nem felelnek meg a valóságnak, lévén a beszéd különböző hullámformák halmaza, a vezérelv maradjon, hogy a beszédjel legkisebb frekvencia összetevőjének periódusidejénél rövidebb mintaperiódusok nem adnak helyes kompressziót. A legalacsonyabb frekvenciájú hullám periódusidejénél hosszabb mintaperiódusok kompressziót okoznak, és egy megszakított intervallum létezik attól kezdve, ahol a mintaperiódus csak kissé nagyobb a legalacsonyabb frekvenciájú hullám periódusidejénél, amint 3 (a) ábra időtengelyén bejelöltük a 3 ms és 6 ms időpontok között. Ezen megszakításos periódusból nyert eredmény torz expandált hullám lesz, ahol a minták az egyetlen ciklusponthoz közeledve a találkozási pontokban nagymértékben elkerülik egymást, de ez megszűnik, minél több ciklust tartalmaz a minta. Jó gyakorlati értékként két és fél ciklus mintánként a kívánatos érték 3 (a) ábrán, de általában minél több ciklust tartalmaz a minta, annál kevesebb lesz a zavaró tényező. Azért, hogy elkerülhessük azokat az extrém torzító hatásokat, amit a minta periódusnál hosszabb hullámhosszak okoznának, ezeket az alacsonyabb frekvenciákat ki kell szűrni, mielőtt a beszédjel belépne a késleltető vonalba. A szűrés nélkül ezek a nem találkozó és nagymértékben torzított hullámok a vonalon továbbhaladva és keresztmodulációba lépve az átvinni kívánt 5 jellel, a rendszer teljesítményét súlyosan károsítanák. Ac— 5-nél kisebb kompressziós értékek esetén és Tmax = 6 ms-ot megtartva, a tömb hossza növekszik, ami azzal jár, hogy a tényleges időminta 7,5 ms-nál nagyobbá válik, így több mint a legalacsonyabb frek-10 venciaösszetevő megkívánta ciklus lesz jelen a tömbben, így a felhasználó szabadon választhat, hogy a vonalat ATmax = 6 ms-nál kisebb késleltetéssel működtesse, ezáltal csökkentve a kirekesztett mennyiséget. A minta kirekesztett részét állandó 6 ms-nak véve 15 a komprimált szalag visszajátszásakor, a tényleges információveszteség egyenlő kompresszió viszony és a 6 ms szorzatával, így c = 5 esetében a rögzítési időből mintánként kirekesztett információ 30 ms. Amint a 3. ábra időtengelyén látható, ez az intervallum 7,5 ms— 20 37,5 ms közé esik, és ezen információveszteség kapcsolatát a reprodukált beszédjel érthetőségével meg kell vizsgálni. Általánosságban az emberi beszéd, hangok viszonylag korlátozott halmazának roppant összetett kódolását 25 tartalmazza, ezt beszédhangnak hívjuk, és ez kiegészül a beszédkód különböző járulékaival a zöngés és zöngétlen komponensekkel, hangterjedelemmel, domináns frekvenciákkal a hangenergia által képviselt hangminta folytonosságával (illetve ennek hiányával). Ha ehhez 30 hozzávesszük a csak időszakosan jelenlevő összetevők közötti valamennyi fontosabb átmenetet, akkor végtelen változatosságú és verzatilitású akusztikus folyamatot kapunk. Az emberi fül ilyen akusztikus üzenetvevő képessége és a fül—agy alkotta rendszer üzenet 35 dekódoló képessége még egyáltalán nem ismeretes, mivel úgy tűnik, hogy az információ kiértékelési sebessége messze meghaladja a fülnek mint vevőkészüléknek puszta akusztikus—válasz karakterisztikáját. Szerencsére a fül—agy rendszer emberi beszédjelek 40 által hordozott üzenetértelmező képessége elég jó ahhoz, hogy a tényleges akusztikus halmazból nagyobb részek is elveszhessenek, vagyakirekesztés sorsára juthassanak anélkül, hogy az akusztikus jelüzenet információtartalmának vétele és értelmezése jelentékenyen káro-45 sodna. Mivel az üzenet tartalmának értelmezése sokkal gyorsabban csökken az egyes szavak érthetőségénél, amint az üzenet prezentációs sebessége a hallgató számára nő, adott jelfolyam kirekesztett hányadával összekapcsolt probléma az érthetőség javára oldható meg, 50 kevesebb figyelmet szentelve annak a pontnak, ahol már az egyes szavak érthetősége is megszűnik. Utóbbi akkor következik be, amikor a veszteség vagy az átmenetekben bekövetkezett változások vagy azok a momentumok, amelyek a magán- és mássalhangzó közötti kap-55 csőlátót reprezentálnák, a kirekesztés folyamányaként ténylegesen elvesznek, egy adott típusú vagy több ilyen kapcsolatban sok esetben vagy mindig, és ezáltal az összefűzött, egymással érintkező tömbök valódi információtartalmát megváltoztatják. Még mielőtt elérnénk 60 az abszolút érthetetlenséget, a tartós hallgatás tűrhetetlenné válik a természetellenes hangok és az intenzív koncentráció okozta fáradtság eredményeként, amit az okoz, hogy megkíséreljük az információtartalmat az idő nagymértékű lerövidítése esetén is kinyerni. 65 Beszédkompresszió esetén az érthetőség veszteség a 6