193999. lajstromszámú szabadalom • Eljárás és kapcsolási elrendezés kötött szótáras beszédszintetizálásra

193999 A találmány tárgya eljárás kötött szótá­ras beszédszintetizálásra, amelynek során valamennyi megszólaltatandó szöveget szeg­mensekre bontjuk, az egyes szegmensekhez paramétercsoportot rendelünk hozzá és az így nyert paramétercsoportokat tároljuk, majd a beszédszintetizálás során a megszólalta­tandó szöveghez rendelt paramétercsopor­tokkal vezérelt digitális szűrés útján zöngés és zöngétlen generátorok jeleiből digitális jelsorozatot állítunk elő, az így nyert digitá­lisjelsorozatból analóg jeleket képezünk, ame­lyet célszerűen erősítünk végül pedig meg­szólaltatjuk. Tárgya továbbá a találmány­nak az eljárás foganatosítására szolgáló kap­csolási elrendezés is. A beszédszintetizálók az emberi beszéd­­keltés folyamatát utánozzák valamilyen for­mában. A beszédszintetizáló bemenetére a közlendő információ kódolt formában érke­zik, amelynek hatására egy speciális átkódo­­lási folyamat eredményeként a beszédszin­tetizáló kimenetén a kívánt közlendőt hordo­zó beszédjel jelenik meg. A kötött szótáras beszédszintetizálók nap­jainkban legelterjedtebb típusa az úgyneve­zett lineáris predikción alapul, amely mind az ár, mind a minőség szempontjából a leg­előnyösebbnek tűnik. A lineáris predikción alapuló beszédszin­tetizálás során a zöngés és zöngétlen generá­torok jeléből egy erősségi faktorral való szor­zás után lineáris, időben változó digitális szű­rés útján hozzuk létre a megszólaltatandó szövegre jellemző jelsorozatot. A digitális szűrés folyamata szimulálja a beszédképző szervek működését. A lineáris predikción ala­puló beszédszintetizálók általános felépíté­sét és működését Dr. Gordos Géza — Takács György: Digitális beszédfeldolgozás című, a budapesti Műszaki Könyvkiadónál 1983- ban megjelent könyvének a 202—204 olda­lai ismertetik. Fenti elveken működő beszédszintetizá­­lóra mutat példát a T/25873 számú magyar közzétételű irat és a 4,344.148 lajstromszá­mú USA szabadalmi leírás. A megoldások 8—10 szürőegyütthatóval rendelkező, rácsos struktúrájú digitális szűrőt tartalmaznak, amelyek 8 KHz-es mintavételezést feltételez­ve 125 msec-enként állítanak elő egjy beszéd­mintát. így az y=ax+b jellegű műveleteket megvalósító szűrőknek 125 msec-enként lega­lább 8 szorzást és 16 összeadást kell elvégez­niük. A fenti szűrést megvalósító real-time hard­ware ezért tartalmaz egy 16x8 bites bonyo­lult és viszonylag költséges szorzóáramkört. A magyar szabadalmi leírásban a szorzót he­lyettesítő hardware lényegesen több elemet tartalmaz, ezáltal bonyolultabb felépítésű, költséges és megnő a meghibásodások lehe­tősége is. A találmány célja olyan eljárás kidolgo­zása, amely segítségével a lineáris predikci­ón alapuló beszédszintetizálás folyamán a 1 digitális szűrés egyszerű módon megvalósít­ható, az eljárást realizáló kapcsolási elren­dezés pedig olcsó, a digitális technikában ál­talánosan alkalmazott áramköri elemekből felépíthető. A találmányi gondolatot több részintézke­dés együttese és a részintézkedések tudatos egymáshoz rendelése testesíti meg. Ennek jegyében része a találmányi gondolatnak, hogy a megszólaltatandó szöveg betöltése­kor a paramétercsoportokat tetszőleges ala­pú logaritmikus értékekként állítjuk elő és tá­roljuk el, majd a digitális szűrés folyamán a részeredményeket ideiglenesen tároljuk, a szűrést pedig a részeredmény és a követke­ző adat által kijelölt konstans betöltésével folytatjuk. A találmányi gondolathoz tartozik, hogy a digitális szűrés során alkalmazott kostan­­sokat oly módon állítjuk elő, hogy a beszéd­­szintetizálás előkészítésekor a digitális szű­rés során alkalmazott digitális jel bithosszú­ságához igazodóan meghatározzuk valameny­­nyi lehetséges értéknek minden további érték­kel képzett hányadosát és az így nyert kons­tansokat eltároljuk. A fenti, találmány szerinti eljárás alkal­mazásával a digitális szűrés realizálására szolgáló kapcsolási elrendezés egyszerű arit­metikai és logikai műveletvégző, valamint a vezérlésre szolgáló áramkörök, továbbá a paramétereket és az adatokat magúkba fog­laló tárolók célszerű összekapcsolásával ál­lítható elő. A kitűzött célnak megfelelően a találmány szerinti eljárás kötött szótáras beszédszin­tetizálásra, — amely során valamennyi meg­szólaltatandó szöveget szegmensekre bont­juk, az egyes szegmensekhez paramétercso­portot rendelünk hozzá és az így nyert para­métercsoportokat tároljuk, majd a beszédszin­tetizálás során a megszólaltatandó szöveg­hez rendelt paramétercsoportokkal vezérelt digitális szűrés útján zöngés és zöngétlen ge­nerátorok jeleiből digitális jelsorozatot állí­tunk elő, az így nyert digitális jelsorozatból analógjeleket képezünk, amelyet célszerűen erősítünk, végül pedig megszólaltatunk, — azon alapul, hogy a beszédszintetizálás elő­készítésekor a digitális szűrés során alkal­mazott digitális jel bithosszúságához igazo­dóan előre meghatározzuk valamennyi lehet­séges értéknek minden további értékkel kép­zett hányadosát, az így nyert konstansokat eltároljuk, ezentúl a megszólaltatandó szö­veg betöltésekor a paramétercsoportokat tet­szőleges alapú logaritmus értékeként állít­juk elő és tároljuk el, majd a beszédszintetizá­láskor kiválasztjuk a megszólaltatandó szö­veghez rendelt paramétercsoportokat, ame­lyekkel vezérelve elkezdjük a digitális szűrés folyamatát, a részeredményeket ideiglenesen tároljuk, a digitális szűrés folyamatához igazo­dóan az ideiglenesen tárolt részeredmény és a következő feldolgozandó adat által megha­tározott konstanst kiválasztjuk, amellyel a 2 3 5 10 15 20 25 30 35 40 45 50 55 60 65

Next

/
Thumbnails
Contents