193999. lajstromszámú szabadalom • Eljárás és kapcsolási elrendezés kötött szótáras beszédszintetizálásra | Library

193999. lajstromszámú szabadalom • Eljárás és kapcsolási elrendezés kötött szótáras beszédszintetizálásra

193999 A találmány tárgya eljárás kötött szótáras beszédszintetizálásra, amelynek során valamennyi megszólaltatandó szöveget szegmensekre bontjuk, az egyes szegmensekhez paramétercsoportot rendelünk hozzá és az így nyert paramétercsoportokat tároljuk, majd a beszédszintetizálás során a megszólaltatandó szöveghez rendelt paramétercsoportokkal vezérelt digitális szűrés útján zöngés és zöngétlen generátorok jeleiből digitális jelsorozatot állítunk elő, az így nyert digitálisjelsorozatból analóg jeleket képezünk, amelyet célszerűen erősítünk végül pedig megszólaltatjuk. Tárgya továbbá a találmánynak az eljárás foganatosítására szolgáló kapcsolási elrendezés is. A beszédszintetizálók az emberi beszédkeltés folyamatát utánozzák valamilyen formában. A beszédszintetizáló bemenetére a közlendő információ kódolt formában érkezik, amelynek hatására egy speciális átkódolási folyamat eredményeként a beszédszintetizáló kimenetén a kívánt közlendőt hordozó beszédjel jelenik meg. A kötött szótáras beszédszintetizálók napjainkban legelterjedtebb típusa az úgynevezett lineáris predikción alapul, amely mind az ár, mind a minőség szempontjából a legelőnyösebbnek tűnik. A lineáris predikción alapuló beszédszintetizálás során a zöngés és zöngétlen generátorok jeléből egy erősségi faktorral való szorzás után lineáris, időben változó digitális szűrés útján hozzuk létre a megszólaltatandó szövegre jellemző jelsorozatot. A digitális szűrés folyamata szimulálja a beszédképző szervek működését. A lineáris predikción alapuló beszédszintetizálók általános felépítését és működését Dr. Gordos Géza — Takács György: Digitális beszédfeldolgozás című, a budapesti Műszaki Könyvkiadónál 1983- ban megjelent könyvének a 202—204 oldalai ismertetik. Fenti elveken működő beszédszintetizálóra mutat példát a T/25873 számú magyar közzétételű irat és a 4,344.148 lajstromszámú USA szabadalmi leírás. A megoldások 8—10 szürőegyütthatóval rendelkező, rácsos struktúrájú digitális szűrőt tartalmaznak, amelyek 8 KHz-es mintavételezést feltételezve 125 msec-enként állítanak elő egjy beszédmintát. így az y=ax+b jellegű műveleteket megvalósító szűrőknek 125 msec-enként legalább 8 szorzást és 16 összeadást kell elvégezniük. A fenti szűrést megvalósító real-time hardware ezért tartalmaz egy 16x8 bites bonyolult és viszonylag költséges szorzóáramkört. A magyar szabadalmi leírásban a szorzót helyettesítő hardware lényegesen több elemet tartalmaz, ezáltal bonyolultabb felépítésű, költséges és megnő a meghibásodások lehetősége is. A találmány célja olyan eljárás kidolgozása, amely segítségével a lineáris predikción alapuló beszédszintetizálás folyamán a 1 digitális szűrés egyszerű módon megvalósítható, az eljárást realizáló kapcsolási elrendezés pedig olcsó, a digitális technikában általánosan alkalmazott áramköri elemekből felépíthető. A találmányi gondolatot több részintézkedés együttese és a részintézkedések tudatos egymáshoz rendelése testesíti meg. Ennek jegyében része a találmányi gondolatnak, hogy a megszólaltatandó szöveg betöltésekor a paramétercsoportokat tetszőleges alapú logaritmikus értékekként állítjuk elő és tároljuk el, majd a digitális szűrés folyamán a részeredményeket ideiglenesen tároljuk, a szűrést pedig a részeredmény és a következő adat által kijelölt konstans betöltésével folytatjuk. A találmányi gondolathoz tartozik, hogy a digitális szűrés során alkalmazott kostansokat oly módon állítjuk elő, hogy a beszédszintetizálás előkészítésekor a digitális szűrés során alkalmazott digitális jel bithosszúságához igazodóan meghatározzuk valamenynyi lehetséges értéknek minden további értékkel képzett hányadosát és az így nyert konstansokat eltároljuk. A fenti, találmány szerinti eljárás alkalmazásával a digitális szűrés realizálására szolgáló kapcsolási elrendezés egyszerű aritmetikai és logikai műveletvégző, valamint a vezérlésre szolgáló áramkörök, továbbá a paramétereket és az adatokat magúkba foglaló tárolók célszerű összekapcsolásával állítható elő. A kitűzött célnak megfelelően a találmány szerinti eljárás kötött szótáras beszédszintetizálásra, — amely során valamennyi megszólaltatandó szöveget szegmensekre bontjuk, az egyes szegmensekhez paramétercsoportot rendelünk hozzá és az így nyert paramétercsoportokat tároljuk, majd a beszédszintetizálás során a megszólaltatandó szöveghez rendelt paramétercsoportokkal vezérelt digitális szűrés útján zöngés és zöngétlen generátorok jeleiből digitális jelsorozatot állítunk elő, az így nyert digitális jelsorozatból analógjeleket képezünk, amelyet célszerűen erősítünk, végül pedig megszólaltatunk, — azon alapul, hogy a beszédszintetizálás előkészítésekor a digitális szűrés során alkalmazott digitális jel bithosszúságához igazodóan előre meghatározzuk valamennyi lehetséges értéknek minden további értékkel képzett hányadosát, az így nyert konstansokat eltároljuk, ezentúl a megszólaltatandó szöveg betöltésekor a paramétercsoportokat tetszőleges alapú logaritmus értékeként állítjuk elő és tároljuk el, majd a beszédszintetizáláskor kiválasztjuk a megszólaltatandó szöveghez rendelt paramétercsoportokat, amelyekkel vezérelve elkezdjük a digitális szűrés folyamatát, a részeredményeket ideiglenesen tároljuk, a digitális szűrés folyamatához igazodóan az ideiglenesen tárolt részeredmény és a következő feldolgozandó adat által meghatározott konstanst kiválasztjuk, amellyel a 2 3 5 10 15 20 25 30 35 40 45 50 55 60 65

Thumbnails

Contents