176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására

MAGYAR NÉPKÖZTÁRSASÁG SZABADALMI LEÍRÁS 176776 0 Bejelentés napja : 1977. IX. 5. (El—760) Elsőbbsége : Bulgária : 1976. IX. 8. (34 160) Nemzetközi osztályozás: G 10 L 1/00 ORSZÁGOS TALÁLMÁNYI HIVATAL Közzététel napja: 1980. XI. 28. Megjelent: 1981. XI. 30. Feltaláló: Szabadalmas: Antonov Ljubomir Jordanov, oki. mérnök, Szófia, Edinen Zentar Po Physika, Szófia, Bulgária Bulgária Eljárás és berendezés beszéd szintetizálására 1 A találmány tárgya eljárás és berendezés beszéd szin­tetizálására, amely a számítógépes technika területén a számítógép és az ember között kapcsolatot teremtő egy­ségként használható. Ismertek már eljárások és berendezések beszéd szin­tetizálására, amelyek teljes szavak vagy szótagok repro­dukcióján alapultak, és az ilyen berendezések nagy kapa­citású mágneslemezes tárakat használtak. Az ilyen be­rendezések szókincse a tár kapacitására való tekintet nélkül mindenképpen korlátozott volt. Ismertek ezenkívül olyan eljárások és berendezések is beszéd szintetizálására, ahol a különböző fonémákat megfelelő amplitúdójú és frekvenciájú szinuszos rezgé­sek összekeveréséből állítják elő. Ezek a berendezések nagyon bonyolult felépítésűek és nehézkes behangolású analóg generátorok felhasználását igénylik. A találmány célja ezért olyan eljárás és berendezés létrehozása beszéd szintetizálására, amely csak kis kapa­citású tárat használ és nem igényel nagy bonyolultságú egységeket és nehézkes behangolást. A kitűzött célt a találmány szerinti eljárással össz­hangban úgy érjük el, hogy a beszéd szintetizálását olyan fonémákra alapítjuk, amelyeket digitális elektro­nikus áramkörök segítségével szintetizálunk és ezt köve­tően digitál-analóg átalakítók segítségével analóg jellé alakítunk. Egy adott szöveg fonémáinak szintézisét an­nak alapján végezzük el, hogy a tárban rögzítjük a kü­lönböző formáns eloszlású fonémák hangperiódusait, zajfonéma elemeket, a hangsúlyozás helyére vonatkozó információt, melyek jellemzőek a vonatkozó fonémák 2 amplitúdó sajátosságaira, az adott fonéma szintéziséhe szükséges hang és zaj elemek sorozatát, a fonémák k vázi­­véletlen változásának táblázatait, valamint a mondat­hangsúlyozás elemzéséből kapott adatokat, a szünetek 5 időtartamát és a fonémák között a fő átmenetek meg­valósításához tartozó hang elemek időtartamát. A szin­tetizálandó szöveg mondatait program szerint nyelv­tanilag elemezzük, hogy a szóban forgó mondat alap­vető jellemzőit megállapíthassuk. Ilyen jellemző például 10 a hangmagasságának, mint frekvencia jellemzőnek a változási jellege, a hangerőnek, mint amplitúdó jellem­zőnek a változása és a beszédszünetek hossza. A foné­mák sorozatát olyan szempontból is elemezzük, hogy megvizsgáljuk a szomszédos fonémák kölcsönhatását és 15 megállapítjuk a sorozaton belül a fonémák változásának módját és helyét. A mondat alapvető tulajdonságainak vizsgálata alapján minden fonéma esetében a fonémát kapcsolatba hozzuk hangrezgési periódusok egy meg­határozott típusával és a periódusok számával, ahol a 20 hangrezgéshez jellegzetes formáns eloszlás tartozik, és minden fonémát társítjuk ezenkívül megfelelő időtar­tamú és ehhez tartozó spektrális eloszlású zajfonéma elemek meghatározott típusával és számával. Egy adott nyelvre jellemző hivatkozott hangrezgési periódusokat 25 és zajfonéma elemeket digitális alakban tárban tároljuk, mint a megfelelő rezgések amplitúdó értékeinek soro­zatát. A fonémák megfelelő frekvencia jellemzőinek előállításához a rezgési amplitúdó kiolvasása a periódus befejeződése előtt megszakítható, vagy a periódus be- 30 fejeződését követően nullértékekkel folytatható. A be-176776

Next

/
Oldalképek
Tartalom