176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására
MAGYAR NÉPKÖZTÁRSASÁG SZABADALMI LEÍRÁS 176776 0 Bejelentés napja : 1977. IX. 5. (El—760) Elsőbbsége : Bulgária : 1976. IX. 8. (34 160) Nemzetközi osztályozás: G 10 L 1/00 ORSZÁGOS TALÁLMÁNYI HIVATAL Közzététel napja: 1980. XI. 28. Megjelent: 1981. XI. 30. Feltaláló: Szabadalmas: Antonov Ljubomir Jordanov, oki. mérnök, Szófia, Edinen Zentar Po Physika, Szófia, Bulgária Bulgária Eljárás és berendezés beszéd szintetizálására 1 A találmány tárgya eljárás és berendezés beszéd szintetizálására, amely a számítógépes technika területén a számítógép és az ember között kapcsolatot teremtő egységként használható. Ismertek már eljárások és berendezések beszéd szintetizálására, amelyek teljes szavak vagy szótagok reprodukcióján alapultak, és az ilyen berendezések nagy kapacitású mágneslemezes tárakat használtak. Az ilyen berendezések szókincse a tár kapacitására való tekintet nélkül mindenképpen korlátozott volt. Ismertek ezenkívül olyan eljárások és berendezések is beszéd szintetizálására, ahol a különböző fonémákat megfelelő amplitúdójú és frekvenciájú szinuszos rezgések összekeveréséből állítják elő. Ezek a berendezések nagyon bonyolult felépítésűek és nehézkes behangolású analóg generátorok felhasználását igénylik. A találmány célja ezért olyan eljárás és berendezés létrehozása beszéd szintetizálására, amely csak kis kapacitású tárat használ és nem igényel nagy bonyolultságú egységeket és nehézkes behangolást. A kitűzött célt a találmány szerinti eljárással összhangban úgy érjük el, hogy a beszéd szintetizálását olyan fonémákra alapítjuk, amelyeket digitális elektronikus áramkörök segítségével szintetizálunk és ezt követően digitál-analóg átalakítók segítségével analóg jellé alakítunk. Egy adott szöveg fonémáinak szintézisét annak alapján végezzük el, hogy a tárban rögzítjük a különböző formáns eloszlású fonémák hangperiódusait, zajfonéma elemeket, a hangsúlyozás helyére vonatkozó információt, melyek jellemzőek a vonatkozó fonémák 2 amplitúdó sajátosságaira, az adott fonéma szintéziséhe szükséges hang és zaj elemek sorozatát, a fonémák k vázivéletlen változásának táblázatait, valamint a mondathangsúlyozás elemzéséből kapott adatokat, a szünetek 5 időtartamát és a fonémák között a fő átmenetek megvalósításához tartozó hang elemek időtartamát. A szintetizálandó szöveg mondatait program szerint nyelvtanilag elemezzük, hogy a szóban forgó mondat alapvető jellemzőit megállapíthassuk. Ilyen jellemző például 10 a hangmagasságának, mint frekvencia jellemzőnek a változási jellege, a hangerőnek, mint amplitúdó jellemzőnek a változása és a beszédszünetek hossza. A fonémák sorozatát olyan szempontból is elemezzük, hogy megvizsgáljuk a szomszédos fonémák kölcsönhatását és 15 megállapítjuk a sorozaton belül a fonémák változásának módját és helyét. A mondat alapvető tulajdonságainak vizsgálata alapján minden fonéma esetében a fonémát kapcsolatba hozzuk hangrezgési periódusok egy meghatározott típusával és a periódusok számával, ahol a 20 hangrezgéshez jellegzetes formáns eloszlás tartozik, és minden fonémát társítjuk ezenkívül megfelelő időtartamú és ehhez tartozó spektrális eloszlású zajfonéma elemek meghatározott típusával és számával. Egy adott nyelvre jellemző hivatkozott hangrezgési periódusokat 25 és zajfonéma elemeket digitális alakban tárban tároljuk, mint a megfelelő rezgések amplitúdó értékeinek sorozatát. A fonémák megfelelő frekvencia jellemzőinek előállításához a rezgési amplitúdó kiolvasása a periódus befejeződése előtt megszakítható, vagy a periódus be- 30 fejeződését követően nullértékekkel folytatható. A be-176776