176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására
7 176776 8 dése után a 19 vezérlőegység a szintézis folytatásához szükséges újabb adatok előállítására vonatkozó utasítást küld az 1 számítógép részére. A 4 fixtárból való kiolvasás és az ezt követő beszédelem reprodukció ideje alatt az 1 számítógép szabaddá válik, és eközben a szintézis vezérléséhez szükséges új adatok előkészítéséhez tartozó elemzéseket végez. Ha az 1 számítógépet megfelelően gyors működésű számítógép képezi, akkor egyetlen számítógép több szintetizáló berendezés vezérlését is elláthatja. Az 1 számítógép általános rendeltetésű számítógéppel, kis számítógéppel vagy mikroprocesszorral egyaránt megvalósítható. A 2. ábrán „n” fonéma kiejtéséhez tartozó rövid beütést, az ezt követő „M” fonémák több periódusát, és az „A” fonémák hosszabb sorozatát tüntettük fel. Ezt követi két olyan hangperiódus csoport, amelyek a „H”és „A” fonémáknak felelnek meg. Ez a rögzített amplitúdó karakterisztika természetes módon kiejtett szóra vonatkozik, melynek simasága és formáns átmenetei természetesen hangzanak. A 3. ábrán vázolt szintetizált szóban egymást követően az alábbi hangperiódusok követik egymást : „n”, két periódus „H”, olyan „E” periódusok, melyek az „H” és az ezt követő „A” között a formáns átmenet simaságát biztosítják, majd „A”, „H” és „A” fonémák periódusai, melyek hosszát úgy választottuk meg, hogy az alaptónus sima változását eredményezzék. A 4. és 5. ábrák közötti kapcsolat ezzel analóg, amikor is az első „M” és az első „I” fonémák közé az alap formáns átmenet kisimítása céljából „Ü” fonémát iktattunk közbe. A 4. és az 5. ábrákon vázolt szavak szonogram megfelelőit a 6. és 7.ábrákon tüntettük fel. A 6. ábrán vázolt természetes beszéd egy szavának szonogramja formánsokban sokkal gazdagabb, de erre való tekintet nélkül a fül a szintetizált szót helyesen érzékeli. Szabadalmi igénypontok 1. Eljárás beszéd szintetizálására, azzal jellemezve, hogy minden fonémát memóriában tárolt fonéma elemekből hozunk létre, ezeket egymás után a memóriából kiolvassuk, ahol a kiolvasási sebességet, irányt és az elemek számát az egyes fonémák típusával és hosszával, valamint a mondat jellegzetességeivel és a szomszédos fonémák típusával összhangban választjuk meg, a szintetizálandó szöveget a nyelv szabályai szerint mondatról mondatra nyelvtanilag és fonetikailag elemezzük, és ezzel sorjában meghatározzuk a mondat alapvető jellemzőit, és ezen értékeket állandó szövegként rögzítjük, melyek szükség esetén fonetikai jeleket, mint például a hangmagasság változásait frekvencia jellemzőként, a hangerő változásait amplitúdó jellemzőként és a szünetek időtartamát tartalmazzák, majd a fonémákból alkotott sorozatot elemezzük és figyelembe vesszük a szomszédos fonémák között fennálló kölcsönhatást, meghatározzuk a sorozaton belül a fonémák változásának helyeit és módját, ezt követően minden fonéma tekintetében a mondat alapvető tulajdonságainak figyelembevételével hangrezgések adott számú periódusát és típusát valóságos beszédből és/vagy mesterségesen előállított beszédből létrehozott jellegzetes formáns eloszlással hasonlítjuk össze, és az összehasonlítást meghatározott időtartamú, amplitúdójú és spektrális eloszlású zajfonémák meghatározott típusaira és adott számú időszektorára elvégezzük, és a nyelvre előre kijelölt hivatkozott hangrezgési periódusokat és zajfonéma elemeket digitális alakban memóriában olyan módon tároljuk, hogy ezek a megfelelő rezgés amplitúdó értékeinek sorozatát képezik, és a fonémák megfelelő frekvencia tulajdonsága eléréséhez a rezgési amplitúdók értékeinek a sorozatát a frekvencia növekedési periódus befejeződése előtt megszakítjuk, és a periódusok befejezését követően nullértékekkel folytatjuk, és a frekvencia csökkentése és a beszéd természetességének biztosítása miatt kiolvasáskor a rezgési amplitúdók periódusainak hosszát kvázivéletlen módon változtatjuk, és zaj és vegyes fonémák szintetizálásakor egységes spektrális eloszlás biztosítására a zajelemek kiolvasási részeit kvázi véletlen kezdeti címekkel indítjuk, a kiolvasást kvázivéletlen időtartamra és irányra végezzük el, és ugyanazon tárolt zajelemekből különböző fonémák létrehozására az elemek tárolt értékeinek a kiolvasási frekvenciáját változtatjuk, vagy ugyanezért a fonémák amplitúdó jellemzőit változtatjuk, és a vegyes fonémákat úgy hozzuk létre, hogy hangperiódusokat és zajrészeket egymással összekapcsolunk, és a fonéma átmenetek simaságának biztosítására a fonémák közötti átmenet jellegének megfelelő formáns eloszlású periódusokat alkalmazunk, és a rezgési amplitúdókat a megfelelő átmeneti tartományban lecsökkentjük, továbbá a memóriában rögzített beszédelemek reprodukcióját a mondat fonéma összetételének és alapjellemzőinek elemzésekor előkészített digitális adatok alapján vezéreljük, és a fonémák amplitúdó jellemzőit a digitális értékek átalakításával kapott szintetizált fonémák analóg jelének az erősítésével vezéreljük, és a vezérlést a fonémák amplitúdó jellemzői digitális értékeinek megfelelő analóg jel segítségével végezzük el. 2. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a periódusok hosszát ±40%-os határokon belül változtatjuk. 3. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a rezgési amplitúdók periódushosszának a kvázivéletlen változtatásait a kiolvasáskor ± 3%-os határokon belül tartjuk. 4. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a beszéd természetességének biztosításához a hangrezgési periódusokat és ezek amplitúdóit kvázivéletlen módon változtatjuk, vegyes fonémák előállításához a modulált amplitúdó-zaj rezgések periódusát, végül az „R” fonéma előállításához a modulált hangrezgések periódusát kvázivéletlen módon változtatjuk. 5. Berendezés beszéd szintetizálására, amely számítógépet tartalmaz, azzal jellemezve, hogy a számítógép (1) kimenete címregiszter számlálón (3) keresztül fixtárhoz (4) csatlakozik, a számítógép (1) második kimenete számlálási irányt meghatározó regiszterrel (6) van összekötve, amelynek kimenete a címregiszter számlálóval (3) van összekötve, a számítógép (1) harmadik és negyedik kimenete (7, 8) a számlálási frekvenciát meghatározó regiszterhez (9) illetve a kiolvasási címek számát meghatározó regiszterhez (10) csatlakozik, és ezen regiszterek (9, 10) előírt számú és frekvenciájú impulzust előállító impulzusgenerátorral (11) vannak összekötve, az impulzusgenerátor (11) kimenete a címregiszter számláló (3) számláló bemenetéhez csatlakozik, a számítógép (1) ötödik kimenete (12) amplitúdó szabályozó regiszteren 5 10 15 20 25 30 35 40 45 50 55 60 65 4