176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására

7 176776 8 dése után a 19 vezérlőegység a szintézis folytatásához szükséges újabb adatok előállítására vonatkozó utasí­tást küld az 1 számítógép részére. A 4 fixtárból való ki­olvasás és az ezt követő beszédelem reprodukció ideje alatt az 1 számítógép szabaddá válik, és eközben a szin­tézis vezérléséhez szükséges új adatok előkészítéséhez tartozó elemzéseket végez. Ha az 1 számítógépet megfelelően gyors működésű számítógép képezi, akkor egyetlen számítógép több szintetizáló berendezés vezérlését is elláthatja. Az 1 szá­mítógép általános rendeltetésű számítógéppel, kis szá­mítógéppel vagy mikroprocesszorral egyaránt megvaló­sítható. A 2. ábrán „n” fonéma kiejtéséhez tartozó rövid be­ütést, az ezt követő „M” fonémák több periódusát, és az „A” fonémák hosszabb sorozatát tüntettük fel. Ezt kö­veti két olyan hangperiódus csoport, amelyek a „H”és „A” fonémáknak felelnek meg. Ez a rögzített amplitúdó karakterisztika természetes módon kiejtett szóra vonat­kozik, melynek simasága és formáns átmenetei termé­szetesen hangzanak. A 3. ábrán vázolt szintetizált szóban egymást köve­tően az alábbi hangperiódusok követik egymást : „n”, két periódus „H”, olyan „E” periódusok, melyek az „H” és az ezt követő „A” között a formáns átmenet simaságát biztosítják, majd „A”, „H” és „A” fonémák periódusai, melyek hosszát úgy választottuk meg, hogy az alaptónus sima változását eredményezzék. A 4. és 5. ábrák közötti kapcsolat ezzel analóg, ami­kor is az első „M” és az első „I” fonémák közé az alap formáns átmenet kisimítása céljából „Ü” fonémát iktat­tunk közbe. A 4. és az 5. ábrákon vázolt szavak szonogram meg­felelőit a 6. és 7.ábrákon tüntettük fel. A 6. ábrán vázolt természetes beszéd egy szavának szonogramja formán­sokban sokkal gazdagabb, de erre való tekintet nélkül a fül a szintetizált szót helyesen érzékeli. Szabadalmi igénypontok 1. Eljárás beszéd szintetizálására, azzal jellemezve, hogy minden fonémát memóriában tárolt fonéma ele­mekből hozunk létre, ezeket egymás után a memóriából kiolvassuk, ahol a kiolvasási sebességet, irányt és az ele­mek számát az egyes fonémák típusával és hosszával, valamint a mondat jellegzetességeivel és a szomszédos fonémák típusával összhangban választjuk meg, a szin­tetizálandó szöveget a nyelv szabályai szerint mondatról mondatra nyelvtanilag és fonetikailag elemezzük, és ezzel sorjában meghatározzuk a mondat alapvető jel­lemzőit, és ezen értékeket állandó szövegként rögzítjük, melyek szükség esetén fonetikai jeleket, mint például a hangmagasság változásait frekvencia jellemzőként, a hangerő változásait amplitúdó jellemzőként és a szüne­tek időtartamát tartalmazzák, majd a fonémákból alko­tott sorozatot elemezzük és figyelembe vesszük a szom­szédos fonémák között fennálló kölcsönhatást, megha­tározzuk a sorozaton belül a fonémák változásának he­lyeit és módját, ezt követően minden fonéma tekinteté­ben a mondat alapvető tulajdonságainak figyelembe­vételével hangrezgések adott számú periódusát és típu­sát valóságos beszédből és/vagy mesterségesen előállított beszédből létrehozott jellegzetes formáns eloszlással ha­sonlítjuk össze, és az összehasonlítást meghatározott időtartamú, amplitúdójú és spektrális eloszlású zajfoné­mák meghatározott típusaira és adott számú időszekto­rára elvégezzük, és a nyelvre előre kijelölt hivatkozott hangrezgési periódusokat és zajfonéma elemeket digitá­lis alakban memóriában olyan módon tároljuk, hogy ezek a megfelelő rezgés amplitúdó értékeinek sorozatát képezik, és a fonémák megfelelő frekvencia tulajdonsága eléréséhez a rezgési amplitúdók értékeinek a sorozatát a frekvencia növekedési periódus befejeződése előtt megszakítjuk, és a periódusok befejezését követően nullértékekkel folytatjuk, és a frekvencia csökkentése és a beszéd természetességének biztosítása miatt kiolvasás­kor a rezgési amplitúdók periódusainak hosszát kvázi­­véletlen módon változtatjuk, és zaj és vegyes fonémák szintetizálásakor egységes spektrális eloszlás biztosítá­sára a zajelemek kiolvasási részeit kvázi véletlen kezdeti címekkel indítjuk, a kiolvasást kvázivéletlen időtartam­ra és irányra végezzük el, és ugyanazon tárolt zajelemek­ből különböző fonémák létrehozására az elemek tárolt értékeinek a kiolvasási frekvenciáját változtatjuk, vagy ugyanezért a fonémák amplitúdó jellemzőit változtat­juk, és a vegyes fonémákat úgy hozzuk létre, hogy hang­periódusokat és zajrészeket egymással összekapcsolunk, és a fonéma átmenetek simaságának biztosítására a fo­némák közötti átmenet jellegének megfelelő formáns eloszlású periódusokat alkalmazunk, és a rezgési ampli­túdókat a megfelelő átmeneti tartományban lecsökkent­­jük, továbbá a memóriában rögzített beszédelemek rep­rodukcióját a mondat fonéma összetételének és alap­­jellemzőinek elemzésekor előkészített digitális adatok alapján vezéreljük, és a fonémák amplitúdó jellemzőit a digitális értékek átalakításával kapott szintetizált foné­mák analóg jelének az erősítésével vezéreljük, és a vezér­lést a fonémák amplitúdó jellemzői digitális értékeinek megfelelő analóg jel segítségével végezzük el. 2. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a periódusok hosszát ±40%-os határokon belül változtatjuk. 3. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a rezgési amplitúdók periódushosszának a kvázivéletlen változtatásait a ki­olvasáskor ± 3%-os határokon belül tartjuk. 4. Az 1. igénypont szerinti eljárás foganatosításának módja, azzal jellemezve, hogy a beszéd természetességé­nek biztosításához a hangrezgési periódusokat és ezek amplitúdóit kvázivéletlen módon változtatjuk, vegyes fonémák előállításához a modulált amplitúdó-zaj rezgé­sek periódusát, végül az „R” fonéma előállításához a modulált hangrezgések periódusát kvázivéletlen módon változtatjuk. 5. Berendezés beszéd szintetizálására, amely számító­gépet tartalmaz, azzal jellemezve, hogy a számítógép (1) kimenete címregiszter számlálón (3) keresztül fixtárhoz (4) csatlakozik, a számítógép (1) második kimenete számlálási irányt meghatározó regiszterrel (6) van össze­kötve, amelynek kimenete a címregiszter számlálóval (3) van összekötve, a számítógép (1) harmadik és negyedik kimenete (7, 8) a számlálási frekvenciát meghatározó regiszterhez (9) illetve a kiolvasási címek számát megha­tározó regiszterhez (10) csatlakozik, és ezen regiszterek (9, 10) előírt számú és frekvenciájú impulzust előállító impulzusgenerátorral (11) vannak összekötve, az im­pulzusgenerátor (11) kimenete a címregiszter számláló (3) számláló bemenetéhez csatlakozik, a számítógép (1) ötödik kimenete (12) amplitúdó szabályozó regiszteren 5 10 15 20 25 30 35 40 45 50 55 60 65 4

Next

/
Thumbnails
Contents