189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására
1 alapján meg lehet változtatni. Helyes változtatás a minőséget javíthatja. Maga az adatbázis 7 memóriában, tipikus PROM vagy EPROM-ban van tárolva. A 9 szintetizátorban a beszéd alkalmasan választott időtartamú szegmensek egymásutániságából áll. A hangot adott esetben erősítés és szűrés közbejöttével a 11 szintetizátor aritmetika hozza létre. A 11 szintetizátor aritmetika olyan átvivő rendszer, amelynek meghatározó paraméterei tipikusan szegmensről szegmensre változnak. A meghatározó paraméterek a mindanivalótól függenek, és azokat egy paraméter-tárból egy 10 rendszer vezérlő juttatja a szokásos esetekben szegmensről szegmensre all szintetizátor aritmetikába. All szintetizátor aritmetikát vezérlő 10 rendszervezérlő az egymás utáni szegmensek azonos funkciójú paraméterei között 2 lépéses adott esetben nem lineáris interpolációt végezhet úgy, hogy egy szegmens utolsó M mintája és a következő szegmens első N mintája által meghatározott interpolációs tartománybeli minta-sorozat (1-1) darab, nem feltétlenül egyenlő szakaszra osztja, és ezen szakaszok mintáinak előállítását a szóbanforgó paraméter olyan, a paraméter-készletben nem szereplő értékeivel végzi, amelyek a két egymás utáni szegmesn paraméter-készletbeli paraméterértékei között egy 1 lépcsős, nem feltétlenül egyenlő lépcsőkből álló átmenetet képviselnek. Ezáltal természetesebb hangzás érhető el. Az előzőekben leírtakat több paraméterre is lehet alkalmazni azonos vagy különböző interpolációs tartománnyal, lépésszámmal és lépcső-sorozattal, beleértve azt a paraméterátúsztatásnak nevezett esetet is, amikor a paraméterekre nincs interpoláció, de a különböző paraméterek más-más beszédminta előállításánál kerülnek kicserélésre. All szintetizátor aritmetika bemenetére - általában a 10 rendszer vezérlőből — két E2 és Ej gerjesztő jel egyike, másika, vagy együttese kerül, mégpedig szintén a paraméter-tárban elhelyezett információktól függően. Az egyik E2 gerjesztő jel zajszerű - ezt alkalmazzuk a zöngétlen hangoknál, a másik E2 jel egy olyan impulzus-sorozat, amelyben az impulzusok távolsága megfelel a mondanivaló hangmagasságának - ezt alkalmazzuk a legtöbb vagy minden zöngés hang esetén, míg opcionálisan a kettő együttesét is alkalmazhatjuk bizonyos zöngés hang esetén. Az irodalomban hullámforma, formám és LPC szintetizátor aritmetikákat ismertetnek. All szintetizátor aritmetika az emberi beszédkeltés akusztikus csőmodelljének önmagában ismert elektronikai megvalósításán alapul. A csőmodell a 2. ábrán látható módon elemi szakaszokból épül fel, ezek együttes darabszáma a szintézis fokszámát határozza meg. Tipikus a 6-14-os fokszám. A fokszámot a továbbiakban általában p jelöli. A Gt és G2 szorzók a megfelelő hangerő beállítást teszik lehetővé. Az egyes elemi szakaszok ún. elemi reflexiós gráfból és T0 vagy TJ2 idejű késleltetőkből épülnek fel és a 3. 4. és 5. ábrán láthatók, az irodalomból ismert háromféle változatban. Az elemi reflexiós gráfok irodalomból ismert négy lehetséges változata a 6.7.8. és 9. ábrákon látható. A csőmodell tulajdonságait az ti, 32-jeflexiós együtthatók határozzák meg, ezek szama megegyezik a szintézis fokszámával. A 10. ábrán példaképpen a 3. és 8. ábra változatát 6 2 felhasználó, egyszórzós csőmodell hatásgráfja látható. A 10. ábrán láthatók az egyes szakaszok és az Ej és E2 jelgenerátor. Az ábrán T. a mintáidényi késleltetés, a gráfélre írt szám szorzószám, a gráfélek összefutása összeadást jelent, a fel nem tüntetett szorzószámok értéke 1. A gárfot minden beszédminta kiszámításához egyszer végig kell számolni. Hangjelenség előállításához a csőmodell u bemenetét gerjesztéssel kell táplálni, és a hangjelenség a v kimeneten jelenik meg. Zöngés hang előállításához a hang alapfrekvenciájának megfelelő periodikus, zöngétlen hang előállításához zajszerű, míg egyes hangok (pl. z) előállításához mindkét fajta gerjesztést alkalmazunk. A 10. ábra példaképpen a kétfajta gerjesztést is feltünteti. Igen sokszor a teljes rendszer időben diszkrét működésű, ami azt jelenti, hogy a beszéd megkívánt mintavételi frekvenciájának megfelelő ütemben az u interfészen adott gerjesztés-minták hatására v interfészen ugyanilyen ütemben beszédminták (röviden: minták) lépnek ki. Időben diszkrét működésnél a periodikus gerjesztés tipikusan csak az alapfrekvenciának megfelelő időközönként különbözik zérustól, míg a zajszerű gerjesztés tipikusan minden minta-ütemben egy véletlenszerű értékkel jelenik meg. A gerjesztést legtöbb esetben a 10 rendszer vezérlő szolgáltatja. A 10 ábrán Bj jelöli az előre haladó ún. gerjesztés hullám értékét az i-edik elemi reflexiós gráf mentén, míg Aj(n) az ugyanebben a gráfban az n-edik minta szintetizálásakor keletkező ún. reflexiós hullám értékét jelöli. A 2. ábrán és az annak példájaként szolgáló 10. ábrán az u és v interfészek között ismétlődő struktúrájú szakaszok jelennek meg. A találmány szerinti megoldás ezt kihasználja a diszkrét működés során azáltal, hogy az elemi gráfot csak egyszer valósítja meg, de két minta között ezt az egyetlen elemi gráfot annyiszor működteti, ahány elemi gráfból az i és v interfészek közötti szakasz áll. Az elemi gráf n reflexiós együtthatója r/i, működésről működésre változik, és egy működés eredménye a következő működés bemeneti adatát szolgáltatja, mely alól az utolsó működés a kivétel, mert az a v, interfész kimeneti adatot szolgáltatja. A 11 szintetizátor aritmetika-a hangerőre jellemző információt minden akusztikus csőmodellbeli szakasz előtt, illetve után, illetve egyszerre akár több helyen is képes fogadni, miáltal elkerülhető, hogy az egyes szakaszokban a jel túl- vagy alul csorduljon. A relatív hangerőre a különböző pontokon alkalmazott erősítési tényezők szorzata a jellemző. A 10. ábrán a példa kedvéért az első szakasz előtti ős az utolsó szakasz utáni hely van feltüntetve. A hangerőre jellemző információ G1 és G2 szorzó (erősítős) beépítése megtöri a csőmodell strukturálisan periodikus jellegét. A 10. ábrán bemutatott példaképpen! elrendezésnek all. ábra szerinti kiviteli alakja digitálisan megvalósított rendszer, ahol a periodikus jelleg kiterjed az u-v interfészek közötti szakaszról az u bemenet v kimenet közötti szakaszra. Ez akkor is megvalósul, ha a hangerő információ az ábrákon bemutatottaktól eltérően az u-v interfészek közötti szakaszon került elhelyezésre. Az uniformizáltan periódikus struktúra a reflexiós gráfra nézve az előzőekben leírt előnyöket a hangerőre jellemző információkat 189.378 5 10 15 20 25 30 35 40 45 50 55 60