189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására

1 alapján meg lehet változtatni. Helyes változtatás a minőséget javíthatja. Maga az adatbázis 7 memóriá­ban, tipikus PROM vagy EPROM-ban van tárolva. A 9 szintetizátorban a beszéd alkalmasan válasz­tott időtartamú szegmensek egymásutániságából áll. A hangot adott esetben erősítés és szűrés közbejötté­vel a 11 szintetizátor aritmetika hozza létre. A 11 szintetizátor aritmetika olyan átvivő rendszer, amely­nek meghatározó paraméterei tipikusan szegmensről szegmensre változnak. A meghatározó paraméterek a mindanivalótól függenek, és azokat egy paraméter-tár­ból egy 10 rendszer vezérlő juttatja a szokásos esetek­ben szegmensről szegmensre all szintetizátor aritme­tikába. All szintetizátor aritmetikát vezérlő 10 rendszer­vezérlő az egymás utáni szegmensek azonos funkciójú paraméterei között 2 lépéses adott esetben nem lineá­ris interpolációt végezhet úgy, hogy egy szegmens u­­tolsó M mintája és a következő szegmens első N min­tája által meghatározott interpolációs tartománybeli minta-sorozat (1-1) darab, nem feltétlenül egyenlő szakaszra osztja, és ezen szakaszok mintáinak előállí­tását a szóbanforgó paraméter olyan, a paraméter­­-készletben nem szereplő értékeivel végzi, amelyek a két egymás utáni szegmesn paraméter-készletbeli pa­raméterértékei között egy 1 lépcsős, nem feltétlenül egyenlő lépcsőkből álló átmenetet képviselnek. Ezál­tal természetesebb hangzás érhető el. Az előzőekben leírtakat több paraméterre is lehet alkalmazni azonos vagy különböző interpolációs tar­tománnyal, lépésszámmal és lépcső-sorozattal, bele­értve azt a paraméterátúsztatásnak nevezett esetet is, amikor a paraméterekre nincs interpoláció, de a kü­lönböző paraméterek más-más beszédminta előállítá­sánál kerülnek kicserélésre. All szintetizátor aritmetika bemenetére - általá­ban a 10 rendszer vezérlőből — két E2 és Ej gerjesztő jel egyike, másika, vagy együttese kerül, mégpedig szintén a paraméter-tárban elhelyezett információktól függően. Az egyik E2 gerjesztő jel zajszerű - ezt al­kalmazzuk a zöngétlen hangoknál, a másik E2 jel egy olyan impulzus-sorozat, amelyben az impulzusok tá­volsága megfelel a mondanivaló hangmagasságának - ezt alkalmazzuk a legtöbb vagy minden zöngés hang esetén, míg opcionálisan a kettő együttesét is alkal­mazhatjuk bizonyos zöngés hang esetén. Az irodalom­ban hullámforma, formám és LPC szintetizátor arit­metikákat ismertetnek. All szintetizátor aritmetika az emberi beszéd­­keltés akusztikus csőmodelljének önmagában ismert elektronikai megvalósításán alapul. A csőmodell a 2. ábrán látható módon elemi szakaszokból épül fel, e­­zek együttes darabszáma a szintézis fokszámát hatá­rozza meg. Tipikus a 6-14-os fokszám. A fokszámot a továbbiakban általában p jelöli. A Gt és G2 szorzók a megfelelő hangerő beállítást teszik lehetővé. Az egyes elemi szakaszok ún. elemi reflexiós gráf­ból és T0 vagy TJ2 idejű késleltetőkből épülnek fel és a 3. 4. és 5. ábrán láthatók, az irodalomból ismert háromféle változatban. Az elemi reflexiós gráfok iro­dalomból ismert négy lehetséges változata a 6.7.8. és 9. ábrákon látható. A csőmodell tulajdonságait az ti, 32-jeflexiós együtthatók határozzák meg, ezek szama megegyezik a szintézis fokszámával. A 10. ábrán példaképpen a 3. és 8. ábra változatát 6 2 felhasználó, egyszórzós csőmodell hatásgráfja látható. A 10. ábrán láthatók az egyes szakaszok és az Ej és E2 jelgenerátor. Az ábrán T. a mintáidényi késlel­tetés, a gráfélre írt szám szorzószám, a gráfélek össze­futása összeadást jelent, a fel nem tüntetett szorzó­­számok értéke 1. A gárfot minden beszédminta kiszá­mításához egyszer végig kell számolni. Hangjelenség előállításához a csőmodell u bemene­tét gerjesztéssel kell táplálni, és a hangjelenség a v ki­meneten jelenik meg. Zöngés hang előállításához a hang alapfrekvenciájának megfelelő periodikus, zön­gétlen hang előállításához zajszerű, míg egyes hangok (pl. z) előállításához mindkét fajta gerjesztést alkal­mazunk. A 10. ábra példaképpen a kétfajta gerjesztést is feltünteti. Igen sokszor a teljes rendszer időben diszkrét mű­ködésű, ami azt jelenti, hogy a beszéd megkívánt min­tavételi frekvenciájának megfelelő ütemben az u inter­fészen adott gerjesztés-minták hatására v interfészen ugyanilyen ütemben beszédminták (röviden: minták) lépnek ki. Időben diszkrét működésnél a periodikus gerjesztés tipikusan csak az alapfrekvenciának megfe­lelő időközönként különbözik zérustól, míg a zajsze­rű gerjesztés tipikusan minden minta-ütemben egy vé­letlenszerű értékkel jelenik meg. A gerjesztést legtöbb esetben a 10 rendszer vezérlő szolgáltatja. A 10 ábrán Bj jelöli az előre haladó ún. gerjesztés hullám értékét az i-edik elemi reflexiós gráf mentén, míg Aj(n) az ugyanebben a gráfban az n-edik minta szintetizálásakor keletkező ún. reflexiós hullám érté­két jelöli. A 2. ábrán és az annak példájaként szolgáló 10. áb­rán az u és v interfészek között ismétlődő struktúrá­jú szakaszok jelennek meg. A találmány szerinti meg­oldás ezt kihasználja a diszkrét működés során azáltal, hogy az elemi gráfot csak egyszer valósítja meg, de két minta között ezt az egyetlen elemi gráfot annyi­szor működteti, ahány elemi gráfból az i és v interfé­szek közötti szakasz áll. Az elemi gráf n reflexiós együtthatója r/i, működésről működésre változik, és egy működés eredménye a következő működés beme­neti adatát szolgáltatja, mely alól az utolsó működés a kivétel, mert az a v, interfész kimeneti adatot szolgál­tatja. A 11 szintetizátor aritmetika-a hangerőre jellem­ző információt minden akusztikus csőmodellbeli sza­kasz előtt, illetve után, illetve egyszerre akár több he­lyen is képes fogadni, miáltal elkerülhető, hogy az e­­gyes szakaszokban a jel túl- vagy alul csorduljon. A relatív hangerőre a különböző pontokon alkalmazott erősítési tényezők szorzata a jellemző. A 10. ábrán a példa kedvéért az első szakasz előtti ős az utolsó sza­kasz utáni hely van feltüntetve. A hangerőre jellemző információ G1 és G2 szorzó (erősítős) beépítése megtöri a csőmodell strukturáli­san periodikus jellegét. A 10. ábrán bemutatott példa­képpen! elrendezésnek all. ábra szerinti kiviteli alak­ja digitálisan megvalósított rendszer, ahol a periodikus jelleg kiterjed az u-v interfészek közötti szakaszról az u bemenet v kimenet közötti szakaszra. Ez akkor is megvalósul, ha a hangerő információ az ábrákon be­mutatottaktól eltérően az u-v interfészek közötti sza­kaszon került elhelyezésre. Az uniformizáltan perió­­dikus struktúra a reflexiós gráfra nézve az előzőekben leírt előnyöket a hangerőre jellemző információkat 189.378 5 10 15 20 25 30 35 40 45 50 55 60

Next

/
Thumbnails
Contents