189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására
1 2 A 11 szintetizátor aritmetika akár lineáris, akár PCM típusú digitál-analóg 32 átalakítót tartalmazhat. A példaképpeni 17. ábrán bemutatott utóbbi esetben a csőmodellt megvalósító rendszer v interfésze és a PCM típusú digitál-analóg 32 átalakító, más néven PCM 33 dekóder bemenete közé megfelelő hardware vagy software 32 átalakító kerül. A 11 szintetizátor aritmetika olyan módon is kialakításra kerülhet, amely lehetőséget ad a belső állapotok (az Aj(n) értékek) törlésére, s amelyet például arra lehet használni, hogy egy zöngétlen/zöngés szegmensváltáskor a zöngétlen hang zörejmentesen alakuljon ki. Kzt a 12. ábrán látható S logikai kapcsolónak az i=0,l...p*l értékekre kiterjedő teljes szintetizálási ciklus alatt zérus állásba történő kapcsolásával érhetjük el. Ezzel a 18 elemi gárf aritmetika a^j ^(n-1 ) bemenetére végig nullát kényszerítünk, ami egyenértékű a teljes reflexiós memória kitörlésével, de hard ware - ben jóval egyszerűbben, olcsón megvalósítható. A 10 rendszervezérlő zönge-aszinkron szintézisnek nevezett eljáráskor szokásosan úgy adja az u gerjesztést a 11 szintetizátor aritmetikának zöngés szegmens létrehozásánál, hogy zöngés szegmensek egymáshoz kapcsolódó sorozatán belül az impulzusok egymástól a periódusidőnek megfelelő távolságra vannak, míg a kiejtést kezdő, vagy zöngétlen szegmenset követő első zöngés szegmensnél az első impulzus a szegmens elején van. A jelen eljárásban az első impulzus a szóbanforgó szegmens elejéhez közeli meghatározott helyen helyezkedik el. Ezáltal simább hangátmenctek érhetők el. A fentiek nyomon követték a szintézis-rendszer működését egy szöveg bemondásától annak szintetizált kimondásáig. Egy 9 szintetizátorban természetesen egyszerre több szöveghez tartozó paraméter-készlet is előfordulhat. Nevezzük a különböző szövegeket alapelemeknek. Alapelemek lehetnek teljes kifejezések, például: Jó napot kívánok, az ötödik vágányra vonat érkezik stb. Lehetnek szavak, példáid az ötödik vágányra, stb. Lehetnek speciális hangjelenségek pl. zenerészlet, kutyaugatás stb. Lehetnek olyan fonetikai egységek, amelyekből valamely nyelv minden szövege összeállítható, pl. magányos a hang a-b,átmenet stb. Lehetnek különböző alapelemek ugyanazon nyelvi egység (pl. szó) különböző hangsúllyal, dallammal és erősséggel kiejtett változatai. A 10 rendszervezérlő megfelelő parancs esetén képes a különböző alapelemeket a parancsnak megfelelő sorrendben, szünetek közbeiktatásával, vagy anélkül, hangerő módosítással vagy anélkül, egymás után fűzi. Ezzel folyamatos beszéd nyerhető a 9 szintetizátorból. A jelen szintetizátor összefűzésí különlegességét a leírás taglalja. Szabadalmi igénypontok 1. Eljárás emberi hangok szintetizátor számára történő szövegelőkészítéséhez, amelynek során az előkészítendő szöveget szegmensekre bontjuk, minden egyes szegmenst analizátorral analizálunk, és minden egyes szegmenshez egy paramétercsoportot rendelünk, amely paramétercsoport tartalmaz egy vagy több számot, amellyel megadjuk a szegmens zöngés vagy zöngétlen jellegét, megadunk továbbá p számot, amelyek az egyes szegmensek reflexiós tényezőit tartalmazzák, egy vagy több számot a relatív hangerőre vonatkozóan, továbbá néhány tetszőleges számot a szegmens egyéb speciális jellemzőire, továbbá a zöngés vagy zöngéüen jellet és az alapfrekvenciát az átlagos küíönbségabszolút-érték függvény (MADF), amely n+K-1 AMDF <k, n. K) = C 2 fs(mric) -s(m)J, in=n ahol K a függvényképzésben résztvevő mintapárok száma, N egy, például a zöngeszinkron szintézisnél a szegmensben lévő minták száma, és n a minták száma, k pedig az időeltolás értéke, segítségével állapítjuk meg, és zöngés jelleget állapítunk meg, ha a (0...0,5)N és (0,5...3)N közötti k értékekre és a szegmens első határa körüli n értékre kiértékelt AMUF k szerinti átlagának és a minimumának, vagy a maximumának és átlagának, vagy a maximum és minimum különbségének és átlagának hányadosa egy előre megadott konstansnál nagyobb, azzal jellemezve, hogy zöngés jelleget állapítunk, meg, ha az előbbiek szerint kiértékelt AMDF függvény lokális minimumai között van kettő vagy több olyan, melynek abszcisszái (aktuális k értékei) eg)'másnak két, vagy háromszorosai. 2. Az 1. igénypont szerinti eljárás foganatosítást módja azzal jellemezve, hogy n^t úgy választjuk meg. hogy (n*K-l ) a szegmens hátsó határa kornyékére essen, és az ÁMDE függvény negatív k értékekre értékeljük ki. 3. Az 1. vagy 2. igénypont szerinti eljárás foganatosítási módja, azzal jellemezve, hogy a leírt lépéseket bármilyen hierarchia szerinti kombinációban alkalmazzuk a zöngés vagy zöngétlen jelleg megállapítására. 4. Az 1-3. igénypontok bármelyike szerinti eljárás foganatosítási módja, azzal jellemezve, hogy zöngés esetben a peridódusidőt az AMDF függvény abszolút minimumának abszcisszájaként állapítjuk meg. 5. Az 1. vagy 2. igénypontok szerinti eljárás foganatosítási módja, azzal jellemezve, hogy zöngés esetben a periódusidőt azon AMDF-minimum abszcisszájaként állapítjuk meg, amelynek egészszámű többszöröseinél jó közelítéssel szintén minimokat állapítunk meg. 6. Az 1-5. igénypontok bármelyike szerinti eljárás foganatosítási módja, azzal jellemezve, hogy vegyes jelleget állapítunk meg, ha a zöngés jelleget állapítunk meg, és a beszédjelen a lokáüs szélsőértékek száma egy előre megadott határértéknél nagyobb, \ 7. Az 1-6. igénypontok bármelyike szerinti eljárás foganatosítási módja, a z z a 1 jellemezve, hogy a hangmagassághoz illeszkedő zöngeszinkron szegmentálását úgy végezzük el, hogy egy-egy szegmens idejét a megállapított periódusidő vagy annak egészszámú többszörösére választjuk. 8. Az 1-7, igénypontok bármelyike szerinti eljárás foganatosítási módja, azzal jellemezve, hogy a zöngétlen szegmenst követő zöngés szegmenssorozat első szegmensében az első impulzus helyét a szegmensben lévő legnagyobb értékű ordináta abszcisszájával, vagy adott számmal megelőző abszcisszával, vagy az azt közvetlenül megelőző nullátmenet abszcisszájával adjuk meg. 189.378 5 10 15 20 25 30 35 40 45 50 55 60 9