189337. lajstromszámú szabadalom • Eljárás formáns szintetizátor vezérlésére mesterséges beszéd és speciális hangjelenségek létrehozása céljából
1 . 189 337 2 paraméternek kell egyforma darabszámú esetben változnia, sőt az is megengedett, hogy egyetlen paraméter sem változik. Ugyanígy az is megengedhető a szimultán lépcsős közelítésnél, hogy egyik szegmensből a másikra áttérve egy, több vagy mindegyik paraméter változatlan maradjon. Ezt akkor lehet tipikusan jól használni, ha a beszéd természetes ejtése során bizonyos paraméterek 3, 5, 6, 7, 9, 10 ... stb. alapegységnyi időtartam alatt közel állandóak. Szótár nélküli szintézisnél az építőelemként használt fonetikai alapelemek egy vagy több, tipikusan ötnél kevesebb szegmensből állnak. • Találmányunk másik lényeges és az előzőekben leírtaktól független jellemzője, hogy a hangsorok létrehozásához szükséges beszédszegmensek elkészítése során a szimultán lépcsős közelítés elvégzését a magánhangzók, a nazális hangok, és a réshangok elemeinek elkészítésénél az általunk kidolgozott, középpontra tükörszimmetrikus eljárás szerint alkalmazzuk. Az eljárás lényege az, hogy felismertük, hogy a tükörszimmetrikus hangjelenségek (pl. a bab, pap, jaj, folyó, mama stb.) mesterséges előállításához nem szükséges a teljes hangsorra jellemző elemeket és csatolóelemeket létrehozni, csak a hangjelenség magánhangzójának elméleti középpontjában meghúzott függőleges tengely jobb oldali részén kell a szegmenseket, ill. fonetikai alapelemeket definiálni, ugyanezt a szegmenst, ill. fonetikai alapelemeket használjuk a szimmetriatengelyre mint tükörvonalra történt átforgatás után a hangsor bal oldalának elkészítésénél is. Ennek a tükörszimmetrikus eljárásnak köszönhető, hogy a szintetizált beszédhez szükséges memóriakapacitást lényegesen csökkenteni lehet anélkül, hogy a beszéd minőségét lerontanánk. Példaként írjuk le, hogy a baba szóban hogyan realizálódik a tökörszimmetrikus szintetizáló eljárás lényege. A baba szó magánhangzói a b hanghoz kapcsolódnak. Az artikuláció során az a hang képzése a zárt ajkak pozíciójából indul (ba...) majd a zárt ajkak pozíciójába tér viszsza (bab...), majd ismét az a képződik zárt ajkak pozíciójából indulva. Ebből következik, hogy az artikuláció következményeként létrejött akusztikus jel kezdeti állapotjellemzői és végállapotjellemzői a bab... - szórész magánhangzójánál megegyeznek. (2. ábra) A 2. ábrából látható, hogy a baba szóra alkalmazott szimultán lépcsős közelítés elvégzése után milyen elemek állnak rendelkezésünkre. Az első magánhangzó 2., 3., 4. számú elemének felhasználásával létrehozhatjuk a magánhangzó második felét is. Tehát a kettőt egymás tükörképének tekintjük. Hasonlóan járunk el a többi említett hangnál is. A fenti elvek a rajzmellékletekből is egyértelműen nyomonkövethetők, amelyeket az ábrák alapján fejtünk ki részletesen. Az 1. ábra a szimultán lépcsős közelítésre vonatkozik. A függőleges tengelyen az I—IV állapotjellemző A amplitúdóit, az erre merőleges és egymás alatti tengelyeken a t időt jelenítjük meg. Ebben az ábrázolási módban az állapotjellemzők időbeli változását bemutató folyamatos görbét lépcsőzetesen közelítjük meg, ahol az egyes görbeszakaszokat szegmenseknek nevezetű t,, t2... időszakaszokra bontjuk és értelmezzük. Az értelmezés úgy történik, hogy a t,, t2, t3... időszakaszok alkalmasan választott közbülső időpontjában vett állapotjellemző értéket tekintjük a lépcsős közelítés értékének. A lépcsőmagasságokat a,b,c,d jelöli. Példánkban a tj alapidőtartamnak tekintendő és a szegmensek t, -el egyenlőek vagy egész számú többszörösei. A lépcsőfokok szintén t, hosszúságúak, vagy annak egész számú többszörösei. A t,-néí hosszabb szegmensekben a lépcsőmagasságok azonos d értékűek. A 2. ábrából egyértelműen megállapíthatóak a tükörszimmetrikus elemek a „bab” szó magánhangzójának állapotjellemző paramétereire vonatkozóan. Ebben az ábrázolásban az előzőek szerinti módon vettük fel az A amplitúdó és a t idő tengelyt és az 1-111 állapotjellemzőt. Tekintettel arra, hogy a példabeli „bab” szó szimmetrikus szerkezetű, az állapotjellemzők is az S szimmetriatengelyre tükörszimmetrikus jellegű görbékkel jellemezhetők. A t,, t2, t3 szegmensek megfelelő átforgatásával a magánhangzónak a szimmetriatengelytől jobbra eső állapotjellemzőit is megkaphatjuk. A d intervallumok a tükörszimmetriatengely mindkét oldalán egyformák. Szabadalmi igénypontok 1. Eljárás szintetizátor(ok) vezérlésére, kötött szótáras szintetizált beszéd azonnali vagy szótár nélküli szintetizált beszéd közel azonos időben történő előállítására, azzal jellemezve, hogy szótár nélküli esetben hivatkozási kóddal ellátott fonetikai alapelemeket hozunk létre olymódon, hogy a nyelvben tipikusan előforduló egyedi hangokat és két vagy több elemből álló hangzókapcsolatokat és ezeknek a különböző természetes kiejtésekben előforduló jellegzetes variánsait egy vagy több , ezen fonetikai alapelemekhez hozzárendelt szegmensből állítunk elő, míg kötött szótáras esetben a szegmenseket Vagy közvetlenül a közleményhez rendelten vagy a szótár nélküli esetben alkalmazottal azonos módon a közlemény fonetikai alapelemeihez rendelten állítjuk elő úgy, hogy minden szegmenshez hozzárendeljük adatként a szegmens időtartamát és a zöngés, zöngétlen vagy kevert jelleget, és legfeljebb négy pólus-frekvenciának és legfeljebb négy pólus-sávszélességnek és a hangerőnek azon értékeit, amelyeket az előző szegmens végéről indulva a szóbanforgó szegmens végéig e jellemzőknek el kell lépcsős interpolációval érni, és zöngés vagy kevert jellegnél a hangmagasságnak azon különbségét, amellyel az előző szegmens vége utáni értéknek a szóbanforgó szegmens végére lépcsős interpolációval meg kell változni és a közlemény első szegmensénél a fent felsorolt jellemzők induló értékeit és néma szegmenseket is definiálunk úgy, hogy a szintetizálni kívánt beszédrészlet vagy hangjelenség természetes ejtésekor vagy elhangzásakor tapasztalható legfeljebb négy pólus-frekvenciát és legfeljebb négy pólus-sávszélességet, valamint az intenzitást és a hangmagasságot leíró időfüggvények közül bármelyikeknek lépcsős közelítései valósuljanak meg olymódon, hogy egy-egy lépcső időtartama egy alkalmasan választott alapidőtartam egész számú többszöröse, és a szegmens időtartama is ezen alapidőtartam egész számú többszöröse, és a szeg-5 10 15 20 25 30 35 40 45 50 55 60 65 3