189337. lajstromszámú szabadalom • Eljárás formáns szintetizátor vezérlésére mesterséges beszéd és speciális hangjelenségek létrehozása céljából

1 . 189 337 2 paraméternek kell egyforma darabszámú esetben változnia, sőt az is megengedett, hogy egyetlen pa­raméter sem változik. Ugyanígy az is megengedhe­tő a szimultán lépcsős közelítésnél, hogy egyik szeg­mensből a másikra áttérve egy, több vagy mind­egyik paraméter változatlan maradjon. Ezt akkor lehet tipikusan jól használni, ha a beszéd természe­tes ejtése során bizonyos paraméterek 3, 5, 6, 7, 9, 10 ... stb. alapegységnyi időtartam alatt közel ál­landóak. Szótár nélküli szintézisnél az építőelem­ként használt fonetikai alapelemek egy vagy több, tipikusan ötnél kevesebb szegmensből állnak. • Találmányunk másik lényeges és az előzőekben leírtaktól független jellemzője, hogy a hangsorok létrehozásához szükséges beszédszegmensek elké­szítése során a szimultán lépcsős közelítés elvégzé­sét a magánhangzók, a nazális hangok, és a réshan­gok elemeinek elkészítésénél az általunk kidolgo­zott, középpontra tükörszimmetrikus eljárás sze­rint alkalmazzuk. Az eljárás lényege az, hogy felis­mertük, hogy a tükörszimmetrikus hangjelenségek (pl. a bab, pap, jaj, folyó, mama stb.) mesterséges előállításához nem szükséges a teljes hangsorra jel­lemző elemeket és csatolóelemeket létrehozni, csak a hangjelenség magánhangzójának elméleti közép­pontjában meghúzott függőleges tengely jobb olda­li részén kell a szegmenseket, ill. fonetikai alapele­meket definiálni, ugyanezt a szegmenst, ill. foneti­kai alapelemeket használjuk a szimmetriatengelyre mint tükörvonalra történt átforgatás után a hang­sor bal oldalának elkészítésénél is. Ennek a tükör­szimmetrikus eljárásnak köszönhető, hogy a szinte­tizált beszédhez szükséges memóriakapacitást lé­nyegesen csökkenteni lehet anélkül, hogy a beszéd minőségét lerontanánk. Példaként írjuk le, hogy a baba szóban hogyan realizálódik a tökörszimmetri­­kus szintetizáló eljárás lényege. A baba szó magán­hangzói a b hanghoz kapcsolódnak. Az artikuláció során az a hang képzése a zárt ajkak pozíciójából indul (ba...) majd a zárt ajkak pozíciójába tér visz­­sza (bab...), majd ismét az a képződik zárt ajkak pozíciójából indulva. Ebből következik, hogy az artikuláció következményeként létrejött akusztikus jel kezdeti állapotjellemzői és végállapotjellemzői a bab... - szórész magánhangzójánál megegyeznek. (2. ábra) A 2. ábrából látható, hogy a baba szóra alkalmazott szimultán lépcsős közelítés elvégzése után milyen elemek állnak rendelkezésünkre. Az első magánhangzó 2., 3., 4. számú elemének fel­­használásával létrehozhatjuk a magánhangzó má­sodik felét is. Tehát a kettőt egymás tükörképének tekintjük. Hasonlóan járunk el a többi említett hangnál is. A fenti elvek a rajzmellékletekből is egyértelmű­en nyomonkövethetők, amelyeket az ábrák alapján fejtünk ki részletesen. Az 1. ábra a szimultán lép­csős közelítésre vonatkozik. A függőleges tengelyen az I—IV állapotjellemző A amplitúdóit, az erre me­rőleges és egymás alatti tengelyeken a t időt jelenít­jük meg. Ebben az ábrázolási módban az állapot­jellemzők időbeli változását bemutató folyamatos görbét lépcsőzetesen közelítjük meg, ahol az egyes görbeszakaszokat szegmenseknek nevezetű t,, t2... időszakaszokra bontjuk és értelmezzük. Az értel­mezés úgy történik, hogy a t,, t2, t3... időszakaszok alkalmasan választott közbülső időpontjában vett állapotjellemző értéket tekintjük a lépcsős közelítés értékének. A lépcsőmagasságokat a,b,c,d jelöli. Példánkban a tj alapidőtartamnak tekintendő és a szegmensek t, -el egyenlőek vagy egész számú több­szörösei. A lépcsőfokok szintén t, hosszúságúak, vagy annak egész számú többszörösei. A t,-néí hosszabb szegmensekben a lépcsőmagasságok azo­nos d értékűek. A 2. ábrából egyértelműen megálla­­píthatóak a tükörszimmetrikus elemek a „bab” szó magánhangzójának állapotjellemző paramétereire vonatkozóan. Ebben az ábrázolásban az előzőek szerinti módon vettük fel az A amplitúdó és a t idő tengelyt és az 1-111 állapotjellemzőt. Tekintettel arra, hogy a példabeli „bab” szó szimmetrikus szer­kezetű, az állapotjellemzők is az S szimmetriaten­gelyre tükörszimmetrikus jellegű görbékkel jelle­mezhetők. A t,, t2, t3 szegmensek megfelelő átfor­gatásával a magánhangzónak a szimmetriatengely­től jobbra eső állapotjellemzőit is megkaphatjuk. A d intervallumok a tükörszimmetriatengely mind­két oldalán egyformák. Szabadalmi igénypontok 1. Eljárás szintetizátor(ok) vezérlésére, kötött szótáras szintetizált beszéd azonnali vagy szótár nélküli szintetizált beszéd közel azonos időben tör­ténő előállítására, azzal jellemezve, hogy szótár nél­küli esetben hivatkozási kóddal ellátott fonetikai alapelemeket hozunk létre olymódon, hogy a nyelvben tipikusan előforduló egyedi hangokat és két vagy több elemből álló hangzókapcsolatokat és ezeknek a különböző természetes kiejtésekben elő­forduló jellegzetes variánsait egy vagy több , ezen fonetikai alapelemekhez hozzárendelt szegmensből állítunk elő, míg kötött szótáras esetben a szegmen­seket Vagy közvetlenül a közleményhez rendelten vagy a szótár nélküli esetben alkalmazottal azonos módon a közlemény fonetikai alapelemeihez ren­delten állítjuk elő úgy, hogy minden szegmenshez hozzárendeljük adatként a szegmens időtartamát és a zöngés, zöngétlen vagy kevert jelleget, és legfel­jebb négy pólus-frekvenciának és legfeljebb négy pólus-sávszélességnek és a hangerőnek azon értéke­it, amelyeket az előző szegmens végéről indulva a szóbanforgó szegmens végéig e jellemzőknek el kell lépcsős interpolációval érni, és zöngés vagy kevert jellegnél a hangmagasságnak azon különbségét, amellyel az előző szegmens vége utáni értéknek a szóbanforgó szegmens végére lépcsős interpoláció­val meg kell változni és a közlemény első szegmen­sénél a fent felsorolt jellemzők induló értékeit és néma szegmenseket is definiálunk úgy, hogy a szin­tetizálni kívánt beszédrészlet vagy hangjelenség ter­mészetes ejtésekor vagy elhangzásakor tapasztalha­tó legfeljebb négy pólus-frekvenciát és legfeljebb négy pólus-sávszélességet, valamint az intenzitást és a hangmagasságot leíró időfüggvények közül bármelyikeknek lépcsős közelítései valósuljanak meg olymódon, hogy egy-egy lépcső időtartama egy alkalmasan választott alapidőtartam egész szá­mú többszöröse, és a szegmens időtartama is ezen alapidőtartam egész számú többszöröse, és a szeg-5 10 15 20 25 30 35 40 45 50 55 60 65 3

Next

/
Thumbnails
Contents