185527. lajstromszámú szabadalom • Eljárás és berendezés szintetizátor(ok) vezérlésére, szótár nélküli szintetizált beszéd a vezérléssel quasi azonos időben történő előállítására

1 185 527 2 megfelelő alaphang frekvencia értékről — és/vagy — irányba megváltoztatva felültetjük és az így előállított jel­lel a szintetizátort vezéreljük. A találmányunk szerinti vezérlőberendezés azzal jelle­mezhető, hogy egy beszédszintetizátorhoz oldhatóan vagy fixen önmagában ismert processzor csatlakozik. Ez utóbbihoz legalább 12 Kbyte kapacitású memóriaegység van kiválasztó áramkör közbeiktatásával kapcsolva. A ki­választó áramkörhöz összehasonlító egység van kötve, amely egyrészt graféma tárhoz másrészt dekódolóhoz il- 5 leszkedik, amely utóbbi adatbefogadó egységhez csat­lakozik. A találmány eljárásra és berendezésre vonatkozik olyan szintetizátor(ok) vezérlésére, amellyel korlátozott 10 szótár nélküli szintetizált beszédet lehet előállítani a ve­zérléssel quasi azonos időben különösen magyar nyelven. Ismeretes, hogy a beszéd mesterséges előállításához szükséges szabályok és adatok megállapítása nyelvorien- 15 tált. Ez azt jelenti, hogy az egyes nyelvek különböző akusztikai szerkezeti sajátosságai miatt külön ki kell dol­gozni a szintetizálni kívánt nyelvre használható adatokat. Ezeknek az anyagoknak a birtokában lehet az adott nyelv vonatkozásában beszélőszerkezeteket működtetni, így 20 nyelvre jellemző szavakat, mondatokat lehet felépíteni. Találmányunk elé azt a célt tűztük ki, hogy az MTA Nyelvtudományi Intézetében Bolla Kálmán által létreho­zott folyamatos magyar beszédszintetizáló eljárástól elté­rően olyan eljárást és berendezést hozzunk létre szinteti- 25 zátorok vezérlésére, amellyel a folyamatos magyar hangsorokat azonosidejű üzemmódban lehet előállítani. További célként tűztük ki, hogy a kijelentés, utasítás és kérés hanglejtését a beírt szöveg végén megadott írásjel kód szerint lehessen előállítani. 30 Célul tűztük ki azt is, hogy a szintetizálandó szavak, mondatok előállításához a magyar helyesírás betűjeleit használjuk, valamint azt, hogy a beszédet ne csak billen­tyűzet segítségével lehessen megadni a készüléknek, ha­nem digitális kódformákkal is. 35 A kitűzött célnak a találmány szerint olyan szintetizá­tor vezérlő eljárással teszünk eleget, amely azzal jelle­mezhető, hogy — magyar szakirodalomból önmagában ismert módszerrel — akusztikai építőelemeket hozunk létre. Ennek során minden beszédhangra külön-külön 40 előállítjuk a hangsorkezdő elemeket. Ezek időtartamát, frekvencia összetevőit, intenzitás értékeit meghatároz­zuk. Meghatározzuk továbbá egyrészt az egyszerű vagyis az a, á, o, u, ü, i, á, ö, e, m, n, v, f, sz, s, j, h, 1 hangok úgynevezett tiszta fázisát reprezentáló elemek időtarta- 45 mát, frekvencia összetevőit és intenzitás értékeit. Egysze­rű hangoknak tekintjük azokat a beszédhangokat, ame­lyekben a kezdeti fázistól a befejezésig sem a frekvenciaszerkezetben, sem az intenzitásszerkezetben nagymértékű, illetve ugrásszerű változás nincs. ^0 Etre példaként említjük, hogy amikor az említett egy­szerű hangok közül valamelyiket kiejtjük, annak sem frekvenciaszerkezetében, sem intenzitásában változás gyakorlatilag nincs. Az összetett hangoknál (p, b, t, d, zs, ny, g, gy, ty, k, cs, c, r) is meghatározzuk a kezdő elemen ^ kívüli további építőelemek időtartamát, frekvencia össze­tevőit, intenzitás értékeit. Az összetett hangok esetében — az egyszerű hangoktól eltérően — a frekvenciaszerke­zet, és intenzitás a hang megszólaltatása során nagymér­tékben, esetenként ugrásszerűen változik. Ezeken túlme- 60 nőén hangkapcsoló elemeket hozunk létre, úgyszintén meghatározva azok időtartamát, frekvencia Összetevőit és intenzitás értékeit, majd minden beszédhangra hangsor­záró elemet állítunk elő ugyancsak meghatározva azok időtartamát, frekvencia összetevőit és intenzitás értékeit. Találmányunk egyik lényege abban áll, hogy a fent leírt módszerrel 370 elemből álló minimalizált és optimalizált adatbázist hoztunk létre. Azt a továbbiakban minden egy­es szintetizált hangsor előállítására ismételten úgy hasz­náljuk, hogy a hangsor betűjelei vagy az azoknak megfe­lelő kódsorozat útján az adatbázisból a szükséges hangelemeket a betűjelek sorrendjében kiválasztjuk, majd az így előállított monoton hangsorra a hangsorvégi írásjel szerint intonációs görbét ültetünk rá. Ez képezi ta­lálmányunk másik lényegét. Az intonációs görbék és a ráültetés önmagában ismert. Ezt úgy végezzük, hogy a monoton hangzásnak megfelelő alaphang frekvencia ér­tékről az intonációt — és/vagy — irányban megváltoztat­va felültetjük és az így előállított jellel a szintetizátort ve­zéreljük. A találmányunk szerinti vezérlőberendezés azzal jelle­mezhető, hogy egy beszédszintetzátorhoz oldhatóan vagy fixen önmagában ismert processzor csatlakozik. Ez utób­bihoz legalább 12 Kbyte kapacitású memóriaegység van kiválasztóáramkör közbeiktatásával kapcsolva. A kivá­lasztóáramkörhöz összehasonlító egység van kötve, amely egyrészt graféma tárhoz, másrészt dekódolóhoz il­leszkedik, amely utóbbi adatbefogadó egységhez csat­lakozik. Egy akusztikai építőelemen mint ismeretes a beszéd­hang azon tört részét értjük, amely meghatározott és a magyar beszédre jellemző — frekvenciaszerkezettel — intenzitásszerkezettel — időtartammal rendelkezik. A magyar beszéd építőelemei idegen beszédre (például angol, német, japán) jellemző rendszerek alapján nem határozhatók meg és ahhoz, hogy beszédet az arra jel­lemző építőelemek alkalmazásával állítsunk elő az építő­elemek számát és korábban említett 3 jellemzőjét intuitív módon kell meghatározni. Úgy találtuk, hogy a magyar beszédet 370, vagy ahhoz közelálló építőelem alkalmazásával elő lehet állítani. Az akusztikai építőelemek meghatározására úgy talál­tuk, hogy a magyar nyelv esetében meg kell határozni a beszédhangok és a hangkapcsolódások akusztikai szerke­zetére legjellemzőbb műszaki adatokat az idő-, intenzitás-, és a frekvenciaszerkezet síkján, és meg kell határozni azokat az összefüggéseket, amelyek a három sík adatait összefogják. Megállapításunk szerint a magyar beszéd létrehozásához szükséges alapvető hangsorépítő elemek a következők: magánhangzó magánhangzó-magánhangzó kapcsolódása mássalhangzó-magánhagzó kapcsolódása magánhangzó-mássalhangzó kapcsolódása mássalhangzó-mássalhangzó kapcsolódása A fenti hangsorépítő elemeket külön kell értelmezni hangsoreleji, hangsorbelseji és abszolút hangsorzáró helyzetre. 2

Next

/
Thumbnails
Contents