185527. lajstromszámú szabadalom • Eljárás és berendezés szintetizátor(ok) vezérlésére, szótár nélküli szintetizált beszéd a vezérléssel quasi azonos időben történő előállítására | Library

185527. lajstromszámú szabadalom • Eljárás és berendezés szintetizátor(ok) vezérlésére, szótár nélküli szintetizált beszéd a vezérléssel quasi azonos időben történő előállítására

1 185 527 2 megfelelő alaphang frekvencia értékről — és/vagy — irányba megváltoztatva felültetjük és az így előállított jellel a szintetizátort vezéreljük. A találmányunk szerinti vezérlőberendezés azzal jellemezhető, hogy egy beszédszintetizátorhoz oldhatóan vagy fixen önmagában ismert processzor csatlakozik. Ez utóbbihoz legalább 12 Kbyte kapacitású memóriaegység van kiválasztó áramkör közbeiktatásával kapcsolva. A kiválasztó áramkörhöz összehasonlító egység van kötve, amely egyrészt graféma tárhoz másrészt dekódolóhoz il- 5 leszkedik, amely utóbbi adatbefogadó egységhez csatlakozik. A találmány eljárásra és berendezésre vonatkozik olyan szintetizátor(ok) vezérlésére, amellyel korlátozott 10 szótár nélküli szintetizált beszédet lehet előállítani a vezérléssel quasi azonos időben különösen magyar nyelven. Ismeretes, hogy a beszéd mesterséges előállításához szükséges szabályok és adatok megállapítása nyelvorien- 15 tált. Ez azt jelenti, hogy az egyes nyelvek különböző akusztikai szerkezeti sajátosságai miatt külön ki kell dolgozni a szintetizálni kívánt nyelvre használható adatokat. Ezeknek az anyagoknak a birtokában lehet az adott nyelv vonatkozásában beszélőszerkezeteket működtetni, így 20 nyelvre jellemző szavakat, mondatokat lehet felépíteni. Találmányunk elé azt a célt tűztük ki, hogy az MTA Nyelvtudományi Intézetében Bolla Kálmán által létrehozott folyamatos magyar beszédszintetizáló eljárástól eltérően olyan eljárást és berendezést hozzunk létre szinteti- 25 zátorok vezérlésére, amellyel a folyamatos magyar hangsorokat azonosidejű üzemmódban lehet előállítani. További célként tűztük ki, hogy a kijelentés, utasítás és kérés hanglejtését a beírt szöveg végén megadott írásjel kód szerint lehessen előállítani. 30 Célul tűztük ki azt is, hogy a szintetizálandó szavak, mondatok előállításához a magyar helyesírás betűjeleit használjuk, valamint azt, hogy a beszédet ne csak billentyűzet segítségével lehessen megadni a készüléknek, hanem digitális kódformákkal is. 35 A kitűzött célnak a találmány szerint olyan szintetizátor vezérlő eljárással teszünk eleget, amely azzal jellemezhető, hogy — magyar szakirodalomból önmagában ismert módszerrel — akusztikai építőelemeket hozunk létre. Ennek során minden beszédhangra külön-külön 40 előállítjuk a hangsorkezdő elemeket. Ezek időtartamát, frekvencia összetevőit, intenzitás értékeit meghatározzuk. Meghatározzuk továbbá egyrészt az egyszerű vagyis az a, á, o, u, ü, i, á, ö, e, m, n, v, f, sz, s, j, h, 1 hangok úgynevezett tiszta fázisát reprezentáló elemek időtarta- 45 mát, frekvencia összetevőit és intenzitás értékeit. Egyszerű hangoknak tekintjük azokat a beszédhangokat, amelyekben a kezdeti fázistól a befejezésig sem a frekvenciaszerkezetben, sem az intenzitásszerkezetben nagymértékű, illetve ugrásszerű változás nincs. ^0 Etre példaként említjük, hogy amikor az említett egyszerű hangok közül valamelyiket kiejtjük, annak sem frekvenciaszerkezetében, sem intenzitásában változás gyakorlatilag nincs. Az összetett hangoknál (p, b, t, d, zs, ny, g, gy, ty, k, cs, c, r) is meghatározzuk a kezdő elemen ^ kívüli további építőelemek időtartamát, frekvencia összetevőit, intenzitás értékeit. Az összetett hangok esetében — az egyszerű hangoktól eltérően — a frekvenciaszerkezet, és intenzitás a hang megszólaltatása során nagymértékben, esetenként ugrásszerűen változik. Ezeken túlme- 60 nőén hangkapcsoló elemeket hozunk létre, úgyszintén meghatározva azok időtartamát, frekvencia Összetevőit és intenzitás értékeit, majd minden beszédhangra hangsorzáró elemet állítunk elő ugyancsak meghatározva azok időtartamát, frekvencia összetevőit és intenzitás értékeit. Találmányunk egyik lényege abban áll, hogy a fent leírt módszerrel 370 elemből álló minimalizált és optimalizált adatbázist hoztunk létre. Azt a továbbiakban minden egyes szintetizált hangsor előállítására ismételten úgy használjuk, hogy a hangsor betűjelei vagy az azoknak megfelelő kódsorozat útján az adatbázisból a szükséges hangelemeket a betűjelek sorrendjében kiválasztjuk, majd az így előállított monoton hangsorra a hangsorvégi írásjel szerint intonációs görbét ültetünk rá. Ez képezi találmányunk másik lényegét. Az intonációs görbék és a ráültetés önmagában ismert. Ezt úgy végezzük, hogy a monoton hangzásnak megfelelő alaphang frekvencia értékről az intonációt — és/vagy — irányban megváltoztatva felültetjük és az így előállított jellel a szintetizátort vezéreljük. A találmányunk szerinti vezérlőberendezés azzal jellemezhető, hogy egy beszédszintetzátorhoz oldhatóan vagy fixen önmagában ismert processzor csatlakozik. Ez utóbbihoz legalább 12 Kbyte kapacitású memóriaegység van kiválasztóáramkör közbeiktatásával kapcsolva. A kiválasztóáramkörhöz összehasonlító egység van kötve, amely egyrészt graféma tárhoz, másrészt dekódolóhoz illeszkedik, amely utóbbi adatbefogadó egységhez csatlakozik. Egy akusztikai építőelemen mint ismeretes a beszédhang azon tört részét értjük, amely meghatározott és a magyar beszédre jellemző — frekvenciaszerkezettel — intenzitásszerkezettel — időtartammal rendelkezik. A magyar beszéd építőelemei idegen beszédre (például angol, német, japán) jellemző rendszerek alapján nem határozhatók meg és ahhoz, hogy beszédet az arra jellemző építőelemek alkalmazásával állítsunk elő az építőelemek számát és korábban említett 3 jellemzőjét intuitív módon kell meghatározni. Úgy találtuk, hogy a magyar beszédet 370, vagy ahhoz közelálló építőelem alkalmazásával elő lehet állítani. Az akusztikai építőelemek meghatározására úgy találtuk, hogy a magyar nyelv esetében meg kell határozni a beszédhangok és a hangkapcsolódások akusztikai szerkezetére legjellemzőbb műszaki adatokat az idő-, intenzitás-, és a frekvenciaszerkezet síkján, és meg kell határozni azokat az összefüggéseket, amelyek a három sík adatait összefogják. Megállapításunk szerint a magyar beszéd létrehozásához szükséges alapvető hangsorépítő elemek a következők: magánhangzó magánhangzó-magánhangzó kapcsolódása mássalhangzó-magánhagzó kapcsolódása magánhangzó-mássalhangzó kapcsolódása mássalhangzó-mássalhangzó kapcsolódása A fenti hangsorépítő elemeket külön kell értelmezni hangsoreleji, hangsorbelseji és abszolút hangsorzáró helyzetre. 2

Thumbnails

Contents