189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására

1 2 A találmány tárgya eljárás és rendszer beszédnek és egyéb hangjelenségeknek a beszédkeltés akusztikus csőmodellje alapján történő mesterséges előállítására, amelynek segítségével mirkofonba mondott és a mik­rofon jelét megfelelően analóg vagy digitális jellé áta­lakított beszéd alapján a szövegkészítő rendszerrel egy szintetizátor számára alkalmas paraméterkészletet ho­zunk létre, amelynek segítségével a szintetizátor arit­metikája létrehozza a mesterséges beszédet. A találmány tehát alapvetően két rendszerre bom­lik, a szövegelőkészítő és a szövegkimondó rendszerre, amely utóbbi a szintetizátor. A találmánnyal az volt a célunk, hogy új eljáráso­kat alkalmazva, a korábbi szintetizátorok hiányossá­gait korrigálva az emberi hangnak jellegében minél pontosabban megfelelő hangot hozzunk létre. Ehhez azonban mind a szövegelőkészítést, mind a szintetizá­tort újszerűén kellett kialakítanunk. A találmány alapvető felismerése az volt, hogy ha az emberi hang akusztikus csőmodelljét, annak is megfelelően módosított vagy kiegészített formáját alkalmazzuk, úgy kielégítő hangzású beszédet hozunk létre. A találmány tárgya tehát eljárás emberi hangok szintetizátor számára történő szövegelőkészítéshez, amelynek során az előkészítendő szöveget szegmen­sekre bontjuk, minden egyes szemgenst analizátorral analizálunk, és minden egyes szemgenshez egy para­métercsoportot rendelünk, amely paramétercsoport tartalmaz egy vagy több számot, amellyel megadjuk a szegmens zöngés vagy zöngétlen jellegét, megadunk továbbá p számot, amelyek az egyes szegmensek ref­lexiós tényezőit tartalmazzák, egy vagy több számot a relatív hangerőre vonatkozóan, továbbá néhány tet­szőleges számot a szegmens egyéb speciális jellemzői­re, továbbá a zöngés vagy zöngétlen jelleget és az alap­­frekvenciát az átlagos különbségabszolútérték függ­vényt (AMDF), amely n+K-1 AMDF (k,n,K) = C E [s(m+k) -s(m)J m=n ahol K a függvényképzésben résztvevő mintapárok száma, N egy, például a zönge szinkron szintézisnél a szegmensben lévő minták száma, és n a minták száma, k pedig az időeltolás értéke, segítségével állapítjuk meg, és zöngés jelleget állapítunk meg, ha a (0...0,5)N és (0,5 ...3)N közötti k értékekre és a szegmens első határa körüli n értékekre kiértékelt AMDF k szerinti átlagának és a minimumának, vagy a maximumának és átlagának, vagy a maximum és minimum különbsé­gének és átlagának hányadosa egy előre megadott konstansnál nagyobb. A találmány lényege abban van, hogy zöngés jelle­get állapítunk meg, ha az előbbiek szerint kiértékelt AMDF függvény lokális minimami között van kettő vagy több olyan, amelynek abszcisszái (aktuális k ér­tékei) egymásnak két, vagy háromszorosai. A találmány szerinti eljárásnál előnyös, ha n-et úgy választjuk meg, hogy (n+K-1) a szegmens hátsó határa környékére essen, és az AMDF függvényt nega­tív k értékekre értékeljük ki. A találmány szerinti eljárásnál előnyös továbbá, hogy az leirt lépéseket bármilyen hierarchia szerinti kombinációban alkalmazzuk a zöngés vagy zöngétlen jelleg megállapítására. A találmány szerinti eljárás egy további előnyös foganatosítási módja szerint zöngés esetben a perió­dusidőt az AMDF függvény abszolút minimumának abszcisszájának állapítjuk meg. A találmány szerinti eljárás még egy előnyös foga­natosítási módja szerint zöngés esetben a periódusidőt azon AMDF-minimum abszcisszájaként állapítjuk meg, amelynek egészszámú többszöröseinél jó közelí­téssel szintén minimumokat állapítunk meg. A találmány szerinti eljárás egy további előnyös foganatositási módja szerint vegyes jelleget állapítunk meg, ha zöngés jelleget állapítunk meg, és a beszéd­jelen a lokális szélsőértékek száma egy előre mega­dott határértéknél nagyobb. A találmány szerinti eljárás még egy további elő­nyös foganatosítási módja szerint a hangmagassághoz illeszkedő zöngeszinkron szegmentálást úgy végezzük el, hogy egy-egy szegmens idejét a megállapított pe­riódusidő vagy annak egészszámú többszörösére vá­lasztjuk. A találmány szerinti eljárás még egy további elő­nyös foganatosítást módja szerint a zöngétlen szeg­­menst követő zöngés szegmenssorozat első szegmensé­ben az első impulzus helyét a szegmensben lévő legna­gyobb értékű ordináta abszcisszájával, vagy adott számmal megegyező abszcisszával, vagy az azt közvet­lenül megelező nullátmenet abszcisszájával adjuk meg. A találmány szerinti eljárásnál előnyös továbbá, ha az analízist az adott szegmensen kívül, nagyobb be­szédszakasz mintáira is elvégezzük, és a vizsgálatot a szegmenst közvetlenül megelőző és követő szomszé­dos kevesebb számú (0-50%) szegmensre végezzük el, ha a szegmensek zöngés vagy zöngétlen jellege mege­gyezik, és nagyobb számú 50-100%) szomszédos szegmensekre végezzük el, ha a zöngés vagy zöngétlen jelleg különbözik. A találmány tárgya továbbá szövegelőkészítő rend­szer, amely tartalmaz mikrofont, és a mikrofonhoz csatlakoztatott annak jelét feldolgozó egységet, to­vábbá az ehhez az egységhez csatlakoztatott memó­riát. A találmány szerinti szövegelőkészítő rendszert az jellemzi, hogy a mikrofon és a hozzá tartozó jelfeldol­gozó egység kimenete a szövegelőkészítő egység be­menetére van csatlakoztatva, amely bemenetet egy memória bemenete képezi, a memória kimente auto­matikus analizátorral van összekapcsolva, amely anali­zátor kimenete az adatbázist képező, szegmentált szöveget magábafoglaló, és a paraméterkészletet tar­talmazó memória bemenetére van csatlakoztatva, amely adatbázis memória kimenete a szövegelőké­szítő egység kimenetét képezi, és össze van kapcsolva egy ellenőrző egységgel, amely egy szintetizátort, a szintetizátorra kapcsolt mikrofont, valamint egy, az esetleges változtatások és opcionális kiegészítések be­vitelére kiképezett egységet tartalmaz, amely az adat­bázis-memóriával van összekapcsolva. A találmány tárgya továbbá szintetizátor az elő­készített szöveghez tartozó paramétercsoport feldol­gozására, amely tartalmaz az adatbázis-memóriát. A találmány szerinti szintetizátort az jellemzi, hogy az adatbázis-memória kimenete célszerűen mik­roprocesszoros vezérlő egyik bemenetére van csatla­koztatva, amely vezérlő másik bemenete parancsbe­viteli egység kimenetével van összekötve, és a vezérlő 189.378 5 10 15 20 25 30 35 40 45 50 55 60 3

Next

/
Thumbnails
Contents