189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására
1 2 A találmány tárgya eljárás és rendszer beszédnek és egyéb hangjelenségeknek a beszédkeltés akusztikus csőmodellje alapján történő mesterséges előállítására, amelynek segítségével mirkofonba mondott és a mikrofon jelét megfelelően analóg vagy digitális jellé átalakított beszéd alapján a szövegkészítő rendszerrel egy szintetizátor számára alkalmas paraméterkészletet hozunk létre, amelynek segítségével a szintetizátor aritmetikája létrehozza a mesterséges beszédet. A találmány tehát alapvetően két rendszerre bomlik, a szövegelőkészítő és a szövegkimondó rendszerre, amely utóbbi a szintetizátor. A találmánnyal az volt a célunk, hogy új eljárásokat alkalmazva, a korábbi szintetizátorok hiányosságait korrigálva az emberi hangnak jellegében minél pontosabban megfelelő hangot hozzunk létre. Ehhez azonban mind a szövegelőkészítést, mind a szintetizátort újszerűén kellett kialakítanunk. A találmány alapvető felismerése az volt, hogy ha az emberi hang akusztikus csőmodelljét, annak is megfelelően módosított vagy kiegészített formáját alkalmazzuk, úgy kielégítő hangzású beszédet hozunk létre. A találmány tárgya tehát eljárás emberi hangok szintetizátor számára történő szövegelőkészítéshez, amelynek során az előkészítendő szöveget szegmensekre bontjuk, minden egyes szemgenst analizátorral analizálunk, és minden egyes szemgenshez egy paramétercsoportot rendelünk, amely paramétercsoport tartalmaz egy vagy több számot, amellyel megadjuk a szegmens zöngés vagy zöngétlen jellegét, megadunk továbbá p számot, amelyek az egyes szegmensek reflexiós tényezőit tartalmazzák, egy vagy több számot a relatív hangerőre vonatkozóan, továbbá néhány tetszőleges számot a szegmens egyéb speciális jellemzőire, továbbá a zöngés vagy zöngétlen jelleget és az alapfrekvenciát az átlagos különbségabszolútérték függvényt (AMDF), amely n+K-1 AMDF (k,n,K) = C E [s(m+k) -s(m)J m=n ahol K a függvényképzésben résztvevő mintapárok száma, N egy, például a zönge szinkron szintézisnél a szegmensben lévő minták száma, és n a minták száma, k pedig az időeltolás értéke, segítségével állapítjuk meg, és zöngés jelleget állapítunk meg, ha a (0...0,5)N és (0,5 ...3)N közötti k értékekre és a szegmens első határa körüli n értékekre kiértékelt AMDF k szerinti átlagának és a minimumának, vagy a maximumának és átlagának, vagy a maximum és minimum különbségének és átlagának hányadosa egy előre megadott konstansnál nagyobb. A találmány lényege abban van, hogy zöngés jelleget állapítunk meg, ha az előbbiek szerint kiértékelt AMDF függvény lokális minimami között van kettő vagy több olyan, amelynek abszcisszái (aktuális k értékei) egymásnak két, vagy háromszorosai. A találmány szerinti eljárásnál előnyös, ha n-et úgy választjuk meg, hogy (n+K-1) a szegmens hátsó határa környékére essen, és az AMDF függvényt negatív k értékekre értékeljük ki. A találmány szerinti eljárásnál előnyös továbbá, hogy az leirt lépéseket bármilyen hierarchia szerinti kombinációban alkalmazzuk a zöngés vagy zöngétlen jelleg megállapítására. A találmány szerinti eljárás egy további előnyös foganatosítási módja szerint zöngés esetben a periódusidőt az AMDF függvény abszolút minimumának abszcisszájának állapítjuk meg. A találmány szerinti eljárás még egy előnyös foganatosítási módja szerint zöngés esetben a periódusidőt azon AMDF-minimum abszcisszájaként állapítjuk meg, amelynek egészszámú többszöröseinél jó közelítéssel szintén minimumokat állapítunk meg. A találmány szerinti eljárás egy további előnyös foganatositási módja szerint vegyes jelleget állapítunk meg, ha zöngés jelleget állapítunk meg, és a beszédjelen a lokális szélsőértékek száma egy előre megadott határértéknél nagyobb. A találmány szerinti eljárás még egy további előnyös foganatosítási módja szerint a hangmagassághoz illeszkedő zöngeszinkron szegmentálást úgy végezzük el, hogy egy-egy szegmens idejét a megállapított periódusidő vagy annak egészszámú többszörösére választjuk. A találmány szerinti eljárás még egy további előnyös foganatosítást módja szerint a zöngétlen szegmenst követő zöngés szegmenssorozat első szegmensében az első impulzus helyét a szegmensben lévő legnagyobb értékű ordináta abszcisszájával, vagy adott számmal megegyező abszcisszával, vagy az azt közvetlenül megelező nullátmenet abszcisszájával adjuk meg. A találmány szerinti eljárásnál előnyös továbbá, ha az analízist az adott szegmensen kívül, nagyobb beszédszakasz mintáira is elvégezzük, és a vizsgálatot a szegmenst közvetlenül megelőző és követő szomszédos kevesebb számú (0-50%) szegmensre végezzük el, ha a szegmensek zöngés vagy zöngétlen jellege megegyezik, és nagyobb számú 50-100%) szomszédos szegmensekre végezzük el, ha a zöngés vagy zöngétlen jelleg különbözik. A találmány tárgya továbbá szövegelőkészítő rendszer, amely tartalmaz mikrofont, és a mikrofonhoz csatlakoztatott annak jelét feldolgozó egységet, továbbá az ehhez az egységhez csatlakoztatott memóriát. A találmány szerinti szövegelőkészítő rendszert az jellemzi, hogy a mikrofon és a hozzá tartozó jelfeldolgozó egység kimenete a szövegelőkészítő egység bemenetére van csatlakoztatva, amely bemenetet egy memória bemenete képezi, a memória kimente automatikus analizátorral van összekapcsolva, amely analizátor kimenete az adatbázist képező, szegmentált szöveget magábafoglaló, és a paraméterkészletet tartalmazó memória bemenetére van csatlakoztatva, amely adatbázis memória kimenete a szövegelőkészítő egység kimenetét képezi, és össze van kapcsolva egy ellenőrző egységgel, amely egy szintetizátort, a szintetizátorra kapcsolt mikrofont, valamint egy, az esetleges változtatások és opcionális kiegészítések bevitelére kiképezett egységet tartalmaz, amely az adatbázis-memóriával van összekapcsolva. A találmány tárgya továbbá szintetizátor az előkészített szöveghez tartozó paramétercsoport feldolgozására, amely tartalmaz az adatbázis-memóriát. A találmány szerinti szintetizátort az jellemzi, hogy az adatbázis-memória kimenete célszerűen mikroprocesszoros vezérlő egyik bemenetére van csatlakoztatva, amely vezérlő másik bemenete parancsbeviteli egység kimenetével van összekötve, és a vezérlő 189.378 5 10 15 20 25 30 35 40 45 50 55 60 3