189378. lajstromszámú szabadalom • Eljárás és berendezés beszédnek és egyéb más hangjelenségnek a beszédkeltés akusztikus csőmodelljén alapuló mesterséges előállítására
1 2 szegmensben a zönge geijesztő impulzus helyét, azaz azt, hogy a zöngés sorozaton beírni vagy kiejtést kezdő első impulzus helyét is a paraméterkészletből vett paraméter határozza meg. Az egymásután! szegmenseket jellemző paramétercsoport tartalmazhat különböző típusú elemeket. Az egyes paraméterek különböző pontossággal, például különböző darabszámú bittel adhatók meg. A paraméterkészlet helyfoglalása lehet például 600...8000 bit/sec. A találmány szerint a szövegelőkészítés menete a következő: A szövegelőkészitő egység a zöngés vagy zöngétlen jelleg és az alapreferencia értékének megállapítására az átlagos különbségabszolútérték függvényt (angolul: avarage magnitude difference function * MADF) vettük alapul, melynek definíciója s(m) mintasorozaton, k eltolás mellett n+K-1 AMDF (k,n, K) = C X [s(m+k)-s(m)] m=n ahol K a függvényképzésben résztvevő mintapárok darabszáma, c egy konstans, értéke legtöbbször 1 vagy 1/K. Zöngés jelleg kerül megállapításra egy szegmens esetén, ha a (0...0,5).N és (0,5...3)» közötti k-értékekre és a szegmens első határa körüli n értékre kiértékelt AMDF (ahol N egy alkalmsán választott szám, például zöngeaszinkron szintézisnél a szegmensben lévő minták száma/k szerinti átalgának és minimumának, vagy maximumának és átlagának, vagy maximuma és minimuma különbségének és átlagának hányadosa meghalad egy-egy alkalmasan választott konstansot. Vegyes jelleg kerül megállapításra, ha ezek a jellemzők két-két alkalmasan választott konstans közé esnek. Ellenkező esetben zöngétlen jellegkerül megállapításra. Ez a megoldás ismert. Újszerű és a találmánnyal került megoldásra, hogy zöngés jelleg kerül megállapításra, ha az előzőek szerint kiértékelt AMDF függvény lokális minimumai között van kettő vagy több olyan, melyeknek abszcisszái (aktuális k értékei) egymásnak jó közelítéssel kétszerei, háromszorosai, ei.t. Ellenkező esetben zöngétlen jelleg kerül megállapításra. Az előző eljárások kiegészíthetők még egy második lépéssel, azzal hogy n úgy kerül megválasztásra, n+K-1 a szegmens hátsó határa környékére essen, és az AMDF függvény negatív k értékekre kerül kiértékelésre: jellegzetesen -(0...0,5)N és -(0,5 ...3)N értékek között. Az előzőekben leírt döntések bármilyen hierarchia szerinti bármilyen kombinációjának használata a zöngés-zöngétlen jelleg megállapítására, mint például az, hogy ha az ismert és a második eljárás ellentétes jellegre mutat, akkor megtörténik a találmány szerinti vizsgálat, s ha az zöngés, akkor az elfogadásra kerül, míg ha zöngétlen, akkor a végső döntés a találmány szerinti két új eljárási lépés szerinti módosítása alapján születik meg. A következő eljárás az előző négy lépés olyan változata, amelyben a döntést a megelőzőleg vizsgált szegmensben hozott döntés befolyásolja, például úgy, hogy a találmány szerinti első és második lépés ellentétes jellegre utad, akkor a megelőző szegmensben hozott döntés lesz érvényes az éppen vizsgált szegmensben. Kis zajú zöngés esetben‘a periódusidő az AMDF abszolút minimumának abszcisszájaként kerül megállapításra. Zöngés esetben a periódusidő megállapítása ama AMDFminimum abszcisszájaként kerül megállapításra, amelynek egészszámú többszöröseinél a két új lépés szerint jó közelítéssel szintén minimumok mutatkoznak. A korábban felsorolt eljárásokat ismételten is lehet alkalmazni úgy, hogy először csak k-ra és csak minden d-edik (d=»2,3,4...)/-ra történik meg az MADF kiértékelése, s csak ha ez zöngés jellegre utal, akkor történik meg a várható periódusidőnek megfelelő k értékek környékén az AMDF kiértékelése minden k-ra és nagyobb K-ra, miáltal lényeges számolási energia szabadítható fel. A szegmensre vegyes jelleget állapítunk meg akkor, ha az előzőekben leírt eljárások zöngés jellegre utalnak, ugyanakkor a beszédjelen a lokális szélsőértékek száma egy alkalmasan választott határértéket meghalad. Mindegyik előbb ismertetett eljárás alkalmazható a hangmagassághoz illeszkedő ún. zönge-szinkron szegmentálás megvalósítására úgy, hogy egy-egy szegmens ideje a megállapított periódusidd, vagy annak egészszámú többszöröse. Zöngétlen szegmenst követő zöngés szegmens-sorozat első szegmensében az első impulzus helye a szegmensben lévő legnagyobb abszolút értékű ordináta abszcisszája, vagy az azt adott számmal megelőző abszcissza, vagy az azt közvetlenül megelőző nullátmenet abszcisszája. Egy szegmenshez tartozó reflexiós tényezők megállapítása az irodalomból ismert analízis-összefüggésekkel úgy, hogy az analítis nemcsak a szőbanforgó szegmens mintáira terjed ki, hanem annál esetleg nagyobb (és ez esetben a vizsgált szegmenset magába foglaló) beszédszakasz mintáira, mely szakasz a vizsgált szegmenset megelőző és követő szomszédos szegmensekre kisebb mértékben terjed ki, ha e szegmens zöngés-zöngétlen jellege a vizsgált szegmenssel megegyezik, míg nagyobb mértékben ellenkező esetben. A kisebb mérték tipikusan a vizsgált szegmens Q...50%-a, míg a nagyobb mérték ugyanannak 50...100%-a. A szövegelőkészités folyamata az alábbi. Az előkészítendő szöveget egy személy mikrofonba mondja, ahonnan az megfelelő analóg és digitális jelfeldolgozó 1 egység után - esetleg hangszalagról, hanglemezről stb. — a 2 szövegelőkészítő egység 5 memóriájába jut. A szöveg helyfoglalása a memóriában tipikusan 64 kbit sec-onként. A tárolt szöveget alkalmasan választott (tipikusan 5...200 msec hosszú)-szegmensekre osztjuk. A szegmentálás igazodhat a hangmagassághoz vagy lehet attól független. A 2 szövegelőkészítő egység az 5 memóriához csatlakoztatott 6 analizátora a szöveget automatikus analízisnek veti alá, melynek eredményeként minden szegmenshez egy paraméter-csoportot rendel. A paraméter-készletből az 1. ábrán blokkvázlatban ábrázolt 9 szintetizátor, vagy a 9 szintetizátor működési algoritmusával felruházott szövegelőkészítő a szintetizált szöveget előállíthatja. A minőség általában megfelelő. Különleges minőségi követelmények esetén a paraméter-készlet tetszőleges elemét emberi szakértelem vagy speciális automatikus algoritmusok 189.378 5 10 15 20 25 30 35 40 45 50 55 60 5