195704. lajstromszámú szabadalom • Kapcsolári elrendezés beszédszintetizátor memóriaigényének csökkentésére
1 195 704 2 A találmány tárgya kapcsolási elrendezés formánsós hullámforma szintézisen alapuló beszédszintetizátor memóriaigényének csökkentésére olyan esetben, amikor a beszédjelet az idő függvényében egy vezérlő egység segítségével egy alapelemtárral ellátott memóriából hívjuk elő. Jelen találmány tárgyát képezi tehát a memóriaigény csökkentését megvalósító kapcsolási elrendezés. A technika jelenlegi színvonala már megköveteli, sőt bizonyos területeken elengedhetetlenné teszi, az ember — gép _ ember kommunikáció beszéddel megvalósított információ-átvitelét. Az emberi beszéd „gépi” /elektronikus, digitális/ feldolgozásának első gyakorlati eredményei a nagysebességű l’CM rendszerű telefon összeköttetések létesítésekor keletkeztek. Ugyanis az. emberi beszéddel megvalósított információátviteli sebesség legjobb esetben is kb. 70-80 bit/sec., a l’CM digitális csatorna információátviteli sebessége pedig nagyságrendekkel nagyobb például 60 kbit/sec. A gazdaságos információátvitel érdekében meg kellett valósítani egy olyan berendezés-párt, amely adóoldalon analizálja a beszédet, kimenetén „sűrítve” továbbítja az információt, majd a vevőoldalon ezt a tömörített információt feldolgozva egy beszédszintetizátor visszalakítja az érthető emberi beszédet. A beszédfeldolgozás eddig kialakult területei, amelyek: — digitális beszédátvitel, tárolás, tömörítés — beszéd analízis, — beszed szintézis, — beszélő személyének azonosítása, — beszéd jcl/z.aj viszony javítás, — orvosbiológiai felhasználások /logopédia/, stb. közül az emberi beszéd gépi /digitális/tárolásával és előállításával, a beszédszintetizátorok memóriaigényének szemszögéből foglalkozunk c találmány keretén belül. A beszédszintetizátor kívülről kapott kódok hatására a kimenetén szolgáltatja a beszéd hangfrekvenciás jelét. A vezérlő egység a kívülről /például számítógép, billentyűzet, stb./ kapott-utasításokat értelmezi és vezérli a szintetizátort, azaz a dekódolót, amely lényegében egy D/A átalakító, és előállítja a memóriában megfelelő címeken elhelyezett digitális információból a beszédjelet. Az emberi beszéd gépi előállítására két módszer ismeretes: — a beszédjel időbeli függvényének digitális értelmezése, tárolás és előhívása, illetve — az emberi beszédszervek rendszertechnikai modellezése és annak elektronikus működtetése. Találmányunkban az elsőnek ismertetett formáns- és hullámforma szintézisen alapuló beszédszintetizátorok memóriaigényét kívánjuk csökkenteni. Természetesen egy beszédszintézisen alapuló eljárás létrehozásához meg kell ismerkedni a beszédanalízis eddig ismert elveivel is. Az. emberi beszéd analízisének és szintézisének elméleti és gyakorlati alapjait Dr. Gordos Géza - Takács György „Digitális beszédfeldolgozás” című könyvéből /Műszaki Könyvkiadó 1983./ ismerhetjük meg. A hullámforma - kódoláson alapuló beszédszintetizátorok hivatkozott irodalom 191-198. oldalán, a beszédtömöéités pedig a 308. oldal után van ismertetve. A 195. oldal 2. bekezdése ugyan utal arra, hogy egy hullámforma szintézisen alapuló beszédgenerálás esetén is lehet az információt tömöríteni, de ehhez nem adja meg a szükséges konkrét műszaki intézkedések sorát,és nem közöl az azt megvalósító berendezésről blokksémát továbbá a tömörítő eljárásokat ismertető rész csak 7 a telefontechnikában alkalmazott, az átviteli sebességet fokozó megoldásokat mutatja be. Nincs utalás saját memóriával rendelkező beszédszintetizátor memóriaigényének csökkentését szolgáló megoldásra. A beszédszintetizátorok témakörében találmányunkhoz a legközelebb az alábbi ismert megoldások állnak, amelyeket a GB 2 057 823 és GB 2 074 822 lajstromszámú, továbbá az US 4 282 404, US 4 420 813 és az US 4 423 290 lajstroinszámú szabadalmi okiratból ismerhetünk meg. Az ismert megoldások mikroprocesszoros vezérléssel egy külső parancs, illetve kód hatására előhívják a memóriából a szükséges bes/édelemet, majd digitális-analóg átalakítás után. esetleg jelkezelés /például szűrés/ után, mint beszédhangot kibocsátják. Különböző szolgáltatásokat valósítanak meg például: figyelik a kimeneti szintet /hangerőt/ cs ajel/zuj viszony javítása érdekében szünet esetén a kimenetet lesüketítik, képesek a kimenő beszédjel ütemének /sebességének/ változtatására, adott sorrendben meghatározott parancsokat közölnek élőszóban, stb. Az ismert megoldások egyike sem ad útmutatást a saját memóriával rendelkező beszédszintetizátorok memóriaigényének csökkentésére. A találmány célja, olyan kapcsolási elrendezés megalkotása, amely formális- és hullámforma szintézisen alapuló beszédszintetizátorok memóriaigényét az ismert megoldásokhoz képest -- csökkenti. A találmány szerinti memóriaigény csökkentő kapcsolási elrendezés lényege azon a felismerésen alapul, hogy a folyamatos beszédben az időben kitartott beszédelemekből/például, szünet, magánhangzók, zöngés mássalhangzók, stb./ elegendő csak egy-egy jellemző rövid mintát eltárolni, majd ezen mintákból megfelelő műszaki intézledésekkel elő lehet állítani az eredeti beszédet. Tehát a beszédben ismétlődő elemeket csak egyszer kell a memóriában elhelyezni és onnan bármikor elő lehet hívni, a beszédelem ismétlésével tetszőleges időtartamú hangot képezhetünk, cs az adott hang dinamikáját /erősségét, jels/intjét/ is megválaszthatjuk. A fentiek érleimében a találmány szerinti kapcsolási elrendezés lényege, hogy a memóriában digitálisan tárolt folyamatos beszédjel szüneteire és azonos beszédelemeire vonatkozó kódok egy elkülönített alapelemtárban vannak elhelyezve. A memória adat-cím veztékkel a címgeneráláron keresztül vezérlő vezetékkel a vezérlő egységhez van kapcsolva. A címgencrátor adatkimenete a dekódoló digitális bemenetére, a szünetkód felismerő szünetkód bemenetére, az ismétléskód felismerő ismétléskőd bemenetére, és a kimeneti szintbeállító a szintbeállító bemenetére van kapcsolva. A szintfelismerő kimenet, az ismétlésfelismerő kimenet és a szintbeállító kimenet rendre a vezérlő egység szilitvc/.érlő, ismétlésvezérlő és szintvezcrlö bemenetéhez van kötve, a dekódoló-vezérlő kimenet pedig a dekódoló vezérlő bemenetére van csatlakoztatva, és a dekódoló analóg kimenete közvetlenül, vagy közvetve ahilátcreszlö szűrőn keresztül az audio kimenethez van illesztve A találmány szerinti kapcsolási elrendezés egy előnyös kiviteli alakjában a memóriát és a címgenerátort összekötő adat-cím vezetéknek .segédmemóriához kapcsolódó leágazása van, A találmány szerinti kapcsolási elrendezést, és annak működéséi a továbbiakban ábrák alapján ismertetjük: 5 10 15 20 25 30 35 40 45 50 55 60 65