194639. lajstromszámú szabadalom • Eljárás és berendezés hang szintetizálására, előnyösen beszéd és/vagy ének szótár nélküli a vezérléssél teljes egészében azonos idejű előállítására

194 639 A találmány tárgya eljárás és berendezés hang szintetizálására, előnyösen beszéd és/vagy ének szótár nélküli a vezérléssel teljes egészében azonos idejű előállítására. Mint ismeretes a mindennapi életben az automa­tizálás elterjedésével egyre nagyobb szükség van beszélő gépekre, azaz olyan berendezésekre, me­lyek segítségével az automaták vagy irányító rend­szerek a kezelővel közvetlenül szóban közük az információt, hiszen a technika gyors fejlődése nem teszi lehetővé, hogy sz egyes területek szakemberei a saját szakmájuk elsajátítása mellett még legalább közepes végzettségű folyamatirányítási, illetve digi­tális szakemberek legyenek. így a kezelők csak használják ,j technikái anélkül, hogy működésével tisztában lepnének. Az ilyen technikai berendezé­sek minél kevesebb digitális szakértelmet kívánnak a kezelőtől, annál hatékonyabbak. Például, egy műtőben használatos műszer esetében, ha az adato­kat vagy azok egy részét szóban közli, hatékonyab­ban használható mint a hagyományos (vérnyomás csökkenés esetén hamarabb be lehet avatkozni, mintha először egy laborműszerész észleli a műsze­ren a jel változását és szól az orvosnak). Hasonlóan fontos információ lehet egy erőművi blokknál, ahol üzemzavar esetén megszólal egy sziréna és a blokk­gépész húsz-harminc műszerből kell, hogy kiszűrje, hogy mi a baj. Szóbeli kijelzés esetén a jelzés egyben a kritikus információ közlése. A fentieken kívül fontos terület az oktatás és a vakok rehabilitációja, azaz olyan új munkaterületek kialakítása, amelye­ken eddig a vakok nem dolgozhattak. Ilyen terület például a számítástechnika, ahol a vizuális megjele­nítés helyett akusztikus megjelenítést alkalmazva a vakok is jó! használhatják a terminálokat, s ily módon új szakma a programozás, illetve az operá­tori munka végzése nyílik meg előttük. A fenti problémák megoldására, azaz beszéd szintetizátorok létrehozására, illetve azok létreho­zására szolgaió eljárások kidolgozására már több ízben is sor került. Az ismert megoldások két nagy csoportra oszthatók:- a kötött szótáras megoldás, csak néhány előre eltárolt megszólaltatására van lehetőség; — kötetlen szótáras megoldás, amikor bármi­lyen leírt szó, szöveg megszólaltatható. A kötött szótáras rendszer csak kis szókészlet esetén alkalmazható, hiszen minden egyes szót kü­­lön-külön tárolni kell (egy-egy szónak digitális tá­rolása esetén mintegy száz gépi szó helyfoglalására van szükség. A kötetlen szótáras megoldás esetén a gépi be­széd élvezhetetlen és sok esetben érthetetlen, amennyiben diszkrét hangokból állítják elő a be­szédet. Ugyanis a hangképzést befolyásolják a han­got követő, illetve az azt megelőző hang. Ezt a tényt felismerve dolgoztak ki egy olyan megoldást, mely­ben a hangokat szeletekre, úgynevezett prototípu­sokra bontva tárolja és az egyes szavakat nem han­gokból, hanem hang szeletekből azaz prototípu­sokból, állítja össze. Egy másik megoldásnál az egyes szavak szimmetriáját használja ki a beszéd előállításánál. Mindkét megoldás felismeri a kettős 1 : betűket, de azokra az általános alak kötött szabá­lyát alkalmazza. így például a „kurucsereg” szóban a „cs”-et kettős hangként szólaltatja meg, ami meg­lehetősen értelemzavaró, ugyanis a: cs, gy, ly, ny, 5 ty, sz, zs kettős mássalhangzókat mindig kettős mássalhangzóként kezeli. A hosszú kettős mással­hangzók szintén hibaforrásul szolgálnak, melyek a beszéd megértésének a rovására mennek. A találmánnyal célunk a fentiekben vázolt vala­it) mennyi nehézség egyidejű kiküszöbölése. A találmánnyal megoldandó feladat ennek meg­felelően egy olyan eljárás és berendezés kialakítása hang szintetizálására, mely alkalmas beszéd, és/ vagy ének szótár nélküli a vezérléssel tejes egészé- 15 ben azonos idejű előállítására. A találmány alapja az a felismerés, hogy a kitű­zött feladat egyszerűen megoldódik, ha a szöveg rögzítésekor az egyes betűkhöz tartozó betűkap­csolatokat is rögzitjük. 20 A találmány szerinti eljárás egy olyan ismert eljárás továbbfejlesztése, melynek során a megszó­­lallatandó hangokat mintavevő áramkör segítségé­vel felszeleteljük és az így előállított hangszeleteket, illetve prototípusokat A/D konverter segítségével ö átalakítjuk, s majd az átalakítás után tároljuk. A mcgszólaltatandó szöveget tároló segítségéve! rögzítjük, ezután megszólaltatjuk. A megszólalta­tás során a tárolt szöveg betűinek megfelelő proto- 3Q, típusokat kikeressük, majd sorbarendezés után az önmagában ismert intonációs (azaz az alaphang változású) görbét ráültetjük a sorbarendezett pro­totípusokra és végű! szintetizátorra adva megszó­laltatjuk. 3^ A továbbfejlesztés, vagyis a találmány abban van, hogy a hangok és hangátmenetek szeletelése során aszimmetirkusan szeletelünk, és a szeleteket sorba-egymás után digitális tárolóban tároljuk, majd a tárolás során a különböző hangok és hang- 40 átmenetek megegyező részeit átlapoljuk. A meg­­szólaltatandó szöveg és/vagy ének rögzítésekor a betükapcsolatokat is tárolóban rögzitjük és/vagy a szöveg megadással teljes egészében egyidőben meg­szólaltatjuk, szükség esetén intonálási egységen- 45 ként (azaz a mondatrészeket írásjelekkel határolt szövegrészeket (.,?!:;), illetve éneknél az azonos hangmagasságon énekelt szövegrészenként) into­­nálunk. A találmány értelmében céiszerü, lia a hangok és 50 hangátmenetek szeletelése és tárolása során az át­menetekre jellemző prototípusokat a következő hang prototípusaival együtt tároljuk, (ugyais egy betűnek szövegben hangként való megszólalását a következő betű befolyásolja). 55 Nevezetesen célszerű, ha a betű rögzítésekor, amennyiben a betű nem önmagában jelöli a han­got, ezt a tényt úgy jelöljük, hogy a betű önmagá­ban ismert kódját, például ASCII kódját egy a kódba beépített plusz jelzéssel Braille Metakóddá alakítjuk (vagyis az ASCII kódot egy plusz bittel egészítjük ki, mely akkor egyes, ha az adott betű a következő betűvel együtt ejtendő, mint hang pl. : sz, zs, cs, ty, ss, zz, stb. és akkor nulla, ha a betűt önmagába kell hangként ejteni, természetesen ez a 12 2

Next

/
Oldalképek
Tartalom