194639. lajstromszámú szabadalom • Eljárás és berendezés hang szintetizálására, előnyösen beszéd és/vagy ének szótár nélküli a vezérléssél teljes egészében azonos idejű előállítására
194 639 A találmány tárgya eljárás és berendezés hang szintetizálására, előnyösen beszéd és/vagy ének szótár nélküli a vezérléssel teljes egészében azonos idejű előállítására. Mint ismeretes a mindennapi életben az automatizálás elterjedésével egyre nagyobb szükség van beszélő gépekre, azaz olyan berendezésekre, melyek segítségével az automaták vagy irányító rendszerek a kezelővel közvetlenül szóban közük az információt, hiszen a technika gyors fejlődése nem teszi lehetővé, hogy sz egyes területek szakemberei a saját szakmájuk elsajátítása mellett még legalább közepes végzettségű folyamatirányítási, illetve digitális szakemberek legyenek. így a kezelők csak használják ,j technikái anélkül, hogy működésével tisztában lepnének. Az ilyen technikai berendezések minél kevesebb digitális szakértelmet kívánnak a kezelőtől, annál hatékonyabbak. Például, egy műtőben használatos műszer esetében, ha az adatokat vagy azok egy részét szóban közli, hatékonyabban használható mint a hagyományos (vérnyomás csökkenés esetén hamarabb be lehet avatkozni, mintha először egy laborműszerész észleli a műszeren a jel változását és szól az orvosnak). Hasonlóan fontos információ lehet egy erőművi blokknál, ahol üzemzavar esetén megszólal egy sziréna és a blokkgépész húsz-harminc műszerből kell, hogy kiszűrje, hogy mi a baj. Szóbeli kijelzés esetén a jelzés egyben a kritikus információ közlése. A fentieken kívül fontos terület az oktatás és a vakok rehabilitációja, azaz olyan új munkaterületek kialakítása, amelyeken eddig a vakok nem dolgozhattak. Ilyen terület például a számítástechnika, ahol a vizuális megjelenítés helyett akusztikus megjelenítést alkalmazva a vakok is jó! használhatják a terminálokat, s ily módon új szakma a programozás, illetve az operátori munka végzése nyílik meg előttük. A fenti problémák megoldására, azaz beszéd szintetizátorok létrehozására, illetve azok létrehozására szolgaió eljárások kidolgozására már több ízben is sor került. Az ismert megoldások két nagy csoportra oszthatók:- a kötött szótáras megoldás, csak néhány előre eltárolt megszólaltatására van lehetőség; — kötetlen szótáras megoldás, amikor bármilyen leírt szó, szöveg megszólaltatható. A kötött szótáras rendszer csak kis szókészlet esetén alkalmazható, hiszen minden egyes szót külön-külön tárolni kell (egy-egy szónak digitális tárolása esetén mintegy száz gépi szó helyfoglalására van szükség. A kötetlen szótáras megoldás esetén a gépi beszéd élvezhetetlen és sok esetben érthetetlen, amennyiben diszkrét hangokból állítják elő a beszédet. Ugyanis a hangképzést befolyásolják a hangot követő, illetve az azt megelőző hang. Ezt a tényt felismerve dolgoztak ki egy olyan megoldást, melyben a hangokat szeletekre, úgynevezett prototípusokra bontva tárolja és az egyes szavakat nem hangokból, hanem hang szeletekből azaz prototípusokból, állítja össze. Egy másik megoldásnál az egyes szavak szimmetriáját használja ki a beszéd előállításánál. Mindkét megoldás felismeri a kettős 1 : betűket, de azokra az általános alak kötött szabályát alkalmazza. így például a „kurucsereg” szóban a „cs”-et kettős hangként szólaltatja meg, ami meglehetősen értelemzavaró, ugyanis a: cs, gy, ly, ny, 5 ty, sz, zs kettős mássalhangzókat mindig kettős mássalhangzóként kezeli. A hosszú kettős mássalhangzók szintén hibaforrásul szolgálnak, melyek a beszéd megértésének a rovására mennek. A találmánnyal célunk a fentiekben vázolt valait) mennyi nehézség egyidejű kiküszöbölése. A találmánnyal megoldandó feladat ennek megfelelően egy olyan eljárás és berendezés kialakítása hang szintetizálására, mely alkalmas beszéd, és/ vagy ének szótár nélküli a vezérléssel tejes egészé- 15 ben azonos idejű előállítására. A találmány alapja az a felismerés, hogy a kitűzött feladat egyszerűen megoldódik, ha a szöveg rögzítésekor az egyes betűkhöz tartozó betűkapcsolatokat is rögzitjük. 20 A találmány szerinti eljárás egy olyan ismert eljárás továbbfejlesztése, melynek során a megszólallatandó hangokat mintavevő áramkör segítségével felszeleteljük és az így előállított hangszeleteket, illetve prototípusokat A/D konverter segítségével ö átalakítjuk, s majd az átalakítás után tároljuk. A mcgszólaltatandó szöveget tároló segítségéve! rögzítjük, ezután megszólaltatjuk. A megszólaltatás során a tárolt szöveg betűinek megfelelő proto- 3Q, típusokat kikeressük, majd sorbarendezés után az önmagában ismert intonációs (azaz az alaphang változású) görbét ráültetjük a sorbarendezett prototípusokra és végű! szintetizátorra adva megszólaltatjuk. 3^ A továbbfejlesztés, vagyis a találmány abban van, hogy a hangok és hangátmenetek szeletelése során aszimmetirkusan szeletelünk, és a szeleteket sorba-egymás után digitális tárolóban tároljuk, majd a tárolás során a különböző hangok és hang- 40 átmenetek megegyező részeit átlapoljuk. A megszólaltatandó szöveg és/vagy ének rögzítésekor a betükapcsolatokat is tárolóban rögzitjük és/vagy a szöveg megadással teljes egészében egyidőben megszólaltatjuk, szükség esetén intonálási egységen- 45 ként (azaz a mondatrészeket írásjelekkel határolt szövegrészeket (.,?!:;), illetve éneknél az azonos hangmagasságon énekelt szövegrészenként) intonálunk. A találmány értelmében céiszerü, lia a hangok és 50 hangátmenetek szeletelése és tárolása során az átmenetekre jellemző prototípusokat a következő hang prototípusaival együtt tároljuk, (ugyais egy betűnek szövegben hangként való megszólalását a következő betű befolyásolja). 55 Nevezetesen célszerű, ha a betű rögzítésekor, amennyiben a betű nem önmagában jelöli a hangot, ezt a tényt úgy jelöljük, hogy a betű önmagában ismert kódját, például ASCII kódját egy a kódba beépített plusz jelzéssel Braille Metakóddá alakítjuk (vagyis az ASCII kódot egy plusz bittel egészítjük ki, mely akkor egyes, ha az adott betű a következő betűvel együtt ejtendő, mint hang pl. : sz, zs, cs, ty, ss, zz, stb. és akkor nulla, ha a betűt önmagába kell hangként ejteni, természetesen ez a 12 2