176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására
3 176776 4 széd természetességének elérése céljából a kiolvasás során a rezgési periódusok amplitúdóit és hosszát kvázivéletlen módon változtatjuk, és abból a célból, hogy zaj és vegyes fonémák szintetizálásakor egyenletes spektrális eloszlást kapjunk, a zaj elemek kiolvasási részeinek kvázivéletlen kezdeti címeket adunk kvázivéletlen időtartammal és kvázivéletlen kiolvasási iránnyal. Abból a célból, hogy ugyanazon tárolt elemekből különböző fonémákat állítsunk elő, a tárban rögzített amplitúdó értékek kiolvasási frekvenciáját változtatjuk, és hogy ugyanazon tárolt elemekből különböző fonémákat kapjunk, változtatjuk a fonémák amplitúdó jellemzőit, továbbá vegyes fonémák előállításához hangperiódusok és zajrészek kombinációit használjuk. A fonéma átmenetek simaságának biztosítása céljából olyan periódusokat használunk, melyek formáns eloszlása a fonémák közötti átmenetnek felel meg, és a fonéma átmenetek simaságának elérése céljából ezenkívül a vonatkozó átmenet tartományában az amplitúdókat lecsökkentjük. Azokat a digitális adatokat, amelyeket az adott nyelv fonéma tartalma és alapvető jellemzői elemzése alapján kaptunk, felhasználjuk a tárban rögzített beszédelemek visszaadásának vezérlésére. A fonémák amplitúdó jellemzőit úgy alakítjuk ki, hogy a digitális értékekből átalakítással kapott szintetizált fonémák analóg jelének az erősítését olyan analóg jellel befolyásoljuk, amely a fonéma amplitúdó jellemzői digitális értékének felel meg. A találmány szerinti eljárás foganatosítására alkalmas berendezés számítógépet tartalmaz, amelynek kimenete fixtár címregiszter számlálójához csatlakozik. A számítógép másik kimenete a számlálási irányt meghatározó regiszterhez csatlakozik, és ennek kimenete a címregiszter számlálóval van összekötve. A számítógép két másik kimenete a számlálási frekvenciát meghatározó regiszterhez és a kiolvasandó címek számát meghatározó regiszterhez csatlakozik és ezen regiszterek kimenete előírt számú és frekvenciájú impulzust keltő impulzusgenerátorral van összekötve. Az impulzusgenerátor kimenete a címregiszter számláló számlálási bemenetével van összekötve. A számítógép egy további kimenete digitál-analóg átalakítóhoz csatlakozik, amelynek kimenete erősítő-modulátor erősítést változtató bemenetéhez csatlakozik. A fixtár kimenete második digitál-analóg átalakítóhoz csatlakozik, és ennek kimenete az erősítő-modulátor bemenetével van összekötve. Az erősítő-modulátor kimenete hangszóróhoz és távközlő vonalhoz csatlakozik. A vezérlőegység kimenete a számítógép bemenetéhez, ennek egy másik kimenete pedig a vezérlőegység bemenetéhez csatlakozik. A találmány szerinti eljárás egy foganatosítási módjánál a periódusok hosszának változtatását ±40%-os határokon belül végezzük el, és a periódusok hosszának, valamint kiolvasás során a rezgési amplitúdóknak a kvázivéletlen változtatásait ±3%-os határokon belül tartjuk. A beszéd természetességének elérése céljából ezenkívül a hangrezgések periódushosszát és amplitúdóját kvázivéletlen módon változtatjuk, és vegyes fonémák létrehozása céljából kvázivéletlen módon változtatjuk a modulált amplitúdójú zajrezgések periódushosszát és az „R” fonéma létrehozása céljából az amplitúdómodulált hangrezgések periódushosszát. A találmány szerinti megoldás előnye, hogy mechanikai mozgó elemeket nem tartalmazó viszonylag kis kapacitású tárat igényel, a szintézishez nincs szüksége bonyolult hangolást igénylő analóg jelleggörbéjű generátorok alkalmazására, a mondat sajátos követelményeitől függő fonémák szintézisénél nagymértékű flexibilitást tesz lehetővé, a fonémák alakjának változtatását a tár tartalmának egyszerű megváltoztatásával lehetővé teszi, lehetőséget biztosít a hangrezgések és amplitúdójuk periodicitásának kvázivéletlen változásai utánzására, amely a beszéd hűségéhez nagymértékben hozzájárul, biztosítja a szöveg szükséges hangsúlyának és hanglejtésének elérését, nem igényli a számítógépben gyors hozzáférésű memória alkalmazását, elősegíti a gyártást, mert a behangolási műveletekre nincs szükség, ugyanakkor helyt ad nagymértékben integrált úi elektronikus elemek, például tárak, mikroszámítógépek alkalmazására, amelyek kis méretek, súly és alacsony ár mellett a berendezést megbízhatóvá teszik. A találmányt a továbbiakban egy kiviteli példa kapcsán, a rajz alapján ismertetjük részletesebben. A rajzon az 1. ábra a találmány szerinti berendezés tömbvázlata, a 2. ábra emberi hangon kiejtett „HAHA” szó felvett amplitúdó görbéje, a 3. ábra a találmány szerint szintetizált „II5IHA” szó felvett amplitúdó görbéje, a 4. ábra emberi hangon kiejtett „MIMMI” szó felvett amplitúdó görbéje, az 5. ábra a találmány szerinti szintetizált „MIMMI” szó amplitúdó görbéje, a 6. ábra az emberi hangon kiejtett „MIMMI” szó szonogrammja, és a 7. ábra a találmány szerint szintetizált „MIMMI” szó szonogrammja. Az 1. ábrán a találmány szerinti berendezés tömbvázlatát tüntettük fel, amelyen látható, hogy a berendezés 1 számítógépet tartalmaz, amelynek 2 kimenete 4 fixtár 3 címregiszter számlálójához csatlakozik. Az 1 számítógép 5 kimenete a számlálási irányt meghatározó 6 regiszterhez csatlakozik, amelynek kimenete a 3 címregiszter számlálóval van összekötve. Az 1 számítógép 7 és 8 kimenetei a számlálás frekvenciáját meghatározó 9 regiszterhez, illetve a kiolvasási címek számát tartalmazó 10 regiszterhez csatlakoznak. A 9 és 10 regiszterek kimenetei 11 impulzusgenerátorral vannak összekötve. All impulzusgenerátor kimenete a 3 címregiszter számláló számláló bemenetével is össze van kötve. Az 1 számítógép 12 kimenete amplitúdó szabályozó 13 regiszteren keresztül 14 digitál-analóg átalakítóhoz csatlakozik, amelynek kimenete 15 erősítő-modulátor erősítést változtató bemenetével van összekötve. A 4 fixtár kimenete olyan 16 digitál-analóg átalakítóhoz csatlakozik, amelynek kimenete a 15 erősítő-modulátor bemenetével van összekötve. A 15 erősítő-modulátor kimenete 17 hangszóróhoz és 18 távközlő vonalhoz csatlakozik. A 19 vezérlőegység kimenete az 1 számítógép 21 bemenetével, az 1 számítógép 20 kimenete pedig a 19 vezérlőegység bemenetével van összekötve. A leírás egységes értelmezése céljából az alábbiakban néhány fontosabb kifejezés kiegészítő magyarázatát adjuk meg: „beszédszintézis” — valamilyen berendezés által kiadott akusztikus kimeneti jel észlelését jelenti, amelyben valamilyen nyelvű, nem feltétlenül bulgár nyelvű emberi beszéd felismerhető; 5 10 15 20 25 30 35 40 45 50 55 60 65 2