176776. lajstromszámú szabadalom • Eljárás és berendezés beszéd szintetizálására

3 176776 4 széd természetességének elérése céljából a kiolvasás so­rán a rezgési periódusok amplitúdóit és hosszát kvázi­­véletlen módon változtatjuk, és abból a célból, hogy zaj és vegyes fonémák szintetizálásakor egyenletes spektrális eloszlást kapjunk, a zaj elemek kiolvasási részeinek kvá­­zivéletlen kezdeti címeket adunk kvázivéletlen időtar­tammal és kvázivéletlen kiolvasási iránnyal. Abból a cél­ból, hogy ugyanazon tárolt elemekből különböző foné­mákat állítsunk elő, a tárban rögzített amplitúdó érté­kek kiolvasási frekvenciáját változtatjuk, és hogy ugyan­azon tárolt elemekből különböző fonémákat kapjunk, változtatjuk a fonémák amplitúdó jellemzőit, továbbá vegyes fonémák előállításához hangperiódusok és zaj­részek kombinációit használjuk. A fonéma átmenetek simaságának biztosítása céljából olyan periódusokat használunk, melyek formáns eloszlása a fonémák kö­zötti átmenetnek felel meg, és a fonéma átmenetek sima­ságának elérése céljából ezenkívül a vonatkozó átmenet tartományában az amplitúdókat lecsökkentjük. Azokat a digitális adatokat, amelyeket az adott nyelv fonéma tartalma és alapvető jellemzői elemzése alapján kap­tunk, felhasználjuk a tárban rögzített beszédelemek visszaadásának vezérlésére. A fonémák amplitúdó jel­lemzőit úgy alakítjuk ki, hogy a digitális értékekből át­alakítással kapott szintetizált fonémák analóg jelének az erősítését olyan analóg jellel befolyásoljuk, amely a fonéma amplitúdó jellemzői digitális értékének felel meg. A találmány szerinti eljárás foganatosítására alkal­mas berendezés számítógépet tartalmaz, amelynek ki­menete fixtár címregiszter számlálójához csatlakozik. A számítógép másik kimenete a számlálási irányt meg­határozó regiszterhez csatlakozik, és ennek kimenete a címregiszter számlálóval van összekötve. A számítógép két másik kimenete a számlálási frekvenciát meghatá­rozó regiszterhez és a kiolvasandó címek számát meg­határozó regiszterhez csatlakozik és ezen regiszterek kimenete előírt számú és frekvenciájú impulzust keltő impulzusgenerátorral van összekötve. Az impulzusgene­rátor kimenete a címregiszter számláló számlálási be­menetével van összekötve. A számítógép egy további kimenete digitál-analóg átalakítóhoz csatlakozik, amely­nek kimenete erősítő-modulátor erősítést változtató be­menetéhez csatlakozik. A fixtár kimenete második digi­tál-analóg átalakítóhoz csatlakozik, és ennek kimenete az erősítő-modulátor bemenetével van összekötve. Az erősítő-modulátor kimenete hangszóróhoz és távközlő vonalhoz csatlakozik. A vezérlőegység kimenete a szá­mítógép bemenetéhez, ennek egy másik kimenete pedig a vezérlőegység bemenetéhez csatlakozik. A találmány szerinti eljárás egy foganatosítási módjá­nál a periódusok hosszának változtatását ±40%-os ha­tárokon belül végezzük el, és a periódusok hosszának, valamint kiolvasás során a rezgési amplitúdóknak a kvá­zivéletlen változtatásait ±3%-os határokon belül tart­juk. A beszéd természetességének elérése céljából ezen­kívül a hangrezgések periódushosszát és amplitúdóját kvázivéletlen módon változtatjuk, és vegyes fonémák létrehozása céljából kvázivéletlen módon változtatjuk a modulált amplitúdójú zajrezgések periódushosszát és az „R” fonéma létrehozása céljából az amplitúdómodulált hangrezgések periódushosszát. A találmány szerinti megoldás előnye, hogy mechani­kai mozgó elemeket nem tartalmazó viszonylag kis ka­pacitású tárat igényel, a szintézishez nincs szüksége bo­nyolult hangolást igénylő analóg jelleggörbéjű generáto­rok alkalmazására, a mondat sajátos követelményeitől függő fonémák szintézisénél nagymértékű flexibilitást tesz lehetővé, a fonémák alakjának változtatását a tár tartalmának egyszerű megváltoztatásával lehetővé teszi, lehetőséget biztosít a hangrezgések és amplitúdójuk pe­riodicitásának kvázivéletlen változásai utánzására, amely a beszéd hűségéhez nagymértékben hozzájárul, biztosítja a szöveg szükséges hangsúlyának és hang­lejtésének elérését, nem igényli a számítógépben gyors hozzáférésű memória alkalmazását, elősegíti a gyártást, mert a behangolási műveletekre nincs szükség, ugyan­akkor helyt ad nagymértékben integrált úi elektronikus elemek, például tárak, mikroszámítógépek alkalmazásá­ra, amelyek kis méretek, súly és alacsony ár mellett a berendezést megbízhatóvá teszik. A találmányt a továbbiakban egy kiviteli példa kap­csán, a rajz alapján ismertetjük részletesebben. A rajzon az 1. ábra a találmány szerinti berendezés tömbváz­lata, a 2. ábra emberi hangon kiejtett „HAHA” szó felvett amplitúdó görbéje, a 3. ábra a találmány szerint szintetizált „II5IHA” szó felvett amplitúdó görbéje, a 4. ábra emberi hangon kiejtett „MIMMI” szó fel­vett amplitúdó görbéje, az 5. ábra a találmány szerinti szintetizált „MIMMI” szó amplitúdó görbéje, a 6. ábra az emberi hangon kiejtett „MIMMI” szó szonogrammja, és a 7. ábra a találmány szerint szintetizált „MIMMI” szó szonogrammja. Az 1. ábrán a találmány szerinti berendezés tömb­vázlatát tüntettük fel, amelyen látható, hogy a berende­zés 1 számítógépet tartalmaz, amelynek 2 kimenete 4 fixtár 3 címregiszter számlálójához csatlakozik. Az 1 számítógép 5 kimenete a számlálási irányt meghatá­rozó 6 regiszterhez csatlakozik, amelynek kimenete a 3 címregiszter számlálóval van összekötve. Az 1 szá­mítógép 7 és 8 kimenetei a számlálás frekvenciáját meg­határozó 9 regiszterhez, illetve a kiolvasási címek szá­mát tartalmazó 10 regiszterhez csatlakoznak. A 9 és 10 regiszterek kimenetei 11 impulzusgenerátorral vannak összekötve. All impulzusgenerátor kimenete a 3 cím­regiszter számláló számláló bemenetével is össze van kötve. Az 1 számítógép 12 kimenete amplitúdó szabá­lyozó 13 regiszteren keresztül 14 digitál-analóg átalakí­tóhoz csatlakozik, amelynek kimenete 15 erősítő-modu­látor erősítést változtató bemenetével van összekötve. A 4 fixtár kimenete olyan 16 digitál-analóg átalakítóhoz csatlakozik, amelynek kimenete a 15 erősítő-modulátor bemenetével van összekötve. A 15 erősítő-modulátor ki­menete 17 hangszóróhoz és 18 távközlő vonalhoz csatla­kozik. A 19 vezérlőegység kimenete az 1 számítógép 21 bemenetével, az 1 számítógép 20 kimenete pedig a 19 vezérlőegység bemenetével van összekötve. A leírás egységes értelmezése céljából az alábbiakban néhány fontosabb kifejezés kiegészítő magyarázatát adjuk meg: „beszédszintézis” — valamilyen berendezés által kiadott akusztikus kimeneti jel észlelését jelenti, amelyben vala­milyen nyelvű, nem feltétlenül bulgár nyelvű emberi beszéd felismerhető; 5 10 15 20 25 30 35 40 45 50 55 60 65 2

Next

/
Oldalképek
Tartalom