Nyelvtudományi Közlemények 85. kötet (1983)
Tanulmányok - Gósy Mária–Olaszy Gábor: A gépi beszéd megértése (Az UNIVOICE magyar nyelvű, azonos idejű, számítógépes szövegszintetizáló rendszer percepciós vizsgálata) [The Perception of Machine Voice (Examination of the UNIVOICE, Hungarian Speaking, Real Time Text-to-Speach Synthesizing System)] 93
' A gépi beszéd megértése (Az UNIVOICE magyar nyelvű, azonos idejű, számítógépes szövegszintetizáló rendszer percepciós vizsgálata) Bevezetés A beszéd mesterséges előállítása napjainkban már realitás, mivel a tudomány és a technika korszerű, egyszerűen használható eszközöket és vizsgálati módszereket biztosít a kutatáshoz. Ezek segítségével pontosan meghatározhatjuk a hangzó beszéd akusztikai szerkezetét ; megállapíthatjuk, hogy mesterséges előállításához milyen fonetikai, fizikai, számítástechnikai méréseket, vizsgálatokat kell elvégeznünk. A beszéd mesterséges előállítása nyelvorientált feladat, ami azt jelenti, hogy minden nyelvben külön-külön és úgy kell feltárni a jellemző hangtani, akusztikai sajátosságokat, hogy azok a mesterséges előállítás során felhasználhatók legyenek. A tudományos megalapozottság igénye döntő fontosságú a további alkalmazások szempontjából is. Alapkövetelmény, hogy a mesterséges (szintetizált) beszéd az adott társadalmi közösség tagjai számára egyértelmű, vagyis jól érthető legyen. A hangminőség és az érthetőség megítélése pedig tudományosan megalapozott beszédmegértési vizsgálatokkal történhet. Ilyenfajta kísérletek adhatnak választ a gépi beszéd felismerésének és azonosításának a természetes beszédtől eltérő és azzal megegyező mechanizmusára is. Az MTA Nyelvtudományi Intézetének fonetikai osztályán az utóbbi években két beszédszintetizáló rendszert fejlesztettek ki : a VOXONt (vö. Bolla 1982) és az UNIVOICE-t (vö. Kiss-Olaszy). A dolgozatban az UNIVOICE elnevezésű azonos idejű, magyar nyelvű, automatikus szövegszintetizáló rendszer „beszédének" percepciós vizsgálati eredményeit ismertetjük. Az UNIVOICE beszédszintetizáló rendszer 1. A magyar beszéd automatikus előállítására szolgáló nyelvészetifonetikai és számítástechnikai eljárást Olaszy Gábor villamosmérnök és Kiss Gábor programozó matematikus dolgozta ki 1980—1982-ben. A munka során a korábban kifejlesztett INBERE (Interaktív Beszédszintetizáló Rendszer) rendszerrel (Kiss—Olaszy 1980) feltárták a magyar beszéd teljes akusztikai szerkezetének addig vizsgált elemeit, meghatározták a számítógépes szintetizáláshoz szükséges hangsorépítő elemek minőségi és mennyiségi mutatóit (Olaszy 1981; 1982a), létrehozták a hangsorépítéshez szükséges szabályrendszert (Olaszy 1982b). Ezek az eredmények lehetővé tették a szintetizált magyar beszéd előállításához szükséges minimalizált és optimalizált adatbázis (Olaszy 1982c) és az adatbázist kezelő számítógépes programrendszer megvalósítását (Kiss-Olaszy 1982). Az UNIVOICE adatai :