Nyelvtudományi Közlemények 85. kötet (1983)

Tanulmányok - Gósy Mária–Olaszy Gábor: A gépi beszéd megértése (Az UNIVOICE magyar nyelvű, azonos idejű, számítógépes szövegszintetizáló rendszer percepciós vizsgálata) [The Perception of Machine Voice (Examination of the UNIVOICE, Hungarian Speaking, Real Time Text-to-Speach Synthesizing System)] 93

100 GÖSY MÁRIA -OLASZY GÁBOR ben „jó válasz", hogy a kísérleti személyek által leírt hangsor tartalmazza a lejátszott hangkapcsolatot is. A bá esetében például természetes ejtésben 50%­os volt az abszolút jó azonosítások aránya, 41%-ban pedig a kísérleti alanyok egy-egy mássalhangzóval „hosszabb" hangsort ismertek föl, mint : bár, bál stb. A természetes hangkapcsolatok felismerése általában jó, jellemző, hogy egy-egy mássalhangzó hozzátoldásával írták le a hallgatók a hallott hangsoro­kat. Jelentősebb hibaarány a magánhangzók azonosításában mutatkozott : az [i : ]-t [e : ]-nek, az [y : ]-t pedig [0 : ]-nek értették ; mindkét esetben a felső nyelvállású magánhangzó helyett középső nyelvállásút hallottak (ez kisebb mértékben az [u : ]-nál is jelentkezett). A mesterséges hangkapcsolatok nagyobb részét ugyancsak jól ismerték fel a kísérleti alanyok ; jellemzők az olyan hibázásaik voltak, amelyeknél egy disztinktív jegyben tértek el az eredetitől, például bá helyett dá-t, óg helyett ók-ot, dű helyett nű-t hallottak. Általában a magánhangzók azonosítása jobb, némely mássalhangzót ebben a beszéd­szekvenciában gyakorlatilag nem értettek meg, például a CV helyzetű [J]-t (6%-os jó válasz), []i]-t (7%), [v]-t (13%), illetőleg a VC helyzetű Íg]-t (10%) és [f]-t (12 + 4%). (Jelentéses egységben ezeknek a mássalhangzóknak az azonosítása nem okoz nehézséget.) Az eredmények szerint néhány esetben a mesterséges hangkapcsolatok felismerése jobb voit, mint a természeteseké, így a szé, a la, a dű, az ím, a csa és a M szótagoknál. Nagyjából megegyezett a bá és a re esetében, míg a többinél a természetes elhangzásúak adtak jobb eredményt. 2. A logatomok két szótagúak, zárt és nyílt szótagokat egyaránt tartal­maznak ; magas, mély és vegyes hangrendűek. A teszteredményeket a 2. táblá­zat mutatja. 2. táblázat Természetes Mes t ers égés A lejátszott jó eltérő jó eltérő értelmetlen hangsor válása válasz válasz válasz (%) 1. acsá 49+ 45 _ 79+3 2. házi 100 — 38 19 kábi 3. szerö 98 — 49 18 szelő 4t. cilü 40+6 — 34+2 15 cím 5. jéba 65+5 — — 50 léba 6. zsibel 21 41 zäibe 12 31 zsimet 7. gyülem 86 — 50 10/9 dülemjgyürem 8. hatyó 100 — 71 19 hacsó 9. tufám 8 20 tuja 28 23/19 tufa/tufan 10. summi 89 — 41 — 11. bála 74+ 18 — 25 43 gála 12. csüdér 86 12 südér 3 21 tünér 13. anosz 81+3 — 23 25/25 amoszjado8z 14. őrén 17 28 őre 15 32 ölem 15. pusók 78 12 pusó — 37 túszok A hangkapcsolatokhoz viszonyítva természetes ejtésben a logatomok azonosítása kissé rosszabb : több értelmetlen hangsor felismerése nem éri el az 50%-ot. Jellemzően lehagyják az abszolút szóvégi mássalhangzókat, a [t]-t, a [k]-t, a [n]-t ; néhányszor pedig éppen hozzátoldanak egyet az elhangzott

Next

/
Thumbnails
Contents