Nyelvtudományi Közlemények 85. kötet (1983)

Tanulmányok - Gósy Mária–Olaszy Gábor: A gépi beszéd megértése (Az UNIVOICE magyar nyelvű, azonos idejű, számítógépes szövegszintetizáló rendszer percepciós vizsgálata) [The Perception of Machine Voice (Examination of the UNIVOICE, Hungarian Speaking, Real Time Text-to-Speach Synthesizing System)] 93

A GÉPI BESZÉD MEGÉRTÉSE 99 c) minden nagyságrendben 15—15 hangsort alkalmaztunk; 4 külön­álló mondatot és egy 6 mondatos összefüggő szöveget. A hangkapcsolatok CV és VC típusúak voltak, a logatomok 4—5 beszédhangból álltak. Utóbbiak létrehozásakor figyelembe vettük a magyar nyelv fonotaktikai szabályait s a matematikai módszerrel, szigorú szempontok alapján a magyar nyelvre meghatározott logatomokat (Tarnóczy 1954). A random (véletlen­szerű) sorrend kialakításakor ügyeltünk arra, hogy a szavak esetében jelenté­sükben hasonlóak ne kerüljenek egymás után. A szavak egy, két és három szótagosak voltak ; magas, mély és vegyes hangrendûek. A kísérlet teljes nyelvi anyagát a következők alkották : 15 CV és VC típusú hangkapcsolat ; 15 két szótagból álló lógatom ; 15 egy—három szótagos értelmes szó ; 4 különálló mondat ; 6 mondatos szövegegység. Az összehasonlítás érdekében az anyagot természetes elhangzásban is rögzítettük (férfi bemondóval) és teszteltük. A kísérleti alanyok középiskolai és főiskolai hallgatók voltak ; összesen 70—70 fő. A mesterséges beszédet tesztelő csoport tagjai nem tudták, hogy gépi beszédet hallanak ; a feladatuk az volt, hogy a hallott és megértett szekvenciákat írják le. (Minden egyes hangsort egyszer hallottak). A kísérlet után többségük úgy nyilatkozott, hogy a megszokottnál kissé torzabb beszédet hallottak ; a bemondót például beszédhibásnak gondolták. Kisebb részük felismerte, hogy ,,gép" beszélt. 1. A CV és VC hangkapcsolatokban valamennyi magyar magánhangzó előfordult (néhány időtartamában különböző magánhangzó-pár közül csak a nyelvileg hosszú változat). A mássalhangzók közül minden képzési módot és képzési helyet egy vagy több mássalhangzó képviselt. (Természetesen nem fordulhatott elő minden beszédhang mindkét fonetikai helyzetben). Az azono­sításukra kapott válaszokat százalékos feldolgozásban az 1. táblázat tartal­mazza. 1. táblázat Természetes Mesterséges A lejátszott jó eltérő jó eltérő hangkapcsolat válasz válasz válasz válasz (%) 1. bá 50+ 41 62 22 dá 2. szé 58+ 40 — 80+3 6 cé 3. tú 88 12 tó 70 19 tó 4. ŐZ8 68 24 ős 10 33 tős 5. la 70+ 23 — 100 — 6. ve 64+3 21 re 13 33/20/20/ ne/le/me 7. óg 63 9/10 ób/ók 25+6 36 ók 8. dű. 37+2 52 dő 68 15 nű 9. ím 18 40/24 émjén 70+3 12 ín 10. csa 74+24 — 91 — 11. nyé 92+3 — 7 48/23 mé/gé 12. ká 89+ 10 — 97 — 13. óf 69 12/9 ójóv 12+4 22 pos 14. re 61+ 14 17 ve 48+ 17 17 le 15. győ 97+3 — 6 25/19 dzsőldző A táblázatban a jó válasz oszlopában két százalékérték található : az első az abszolút korrekt azonosítás arányát mutatja, a második pedig olyan értelem-7*

Next

/
Thumbnails
Contents