Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 1991. Tanulmányok a magyar nyelv, az irodalom köréből. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 20)

H. Varga Gyula: Igekötős szóalakok morfológiai elemzése számítógéppel

Itt kell szólnunk arról az új helyesírási hibatípusról, amely a nyomtatott sajtóban ütötte fel a fejét. A fényszedésre való áttéréssel, illetve az elektronikus szövegszerkesztők használatával újságjainkban elburjánoztak a hibás sorvégi elválasztások. (Legutóbb Fábián Pál és F. Kovács Ferenc bírálatait olvashattuk az Édes Anyanyelvünk XIV. évfolyamának 1. számában.) Az előbb említett és a továbbiakban ismertetendő műveletek segítségével elkerülhető a *fe-ladat, *me­géri, *bek-rémez stb. szóalakok hibás elválasztása. 2 b) Igekötős szerkezeteink viselkedésének explicit leírását az elméleti nyelvtudomány is igényli. Egy mondatszerkezetbe (-vázba) bekerülve egy igekötős ige másképpen viselkedik, mint egy szimplex ige, bizonyos logikai műveletek és pragmatikai tényezők hatására az igekötős igéken morfoszintaktikai változások mennek végbe. Fel kell tárnunk azokat a szabályokat, amelyek a mondatgenerálás során egy folytonos szóalakból egy nem folytonos -- más szóhasználattal: analitikus ~ szóalakot hoz létre, s le kell írnunk ezen szóalakok létrehozásának módját. c) Az igekötős alakulatok kezelése megoldandó feladatcsoportot jelent a maga , sajátos módszereivel és eszközeivel dolgozó számítógépes nyelvészet számára is. A mondatszintetizálás, az automatikus szótárkészítés, a gépi fordítás, a különféle interaktív rendszerek stb., stb. igénylik az igekötős szerkezetek működésének formális leírását. Szükség van tehát egy olyan algoritmusra, melynek során programunk fölismeri a beérkező szóalakokban lappangó igekötőket, és — a további feldolgozás számára — automatikusan leválasztja őket igéjükről, igenevükről. Az analízis műveletsora onnan indul, hogy egy szótárból vagy szövegből különféle betűsorokat (szavakat) kapunk. Az elemzés két részből áll: a) igekötő­keresés és leválasztás; b) a visszamaradt szórész ("maradék") azonosítása. Az 1. lépés viszonylag egyszerű: listát kell adni az igekötőkről, s a szókezdeteket megvizsgálva leválasztani őket. Rögtön kiderül, hogy nem az igekötő megtalálása és leválasztása nehéz, hanem a téves igekötő-azonosítások kiszűrése. Formai szempontból — vagyis csupán a betűket (karaktereket) vizsgálva — ugyanis "igekötőket" találunk nemcsak a megint, elül, felette, betűz stb. homonímákban, hanem az átkoz, becsül, felel, kisebbít, les, rág stb. igékben is. 2 Bizonyara ezeket a hibakat is ki fogja küszöbölni a magyar helyesírási programcsomag, melyen -­értesüléseim szerint — két munkacsoport is dolgozik. Eredményeikről azonban jelenleg nincs tudomásom. 8

Next

/
Thumbnails
Contents