Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 1991. Tanulmányok a magyar nyelv, az irodalom köréből. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 20)
Papp Ferenc: A magyar főnév esetragos alakjainak automatikus szintéziséről
PAPP FERENC Budapest, az MTA Nyelvtudományi Intézete A MAGYAR FŐNÉV ESETRAGOS ALAKJAINAK AUTOMATIKUS SZINTÉZISÉRŐL* 0. Az alábbiakban megismertetem az olvasót azokkal a legfontosabb nyelvi tényekkel, amelyek a címben foglalt feladat megoldásához kellenek. Pontosabban: ezeket a tényeket minden egyes magyar anyanyelvű olvasó jól, "von Haus aus" ismeri: csupán e tények pontos-szigorú számbavétele, algoritmikus rendbe rakása szükségeltetik, épp az automatikus, tehát esetenkénti (ad hoc) beavatkozást nem igénylő szintézis céljából. Az alábbiakra (a gyakorlatban) alig lesz szükség, legfeljebb gépi fordítás, kivonatolás stb. magyar kimeneténél kellenének, egyebek mellett, az automatikus szintézis adatai és szabályai. Itt a gép azért kell, hogy rajta ellenőrizzük ismereteinket: vajon valóban mindent tudunk-e a magyar morfológia e fejezetéből? Hiszen a gép ilyen szempontból könyörtelen, nincs nyelvérzéke: ha valamit nem vagy nem a kellő módon közöltünk vele, akkor persze rossz alakokat fog kiadni. 1. Az első, amit létre kell hoznunk, a magyar betűk -- nevezzük őket a továbbiakban karaktereknek (ezzel e szavunk új jelentést kap, angol szemantikai kölcsönzés). így elkerültük a magyar betű szó kétértelműségét: míg a köznyelvben durván szólva egy-egy "leütést" jelöl (tehát ott a csók szó négybetűs), addig a helyesírási szakirodalomban a betű egy fonéma jele (a csók tehát hárombetűs). Látnunk kell, hogy a latin alapkarakterek az angolban annak hieroglifikus írásrendszere miatt elegendők, vö. a read karaktersor (string) különféle olvasataival, a blood—foot stringek oo szakaszának fonémamegfelelésével, az enough string fantasztikus fonémamegfelelésével stb. Úgyhogy nem olyan biztos, hogy az angol írásbeliség oly ideális, amilyennek tisztán számítógépes szempontból első pillantásra látszanék -- nem minden fenékig számítógép. Az alapkaraktereken kívül tehát létre kell hoznunk az ékezeteseket. A több jegyű (egyenként több karakterből álló: cs, dzs, ddzs) betűk azért visszatérnek. Közülük célszerű csak a két jegyűekkel számolni, a három- és négyjegyűeket kivé* Elhangzott a Magyar Nyelvtudományi Társaság Heves megyei csoportjának felolvasóülésén 1991. április 16-án. 3