Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 1991. Tanulmányok a magyar nyelv, az irodalom köréből. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 20)

Papp Ferenc: A magyar főnév esetragos alakjainak automatikus szintéziséről

PAPP FERENC Budapest, az MTA Nyelvtudományi Intézete A MAGYAR FŐNÉV ESETRAGOS ALAKJAINAK AUTOMATIKUS SZINTÉZISÉRŐL* 0. Az alábbiakban megismertetem az olvasót azokkal a legfontosabb nyelvi tényekkel, amelyek a címben foglalt feladat megoldásához kellenek. Pontosabban: ezeket a tényeket minden egyes magyar anyanyelvű olvasó jól, "von Haus aus" is­meri: csupán e tények pontos-szigorú számbavétele, algoritmikus rendbe rakása szükségeltetik, épp az automatikus, tehát esetenkénti (ad hoc) beavatkozást nem igénylő szintézis céljából. Az alábbiakra (a gyakorlatban) alig lesz szükség, legfel­jebb gépi fordítás, kivonatolás stb. magyar kimeneténél kellenének, egyebek mel­lett, az automatikus szintézis adatai és szabályai. Itt a gép azért kell, hogy rajta el­lenőrizzük ismereteinket: vajon valóban mindent tudunk-e a magyar morfológia e fejezetéből? Hiszen a gép ilyen szempontból könyörtelen, nincs nyelvérzéke: ha va­lamit nem vagy nem a kellő módon közöltünk vele, akkor persze rossz alakokat fog kiadni. 1. Az első, amit létre kell hoznunk, a magyar betűk -- nevezzük őket a továb­biakban karaktereknek (ezzel e szavunk új jelentést kap, angol szemantikai kölcsön­zés). így elkerültük a magyar betű szó kétértelműségét: míg a köznyelvben durván szólva egy-egy "leütést" jelöl (tehát ott a csók szó négybetűs), addig a helyesírási szakirodalomban a betű egy fonéma jele (a csók tehát hárombetűs). Látnunk kell, hogy a latin alapkarakterek az angolban annak hieroglifikus írásrendszere miatt ele­gendők, vö. a read karaktersor (string) különféle olvasataival, a blood—foot stringek oo szakaszának fonémamegfelelésével, az enough string fantasztikus fonémamegfe­lelésével stb. Úgyhogy nem olyan biztos, hogy az angol írásbeliség oly ideális, ami­lyennek tisztán számítógépes szempontból első pillantásra látszanék -- nem minden fenékig számítógép. Az alapkaraktereken kívül tehát létre kell hoznunk az ékezeteseket. A több jegyű (egyenként több karakterből álló: cs, dzs, ddzs) betűk azért visszatérnek. Közülük célszerű csak a két jegyűekkel számolni, a három- és négyjegyűeket kivé­* Elhangzott a Magyar Nyelvtudományi Társaság Heves megyei csoportjának felolvasóülésén 1991. április 16-án. 3

Next

/
Oldalképek
Tartalom