Nyelvtudományi Közlemények 77. kötet (1975)

Tanulmányok - Vásárhelyi S. István: Magyar igealakok szintézise [A Synthesis of Hungarian Verbal Forms through the Help of a Verbal Computer] 67

MAGYAR IGEALAKOK SZINTÉZISE 71 kívül egyszerű programot kíván, de nagy, rossz kihasználtságú adattömbökre van szükség. A másik fajta esetén az adatok rendezettségi foka alacsonyabb, így kisebb helyet is foglalnak el, de a program bonyolultabb. Egy szemléletes példa : Ha a szótárban a szavak abc-rendben szorosan egymás után következ­nek, akkor egy 1000-szavas szótár kis helyet foglal el, de a szó megtalálása viszonylag körülményes. De ha a szavakat az első két betűjük szerint külön lapra írjuk, AA—AB—AG-. . .—ZY—ZZ sorrendben, akkor a keresés egy­szerűvé válik, ugyanakkor a terjedelem megnövekszik, és egyes lapokon na­gyon kevés, másokon esetleg egy szó sem lesz. A vektorszorzás elve nagyjából a két véglet között félúton foglal helyet. VARGA DÉNES módszere, amely a nyelvi jelsorozatok felismerésének új­szerű módja, a Boole-vektorok konjunkcióján, azaz halmazok metszetének megállapításán alapszik. Vegyünk egy tetszőleges nagyságú halmazt, amelynek minden részhalmaza egy-egy (nyelvi) tulajdonságot reprezentál. Minden nyelvi elemhez rendeljünk hozzá egy Boole-vektort, azaz O-kból és l-esekből álló számsorozatot, amelyek rendre azt jelzik, hogy a nyelvi elem melyik tulaj­donságú halmazokba tartozik (ott a vektorban l-es áll). Amennyiben több elem egyszerre jelentkezik, ezek együttes előfordulása csökkenti a lehetőségek körét, és csak azok a tulajdonságok maradnak érvényben, amelyek mindegyik vek­torban közösek. A számítógépben a közös rész (konjunkció, metszet) megálla­pítása a logikai ÉS műveletével történik ; az ÉS-műve\et eredménye akkor és csak akkor 1, ha minden tagja is 1. Két példa: 1. Ha A, B, G és D tulajdonságok, x, y, z pedig elemek. Ha x A és C tulajdonságú, akkor Boole-vektora 1010, s tegyük fel, hogy y-é 1101, z-é 0111. Ha x ós y együttesen fordul elő, akkor a két vektor konjunkciója x 1010 y 1101 xÊSy. 1000, vagyis feltételezhetjük, hogy x és y együttes előfordulásakor csak az A tulaj­donság van érvényben. 2. Konkrétan, igeelemzósre felhasználva, A—B—G részhalmazok a ki­jelentő mód alanyi ragozás egyes szám három személyének feleljenek meg. A ragokban {-ok, -eh, -öle, -om, -em, -öm ; -sz, -asz, -esz, -ol, -el, -öl ; 0,-ik) elő­forduló betűk abc-sorrendben : A, E, I, K, L, M, O, ö, SZ, valamint a 0. Vektoraik: A: 010, E: 110, I: 001, K : 101, L : 010, M: 100,0: 110, 0:110, SZ : 010, 0: 001. Tegyük fel, hogy az elemzendő szó tövét megtaláltuk, a teljes szóalakból pedig leválasztottuk a végződés betűit. Ezek vektorait összeszorozva, -ASZ: A: 010 -OL: 0:110 — IK: 7:001 SZ: 010 L: 010 ff: 101 A ESSZ: 010, OÉSL: 010, I ÉS K : 001, megkapjuk, hogy a ragok e. sz. 2., 2., ill. 3. személyű alakot jelentenek.

Next

/
Thumbnails
Contents