Nyelvtudományi Közlemények 68. kötet (1966)
Tanulmányok - Hell György: A gépi fordítás időszerű kérdései 453
458 HELL GYÖRGY A jelentést meghatározó szmonimaj csoportokat különböző szinten hasonlíthatjuk össze. Az eljárás lényegében azt jelenti, hogy azonos, vagy egy magasabb kategória alá tartozó szavakat vagy csoportokat alkotunk a szó jelentésének meghatározása során. A thezaurusz használhatósága ellen több kifogást emelnek. Az egyik az, hogy a thezaurusz csoportok önkényesen, valamilyen szubjektív magátóí érthetőség alapján vannak megalkotva és egyáltalán nem bizonyos, hogy a gyakorlatban is alkalmazhatók. Ez a kifogás nem mellékes jellegű, ha arra gondolunk, hogy a gépi fordításnak egzakt módon megfogalmazott szabályokra van szüksége, melyek nem egyéni véleményen, hanem a nyelvi anyag tulajdonságain alapulnak. A cambridgei csoport kutatásai is igazolták, hogy Roget rendszere változtatás nélkül nem alkalmazható. A theuzaurusz megváltoztatása azonban nem egyszerű dolog. Ha a kiindulási elemeket újra akarjuk csoportosítani, úgy ezt nem tehetjük az elemeknek csak egy részével, hanem a dolog természeténél fogva az egész már megalkotott rendszert át kell alakítanunk. Ujabban több olyan kísérlet van, mely a thezaurusz-csoportokat szövegek elemzése alapján, statisztikai adatok birtokában, objektív módon igyekszik megalkotni. Kész és használható rendszert a gépi fordítás irodalmában még nem lehet találni. Az értelmező szótárak szerkesztési gyakorlatára épülő definíciós szemantikai rendszerek között kétfélét lehet megkülönböztetni. Az egyik a szójelentés meghatározásának a fogalom jegyeihez hasonló elemzésre épít, a másik a meghatározás szavaiból azokat használja föl, melyek további értelmezése nem jelent szóismétlést. Mindkét változat szerint a szavak jellemzőket kapnak. A szavak kapcsolódását urj,. előíró, vagy elemző szabályokkal állapítják meg attól függően, hogy értelmes mondatok létrehozására vagy grammatikailag már elemzett mondatok lehetséges értelmezésére irányulnak-e. A definíciós rendszer keretein belül a szavak többértelműsége is kitűnik, hiszen egy-egy szóhoz többféle értelmezés is fűzhető. így más jelleggel ugyan, mint a thezauruszoknál, de lehetőség nyílik szinonimák csoportosítására azáltal, hogy a szavak kapcsolódását meghatározó szabályok az azonos lényeges jellemzőkkel rendelkező egységeket rendelik egymás mellé, illetve a fordításban az így kapott értelmezésnek megfelelő szavakat adják ki. A definíciós rendszer sem tudott mostanáig gyakorlatilag használható szabályokat adni a gépi fordításnak. Ennek okát abban kereshetjük, hogy bár igyekszik konkrét lenni, szabályainak megalkotásában mégsem olyan precíz, hogy kielégítő algoritmus megírására alkalmasak lennének. így pl. nem tudni világosan, melyek azok a szemantikai jellemzők, amelyekkel a szavak jelentését meg lehet határozni. Az eddigi próbálkozások mind egyénileg eltérő jellemzőket használnak. Lényeges ugyanis, hogy a jellemzők minden szót elegendő módon meghatározzanak, ugyanakkor mégsem szabad minden szót egyénileg jellemezni, me rt ez az egész rendszert alkalmatlanná tenné a gyakorlatra. Meg kellene tehát szabni az egyes szók jellemzésének határát és ez nehéz feladat. Külön nehézséget jelent a szemantikai jellenzőkkel ellátott szók kapcsolási szabályainak megalkotása. Ez nemcsak a szó jellemzőinek sorát adó mátrixok matematikai egymáshoz rendelésének nehézségét jelenti (ez a kérdés sincs még megnyugtatóan megoldva), de főleg azt, milyen szabályokkal lehet a szókapcsolatokat megnyugtató módon megadni. Azok a tanulmányok, amelyek eddig ezekkel a kérdésekkel foglalkoztak, csak kiragadott példák szűk körén belül próbáltak a megvalósítás lehetőségére rámutatni.