Nyelvtudományi Közlemények 68. kötet (1966)

Tanulmányok - Hell György: A gépi fordítás időszerű kérdései 453

458 HELL GYÖRGY A jelentést meghatározó szmonimaj csoportokat különböző szinten ha­sonlíthatjuk össze. Az eljárás lényegében azt jelenti, hogy azonos, vagy egy ma­gasabb kategória alá tartozó szavakat vagy csoportokat alkotunk a szó jelenté­sének meghatározása során. A thezaurusz használhatósága ellen több kifogást emelnek. Az egyik az, hogy a thezaurusz csoportok önkényesen, valamilyen szubjektív magátóí érthe­tőség alapján vannak megalkotva és egyáltalán nem bizonyos, hogy a gyakor­latban is alkalmazhatók. Ez a kifogás nem mellékes jellegű, ha arra gondolunk, hogy a gépi fordításnak egzakt módon megfogalmazott szabályokra van szük­sége, melyek nem egyéni véleményen, hanem a nyelvi anyag tulajdonságain alapulnak. A cambridgei csoport kutatásai is igazolták, hogy Roget rendszere változtatás nélkül nem alkalmazható. A theuzaurusz megváltoztatása azonban nem egyszerű dolog. Ha a kiindulási elemeket újra akarjuk csoportosítani, úgy ezt nem tehetjük az elemeknek csak egy részével, hanem a dolog természeténél fogva az egész már megalkotott rendszert át kell alakítanunk. Ujabban több olyan kísérlet van, mely a thezaurusz-csoportokat szövegek elemzése alapján, statisztikai adatok birtokában, objektív módon igyekszik megalkotni. Kész és használható rendszert a gépi fordítás irodalmában még nem lehet találni. Az értelmező szótárak szerkesztési gyakorlatára épülő definíciós szemantikai rendszerek között kétfélét lehet megkülönböztetni. Az egyik a szójelentés meghatározásának a fogalom jegyeihez hasonló elemzésre épít, a másik a meghatározás szavaiból azokat használja föl, melyek további ér­telmezése nem jelent szóismétlést. Mindkét változat szerint a szavak jellemzőket kapnak. A szavak kapcsolódását urj,. előíró, vagy elemző szabályokkal állapít­ják meg attól függően, hogy értelmes mondatok létrehozására vagy gramma­tikailag már elemzett mondatok lehetséges értelmezésére irányulnak-e. A definíciós rendszer keretein belül a szavak többértelműsége is kitűnik, hiszen egy-egy szóhoz többféle értelmezés is fűzhető. így más jelleggel ugyan, mint a thezauruszoknál, de lehetőség nyílik szinonimák csoportosítására azáltal, hogy a szavak kapcsolódását meghatározó szabályok az azonos lényeges jellem­zőkkel rendelkező egységeket rendelik egymás mellé, illetve a fordításban az így kapott értelmezésnek megfelelő szavakat adják ki. A definíciós rendszer sem tudott mostanáig gyakorlatilag használható szabályokat adni a gépi fordításnak. Ennek okát abban kereshetjük, hogy bár igyekszik konkrét lenni, szabályainak megalkotásában mégsem olyan precíz, hogy kielégítő algoritmus megírására alkalmasak lennének. így pl. nem tudni világosan, melyek azok a szemantikai jellemzők, amelyekkel a szavak jelentését meg lehet határozni. Az eddigi próbálkozások mind egyénileg eltérő jellem­zőket használnak. Lényeges ugyanis, hogy a jellemzők minden szót elegendő módon meghatározzanak, ugyanakkor mégsem szabad minden szót egyénileg jellemezni, me rt ez az egész rendszert alkalmatlanná tenné a gyakorlatra. Meg kellene tehát szabni az egyes szók jellemzésének határát és ez nehéz feladat. Külön nehézséget jelent a szemantikai jellenzőkkel ellátott szók kapcso­lási szabályainak megalkotása. Ez nemcsak a szó jellemzőinek sorát adó mátrixok matematikai egymáshoz rendelésének nehézségét jelenti (ez a kérdés sincs még megnyugtatóan megoldva), de főleg azt, milyen szabályokkal lehet a szókapcsolatokat megnyugtató módon megadni. Azok a tanulmányok, amelyek eddig ezekkel a kérdésekkel foglalkoztak, csak kiragadott példák szűk körén belül próbáltak a megvalósítás lehetőségére rámutatni.

Next

/
Thumbnails
Contents