Nyelvtudományi Közlemények 68. kötet (1966)

Tanulmányok - Hell György: A gépi fordítás időszerű kérdései 453

A GÉPI FORDÍTÁS IDŐSZERŰ KÉRDÉSEI 457 ennek a grammatikai kérdésnek megoldásához föl kell használni a szemantikai kapcsolatokat is. 3. Szemantikai rendszerek a gépi fordításban Az utóbbi években többen próbálkoztak olyan szemantikai rendszert megalkotni, mely a gépi fordításban is eredményesen felhasználható. Ezek a kísérletek általában nem nyúltak vissza az általános nyelvészetben már meglevő' szemantikaelméletekhez, hanem inkább a szótárírás gyakorlatára támaszkodva a hasonló jelentésű szavak csoportjaiból vag az értelmező szótárak jelentés­meghatározásából indulnak ki. S. LAMB erősen grammatikai jellegű jelentés­elméletétől eltekintve így két részletesebben kidolgozott gyakorlati rendszert találunk: a thezaurusznak nevezett rendszert és a szó jelentését jelentéselemek felsorolásával megalapozó elgondolást. A thezaurusz elnevezés ROGET hasonló című szótárára nyúlik vissza, amelyben a szerző az azonos tárgyak, fogalmak jelölésére szolgáló szavakat rendszerezve gyűjti össze. A thezaurusz tulajdonképpen szinonima szótár, bár tartalmaz olyan szócsoportokat is, melyek egy tárgykör (pl. hajózás) körébe eső szavakat ad. A hasonló jelentésű szavak csoportjait ROGET egy eléggé önkényes fölosztás szerint rendezi, s ez az, ami ezt a szótárt a betűrendes szinonímás szótáraktól megkülönbözteti, és a gépi fordításban való felhasználásra alkal­massá teszi. A thezauruszon belül egy-egy szó egy vagy több szinonímacsoportba tartozik, és így, ha ezeket a szinonima-csoportokat jelzéssel látjuk el, egy szó egy vagy több jelzőszámot kap. A thezaurusz rendszer a gyakorlati alkalmazás­ban arra épít, hogy egy összefüggő szövegen belül a szavak jelentése a szöveg egységes tartalmára vonatkozik, ami abban nyilvánul, hogy jelzőszámaik is egységesek lesznek. A gépi fordításban természetesen az egész folyamat for­dítottja játszódik le. Ott a kérdés éppen az, hogy a fordításban a szavak sok­féle idegennyelvi megfelelője közül, melyiket válasszuk meg. Azt, amelynek jelzőszáma a mondat többi szavainak jelzőszámával összhangban van. (Ez az elgondolás még azt is feltételezi, hogy a mondatban kell lennie egy-két olyan szónak, mely egyértelműen utal a szöveg tartalmára. Ez általában így is van, bár a tartalmat egyéb adottságokból is megkaphatjuk.) A theaurusz általános fölépítése az alábbi képet mutatja: 'fffí ^1112 ^1113 ^1121 ^1122^1131 ^1132 ^1133^1134 ^135^1136-3. ábra

Next

/
Thumbnails
Contents