Tudományszervezési Tájékoztató, 1964

2. szám - Szemle

ki. A transzformációs rész szabályokba foglalva tartalmazza két nyelv szerkezetének viszonyát és utasitások formájában megadja, hogy a tartalom változatlansága érdeké­ben milyen célnyelvi kifejezésmód felel meg a forrásnyelv bizonyos nyelvtani szerke zeteinek. A gépi forditás egyszerű feladattá válnék, ha a nyelveket sikerülne kölcsö nősen olyan egységekké bontani, melyek mindig egyértelműen megfelelnek egymásnak. Ilyen egységek tulajdonképpen (igen nagy megközelítéssel) a mondatok, de teljesen elképzelhetetlen és a jövőben is megvalósíthatatlan egy olyan mondattár készitése, mely párhuzamosan tartalmazná egy nyelv minden lehetséges mondatát és a forditást egy másik nyelven. A gépi forditás elemi részei a mondatnál kisebb egységek, általa ban a szavak. Ha a szó még kisebb elemek kombinációjának tekinthető — és ez a leg­több nyelvben igy van •—, akkor a szótár terjedelmére vonatkozólag elfogadhatjuk az alábbi összefüggést: namn-y > m + n + x, vagyis, ha a nyelvészeti megfontolásból önállónak tekinthető szóelemek (m és n) kom binációja (mn), az elő nem forduló kombinációkat (y) leszámitva nagyobb, mint ezek­nek az elemeknek az összege plusz a szegmentálást nyelvészeti szempontból is megne­hezítő (tehát szét nem bontott) kombinációk száma, ugy célszerű a szótárban a rago­zott szóalakoknál kisebb egységeket elhelyezni.^ 3' A gépi forditás kezdeti éveiben, amikor a használatos gépek emlékező'táro­lóinak kapacitása nem volt alkalmas arra, hogy több ezres szókincset befogadjon, az analitikai (nyelvészeti) szegmentálás szempontjai, nem tudtak minden esetben érvénye sülni a műveleti szegmentálás gyakorlatilag megkivánt követelményeivel szemben. Ma a gépi forditás egész gyakorlatában egyre teljesebben érvényesülnek a tisztán nyel­vészeti szempontok, és az angolnyelvü szótárakban pl. a teljes alakú szók mellett csak egy-két végződés szerepel mint elemzési egység. A szókincs kérdésében az első évek gépi forditói szintén nagyon kötve voltak a gép lehetőségeihez. Akkor még nem lehetett szó arról, hogy a gép szó tárában nagyobb területet felölelő szókincs kapjon helyet. Csak arra volt lehetőség hogy egy szűkebb szakterület (matematika, fizika, biológia) szótárát helyezzék el a gépben. Ez a 2 000 - 4 000 szóból álló "mikroszótár" ugyanakkor — a használati te­rület erős leszűkítése fclytán — szemantikai szempontból is jó szolgálatot tett, mert a forditási nehézségeket okozó többértelmü szavak egy szűk szakmai területen még eléggé egyértelműen fordithatók. 23/ LAMB, S .M.: Segmentation. — Proceedings, i.m. 335—342.p. 140

Next

/
Thumbnails
Contents