Nyelvtudományi Közlemények 77. kötet (1975)

Tanulmányok - Papp Ferenc: Paul L. Garvin: On Machine Translation 297

SZEMLE-ISMERTETÉSEK 299 algoritmusnak fel kell ismernie a döntési pontokat és az ezekre utaló elemeket (erről alább). Tekintettel arra, hogy ma már nem is olyan könnyű hozzájutni a kísérletben szereplő egyes mondatokhoz (GAEVIN csak a kiinduló oroszokat közli: 62 — 64. 1.) és azok angol fordításához, ahogy azt a gép akkor kiadta (Voprosy jazykoznanija i. h. 147, továbbá [3], 23. 1.), álljon itt néhány példa, saját magyar (emberi) fordításunkkal megtoldva (transzkripció az eredeti kísérlet szerint) : KACHYESTVO UGLYA OPRYEDYELYAYETSYA KALORIYNOSTJYU — The quality of coal is determined by calory content 'A szén minőségét kalóriatartalma határozza meg'; TOL PRYIGOTOVLYAYETSYA YIZ UGLYA - TNT is produced from coal 'A trotil szénből készül' ; MYEZHDUNARODNOYE PONYIMANYIYE YAVLYAYETSYA VAZHNIM FAKTOROM V RYESHYENYlYI POLYITYICHYESKYIX VOPROSOV - International understanding constitutes an importan factor in décision of political questions 'A nemzetközi megértés fontos tényező a politikai kérdések megoldásában'. A fulcrum-módszer legelső nyomtatott említése alkalmasint 1957-el datálódik (vö. [4], 952. tételszám alatt); itt egy 1960-as és egy továbbfejlesztett, 1968-as publikáció képviseli, bár e két helyen kívül is szinte mindenütt ott van a szerző gondolatrendszerében. Magyarul talán támpont-módsze rnek lehet nevezni. Eszerint ugyanis az automatikus elemzés nem egyszerűen balról jobbra halad, nem a szótárban rögzített információk alapján egy a nyelvtantól és így az egyes konkrét nyelvektől független algoritmus végzi el az információk előre várható összeegyeztetését (prédictive analysis — I. RHODES, majd A. OETTINGEB, VÖ. [4], 292 — 300. 1.), hanem egy a konkrét nyelvtől függő analízis során először a legtöbb támpontot nyújtó elem emelődik ki, majd ezt követően a további, az elemzéshez támpontot nyújtható szavak. Az oroszban például a ragozott ige bizonyul a legtöbb támpontot nyújtónak, majd a tőle függő főnevek, és így tovább. Egy-egy ilyen támpontnál mindig valamely döntés születik, e döntések során az algoritmus megszemléli a döntéshez hozzájáruló egyéb elemeket is. A támpont-módszer tehát szerzőnknél szervesen összekapcsolódik „kétrészes" megközelítési módjával (bipartite approach : 43. 1. és passim), amely szerint ugyanis a szótár az egyik rész és a konkrét nyelvtannal egybeépített analizáló algoritmus a másik. Ez a felfogás arra az általánosabb elképzelésre épül, amely szerint egy nyelvi elemző algortmusnak nem hogy kontextusra érzékeny grammatikára kell épülnie, hanem képesnek kell lennie az elemzés során egyre inkább érzékennyé válnia a kontextusra ; a „háromrészes" megközelítés, ahol a szótáron kívül külön van a nyelvtan és külön egy elemző algoritmus, erre nem képes (vö. itt 45 ; a kontextusra érzékeny/nem érzékeny grammatikák plasztikus leírását egyébként 1. [5], 63 kk.). A támpont-módszer rendkívül dinamikus, célratörő — de egyben talán nagyonis az olyan erősen ragozó kiinduló nyelvhez tapad, mint amilyen az orosz. (GABViNnál nem találtam utalást arra, hogy hogyan talál elemzéséhez támpontot, majd további támpontokat, egy olyan nyelv esetében, amilyen például az angol.) Az algoritmizálás ós a heurisztika elvi és gyakorlati viszonya szintén vissza-visszatérő probléma a szerző számára ; bizonyos gyakorlati szempontból kapcsolatos a támpont-módszerrel is nála. A nyelvi elemzés során ugyanis nem lehet mindent algoritmizálni, mondja a szerző. Vagy, pontosabban : természetesen mindent algoritmizálni kell (ami nincs algoritmusba foglalva, az nem oldható meg automatikusan), de bizonyos pontokon helyet kell hagyni a próbálkozó döntéseknek. Mint ahogy a sakkjáték minden lehetséges helyzetét gyakorlatilag nem lehet bevenni a programba — mondja GABVIN —, épp úgy nem lehet a gépet előkészíteni minden a nyelvi elemzés során előállt helyzetre sem. Bizonyos esetekben a programnak teljesen mechanikusan („algoritmus szerint") kell haladnia — azután bizonyos pontokon a beadott elvek alapján kell próbálkoznia a továbbhaladás módozatait illetően. Nem összegezésül — csupán befejezésképpen a következőt kell mondanunk. GABVIN e cikkgyűjteménye semmiképpen sem fejfa egy húszmillió dolláros halotton : a GF maga is él, nem beszélve arról, hogy milyen sok más hasznos elméleti és gyakorlati ágacska hajtott ki belőle. Azonban esetleg egyik összefoglaló-lezáró köve lehet a GF egy szakaszának. Méghozzá annak a szakasznak, amely a jelentést nem vette komolyan figyelembe (NB : a kötet tárgymutatójában a meaning címszó nem szerepel ; van persze content processing, de nem az itt mondandók értelmében és mértékében). A GF beindulásakor (sőt szinte még azt megelőzően) főleg BAB-HILLEL hívta fel nemegyszer a figyelmet arra, hogy igazi GF nem lehetséges, mert a gép nem érti, mit fordít, márpedig az igazi fordító nem formákat fordít, hanem a formák alapján megérti a dokumentumot és annak tartalmát elmondja (újrafogalmazza) a célnyelven. Legyen szabad egy hasonlattal élnem : az eddigi GF során úgy jártunk el a géppel, mint egy emberrel járnánk el azt bízva rá, hogy fordítsa le a következő mondatot : A sető pente vopan megkelendítette az akaloskát. A gép a mi értelmes mondatainkból is pontosan annyit értett, amennyit

Thumbnails

Contents