Tudományszervezési Tájékoztató, 1966

6. szám - Szemle

A gépi kivonatolás célja a szöveg "zanza"-izálása, zsu­gorítása: egy hosszabb szövegből rövidebb /másodlagos/ szöveg létrehozása; de oly módon, hogy a rövid szöveg tartalmazza a hosszabb szöveg megkivánt, releváns össze­függéseit. A gépi kivonatolás legáltalánosabb célkitűzése tehát az eredeti szöveg "lényeges" mondatainak kiemelése, s a másodlagos szövegnek ezekből való összeállí­tása. A "lényeges" mondatok kiválasztása különféle módon hajtható végre, ezeknek az eljárásoknak egy része nyelv statisztikai, más része strukturális — illetőleg a kettő kombinációja. /А magyar nyelvű kivonatolási kísérletek világszerte a legelsők közt voltak./ Különféle dokumentációs feladatok kombináltan is felhasználhatók, például ugyanarról a szövegről készülhet deszkriptor—feldolgozás és kivonat is /gépi uton/. Azt azonban, hogy milyen dokumentációs műfaj elkészítése célszerű, mindig a megren­delőnek kell megmondani. A nyelvésznek —mint a dokumentációt automatizáló kollekti­ve tagjának— elvileg kell felkészülni a lehetséges feladatok megoldására. 8.2. FORDÍTÁSOK GÉPI ELŐKÉSZÍTÉSE A dokumentáció hetero-1ingvális feladatai két részre oszlanak: a teljes fordítások és a részleges fordítások gépi előkészítésére. A részleges fordítások fő formája cimek forditása; a két feladat különbsége a korpuszok különbségéből adódik; a cimeknek más a kontextusa és gyakran a szintaxisa is /viszont terjedelmük jóval korlátozottabb/. A klasszikus gépi forditás a matematikai nyelvészetnek, sőt azon túlmenően a kibernetikának szimbolikus jelentőségűvé nőtt erőpróbája. Elméleti szempontból elmondhatjuk, hogy ha soha egyetlen tökéletesen forditó gépi program sem születne meg, a gépi forditás már eddig is felbecsülhetetlen értékű pozitiv ösztön­zést adott a nyelvészet fejlődésének. A feladat azonban természetesen a ténylegesen, üzemszerűen megvalósuló gépi forditás. A gépi forditás előkészítése, kutatása első évtizedének végére kialakult az a vélemény —a természetes nyelvek matematikai formájú elméletének fényében—, hogy a FAHQT /= Fully Automatic High Quality Translation = teljesen automatikus, ma­gas szinvonalu forditás/ egyelőre nem valósitható meg. Ennek fő oka abban rejlik, hogy az emberi absztrakt nyelvmüködésnek azt a jellegét, hogy végtelen számú mondatot tud létrehozni, még nem sikerült egyenértékű szintak­tikai elemzési eljárással modellálni. A jelenlegi kutatások ennek figyelembevételével a következő kérdésekre irányulnak: a/ milyen minőségű forditás érhető el gépi uton? b/ milyen mértékű, milyen minőségű forditás tekinthető elfogadhatónak az üzemszerű 790

Next

/
Thumbnails
Contents