Magyar Hírek, 1985 (38. évfolyam, 2-26. szám)

1985-04-27 / 9. szám

w ITOGEPEN — A gépesített szókincstár értéke abban rej­lik, hogy gyors és rugalmas. Hogy ez mit je­lent a gyakorlatban, azt tavaly őszi tanul­­mányutam példáival érzékeltethetem. ’Maucy­­ban működik az a tudományos intézet, amely az egész kontinensen élen jár a gépesített fel­dolgozásban. Itt figyelhettem meg a mi mun­kálatainknak talán nem is távoli jövőjét. Fran­cia kollégáink a Thibault család szókincsét vitték számítógépre. Bármelyik szót kérdeztük is, néhány másodperc múlva megjelent a kép­ernyőn, hányszor, milyen szövegkörnyezetben és melyik részben írta le Martin du Gard a keresett szót. De nem vett hosszabb időt igény­be az a művelet sem, melynek során Nancy egy-egy adatot átjuttatott az óceánon Chica­góba. Itt az történt, hogy egy műhold közbe­iktatásával a számítógépben tárolt egész me­móriaanyagot átadták annak az amerikai in­tézetnek, amelyikkel közös kutatást végeztek. — Tehát az egyik alkalmazási lehetőség az írói szótárak összeállítása? — Ennek az iránynak nálunk hagyományai vannak. Több mint húsz éve indultak meg Szegeden a költészeti hangtan munkálatai Kalmár László akadémikus vezetésével. Tanít­ványai — a most Franciaországban tevékeny­kedő Fónagy Iván, a kiemelkedő munkásságú Dömölki Bálint és Szende Tamás — ma is oszlopai a számítógépes nyelvészetnek. A folytatás már Debrecen nevéhez fűződik. Itt jelent meg Ady Endre összes költői mű­vének hangstatisztikája. Ennél kötetenként, s ahol volt, ciklusonként megvizsgáltuk, milyen — tudományosan szólva — a fonémák össze­tétele, megoszlása. A következő munkánk Balassi Bálint összes művének, valamint Ady költészetének számítógépes feldolgozása volt, immár a szavak alapján. Ezt úgy kell elkép­zelni, hogy leltárba vettük Balassi Bálint va­lamennyi ránk maradt szavát, mondatkörnye­zetével és a lelőhely megjelölésével együtt. Ha tehát valamely kutatót érdekli, mely szót, miért és hol használt nagy reneszánsz köl­tőnk, akkor felüti az egyelőre csak egy-két példányban Debrecenben meglevő anyagot. Ha most csupán a gépi munkálatok kapcsán elkészült disszertációkat veszem számba, ak­kor is azt mondhatom, hogy az irodalmárok és nyelvészek több oldalúan használhatják az anyagot. Kikereshetik egy-egy motívum ke­letkezését, fejlődését; kereshetik benne egy régebbi vagy éppen a mai nyelvállapot tükrö­ződését. De más szempontból, valamely telje­sen elvontnak tűnő grammatikai kutatás is épülhet erre a számítógépes feldolgozásra. Közvetlenül a Nagyszótár előkészítő mun­kálataihoz tartozik a Magyar Értelmező Szó­tár hét kötetének gépre vitele. Ebből készült egy sajátos mű, a Magyar Nyelv Szóvégmu­­tató Szótára. Ebben a szavakat a szokásoknak megfelelően, balról jobbra írtuk, de jobbról balra vannak betűrendbe szedve. Ez a nyel­vésznek nagyon hasznos, mert egy helyen ta­lálja például az összes -ság, -ség végződésű szót, valamennyi ikes igét. — Mire jó mindez? — Már az Értelmező Szótár hatvanezer sza­vának feldolgozásából is sikerült megnyugta­tóan tisztáznunk néhány nyelvtani kérdést. Az egyik ilyen probléma az volt, miért használa­tos a főnevekhez illeszkedő birtokos személy­ragnak két változata. Miért mondjuk, hogy „lába”, de „combja”? A gépi csoportosításból az derült ki, hogy oda kerül hyelvérzékünk sugalmazására a -j, ahol nem magyaros, fü­lünknek kellemetlen a szó vége. Ilyenkor a -j hang nyomatékosítja, hol ér véget a főnév, s hol kezdődik a végződés, a csatlakozó nyelv­tani elem. — Hogyan lehet eleget tenni egyszerre két olyan ellentétes igénynek, mint a reprezenta­tivitás és a nyitottság? Vagyis, hogy a nagy­szótár a nemzeti szókincs törzsanyagát tartal­mazza, de ugyanakkor naprakész is maradjon? — Ezek az igények valójában kiegészítik egymást. Mi azzal kezdtünk dolgozni, ami vi­tathatatlan. Néhány hete megkezdődött az adatrögzítés a századforduló klasszikus értékű szépirodalmi prózájával. Egy fiatalember át­másolja a kiválasztott Bródy-, Krúdy- és Mó­­ricz-novellákat a számítógép memóriája szá­mára. Erről az anyagról készül legközelebb egy olyan típusú számítás, mint amelyet Ady és Balassi szövegein végeztünk Debrecenben. Eközben nyugvópontra jut, milyen szövegek, milyen arányban kerülnek be a mintába. Egy kisebb, irodalmárokból álló szakértői csoport már összeállított erről egy vitaanyagot, ame­lyet nemsokára egy szélesebb — nyelvész, iro­dalmár, történész, néprajzos — kör vitat meg. Olyan kérdésekben kell dönteni, hogy vajon bevegyünk-e tankönyvi anyagot, illetve hogy milyen teret kapjon tárunkban a sajtószemel­vény. Nekem az a véleményem, hogy a tan­könyveket szerepeltetni kell a törzsanyagban, mert e szövegeknek olyan hatása van az em­berekre, mint valaha a Károli-bibliának volt, A nyelvközösség tömegkultúrájára kifejtett roppant hatásáért van súlya a sajtóanyagoknak is. Az újságoknak ráadásul nem csupán a min­denkori nyelvhasználatra van befolyásuk, ha­nem jórészt ezek közvetítik az új szavakat is. (Néhány héttel ezelőtt olvastam egy cikkben, hogy a sertéstenyésztésben a falvakban „zug­kanok” működnek, azaz a pároztatáshoz nem kiválogatott, nem fajtiszta kanokat használ­nak fel. Itt a szemünk láttára keletkezett egy olyan új szótári egység, amelynek helye van a számítógépes adattárban.) — Hogyan kapnak helyet ebben a nyelvi kincsestárban a határokon túl élő magyarok nyelvi kultúrájának értékei? — Most jelenik meg a Kriterion Kiadó gon­dozásában Szabó T. Attila nagy műve, az Erdélyi Magyar Szótörténeti Tár. Ahogy e publikáció előrehalad, több tízezer, vagy né­hány százezer szót már megtalálunk benne, ezekkel az adatokkal ellenőrizni fogjuk a sa­ját anyagunkat, mi maradt ki az Erdélyben használatos szavak közül. De vehetünk példát a szórványmagyarság köréből is. Kontra Miklós, Imre Samu a]^ démikus munkatársa a Nyelvtudományi Inté­zetben, most folytat egy izgalmas számító­gépes vizsgálatot az amerikai magyarság nyel­véről. Az olyan fordulatokat, mint „burdos­­ház” (munkásszállás) és „adok egy liftet” (ko­csin elviszlek valahová) elsősorban tőle ismer­jük. Az ilyen kifejezésekből a legérdekeseb­beket bevesszük a mi anyagunkba is. A nagyszótár tehát az egész magyarság kö­zös kincsestára lesz. Elkészítése nyelvtudomá­nyunk legnagyobb jelenkori vállalkozása. Szerkesztői azt tervezik, hogy ezekre az ala­pokra egész humán adatbank épül. Tarán már az ezredfordulón, a magyar nyelv szókincsé­vel, annak történetével vagy mai kérdéseivel foglalkozó szakember e szolgáltatás anyagait munkahelyi vagy otthoni számítógépe segít­ségével közvetlenül fogja felhasználni. KRONSTEIN GÄBOR

Next

/
Thumbnails
Contents