Magyar Hírek, 1985 (38. évfolyam, 2-26. szám)
1985-04-27 / 9. szám
w ITOGEPEN — A gépesített szókincstár értéke abban rejlik, hogy gyors és rugalmas. Hogy ez mit jelent a gyakorlatban, azt tavaly őszi tanulmányutam példáival érzékeltethetem. ’Maucyban működik az a tudományos intézet, amely az egész kontinensen élen jár a gépesített feldolgozásban. Itt figyelhettem meg a mi munkálatainknak talán nem is távoli jövőjét. Francia kollégáink a Thibault család szókincsét vitték számítógépre. Bármelyik szót kérdeztük is, néhány másodperc múlva megjelent a képernyőn, hányszor, milyen szövegkörnyezetben és melyik részben írta le Martin du Gard a keresett szót. De nem vett hosszabb időt igénybe az a művelet sem, melynek során Nancy egy-egy adatot átjuttatott az óceánon Chicagóba. Itt az történt, hogy egy műhold közbeiktatásával a számítógépben tárolt egész memóriaanyagot átadták annak az amerikai intézetnek, amelyikkel közös kutatást végeztek. — Tehát az egyik alkalmazási lehetőség az írói szótárak összeállítása? — Ennek az iránynak nálunk hagyományai vannak. Több mint húsz éve indultak meg Szegeden a költészeti hangtan munkálatai Kalmár László akadémikus vezetésével. Tanítványai — a most Franciaországban tevékenykedő Fónagy Iván, a kiemelkedő munkásságú Dömölki Bálint és Szende Tamás — ma is oszlopai a számítógépes nyelvészetnek. A folytatás már Debrecen nevéhez fűződik. Itt jelent meg Ady Endre összes költői művének hangstatisztikája. Ennél kötetenként, s ahol volt, ciklusonként megvizsgáltuk, milyen — tudományosan szólva — a fonémák összetétele, megoszlása. A következő munkánk Balassi Bálint összes művének, valamint Ady költészetének számítógépes feldolgozása volt, immár a szavak alapján. Ezt úgy kell elképzelni, hogy leltárba vettük Balassi Bálint valamennyi ránk maradt szavát, mondatkörnyezetével és a lelőhely megjelölésével együtt. Ha tehát valamely kutatót érdekli, mely szót, miért és hol használt nagy reneszánsz költőnk, akkor felüti az egyelőre csak egy-két példányban Debrecenben meglevő anyagot. Ha most csupán a gépi munkálatok kapcsán elkészült disszertációkat veszem számba, akkor is azt mondhatom, hogy az irodalmárok és nyelvészek több oldalúan használhatják az anyagot. Kikereshetik egy-egy motívum keletkezését, fejlődését; kereshetik benne egy régebbi vagy éppen a mai nyelvállapot tükröződését. De más szempontból, valamely teljesen elvontnak tűnő grammatikai kutatás is épülhet erre a számítógépes feldolgozásra. Közvetlenül a Nagyszótár előkészítő munkálataihoz tartozik a Magyar Értelmező Szótár hét kötetének gépre vitele. Ebből készült egy sajátos mű, a Magyar Nyelv Szóvégmutató Szótára. Ebben a szavakat a szokásoknak megfelelően, balról jobbra írtuk, de jobbról balra vannak betűrendbe szedve. Ez a nyelvésznek nagyon hasznos, mert egy helyen találja például az összes -ság, -ség végződésű szót, valamennyi ikes igét. — Mire jó mindez? — Már az Értelmező Szótár hatvanezer szavának feldolgozásából is sikerült megnyugtatóan tisztáznunk néhány nyelvtani kérdést. Az egyik ilyen probléma az volt, miért használatos a főnevekhez illeszkedő birtokos személyragnak két változata. Miért mondjuk, hogy „lába”, de „combja”? A gépi csoportosításból az derült ki, hogy oda kerül hyelvérzékünk sugalmazására a -j, ahol nem magyaros, fülünknek kellemetlen a szó vége. Ilyenkor a -j hang nyomatékosítja, hol ér véget a főnév, s hol kezdődik a végződés, a csatlakozó nyelvtani elem. — Hogyan lehet eleget tenni egyszerre két olyan ellentétes igénynek, mint a reprezentativitás és a nyitottság? Vagyis, hogy a nagyszótár a nemzeti szókincs törzsanyagát tartalmazza, de ugyanakkor naprakész is maradjon? — Ezek az igények valójában kiegészítik egymást. Mi azzal kezdtünk dolgozni, ami vitathatatlan. Néhány hete megkezdődött az adatrögzítés a századforduló klasszikus értékű szépirodalmi prózájával. Egy fiatalember átmásolja a kiválasztott Bródy-, Krúdy- és Móricz-novellákat a számítógép memóriája számára. Erről az anyagról készül legközelebb egy olyan típusú számítás, mint amelyet Ady és Balassi szövegein végeztünk Debrecenben. Eközben nyugvópontra jut, milyen szövegek, milyen arányban kerülnek be a mintába. Egy kisebb, irodalmárokból álló szakértői csoport már összeállított erről egy vitaanyagot, amelyet nemsokára egy szélesebb — nyelvész, irodalmár, történész, néprajzos — kör vitat meg. Olyan kérdésekben kell dönteni, hogy vajon bevegyünk-e tankönyvi anyagot, illetve hogy milyen teret kapjon tárunkban a sajtószemelvény. Nekem az a véleményem, hogy a tankönyveket szerepeltetni kell a törzsanyagban, mert e szövegeknek olyan hatása van az emberekre, mint valaha a Károli-bibliának volt, A nyelvközösség tömegkultúrájára kifejtett roppant hatásáért van súlya a sajtóanyagoknak is. Az újságoknak ráadásul nem csupán a mindenkori nyelvhasználatra van befolyásuk, hanem jórészt ezek közvetítik az új szavakat is. (Néhány héttel ezelőtt olvastam egy cikkben, hogy a sertéstenyésztésben a falvakban „zugkanok” működnek, azaz a pároztatáshoz nem kiválogatott, nem fajtiszta kanokat használnak fel. Itt a szemünk láttára keletkezett egy olyan új szótári egység, amelynek helye van a számítógépes adattárban.) — Hogyan kapnak helyet ebben a nyelvi kincsestárban a határokon túl élő magyarok nyelvi kultúrájának értékei? — Most jelenik meg a Kriterion Kiadó gondozásában Szabó T. Attila nagy műve, az Erdélyi Magyar Szótörténeti Tár. Ahogy e publikáció előrehalad, több tízezer, vagy néhány százezer szót már megtalálunk benne, ezekkel az adatokkal ellenőrizni fogjuk a saját anyagunkat, mi maradt ki az Erdélyben használatos szavak közül. De vehetünk példát a szórványmagyarság köréből is. Kontra Miklós, Imre Samu a]^ démikus munkatársa a Nyelvtudományi Intézetben, most folytat egy izgalmas számítógépes vizsgálatot az amerikai magyarság nyelvéről. Az olyan fordulatokat, mint „burdosház” (munkásszállás) és „adok egy liftet” (kocsin elviszlek valahová) elsősorban tőle ismerjük. Az ilyen kifejezésekből a legérdekesebbeket bevesszük a mi anyagunkba is. A nagyszótár tehát az egész magyarság közös kincsestára lesz. Elkészítése nyelvtudományunk legnagyobb jelenkori vállalkozása. Szerkesztői azt tervezik, hogy ezekre az alapokra egész humán adatbank épül. Tarán már az ezredfordulón, a magyar nyelv szókincsével, annak történetével vagy mai kérdéseivel foglalkozó szakember e szolgáltatás anyagait munkahelyi vagy otthoni számítógépe segítségével közvetlenül fogja felhasználni. KRONSTEIN GÄBOR