Szabómihály Gizella - Lanstyák István (szerk.): Magyarok Szlovákiában VII. Nyelv - Magyarok Szlovákiában 7. (Somorja, 2011)

Tanulmányok - A magyar nyelv szlovákiai változatainak jellemzői

A magyar nyelv szlovákiai változatainak adatbázisai 163 pontjából legnagyobb jelentőségű számítógé­pes szövegátalakítás vagy kapcsolattartás, kommunikáció a többi irodával, illetve a Nyelvtudományi Intézettel). Az előzetes megbeszélések és levelezések után a Kárpát-medencei magyar nyelvi korpusz készítői az első elméleti és gyakorlati informá­ciók megszerzése céljából tartott projektmeg­beszélést 2003. január 30-31-én tartották, de - mint későbbi gyakorlat folyamán kiderült - a folyamatos, eredményes munka végzéséhez az egyszeri alkalom nem volt elegendő; további folyamatos egyeztetésekre, szakmai összejöve­telekre volt szükség. Mivel a kutatóhálózat kor­pusznyelvészeti teendőket ellátó munkatársai egyik esetben sem rendelkeztek számítógépes nyelvészeti vagy korpusznyelvészeti képzett­séggel - számítógépes előismerete is csak néhányuknak volt —, ezért szükség volt az elő­­kódolást végző személyek betanítására (a kódolásról bővebben 1. Pintér 2003: 79-80). Mivel a szövegtár szerkesztése javarészt mechanikus folyamatok elvégzése, ezért a szá­mítógépes előképzettség itt nem is volt feltétel (a számítógépes affinitás is elegendő volt). Ezt bizonyítja az is, hogy több irodában azok, akik kezdetben a korpusszal foglalkoztak, még nyel­vészeti ismeretekkel sem rendelkeztek. A nyel­vészeti beállítottság, a nyelvészeti alapismere­tek hiánya természetesen nem jelenthetett prob­lémát, hiszen a nyelvészeti tudást igénylő mun­kát a nyelvi irodák nyelvészei is elvégezhették. A tréningeket (a második 2004. június 21-22-én volt) az MTA Nyelvtudományi Intézetének Nyelvtechnológiai Osztályát veze­tő Váradi Tamás és Oravecz Csaba tartották. Az első találkozó alkalmával a határon túli szöve­gek gyűjtését és kódolását végző személyek3 megismerkedtek a kódoláshoz szükséges elmé­leti és gyakorlati információkkal, így a máso­dik találkozó során már megvitathatták a kódo­lás folyamán felmerült gyakorlati problémákat is. Mivel ezek az összejövetelek Budapesten zajlottak, kisebb-nagyobb számban mindig minden kutatóállomás képviseltette magát.4 Bár mind a négy iroda azonos feladatot végzett, a második megbeszélésen irodánként mégis más-más problémák merültek fel. A megbeszé­lések csak részben hozták meg a tőlük várt eredményeket, mivel az utolsó közös megbe­szélés után sem gyorsult az anyagfeldolgozás, és a problémákkal küszködő irodák egy év elteltével is ugyanazon hibák kiküszöbölésével foglalkoztak. A korpusznyelvészeti tréningek eredménye­iről, illetve a kutatóhálózat korpusznyelvészeti tevékenységéről honlap is készült, melyre a kódoláshoz, illetve a munka közben felmerült problémák megoldásához szükséges informáci­ók révén folyamatosan felkerültek (http://cor­­pus.nytud.hu/mnszworkshop/index.html). A Magyar nemzeti szövegtár határon túli korpusza (azaz a Kárpát-medencei magyar nyel­vi korpusz) egységes formátumú és szerkezetű szövegcsoportot alkot. Ennek az is feltétele, hogy az anyaggyűjtés és -feldolgozás minden irodában azonos (illetve az anyaggyűjtés tekin­tetében részben eltérő) feltételek mellett zajlott. A korpusz készületeinek alapvetően két fontos lépése volt: az anyaggyűjtés és a gyűjtött szöve­gek XML-annotációja. A következőkben e két­lépcsős folyamatot próbálom meg összefoglalni. A Gramma Nyelvi Iroda által feldolgozott anyag főbb szerkezeti pontjaiban, azaz alkor­­puszaiban követi a Magyar nemzeti szövegtá­rat. A lekérdezést elősegítő egységes szöveg - struktúra az Mnsz-ben és a Szlovákiai magyar korpuszban is a következő: tudományos próza, 3 A szlovákiai magyar korpusz gyűjtését és előkódolását Pintér Tibor, Mészáros Tímea, illetve Simon Szabolcs végez­ték 4 A korpusznyelvészeti összejövetelek sajátos formái voltak a Szabó T. Attila Nyelvi Intézet által Illyefalván szervezett találkozók, ahol a kutatóhálózat tagjai egy héten keresztül részletesen megbeszélhették az egyes kutatásokat (nemcsak a korpusznyelvészeti teendőket, hanem a lexikográfiai, oktatásügyi, illetve szervezési kérdéseket is). Sajnos az illye­­falvi találkozók nem váltották be a hozzájuk fűzött kezdeti reményeket, mivel a három alkalom közül a 2004-ben őrvi­déki, muravidékí és horvátországi kutatóhelyekkel kiegészült kutatóhálózat egyiken sem tudott teljes létszámban részt venni. így az első két találkozó után harmadik alkalommal a kutatóhálózatból már csak a szervezők voltak jelen.

Next

/
Oldalképek
Tartalom