Szabómihály Gizella - Lanstyák István (szerk.): Magyarok Szlovákiában VII. Nyelv - Magyarok Szlovákiában 7. (Somorja, 2011)
Tanulmányok - A magyar nyelv szlovákiai változatainak jellemzői
A magyar nyelv szlovákiai változatainak adatbázisai 163 pontjából legnagyobb jelentőségű számítógépes szövegátalakítás vagy kapcsolattartás, kommunikáció a többi irodával, illetve a Nyelvtudományi Intézettel). Az előzetes megbeszélések és levelezések után a Kárpát-medencei magyar nyelvi korpusz készítői az első elméleti és gyakorlati információk megszerzése céljából tartott projektmegbeszélést 2003. január 30-31-én tartották, de - mint későbbi gyakorlat folyamán kiderült - a folyamatos, eredményes munka végzéséhez az egyszeri alkalom nem volt elegendő; további folyamatos egyeztetésekre, szakmai összejövetelekre volt szükség. Mivel a kutatóhálózat korpusznyelvészeti teendőket ellátó munkatársai egyik esetben sem rendelkeztek számítógépes nyelvészeti vagy korpusznyelvészeti képzettséggel - számítógépes előismerete is csak néhányuknak volt —, ezért szükség volt az előkódolást végző személyek betanítására (a kódolásról bővebben 1. Pintér 2003: 79-80). Mivel a szövegtár szerkesztése javarészt mechanikus folyamatok elvégzése, ezért a számítógépes előképzettség itt nem is volt feltétel (a számítógépes affinitás is elegendő volt). Ezt bizonyítja az is, hogy több irodában azok, akik kezdetben a korpusszal foglalkoztak, még nyelvészeti ismeretekkel sem rendelkeztek. A nyelvészeti beállítottság, a nyelvészeti alapismeretek hiánya természetesen nem jelenthetett problémát, hiszen a nyelvészeti tudást igénylő munkát a nyelvi irodák nyelvészei is elvégezhették. A tréningeket (a második 2004. június 21-22-én volt) az MTA Nyelvtudományi Intézetének Nyelvtechnológiai Osztályát vezető Váradi Tamás és Oravecz Csaba tartották. Az első találkozó alkalmával a határon túli szövegek gyűjtését és kódolását végző személyek3 megismerkedtek a kódoláshoz szükséges elméleti és gyakorlati információkkal, így a második találkozó során már megvitathatták a kódolás folyamán felmerült gyakorlati problémákat is. Mivel ezek az összejövetelek Budapesten zajlottak, kisebb-nagyobb számban mindig minden kutatóállomás képviseltette magát.4 Bár mind a négy iroda azonos feladatot végzett, a második megbeszélésen irodánként mégis más-más problémák merültek fel. A megbeszélések csak részben hozták meg a tőlük várt eredményeket, mivel az utolsó közös megbeszélés után sem gyorsult az anyagfeldolgozás, és a problémákkal küszködő irodák egy év elteltével is ugyanazon hibák kiküszöbölésével foglalkoztak. A korpusznyelvészeti tréningek eredményeiről, illetve a kutatóhálózat korpusznyelvészeti tevékenységéről honlap is készült, melyre a kódoláshoz, illetve a munka közben felmerült problémák megoldásához szükséges információk révén folyamatosan felkerültek (http://corpus.nytud.hu/mnszworkshop/index.html). A Magyar nemzeti szövegtár határon túli korpusza (azaz a Kárpát-medencei magyar nyelvi korpusz) egységes formátumú és szerkezetű szövegcsoportot alkot. Ennek az is feltétele, hogy az anyaggyűjtés és -feldolgozás minden irodában azonos (illetve az anyaggyűjtés tekintetében részben eltérő) feltételek mellett zajlott. A korpusz készületeinek alapvetően két fontos lépése volt: az anyaggyűjtés és a gyűjtött szövegek XML-annotációja. A következőkben e kétlépcsős folyamatot próbálom meg összefoglalni. A Gramma Nyelvi Iroda által feldolgozott anyag főbb szerkezeti pontjaiban, azaz alkorpuszaiban követi a Magyar nemzeti szövegtárat. A lekérdezést elősegítő egységes szöveg - struktúra az Mnsz-ben és a Szlovákiai magyar korpuszban is a következő: tudományos próza, 3 A szlovákiai magyar korpusz gyűjtését és előkódolását Pintér Tibor, Mészáros Tímea, illetve Simon Szabolcs végezték 4 A korpusznyelvészeti összejövetelek sajátos formái voltak a Szabó T. Attila Nyelvi Intézet által Illyefalván szervezett találkozók, ahol a kutatóhálózat tagjai egy héten keresztül részletesen megbeszélhették az egyes kutatásokat (nemcsak a korpusznyelvészeti teendőket, hanem a lexikográfiai, oktatásügyi, illetve szervezési kérdéseket is). Sajnos az illyefalvi találkozók nem váltották be a hozzájuk fűzött kezdeti reményeket, mivel a három alkalom közül a 2004-ben őrvidéki, muravidékí és horvátországi kutatóhelyekkel kiegészült kutatóhálózat egyiken sem tudott teljes létszámban részt venni. így az első két találkozó után harmadik alkalommal a kutatóhálózatból már csak a szervezők voltak jelen.