Szabómihály Gizella - Lanstyák István (szerk.): Magyarok Szlovákiában VII. Nyelv - Magyarok Szlovákiában 7. (Somorja, 2011)
Tanulmányok - A magyar nyelv szlovákiai változatainak jellemzői
PINTER TIBOR A MAGYAR NYELV SZLOVÁKIÁI VÁLTOZATAINAK ADATBÁZISAI A nyelvészeti kutatások elengedhetetlen segédeszközei a nyelvi adatbázisok. A magyar nyelv adatbázisai általában a magyar nyelv standard nyelvváltozatát célozzák meg, a határon túli nyelvváltozatok feldolgozása nem tartozik a magyarországi kutatások közé. Kivételt csupán néhány szótár, illetve a (pár éven belül megújuló) Magyar nemzeti szövegtár (Mnsz) alkot, amely konceptuális alapon tartalmaz határon túli nyelvváltozatokat. A 2001-ben megalakult határon túli magyar kutatóállomások (mai nevén a Termini Kutatóhálózat) kezdettől fogva alapfeladatként tartotta számon a határon túli magyar nyelvváltozatok anyagának szövegtárba rendezését. A magyar nyelv határon túli szövegtára (a Magyar nemzeti szövegtár részeként létrejött Kárpát-medencei magyar nyelvi korpusz, rövidítve a Kmmnyk) az NKFP 5/044/2002. sz. pályázatának támogatásával készült el. Az így összeállított korpusz valóban „nemzeti” lett, mivel így már nemcsak a magyarországi magyar nyelvváltozatokból merít, hanem a Magyarországgal szomszédos államokban beszélt magyar nyelvváltozatokból is. (Szervezett gyűjtés és feldolgozás eddig a szlovákiai, romániai, ukrajnai és szerbiai magyar nyelvváltozatokból történt.) A KÁRPÁT-MEDENCEI MAGYAR NYELVI KORPUSZ A Gramma Nyelvi Iroda 2001-es megalakulását követően elsődleges céljai között tartotta számon a szlovákiai magyar nyelvváltozatok, elsődlegesen a beszélőközösségben standardként használt nyelvváltozat számára annotált szövegkorpusz létrehozását. Ennek első lépéseként a 2005-ben bemutatott Magyar nemzeti szövegtár határon túli magyar nyelvváltozatait felölelő Kárpát-medencei magyar nyelvi korpusz1 részeként induló, mintegy 10 millió szövegszót tartalmazó „szlovákiai magyar alkorpusz” munkálatai indultak el. A Kárpát-medencei magyar nyelvi korpusz határon túli magyar alkorpuszának elkészítésében a Gramma Nyelvi Iroda mellett a Termini Kutatóhálózat1 2 más tagjai is részt vettek: a Szabó T. Attila Nyelvi Intézet, a Hodinka Antal Intézet, valamint a kanizsai Vajdasági Magyar Nyelvi Korpusz. A nyelvi irodák létrehozásában legfontosabb szerepet a határon túli magyar nyelvváltozatok vizsgálatát érintő feladatok, illetve a határon túli magyarságot érintő különféle társadalomtudományi kutatások megszervezése játszotta (Lanstyák - Menyhárt 2001: 190-191). A szövegtípusok arányát figyelembe véve a Kárpát-medencei magyar nyelvi korpusz - mint az Mnsz határon túli alkorpusza - és ezáltal szlovákiai viszonylatban a Szlovákiai magyar korpusz is a magyar nyelv legkiegyensúlyozottabb számítógépes nyelvi adatbázisának részeként jött létre. A kiegyensúlyozottság ugyanakkor egyúttal nem jelent reprezentativitást, mivel a reprezentativitás kritériumait ez esetben szinte lehetetlen megfogalmazni, s ha 1 A Kárpát-medencei magyar nyelvi korpusz szerkesztésének részleteiről, mint ahogy felhasználhatóságának egyes lehetőségeiről, illetve feldolgozásának egyes lépéseiről bővebben lásd Pintér 2007a, 2007b, 2008a, 2008b. 2 A hálózathoz 2003-ban csatlakoztak az akkor egy-egy kutatóval rendelkező szlovéniai, ausztriai és horvátországi kutatóhelyek, amelyek 2007 óta közösen, Imre Samu Nyelvi Intézetként működnek.