Nyelvtudományi Közlemények 113. kötet (2017)
Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85
88 Dömötör et ál. zésre, a nyelvtörténésznek a magánéleti nyelvhasználat közvetett forrásait kell hasznosítania: olyan szövegtípusokat, amelyek az élőnyelvi használathoz a legközelebb állnak. Az ómagyar kori magánéleti regiszter anyaga igen szűkös, a középmagyar kori viszont kifejezetten teijedelmes, mégis viszonylag kevés kutatás merít belőle témákat. A korpuszt boszorkányperek szövegeiből, nemesek, diákok, irodalmi alkotók és jobbágyok leveleiből állítottuk össze. A gyűjtemény így párhuzamba állítható például a következő angol nyelvű korpuszokkal: Corpus of English Dialogues,2 The Corpus of Early English Correspondence,3 illetve a korai modem portugál és spanyol leveleket tartalmazó P.S. (Post Scriptum) projektummal.4 Bár a bírósági jegyzőkönyvek megszerkesztett iratok, szóbeli vallomásokon alapulnak: a tanúknak minél pontosabban vissza kell idézniük mindent, ami számottevő lehet az adott eljárásban. így gyakran elevenítenek fel korábban elhangzott párbeszédeket, vitákat, veszekedéseket, fenyegetéseket stb. A magánlevelek pedig kétségtelenül a leginkább dialogikus és interakciós szövegtípust képviselik (vö. Pahta et al. 2010: 7). Az első magyar nyelvű magánlevél a 15. század legvégéről maradt fenn, míg az első bírósági jegyzőkönyv a 16. század első feléből ismeretes. Emiatt - a fentebbiekkel is összhangban - a korpusz anyaga nem lehet kiegyensúlyozott: az ómagyar kori rész teijedelme messze alatta marad a középmagyar kori szövegmennyiségnek. 2.3. A szövegválogatás és a metaadatok A korpuszba beépítendő szövegek kiválasztásakor nagy szerepük volt a szociológiai változóknak, mivel az anyagot szociolingvisztikai vizsgálatokra is alkalmassá kívántuk tenni. A jegyzőkönyvek keletkezési kora és helye lefedi az egész középmagyar időszakot, illetve a nyelvterület jelentős részét. Az írás dátuma és helyszíne az adatbázisban metaadatként segíti, hogy az adott szövegre jellemző nyelvváltozatot, nyelvjárást azonosítani lehessen. A boszorkányperekben vádlottként vagy tanúként részt vevő beszélők társadalmi pozíciója szintén ismeretes: a szereplők jellemzően alacsony társadalmi státusú nők és férfiak. A magánlevelek további szempontokat kínálnak a nyelvhasználók jellemzésére, ezek szintén metaadatként kerülnek be az adatbázisba. Ilyenek a feladó neme, társadalmi státusa és a címzetthez való viszonya, a címzett neme és társadalmi státusa, valamint a leírás módja is (a levelet a feladó saját kezűleg vetette-e papírra, vagy diktálás, másolás útján jött-e létre). Bár a keletkezési hely itt is szerepel a metaadatok között, 2 http://www.helsinki.fi/varieng/CoRD/corporayCED/index.html 3 http://www.helsinki.fi/varieng/domains/CEEC.html 4 http://ps.clul.ul.pt