Nyelvtudományi Közlemények 113. kötet (2017)
Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85
Korpuszépítés ó- és középmagyar kori magánéleti szövegekből 95 volna nehezen kereshetővé. Például az ahol határozói névmás mellett gyakran bukkan fel az ahon. Bár a középmagyarban feltehetően már egyik alak sem volt morfológiailag kompozicionális, a kettő közötti különbség mégsem tekinthető pusztán nyelvjárási különbségnek, hiszen különböző primér ragokat őriznek (azaz eredetileg mégis különbözik a morfológiai szerkezetük). Emiatt nem tűnt észszerűnek az a megoldás, hogy a közöttük lévő különbséget neutralizáljuk azáltal, hogy mindkettőt ahol-та, azaz a modem standard formára normalizáljuk. Ezt a jelenségtípust úgy kezeltük, hogy ilyen esetekben megtartottuk az eredeti alakokat a normalizált verzióban is (természetesen csak a morfológiailag releváns különbségeket őrizve meg), lemmáikat pedig összeindexeltük. A gyakorlatban ez azt jelenti, hogy ha a felhasználó a modem standard formára (ahol) keres rá, akkor a találati lista egyaránt tartalmazni fogja az ahol és az ahon előfordulásait is, s ezek közül aztán kiszűrheti az ahon előfordulásait, ha ezekre nincs szüksége. Reményeink szerint ez felhasználóbarát eljárásmódnak fog bizonyulni, hiszen segítségével a morfológiai kövületek sokkal könnyebben kereshetők. A szegmentált normalizált verzió, amely egyben a morfológiai elemző bemenete is, az 1. ábrán látható; a vastag betűvel szedett sor a szöveg eredeti változata, alatta a kézi normalizálás eredményeként előálló verzió olvasható, tehát az, amely megközelíti a mai magyar standardot. 1 1. ábra. Eredeti szöveg és átirata. Bősz. la. Abaúj-Toma megye, Szilas, 1736. Félkövér betűvel szedve: az eredeti tagmondatok, alattuk soronként: normalizált változatuk. egy kis idő múlva estve\ feli Egy kis idő múlva, estefelé, <még világos vólt> <még világos volt,> Tehin\ gyüvéskor gyön Falubul edgy nagy Files\ Bagoly nagy czetajvah patajvai, tehénjövéskor jön a faluból egy nagy fülesbagoly nagy csetajjal-patajjal, fel az utón mentiben fel az úton mentében, <ahol a szöllő koszt volt,> <ahol a szőlő között volt,> oda\ gyött igenessen hozzája, odajött egyenesen hozzája. Ember nincsen Ember nincsen, aki meg tudna mondanj, aki meg tudná mondani, micsoda nagy nyelve ki\ mutatasaval, és feje ki\ Húzásával, szarnyajval, micsoda nagy nyelve kimutatásával és feje kihúzásával, szárnyaival,