Nyelvtudományi Közlemények 113. kötet (2017)
Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85
96 Dömötör et al. és nyakat rea\ nyújtogatta, és nyakát rányújtogatta, ugy\ hogy elejben edgy karóra szállott, úgyhogy eleibe’n egy karóra szállt. eszve\ szidta a Fatens, Összeszidta a fatens: Te Erdeg\ atta Bekenj menyei előlem „Te ördögadta Bekéné, menjél előlem, hagy békét, hagyj békét!” soha szöllőben nem maradhatott előtte, Soha szőlőben nem maradhatott előtte, hanem a szőllőbő ki kellet tirnem hanem a szőlőből ki kellett térnem. oldalaglast mentem Oldalaglást mentem, úgy mond úgy mond. 3.3.2. A csoportmunka menete Bár az egyes normalizált szövegváltozatok a normalizálást végző munkatársak egyéni munkájának eredményei, a normalizálás maga mégis csapatmunkára épült. A projekt résztvevői egyrészt a rendszeres megbeszélések során folyamatosan megvitatták azokat a problémákat, amelyekről a normalizálási útmutató (addig még) nem tartalmazott információt. Másfelől mindkét szövegváltozat (tehát a digitalizált eredeti és annak normalizált változata is) háromszoros ellenőrzésen ment keresztül a csoportban annak érdekében, hogy minél kevesebb hiba maradjon a szövegekben. Ugyanakkor természetes, hogy ha a normalizálást különböző emberek végzik kézzel, akkor a korpusz normalizált szövegváltozatai nem lesznek teljesen homogének. Annak érdekében, hogy minél kisebbek legyenek az egyéni különbségek, a normalizálási útmutatót folyamatosan frissítettük, amikor újabb és újabb, többféleképpen is kezelhető problémával találkoztunk, hogy az útmutató alapján mindenki a közösen választott megoldás szerint járhasson el a normalizálás során. 4. Morfológiai elemzés A digitalizált és normalizált szövegeket a Humor morfológiai elemzővel dolgoztuk fel, melyet eredetileg a mai magyar köznyelv elemzésére fejlesztettek ki. A ó- és középmagyar szövegek elemzéséhez tehát módosítani kellett az elemző adatbázisát. Az elemző tő- és toldaléktárát kiegészítettük azokkal az elemekkel, a-