Nyelvtudományi Közlemények 113. kötet (2017)

Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85

96 Dömötör et al. és nyakat rea\ nyújtogatta, és nyakát rányújtogatta, ugy\ hogy elejben edgy karóra szállott, úgyhogy eleibe’n egy karóra szállt. eszve\ szidta a Fatens, Összeszidta a fatens: Te Erdeg\ atta Bekenj menyei előlem „Te ördögadta Bekéné, menjél előlem, hagy békét, hagyj békét!” soha szöllőben nem maradhatott előtte, Soha szőlőben nem maradhatott előtte, hanem a szőllőbő ki kellet tirnem hanem a szőlőből ki kellett térnem. oldalaglast mentem Oldalaglást mentem, úgy mond úgy mond. 3.3.2. A csoportmunka menete Bár az egyes normalizált szövegváltozatok a normalizálást végző munkatársak e­­gyéni munkájának eredményei, a normalizálás maga mégis csapatmunkára épült. A projekt résztvevői egyrészt a rendszeres megbeszélések során folyamatosan megvitatták azokat a problémákat, amelyekről a normalizálási útmutató (addig még) nem tartalmazott információt. Másfelől mindkét szövegváltozat (tehát a di­gitalizált eredeti és annak normalizált változata is) háromszoros ellenőrzésen ment keresztül a csoportban annak érdekében, hogy minél kevesebb hiba marad­jon a szövegekben. Ugyanakkor természetes, hogy ha a normalizálást különböző emberek végzik kézzel, akkor a korpusz normalizált szövegváltozatai nem lesz­nek teljesen homogének. Annak érdekében, hogy minél kisebbek legyenek az e­­gyéni különbségek, a normalizálási útmutatót folyamatosan frissítettük, amikor újabb és újabb, többféleképpen is kezelhető problémával találkoztunk, hogy az útmutató alapján mindenki a közösen választott megoldás szerint járhasson el a normalizálás során. 4. Morfológiai elemzés A digitalizált és normalizált szövegeket a Humor morfológiai elemzővel dolgoz­tuk fel, melyet eredetileg a mai magyar köznyelv elemzésére fejlesztettek ki. A ó- és középmagyar szövegek elemzéséhez tehát módosítani kellett az elemző a­­datbázisát. Az elemző tő- és toldaléktárát kiegészítettük azokkal az elemekkel, a-

Next

/
Thumbnails
Contents