Nyelvtudományi Közlemények 113. kötet (2017)
Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85
Korpuszépítés ó- és középmagyar kori magánéleti szövegekből 99 2. ábra. Egy szövegrészlet automatikus morfológiai elemzést követő, de a kézi egyértelműsítést megelőző annotációja. A többértelmű szavak elemzése félkövér (a képernyőn zöld félkövér) betűvel jelenik meg. Ezen Patens I valtya azt hűti után. Ezen fatens 1 vallja azt hite után. ezenJDetJPro) fatens{N]j vaifV S3 De»] az|N|Pro.Acc] hít{N PxS3) után{PP] A történeti szövegek elemzéséhez használt kitelj esztett morfológiai elemző - azonos részletességű elemzések mellett - átlagosan több (2,21) elemzést rendel a szavakhoz, mint a mai magyar elemzésére használt elemző (1,92). Ugyanakkor szélsőséges esetekben az elemző által adott lehetséges elemzések száma az átlagosnál sokkal magasabb lehet. A korpusz tartalmaz olyan, a mai magyarban már nem létező igenévi és passzív szerkezeteket, amelyeknek a morfológiai elemzőhöz adása jelentősen megnövelte néhány viszonylag gyakori igealak lehetséges elemzéseinek számát (1. a 3. ábrán). A nagyobb mértékű többértelműség több tényező következménye:- a történeti elemző kevésbé normatív: megenged olyan nem standard vagy dialektális konstrukciókat is, amelyek egybeesnek valamely szabályos alakkal (például a suksükölést),- számos azonos alak szerepel a megnövekedett igei paradigmában, többek között a tömegesen többértelmű faktitív-passzív részparadigma7 legtöbb eleme és igenévi alakok,- ezekhez járul még a fentebb leírt sokféle típusú inherens többértelműség. 7 Ez a többértelműség a mai magyarból a passzív konstrukció kihalása miatt hiányzik.