Nyelvtudományi Közlemények 113. kötet (2017)

Tanulmányok - Dömötör Adrienne - Gugán Katalin - Novák Attila - Varga Mónika: Kiútkeresés a morfológiai labirintusból - korpuszépítés ó- és középmagyar kori magánéleti szövegekből (Finding the way out of the morphological maze: Building a corpus of Old and Middle Hungarian informal texts) 85

100 DÖMÖTÖR ET AL. З.ӓЬга. Az elvesztetted igei alak lehetséges elemzései a kézi egyértelműsítés előtt. hogy I <hogy hogytC] az az azJDe.) nem Nem nemJAdv hogy hogy hogytC] és ak. és akt és[C] ak. és ez es ez étXC] ez? Azért Azért azértJC] elvesztetted elvesztetted pecséted pecseted.» ugyan ell-t-vesztlVPfx VbPast S2 Dell el|+veszt(VPfx.\Mass Past.S2.Del) ell+vesztJVPfx.V.Fact Past S2 Del) et+veszt[VPfx VPartAdv-Ал A S2] ell+vesztJVPfxV PartPrf PxS2] el|+veszt(VPfx V.PartPrf PxS2.Acc] el|+veszt(VPfx V.Pass _Nact=tAPxS2] el|+veszt(VPfx V.Pass _Nact=tAPxS2 Acc] eli+veszt(VPfxV.PartPrf=AJíPxS2] el|+veszt[VPfx V PartPrf*Alt PxS2Acc] el+vcszt(VPfx V PartPrfSubp! APxSzAccj el|+veszt(VPfx V.PartPrf_SubptAPxS2] ell+vesztJVPfx.V.Pass PartPrf_Subj=tAPxS2.Aec| eli+veszt(VPfx.V.Pass PartPrf_Sub)*tAPxS2] el!+veszt(VPfxV._Nact=tAPxS2.Acc] ell+veszt(VPfx.V._Nact=tAPxS2] eli+vesztJVPfx V.Fact_Nact=tAPxS2 Acc] el|+veszt(VPfx V.Fact _Nact='APxS2] elí+veszt[VPfx V.Fact PartPrf_Suti=tAPxS2 Acc] eti+vesztJVPfx V.Fact PartPrf_Subj=tA PxS2] — паеедкйвпап-­tod. rad y[VPfxV.Inf.S2] kis ravaszságot gondolni. kis ravaszság« gondolni. »rój lusfAdil ravaszság[N Acc] j gondol[V Inf] xcsétgyüiút pecsétgyűrűt pecset+gyürüIN.Acc] volna volna. S2]; vanJV.Cond] lyürüt metszethette! volna lyűrút metszethettél volna. gyűrü(N Acc] mefszJV.Faa.Mod.Past.S2I van(V.Cond| n való nem ír ásódéul inrtéto* n való nem írásodról mnéno »ro DatSI; valófAdfl nemJAdv] írás[N.PxS2 Del] mnétto ó néven I veszem Ián. u 1 ne. won i wocToni Ián 5.1. Kézi egyértelműsítés A korpusz kézi ellenőrzéséhez, illetve a projekt kezdetén a szöveg kézi egyértel­műsítéséhez egy olyan, böngészőben működő felületet hoztunk létre, amelyben az egyértelműsítési és normalizálási hibák hatékonyan javíthatók. A rendszer a dokumentumot a korábban említett, könnyen és természetes módon (balról jobb­ra) olvasható interlineáris annotációs formában jeleníti meg a kézi ellenőrzést, il­letve egyértelműsítést végző felhasználó számára. Az adott szóhoz úgy lehet má­sik elemzést választani, hogy az egérmutatót a szó fölé helyezzük, és az így megjelenő, az adott szó lehetséges elemzéseit tartalmazó listában a megfelelő e­­lemre kattintunk. A lista kizárólag olyan releváns elemzéseket tartalmaz, ame­lyeket a rendszer hátterében működő webszerveren futó morfológiai elemző az adott szóhoz rendel. Ez a magyar esetében nagyon fontos, mert több ezer lehet­séges címke közül lehetetlen lenne a megfelelőt kiválasztani, nem beszélve arról, hogy a lemma előállítása sem mindig triviális, például az ikes-iktelen többértel­műségek miatt, mint tör~törik, múl~múlik stb. vagy a -z képzős igék esetében, a­­hol az elemző mindkét változatot produktívan generálja, akár létezik az ikes vál­tozat, akár nem (megigéz-megigézik). A megjelenített eredeti, illetve normalizált szóalak, valamint az elemzés kézzel is szerkeszthető az adott elemre kattintva, és

Next

/
Oldalképek
Tartalom