Nyelvtudományi Közlemények 89. kötet (1987-1988)

Tanulmányok - Pajzs Júlia: Számítógépes szótárak [Machine readable dictionaries] 67

és a természetes nyelvi interfészekhez, fordítórendszerekhez készített szótárakkal. Igyekszem tehát azokra a projektumokra korlátozni az ismertetést, amelyek a NSz. szempontjából rele­vánsnak tűnnek. Nem célom itt a magyar számítógépes szótárak ismertetése, noha az Értelmező Szótár számítógépre vitele világvi­szonylatban is úttörő jellegű vállalkozás volií, erről azonban már számos publikáció látott napvilágot (Papp 1969, Kornai 1986). 1 . Néhány szótári adatbázis, amely nyomtatott szótárból készült 1.1. Merriam-Webster Az első számítógépen is tárolt angol szótár a Merriam-Webs­ter Seventh New Collegiate Dictionary (W7), és a Merriam-Webs­ter New Pocket Dictionary volt (MPD) (Amsler 1984). Miután el­készültek a nyomtatott szótárak, kutatást indítottak a számító­gépes változat kidolgozására. Az erre irányuló projektum 1966-68-ig tartott Olney és Ziff vezetésével. Először is lyuk­kártyára gépelték a két szótár teljes anyagát, ami nem volt könnyű, mivel a lyukkártyák karakterkészlete jóval kisebb, mint a nyomtatott szótáré. A felvitel után programokat írtak a szó­cikkek egy részének elemzésére, konkordanciát készítettek az értelmezésekre, morfológiai elemző és generáló programokat fej­lesztettek és leválogatták a szócikkek egy részét további kuta­tás céljára. Ez a projektum a számítógépes lexikográfia „hősko­rának" terméke. Az adatbázis jelenleg is a kutatók rendelkezé­sére áll, számtalan — elsősorban nyelvészeti — kutatás alap­anyagául használták. Az egyik ilyen, a W7-et alapanyagául használó kutatás során (Byrd 1984, 1985) a szótárhoz egy olyan adatbáziskezelőt készí­tettek, amellyel 3 „dimenzióban" lehet kérdéseket feltenni. A Wordsmith elnevezésű szótári adatbáziskezelő használatakor a képernyő közepén állandóan az aktuális szócikket látjuk egy ab­lakban, az ablak körül csillag alakban kiírathatok a kapcsolódó címszavak. A dimenzió itt az anyag háromféle szempontból való rendezettségét jelenti. Eszerint az első dimenzió a címszavak ábécérendje, a második dimenzió a rímelő szavak listája, a har­madik dimenzió az atergo rendezés. Azaz minden aktuális szó­cikkhez kiírathatok a szótárban előtte-utána lévő címszavak,

Next

/
Thumbnails
Contents