Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 1994. Tanulmányok a magyar nyelv, az irodalom köréből. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 22)

ABKAROVITS ENDRE: Új irányzatok a szótárírásban Angliában

100 milliós adatbázison alapszik. (Jellemző, hogy a kiadók igyekeznek hangzatos elnevezéseket adni adatbázisuknak. Például: COBUILD: The Bank of English, Oxford: British National Corpus.) Az adatbázisokban tárolt adatok mennyisége napról napra növekszik. (A COBUILD új szótára 200 millió adatra épül, de valójában már 500 mil­lió adat van a számítógépükben!) Minél nagyobb egy korpusz, annál biz­tonságosabb következtetéseket lehet levonni belőle. Nem véletlen, hogy a kiadók igyekeznek hangsúlyozni, hogy az ő korpuszuk a legnagyobb, a legreprezentatívabb, a valós nyelvet leginkább tükröző. A fentiekben leírtakból is következően számos területen van lehetőség a továbblépésre. Valószínűleg megnövekszik a gyakoriságra vonatkozó mutatók jelentősége. Jelenleg még csak a szó egészére találhatók ilyenek a COBUILD szótárban. Várható, hogy előbb-utóbb a szó különböző jelenté­seire, lehetséges nyelvtani környezetére stb. vonatkozóan is megjelennek ilyen mutatók. Ez óriási munkát jelent majd a szótárak összeállítóinak, de ezek a lehetőségek már ma benne vannak a számítógépes adatbázisokban. (Magam is végeztem kutatásokat arra vonatkozóan például, hogy a fenti igék esetében a korpusz milyen gyakoriságot mutat infinitives és gerundi­umos szerkezetekkel kapcsolatban, s ezek eredménye számos esetben meg­hökkentő, a hagyományos nyelvtankönyveknek ellentmondó. Például ­ahol van egyáltalán választási lehetőség-jóval gyakoribb az infinitív, mint ahogy talán a legtöbb nyelvtanár gondolná. Csak egyet lehet érteni azzal, amit Biber-Conrad-Rippen egy másik jelenséggel, a főnévi bővítmények­kel kapcsolatban kimutat, hogy a nyelvtankönyvek szerzői számára a múlt­ban nem annyira egy szerkezet előfordulásának gyakorisága, hanem nehéz­sége és/vagy taníthatósága számított. A lexikográfia területén pedig az je­lentheti az egyik fő veszélyt, ha a nyelvet homogénnek tekintjük, s nem vesszük figyelembe, hogy például egy szinonimacsoport tagjai közül egyik szó az egyik regiszterben, a másik egy másikban gyakoribb. Ezért is lenne szükség például a COBUILD szótár gyakorisági mutatóinak további fi­nomítására.) Hasonlóképpen nagy fejlődés várható a szótárak kezelhetőségét, a rö­vidítések megjegyezhetőségét, a szóra vonatkozó egyéb információk gaz­dagodását illetően is. A kiadók és kutatási műhelyek közötti rivalizálás is csak termékenyítőleg fog hatni erre a folyamatra. 79

Next

/
Thumbnails
Contents