Az Eszterházy Károly Tanárképző Főiskola Tudományos Közleményei. 1994. Tanulmányok a magyar nyelv, az irodalom köréből. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 22)
ABKAROVITS ENDRE: Új irányzatok a szótárírásban Angliában
100 milliós adatbázison alapszik. (Jellemző, hogy a kiadók igyekeznek hangzatos elnevezéseket adni adatbázisuknak. Például: COBUILD: The Bank of English, Oxford: British National Corpus.) Az adatbázisokban tárolt adatok mennyisége napról napra növekszik. (A COBUILD új szótára 200 millió adatra épül, de valójában már 500 millió adat van a számítógépükben!) Minél nagyobb egy korpusz, annál biztonságosabb következtetéseket lehet levonni belőle. Nem véletlen, hogy a kiadók igyekeznek hangsúlyozni, hogy az ő korpuszuk a legnagyobb, a legreprezentatívabb, a valós nyelvet leginkább tükröző. A fentiekben leírtakból is következően számos területen van lehetőség a továbblépésre. Valószínűleg megnövekszik a gyakoriságra vonatkozó mutatók jelentősége. Jelenleg még csak a szó egészére találhatók ilyenek a COBUILD szótárban. Várható, hogy előbb-utóbb a szó különböző jelentéseire, lehetséges nyelvtani környezetére stb. vonatkozóan is megjelennek ilyen mutatók. Ez óriási munkát jelent majd a szótárak összeállítóinak, de ezek a lehetőségek már ma benne vannak a számítógépes adatbázisokban. (Magam is végeztem kutatásokat arra vonatkozóan például, hogy a fenti igék esetében a korpusz milyen gyakoriságot mutat infinitives és gerundiumos szerkezetekkel kapcsolatban, s ezek eredménye számos esetben meghökkentő, a hagyományos nyelvtankönyveknek ellentmondó. Például ahol van egyáltalán választási lehetőség-jóval gyakoribb az infinitív, mint ahogy talán a legtöbb nyelvtanár gondolná. Csak egyet lehet érteni azzal, amit Biber-Conrad-Rippen egy másik jelenséggel, a főnévi bővítményekkel kapcsolatban kimutat, hogy a nyelvtankönyvek szerzői számára a múltban nem annyira egy szerkezet előfordulásának gyakorisága, hanem nehézsége és/vagy taníthatósága számított. A lexikográfia területén pedig az jelentheti az egyik fő veszélyt, ha a nyelvet homogénnek tekintjük, s nem vesszük figyelembe, hogy például egy szinonimacsoport tagjai közül egyik szó az egyik regiszterben, a másik egy másikban gyakoribb. Ezért is lenne szükség például a COBUILD szótár gyakorisági mutatóinak további finomítására.) Hasonlóképpen nagy fejlődés várható a szótárak kezelhetőségét, a rövidítések megjegyezhetőségét, a szóra vonatkozó egyéb információk gazdagodását illetően is. A kiadók és kutatási műhelyek közötti rivalizálás is csak termékenyítőleg fog hatni erre a folyamatra. 79