Az Egri Ho Si Minh Tanárképző Főiskola Tud. Közleményei. 1987. (Acta Academiae Paedagogicae Agriensis : Nova series ; Tom. 18/03)
D. Berencsi Margit — Fekete Péter — O. Bozsik Gabriella — Pásztor Emil — V. Raisz Rózsa — Varga Gyula: A szókincs-fejlesztés szükségessége és lehetőségei az általános iskolákban
- 28 A táblázatból kitűnik, hogy az eléggé terjedelmes anyag kevés lexémából épül fel. A szövegszóknak mindössze a 14,91 %-a (F), ill. a 12,01 %a (B) önálló szótári szó. A tanulók tehát látszólag kis terjedelmű "szótárból" válogatnak. Hasonló eredményre jutott NAGY J. JÓZSEF is (1981, 46). Az állomány másik jellemző tulajdonsága az egyes lexémák rendkívül eltérő gyakorisága. Míg a jeltípusok fele csak egyszer fordul elő, addig néhányuk igen nagy produktivitást mutat. Az egyszeri előfordulások (F: 54,97; B: 55,31) a szövegszóknak csak igen kis hányadát teszik ki (F: 8,20 és B: 6,64 %). A tanulók nagyon gazdaságtalanul használják szókincsüket, hisz felét csupán véletlenszerűen (egyszer), további negyedét pedig ritkán (2—3 alkalommal) veszik elő. Hasonló gondolatok a tankönyvek szókészletével kapcsolatban is felmerültek: "a szavaknak 40,14 %-a csak egyszer fordul elő a corpusban. Más nyelvstatisztikai vizsgálatokból ismeretes, (...), hogy a szavaknak mintegy fele csak egyszer fordul elő. Itt a szöveg speciális tanszöveg. Kézenfekvőnek látszik az a következtetés, hogy a szavak 40 %-ának jelentése, árnyalatai és szemantikai-fogalmi kapcsolatai nem lehetnek tisztázottak. A tanulóknak még arra sincsen megfelelő alkalmuk, hogy az adott szót bármilyen szinten elsajátítsák." (CZAHESZ 1979, 19). A fenti megállapítások pedagógiai jogosságát nem vitatjuk. Statisztikai szempontból azonban bizonyos megszorításokat kell tennünk. Objektív, szövegstatisztikai törvényszerűség, hogy minél hosszabb a szöveg (több a szövegszó), annál nagyobb az egyes lexémák előfordulása (N/L); annál kisebb arányú az új lexémák megjelenése (L % = L az Sz százalékában). Mindkét tulajdonság tendeciajellegű, aszimmetrikus eloszlású (függ a korpusz összetételétől, természetétől, tejedelmétől). Csak ezek figyelembevételével lehet az adatokat összevetni. Ilyenformán a fogalmazások elemismétlődését (6,71: egy lexéma átlagosan ennyiszer ismétlődik a fogalmazásokban), ill. szótárát (L %) jónak minősíthetjük. A beszélgetések hasonló mutatói jóval alacsonyabbak. Ezt azonban csak NAGY J. és KESZLER adataival érdemes összevetni. Az előbbi részadatai (vö. i. m. 39; A = 15,9 %; B = 13,94 % — 15.000 szövegszóra) a miénkhez hasonló eredményt mutat. A KESZLER B. átlaga azért olyan magas, mert jóval kisebb anyagot vizsgál, s a szövegek minőségükben alaposan különböznek a miénktől (vö. KESZLER