Nyelvtudományi Közlemények 66. kötet (1964)

Tanulmányok - Kiefer Ferenc: Választás és véletlen a nyelvben 239

240 ISMERTETÉSEK - SZEMLE eseményekkel, hanem egymással megegyező, tömegesen előforduló események összessé­gével, eseménykategóriákkal foglalkozik. Valószínűségi összefüggések igen nagy szerepet játszanak ma a legkülönbözőbb tudományágakban. Ha a valószínűségi relációk a klasszikus oksági törvényekhez való viszonyát akarnánk meghatározni, azt kellene mondanunk, hogy a klasszikus törvények mintegy „határértékei" a statisztikai törvényeknek, amennyiben azok ugyanis igen nagyszámú mikroszkopikus eseményre vonatkoznak. Ezt a „kettősséget" a nyelvben is tapasztalhatjuk. A klasszikus szemlélet szerint egy szó használatát különböző körülmé­nyek határozzák meg. Amikor ki akarunk fejezni valamit, akkor a kifejezendő tartalom­nak megfelelő szót (szóalakot) kell keresnünk. Más szóval ez azt jelenti, hogy egy szó használata és a beszélő vagy az író szándéka közt oksági viszony áll fenn. Az író, illetőleg beszélő a nyelvi formák mennyiségi összetevőit illetően viszont valószínűségi törvények­nek van alávetve. Oksági viszonyt illetően meghatározottságot tulajdonképpen akkor is látunk, ha a nyelvi jelenségek összességét tekintjük például egy adott szövegben. Ha a nyelvről teljes képet akarunk alkotni, mind a mennyiségi, mind a minőségi oldalát figyelembe kell venni. Választás (oksági törvények) ós véletlen (statisztikai törvények) ugyanannak a nyelvi valóságnak különböző aspektusai. Ugyanakkor a nyelv minőségi jellemzőinek, mint például a stílusnak is vannak „mennyiségi" oldalai. Mennyiség és minőség tehát nem választható el egymástól. Hiszen két író stílusának különbözősége abban is megnyilvánul, hogy például bizonyos nyelvi formákat különböző gyakorisággal használ, vagy hogy például különböző nagyságú a szókincsük. így lesz a nyelv statisztikai modelljének egyik legfontosabb területe a stílus-statisztika. A szókincs vizsgálatánál különböző arányokat szokás kiszámítani. Ezek közül a stílus statisztikai vizsgálata szempontjából különösen fontos a következő három arány: speciális szókincs : teljes szókincs; speciális szavak (szóalakok) előfordulásának száma : összes szavak előfordulásának száma; speciális szókincs : összes szavak (szó­alakok) száma. Ezek az arányok azonban mind függenek a minta nagyságától, mégis felhasználhatók szűk keretek közt a stílus jellemzésére. Ilyen arányok segítségével lehet valószínűsíteni valamely mű ismeretlen szerzőségét. (Ezt tették például Chaucer „The Equatorie" című műve esetében.3 ) Az említett arányokat természetesen csak akkor tudjuk megállapítani, ha meg tudjuk számolni a szavakat. Amíg arányokról van szó, kvalitatív statisztikáról beszélünk, amikor azonban eloszlásokat és sűrűségeket vizsgálunk, a kvantitatív statisztika mód­szereit alkalmazzuk. A mintavételnél két módszert alkalmazhatunk. 1. Vakpróba alapján veszünk mintát, ami azt jelenti, hogy,aj a kiválasztás alapja az a tény, hogy a sokaság minden egyes eleme kiválasztásának ugyanaz a való­színűsége; b) két egymás után következő kiválasztás független egymástól. Ha például egy szótárban található szavak számát akarjuk meghatározni, meg kell állapítanunk, hogy egy oldalra általában hány szó jut. A vakpróbához különböző, úgynevezett vak­próba-számok használhatók (például a Tippett-féle táblázatok).4 2. Szavaknál ez a mód­szer azonban nem minden esetben használható, hiszen általában összefüggő szöveget kell megvizsgálnunk, és az ilyen szövegek bizonyos fajta szavakat több példányban tartalmazhatnak, amelyek egy-egy gondolat vagy esemény leírására szolgálnak; ezért, ha a fenti módszert használjuk, helytelen következtetésre jutnánk. A mintavételt tehát valamilyen rendszer szerint az egész szövegre ki kell terjeszteni. Elfogadhatunk például olyan megoldást is, hogy minden oldalon bizonyos sorokat veszünk figyelembe, vagy hogy a vakpróba alapján kiválasztott mintákban megvizsgáljuk az n első vagy utolsó sort. A stílus statisztikai vizsgálatához azonban nem elég a számlálás. HERDAN olyan mutatót (paramétert) keres, amely a minta nagyságától független, és ezért egyértelműen felhasználható a stílus statisztikai jellemzésére. HERDAN paraméterének, melyet vm­mel jelöl, állandóságát matematikai módszerekkel is be lehet bizonyítani. HERDAN megállapításai szerint vm állandó értéket mutat, bármekkora mintát vegyünk is ugyan­annak a szerzőnek a műveiből. A kérdés most már az, hogy állandó-e a vm egy adott korszakon belül is, hiszen írói stíluson túl korstílusról is beszélünk. A detroiti egyetem 3 Vö. G. HERDAN, Chaucer'S authorship of the Equatorie of the Planetis: Language 32 (1956), 254. 4 Vö. L. H. C. TIPPETT, Random Sampling JSTumbers, Vol. XV., Tracts for Compu­ters, Cambridge, 1927. A vakpróba-számok tulajdonképpen véletlen számok. Ha pél­dául egy könyvből véletlenszerűen akarunk elolvasni néhány oldalt, akkor kezünkbe vesszük a Tippett-féle táblázatot és felütjük a könyvet a táblázatban megadott oldalakon.

Next

/
Oldalképek
Tartalom