Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)
1. A valószínűség elmélet és a matematikai statisztika alapfogalmai
1.2 A MATEMATIKAI STATISZTIKA FONTOSABB ALAPFOGALMAI A minta fogalma és a mintavétellel kapcsolatos kikötések A matematikai statisztikában „mintá”-nak nevezik a valószínűségi változó véletlen jellegű ingadozásának megfigyelésére végzett észlelések ösz- szességét, s ilyen szempontból az egyes megfigyelések a „minta elemei”-t képezik. Az előttünk álló feladat pedig éppen az, hogy e minta segítségével következtessünk magára az eloszlásra, illetve annak különböző feltételek közötti alakulására. Hogy ezt viszonylag egyszerű módszerekkel megtehessük, (a valószínűségelmélet itt nem részletezett tételeit szem előtt tartva) szükség van arra, hogy a minta kielégítsen két alapfeltételt. Szükséges, hogy a) a minta elemeit alkotó megfigyelések „egymástól függetlenek” legyenek, és b) a minta „reprezentatív” legyen. A függetlenség feltétele azt jelenti, hogy a jelenségnek az egyes megfigyelések során észlelt állapotai nem befolyásolhatják a sorban utánuk következő megfigyelések alkalmával észlelhető állapotokat. Például nem fordulhat elő az, hogy a magas számértékkel jellemezhető megfigyelések után (magas évi nagyvizek után), a következő évben általában újból magas, vagy esetleg éppen fordítva, általában inkább alacsony értékek következhessenek. A reprezentativitás iránti igény két feltételt foglal magában. Az egyik feltétel az, hogy az észlelés valóban arra a valószínűségi változóra vonatkozzék, amelynek az eloszlását meg óhajtjuk határozni. És ez nem feleslegesen hangoztatott kikötés! Hogy csak egy példát vegyünk: Közismert tény, hogy a csapadék mennyiségével kapcsolatos számításoknál mindig a talajra jutó vízmennyiség véletlen jellegű ingadozását kívánjuk meghatározni. Ugyanakkor a csapadék észlelésekor a talaj felett 1 méterre elhelyezett edénybe jutó vízmennyiséget mérik. A talajba és a csapadékmérőbe jutó vízmennyiség a különböző zavaró tényezők hatása miatt azonban nem szükségképpen azonos. így tehát valóban ki lehetünk téve annak, hogy egészen más valószínűségi változónak az eloszlását határozzuk meg, mint amire éppen szükség lenne. A reprezentativitás másik feltétele az, hogy a valószínűségi változó véletlen jellegű ingadozása minden megfigyeléskor ugyanolyan legyen, az adathalmaz homogén legyen, vagyis a minta minden eleme ugyanabból az eloszlásból származzon. És ez ismét nem felesleges fontoskodás! Gondol25