Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)
2. A minták elemzése
A mintaelemek egyöntetűségének vizsgálata1 A minta elemek egyöntetűségének, azonos eloszlásból származásának ellenőrzése, az ellenőrzés módszere alapvetően függ az eloszlás jellegétől. Ha diszkrét eloszlásról van szó, e vizsgálatok a Pearson által levezetett z? („khi négyzet”) próba segítségével végezhetők el. Ha viszont folytonos eloszlású valószínűségi változó esetén kell tájékozódni a minta elemeinek egyöntetűsége felől, a vizsgálatot Szmirnov tételére építve végezhetjük el. E kétfajta vizsgálat az elméleti alapok különbözősége ellenére is megegyezik azonban abban, hogy az eljárás mindkét esetben az észlelési sorrendbe állított minta egyes részeinek az összehasonlításán alapul. így az első lépés mindkét esetben az, hogy a mintát valamiféleképpen részmintákra kell bontani. Az aztán, hogy ezt a felosztást miképpen kell elvégezni, alapvetően a vizsgált jelenség jellegétől függ. Ha feltehető, hogy a valószínűségi változó értékét egy folytonosan egy irányban ható hatás befolyásolta (amilyen például mederemelkedés alkalmával a vízállások esete), a mintát célszerű középen kétfelé vágni. Már egészen más a helyzet, ha az észlelt értékeket bizonyos meghatározott időponttól kezdve érték zavaró hatások (amilyen például a folyók árvédelmi töltéseinek a kiépítése alkalmával a vízállások esete; vagy csapadék észlelésénél az, ha a csapadékmérő hely közvetlen környezetében egy nagy házat építenek fel). Ebben az esetben a mintát természetesen úgy kell két részre bontani, hogy a kettő közötti határnak megfelelő időpont a külső körülmények megváltozásával az idejével legyen azonos. Ismét más a helyzet akkor, ha periodikus tényezők (például napfolttevékenység) hatását kell tisztázni. Ilyenkor a mintát azokon a helyeken kell részekre bontani, ahol a szóban forgó periodikus hatást ábrázoló görbe metszi az átlagnak megfelelő szintet. A periódus hosszától függően így a vizsgált minta több részmintára bomlik, amelyek diszkrét eloszlás esetén már közvetlenül alkalmasak a további számítások elvégzésére. Folytonos eloszlású valószínűségi változónál viszont az előkészítés befejezéseként ezek célszerű összevonásával még két olyan mintát kell előállítani, amelyek közül az egyiket azok az észlelések alkotják, amelyeknél a szóban forgó hatás az átlagosnál nagyobb, míg a másikat azok, amelyeknél az az átlagosnál kisebb értékkel volt jellemezhető. Végül többször előfordul az is, hogy az észlelési körülményekben a legfontosabb vizsgálat sem tud változást kimutatni. Ez esetben — jobb híján ugyancsak az látszik a legcélravezetőbbnek, ha a mintát középen vágják kétfelé; bár megnyugtatásunkra megtehetjük, hogy emellett még több, egyéb felosztási móddal is kísérletet teszünk. * * * Rátérve most már a vizsgálatok további részleteire, a diszkrét eloszlású valószínűségi változó esetén alkalmazható Pearson-féle z1 próba a következő tételen alapszik: Ha egy diszkrét valószínűségi változóra vonatkozó, egymástól független megfigyelések alapján meghatározott n elemű mintát, amelyen az i ér1 Az „egyöntetűség” vizsgálatot szokás idegen kifejezéssel „homogenitás” vizsgálatnak is nevezni. 43