Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)
2. A minták elemzése
eloszlásból vett minta esetén ellenőrizzük azt, hogy a két, általában eltérő empirikus középérték tekinthető-e ugyanazon várható érték becslésének. A feladat megoldása — illetve bizonyos esetben a pontossága — elsősorban attól függ, hogy a számitásokhoz nagy (legalább 30 elemű), vagy kis minta áll-e rendelkezésre, s hogy milyen az alapsokaság eloszlása. * % Nagy minták esetén az a tétel, amely alapján az empirikus középértékre támaszkodva a várható érték nagyságát becsülni lehet, a következőképpen szól: Az n egymástól független és azonos eloszlású elemet tartalmazó minta £„ empirikus középértéke várható értékű és M(f,) = M(í) (2.36) »(ín) = D(í) y n (2.37) szórású, jó közelítéssel normális eloszlású valószínűségi változó, feltéve, hogy 30<;n<oo. (2.38) Ezt tehát úgy kell érteni, hogy ha igen sokszor megismételnénk (vagy megismételhetnénk) az n elemű minta vételét, s minden esetben kiszámítanánk az empirikus középértéket, úgy az igen jó közelítéssel olyan normális eloszlással jellemezhető véletlen jellegű ingadozást mutatna, amelynek várható értékét és szórását az (2.36) és (2.37) összefüggés adja meg. E szerint tehát — a már korábban többször alkalmazott gondolatmenetet követve — annak a vizsgálata, hogy valamely (elvileg tetszőlegesen felvehető) C érték tekinthető-e a minta alapsokaságára jellemző várható értéknek a következőképpen végezhető el: Miután meggyőződtünk arról, hogy a minta egyöntetű és elemei függetlenek egymástól, mindenekelőtt meghatározzuk a felvett érték és az empirikus középérték IC —(2.39) különbségét mint abszolút értéket, majd a D(i) « o„(í) (2.40) közelítéssel élve kiszámíthatjuk az ^ = LC —Í»l(2.41) nÁ~) paramétert. Ezt követi a III. táblázat felhasználásával az F(ay) meghatározása, amelynek felhasználásával végül is a keresett valószínűség a szokásos p = 2[100 — F(x,)] (2.16) kifejezésből számítható ki. 61