Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)

2. A minták elemzése

Két valószínűségi változó függetlenségének vizsgálata Két esemény együttes előfordulásának a valószínűsége (mint már ar­ról az alapfogalmak ismertetésénél szó volt) igen egyszerűen számítható akkor, ha a vizsgált eredménypárra jellemző két valószínűségi változó egy­mástól független. Így gyakran szükségessé válik az ilyen jellegű független­ség ellenőrzése is. Ezzel kapcsolatban diszkrét valószínűségi változóra dolgoztak ki eljá­rást, amely bizonyos közelítéssel alkalmazható aztán a folytonos valószínű­ségi változók esetére is. A módszert magát Pearson vezette be, s a vizsgá­lat alapjául szolgáló tétel a következőképpen szól: Ha két, egymástól független, diszkrét valószínűségi változóra vonat­kozó n megfigyelési eredménypárból képzett két, n-r-n elemű minta közül az egyikben r, a másikban q egymástól különböző, n„ illetve nk gyakoriságú i, illetve k szám fordul elő oly módon, hogy az n megfigyelésből az i, k számpár előfordulási gyakorisága nik, úgy a összeg nagy n esetén r V "k nfk TI (TI/,. X1 ^ 0 J=(r_l)(q_l) (2.25) (2.26) szabadságfokú y} eloszlást mutat. Így tehát a vizsgálatok alapját képező tétel analóg azzal, amelyet az egyöntetűség vizsgálattal kapcsolatban mutattunk be, oly annyira, hogy a gyakorlati számítások alapjául szolgáló (2.25) és (2.26), illetve (2.18) és (2.19) összefüggés is tökéletesen azonos. Következésképpen e vizsgálatok módja is pontosan megegyezik azzal az eljárással, amelyet az egyöntetűség vizs­gálat kapcsán már ismertettünk, fgy természetesen itt is igaz az, hogy ha / > 30 értékre adódik, úgy a y} eloszlás már jól közelíthető normális elosz­lással, vagyis ilyen esetben a számításokat a (2.22) képlettel kapcsolatban elmondottak szerint kell elvégezni. Ilyen módon ebben a tárgykörben már csak két kérdésre kell kitérni. Az egyik az, hogy a y'1 összegből képzett, s „négyzetes közép kontingenciá”- nak nevezett n paraméter segítségével könnyen tájékozódni lehet a vizsgált két valószínű­ségi változó közötti függőség mértékéről is. Ugyanis, ha l szimbólummal jelöljük meg az r és q közül azt, amelyik a másiknál nem nagyobb, úgy 0 ^ ^ i; (2.28) és az így meghatározott paraméter az alsó, illetve felső határértéket akkor és csakis akkor veszi fel, ha a két vizsgált valószínűségi változó egymástól teljesen független, illetve ha azok között egyértelmű függőség van. 4 49

Next

/
Thumbnails
Contents