Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)
2. A minták elemzése
Két valószínűségi változó függetlenségének vizsgálata Két esemény együttes előfordulásának a valószínűsége (mint már arról az alapfogalmak ismertetésénél szó volt) igen egyszerűen számítható akkor, ha a vizsgált eredménypárra jellemző két valószínűségi változó egymástól független. Így gyakran szükségessé válik az ilyen jellegű függetlenség ellenőrzése is. Ezzel kapcsolatban diszkrét valószínűségi változóra dolgoztak ki eljárást, amely bizonyos közelítéssel alkalmazható aztán a folytonos valószínűségi változók esetére is. A módszert magát Pearson vezette be, s a vizsgálat alapjául szolgáló tétel a következőképpen szól: Ha két, egymástól független, diszkrét valószínűségi változóra vonatkozó n megfigyelési eredménypárból képzett két, n-r-n elemű minta közül az egyikben r, a másikban q egymástól különböző, n„ illetve nk gyakoriságú i, illetve k szám fordul elő oly módon, hogy az n megfigyelésből az i, k számpár előfordulási gyakorisága nik, úgy a összeg nagy n esetén r V "k nfk TI (TI/,. X1 ^ 0 J=(r_l)(q_l) (2.25) (2.26) szabadságfokú y} eloszlást mutat. Így tehát a vizsgálatok alapját képező tétel analóg azzal, amelyet az egyöntetűség vizsgálattal kapcsolatban mutattunk be, oly annyira, hogy a gyakorlati számítások alapjául szolgáló (2.25) és (2.26), illetve (2.18) és (2.19) összefüggés is tökéletesen azonos. Következésképpen e vizsgálatok módja is pontosan megegyezik azzal az eljárással, amelyet az egyöntetűség vizsgálat kapcsán már ismertettünk, fgy természetesen itt is igaz az, hogy ha / > 30 értékre adódik, úgy a y} eloszlás már jól közelíthető normális eloszlással, vagyis ilyen esetben a számításokat a (2.22) képlettel kapcsolatban elmondottak szerint kell elvégezni. Ilyen módon ebben a tárgykörben már csak két kérdésre kell kitérni. Az egyik az, hogy a y'1 összegből képzett, s „négyzetes közép kontingenciá”- nak nevezett n paraméter segítségével könnyen tájékozódni lehet a vizsgált két valószínűségi változó közötti függőség mértékéről is. Ugyanis, ha l szimbólummal jelöljük meg az r és q közül azt, amelyik a másiknál nem nagyobb, úgy 0 ^ ^ i; (2.28) és az így meghatározott paraméter az alsó, illetve felső határértéket akkor és csakis akkor veszi fel, ha a két vizsgált valószínűségi változó egymástól teljesen független, illetve ha azok között egyértelmű függőség van. 4 49