Hidrológiai Közlöny 1994 (74. évfolyam)

3. szám - Reimann József: Újabb módszerek a korreláció- és regresszióelméletben. I. A valószínűségi változók közötti kapcsolatok mérése

146 HIDROLÓGIAI KÖZLÖNY 1994. 74. ÉVF. 2. SZÁM q - 4.II(xi, yí)~ 1 • 2. ábra mivel az A.B esemény részhalmaza mind az A, mind a B halmazoknak. (2. ábra) Ezekből következik, hogy H(x,y) < F(X) és \\(x,y) < G(y) azaz: H(xy) < min [F(jc), G(y)], vagyis H(x,y) kisebb/egyenlő az (x,y) pontban, mint a vetület elosz­lások közül a kisebbik. Bevezetve a min[F(x), G(y)) = F(x), ha F(x) <G(y) és min [F(x), G(y)] = G(y), ha G(y) <F(x) jelölést, azt az eredményt kaptuk, hogy pozitív kvadránsfüg­gőség esetén F(x), G(y) < H(x,y) < min [F(x), G(y)] (9) Az (x,y) sík feletti legmagasabban futó eloszlásfe­lület, amelyeknek vetület eloszlásai F(x) ill. G(y) a H(x,y) = min [F(x), G(y)j kétváltozós eloszlásfügg­vény. Könnyű ugyanis belátni, hogy: H(x, + oo ) = min [F(x), G(oo) = mi n /F(x),l/=F(x)' H(+oo, y) = min F(+oo), G(y)) / = min / (l,G(y)=G(y) Pozitív kvadránsfiiggőség esetén a legkisebb ilyen eloszlásfelület a H(x,y) =F(x).G(y), amely a vetület eloszlások szorzata. Az X és Y valószínűségi változók közötti kapcsolat szorosságának mérésére több korre­lációs mérőszámot vezettek be, amelyek mindegyiké­ben a (9) egyenlőtlenségben szereplő eloszlásfüggvé­nyek távolsága játszik fő szerepet. Felsorolunk néhány ilyen korrelációs mérőszámot: £jf (H-FG).dx.dy Pl P2 (Pearson) (10.1) p = 12/jT (H-FG),dF.dG = x = 41 I H.dH-U­co co jfj* (H-FG)dF. dG co co fj lmin(FG)-FG]dF. dG (Spearman) (10.2) JJjHI,-FG.fg)dx.dy u = 90fj (H-FGfdF . dG = fj \min(FG)~FG\dF.dG (Kendall) (10.3) 00 00 fj (H-FGfdFdG Jjf [ m in (FG )-FG \dFdG ' H(xi,yi)-F(&).G(yr min[F(xi,yi)]-F(x0G(yL) (Blomqvist) v = 90.fj (H-FG) [min(F,G)-FG] - dF.dG (10.6) (10.7) co oo ír fj (H-FG).dx.dy ^ fj"(min(FG)-FG)dx.dy (10.9) (Hoeffding) (10.4) y = V^jT (Blum—Kiefer-Wolfowitz) (10.5) A (10.2)-(10.4) formulában szereplő dF.fdx, dG=gdy, ahol / ill. g a vetület-sűrűségfüggvények, a (10.6.) formulában szereplő xi ill. yl a vetület el­oszlások mediánjai, azaz az F(xl) = G(yl) = egyen­2 2 2 leteket kielégítő számok. A (10.7), (10.8) és (10.9) mérőszámok a szerzőtől származnak. Az olvasóban felmerül a kérdés, miért van szükség ennyiféle mérőszámra ahhoz, hogy eldöntsük, milyen szoros kapcsolat van két valószínűségi változó között? Miért nem elég a jól ismert Pearson féle korrelációs együttható, amely a (10.1) formulában szerepel. Mint már említettük, ez a mérőszám abszolút értékre nézve csak akkor egyenlő 1-gyel, ha X és Y között lineáris, tehát y = aX+b alakú függvénykapcsolat van. Ha X és 7 között tetszőleges, folytonos, monoton növekvő függvénykapcsolat van, írjuk ezt Y = § (X) alakban, akkor a (10.2)-(10.9) mérőszámok mindegyike az 1 értéket veszi fel, tehát ez esetben jobban méri a kap­csolat szorosságát mint a (10.1) formulában szereplő korrelációs együttható. A kapcsolat szorosságára vo­natkozó jó mérőszámtól megköveteljük, hogy monoton növekvő függvénykapcsolat esetén az 1 értéket vegye fel. Függetlenség esetén valamennyi felsorolt mérő­szám értéke 0. Ebben a cikkben nem foglalkozunk a felsorolt kor­relációs mérőszámok részletes vizsgálatával; az olvasó a cikk végén adott irodalomjegyzékben ezt megtalál­hatja. Célunk csak annak érzékeltetése volt, hogy ha ismeijük az X és y-valószínűségi változó H (x,y) együttes eloszlásfüggvényét és a vetület-eloszlásfügg­vényeket, F (x)-et, ill. G (y)-t, akkor az X és Y va­lószínűségi változók közötti sztochasztikus kapcsolat szorosságát ki tudjuk számítani, mégpedig különböző mérőszámok konstruálhatok. A kulcsszerepet mind­egyik mérőszámban a H {x,y) - F (x) . G (y) különb­ség tölti be (pozitív kvadráns függőség esetében). A (10.1)-(10.9) mérőszámok tényleges kiszámítása álta­lában nehézségekbe ütközik. A fő oka a kiszámítás nehézségének, hogy rendszerint nem ismeijük a H (x,y) együttes eloszlásfüggvényt. Az F (jc) ill. G (y) vetület eloszlásfüggvényeket illeszkedésvizsgá­lattal statisztikai mintákból általában meg tudjuk ha­tározni.

Next

/
Thumbnails
Contents