Hidrológiai Közlöny 1983 (63. évfolyam)

11. szám - Dr. Reimann József: Megjegyzések a korreláció- és regresszióelmélethez. I. Korreláció-elmélet

480 Hidrológiai Közlöny 1983. 11. sz. Dr. Reimann ./.: Korreláció-elmélet A korrelációs együtthatónak a változók lineáris transzformációjával szembeni invarianciáját dr. Hankó Zoltán a g — m\ m 1 m -l-l, il v­1 w 2 m 2 speciális lineáris transzformáltak esetére igazolta. (Az igazolás a megfelelő empirikus mennyiségek­kel történt.) A bevezetésben idézett szerzők meg­állapították, hogy az (1) formulával definiált empi­rikus korrelációs együttható értéke nem invariáns az ortogonális koordináta-rendszer elforgatásával szemben, sőt megmutatták, hogy r 2 értéke, 0 és 1 között tetszőleges adott érték lehet alkalmasan választott elforgatási szög esetében. Ez a meg­állapítás teljes mértékben helytálló, sőt a q elmé­leti értékre is érvényes, azonban ezt a tényt nem indokolt a korrelációs együttható hibájának tekin­teni. Ugyanis a koordináta-rendszert pozitív a szöggel elforgatva (2. ábra) az - e== r) sin a-f- £ cos a 8 = rj cos a— | sin a valószínűségi változókhoz jutunk és az (e, <5) való­színűségi változó pár már teljesen más valószínű­ségi változó pár, mint a (rj). Az (e, ö) pontok koordinátáit (a kétdimenziós min­tapontok koordinátáit) már az új koordináta­tengelyeken kell leolvasni, vagyis a mintapontokat az elforgatott tengelyekre kell vetíteni. A koordi­náta-rendszer elforgatásával olyan helyzetet ho­zunk létre, mintha egy másik kétdimenziós min­tánk lenne. Miért várhatnánk, hogy különböző va­lószínűségi változópárok között ugyanaz legyen a korrelációs együttható? (A koordináta-rendszer elforgatásával lényegében végtelen sok kétdimen­ziós mintát generálunk!) Azt kell mondanunk, hogy ha £ és rj sztochasztikus kapcsolatára va­gyunk kíváncsiak, akkor nem szabad a koordiná­ta-rendszert elforgatni, mert ezek sztochasztikus összefüggésére minden információt elvesztünk. 2. Egyéb mérőszámok valószínűségi változók kapcsolatának szorosságára Felmerül a kérdés, hogy ha a korrelációs együtt­ható két valószínűségi változó sztochasztikus kap­-7] 2. ábra. A koordinátarendszer a-szöggel történő elfor­gatásakor keletkező új valószínűségi változók Puc. 2. Hoeue eeponmnocrmtbie nepeMemme, eo3HUKaiouiue npu epauieuuu cucmeMbi Koopöunam c yzjioM a Abb. 2. Neue Zufallsgrösse die durch Verdrehung des Koordinatensystems um den Winkel a entstehen csolatának nem a szorosságát, hanem a linearitá­sát méri, van-e jobb mérőszám a kapcsolat szo­rosságára vonatkozólag? Ahhoz, hogy a kérdésre válaszolhassunk, célszerű tisztázni, hogy milyen tulajdonságokkal kell rendelkeznie egy jó mérő­számnak a két változó szorosságát illetőleg. Jelöl­jünk egy ilyen mérőszámot <5(|, rj)-val. Erre vo­natkozólag az [5] dolgozatban a következő posz­tulátumok találhatók, amelyek a Rényi [4] cikké­ben közölt posztulátumok módosításai. A) <5(í, rj) értelmezve van tetszőleges | és i] való­színűségi változók esetére, ha egyik sem ál­landó. fí) <5(|, Í?)=<5(Í7, I) G) 0<<5(|, 77)<1, D) ő( I, rj) = 0 akkor és csak akkor, ha £ és rj füg­getlenek E) á(|, ri)=l ha szigorú monoton függvénykap­csolat van | és rj között F) fia az f(x) és g(x) Borel — mérhető függvények az ar-tengelyt kölcsönös egyértelmű módon ké­pezik le önmagára (monoton függvények), ak­kor «5[/(!), gr(T?)]=á(É. rj) G) Ha | ós 7? együttes eloszlása kétdimenziós nor­mális eloszlás, akkor <5(|, rj) a |g(£, t])\ korre­lációs együttható egyértelmű monoton növek­vő függvénye. fí) Ha (I, rj) és (£„, tj„) n— 1, 2, . . . valószínűségi változó párok fí(x, y), ill. H v(x, y) eloszlás­függvényekkel és a [H m(x, y)1 sorozat gyen­gén konvergál H(x, y)-hoz, akkor lim rj n)= <5(1, rj) n-*• oo Mint a korábbiakban vázolt fejtegetésekből kide­rül, a korrelációs együttható nem elégíti ki az A) posztulátumot, mert csak abban az esetben van ér­telmezve, ha mind £ mind rj véges szórásúak. AB) és G) posztulátumokat o(rj) kielégíti, a többi kö­vetelmény egyikét sem. A gyakorlat szempontjá­ból különösen problématikus — és ebben áll a kor­relációs együtthatónak a gyenge volta a kapcsolat­mérés szempontjából, hogy nem tesz eleget a D), E) és F) posztulátumoknak, azaz nemcsak akkor 0, ha változók függetlenek (csak speciális esetben), nem 1 az értéke függvénykapcsolat esetén (csak ha a kapcsolat lineáris) és nem invariáns a változók monoton transzformációjával szemben (csak ha lineáris a transzformáció). Vizsgáljuk most néhány egyéb mérőszám tulaj­donságait a posztulátumok tükrében. Gyakran használt mérőszám a kapcsolat szo­rosságát illetőleg az ún. korrelációhányados, ame­lyet K. Pearson vezetett be. Az rj valószínűségi változó f-re vonatkozó korrelációhányadosa a ahol a számlában rj feltételes várható értékének szórása, a nevezőben r\ szórása áll, amelyről fel­tesszük, hogy véges (és pozitív). A 0|(^) mérő­szám értéke a [0, 1] intervallumba esik, de nem szimmetrikus.

Next

/
Oldalképek
Tartalom