Hidrológiai Közlöny 1983 (63. évfolyam)
11. szám - Dr. Reimann József: Megjegyzések a korreláció- és regresszióelmélethez. I. Korreláció-elmélet
480 Hidrológiai Közlöny 1983. 11. sz. Dr. Reimann ./.: Korreláció-elmélet A korrelációs együtthatónak a változók lineáris transzformációjával szembeni invarianciáját dr. Hankó Zoltán a g — m\ m 1 m -l-l, il v1 w 2 m 2 speciális lineáris transzformáltak esetére igazolta. (Az igazolás a megfelelő empirikus mennyiségekkel történt.) A bevezetésben idézett szerzők megállapították, hogy az (1) formulával definiált empirikus korrelációs együttható értéke nem invariáns az ortogonális koordináta-rendszer elforgatásával szemben, sőt megmutatták, hogy r 2 értéke, 0 és 1 között tetszőleges adott érték lehet alkalmasan választott elforgatási szög esetében. Ez a megállapítás teljes mértékben helytálló, sőt a q elméleti értékre is érvényes, azonban ezt a tényt nem indokolt a korrelációs együttható hibájának tekinteni. Ugyanis a koordináta-rendszert pozitív a szöggel elforgatva (2. ábra) az - e== r) sin a-f- £ cos a 8 = rj cos a— | sin a valószínűségi változókhoz jutunk és az (e, <5) valószínűségi változó pár már teljesen más valószínűségi változó pár, mint a (rj). Az (e, ö) pontok koordinátáit (a kétdimenziós mintapontok koordinátáit) már az új koordinátatengelyeken kell leolvasni, vagyis a mintapontokat az elforgatott tengelyekre kell vetíteni. A koordináta-rendszer elforgatásával olyan helyzetet hozunk létre, mintha egy másik kétdimenziós mintánk lenne. Miért várhatnánk, hogy különböző valószínűségi változópárok között ugyanaz legyen a korrelációs együttható? (A koordináta-rendszer elforgatásával lényegében végtelen sok kétdimenziós mintát generálunk!) Azt kell mondanunk, hogy ha £ és rj sztochasztikus kapcsolatára vagyunk kíváncsiak, akkor nem szabad a koordináta-rendszert elforgatni, mert ezek sztochasztikus összefüggésére minden információt elvesztünk. 2. Egyéb mérőszámok valószínűségi változók kapcsolatának szorosságára Felmerül a kérdés, hogy ha a korrelációs együttható két valószínűségi változó sztochasztikus kap-7] 2. ábra. A koordinátarendszer a-szöggel történő elforgatásakor keletkező új valószínűségi változók Puc. 2. Hoeue eeponmnocrmtbie nepeMemme, eo3HUKaiouiue npu epauieuuu cucmeMbi Koopöunam c yzjioM a Abb. 2. Neue Zufallsgrösse die durch Verdrehung des Koordinatensystems um den Winkel a entstehen csolatának nem a szorosságát, hanem a linearitását méri, van-e jobb mérőszám a kapcsolat szorosságára vonatkozólag? Ahhoz, hogy a kérdésre válaszolhassunk, célszerű tisztázni, hogy milyen tulajdonságokkal kell rendelkeznie egy jó mérőszámnak a két változó szorosságát illetőleg. Jelöljünk egy ilyen mérőszámot <5(|, rj)-val. Erre vonatkozólag az [5] dolgozatban a következő posztulátumok találhatók, amelyek a Rényi [4] cikkében közölt posztulátumok módosításai. A) <5(í, rj) értelmezve van tetszőleges | és i] valószínűségi változók esetére, ha egyik sem állandó. fí) <5(|, Í?)=<5(Í7, I) G) 0<<5(|, 77)<1, D) ő( I, rj) = 0 akkor és csak akkor, ha £ és rj függetlenek E) á(|, ri)=l ha szigorú monoton függvénykapcsolat van | és rj között F) fia az f(x) és g(x) Borel — mérhető függvények az ar-tengelyt kölcsönös egyértelmű módon képezik le önmagára (monoton függvények), akkor «5[/(!), gr(T?)]=á(É. rj) G) Ha | ós 7? együttes eloszlása kétdimenziós normális eloszlás, akkor <5(|, rj) a |g(£, t])\ korrelációs együttható egyértelmű monoton növekvő függvénye. fí) Ha (I, rj) és (£„, tj„) n— 1, 2, . . . valószínűségi változó párok fí(x, y), ill. H v(x, y) eloszlásfüggvényekkel és a [H m(x, y)1 sorozat gyengén konvergál H(x, y)-hoz, akkor lim rj n)= <5(1, rj) n-*• oo Mint a korábbiakban vázolt fejtegetésekből kiderül, a korrelációs együttható nem elégíti ki az A) posztulátumot, mert csak abban az esetben van értelmezve, ha mind £ mind rj véges szórásúak. AB) és G) posztulátumokat o(rj) kielégíti, a többi követelmény egyikét sem. A gyakorlat szempontjából különösen problématikus — és ebben áll a korrelációs együtthatónak a gyenge volta a kapcsolatmérés szempontjából, hogy nem tesz eleget a D), E) és F) posztulátumoknak, azaz nemcsak akkor 0, ha változók függetlenek (csak speciális esetben), nem 1 az értéke függvénykapcsolat esetén (csak ha a kapcsolat lineáris) és nem invariáns a változók monoton transzformációjával szemben (csak ha lineáris a transzformáció). Vizsgáljuk most néhány egyéb mérőszám tulajdonságait a posztulátumok tükrében. Gyakran használt mérőszám a kapcsolat szorosságát illetőleg az ún. korrelációhányados, amelyet K. Pearson vezetett be. Az rj valószínűségi változó f-re vonatkozó korrelációhányadosa a ahol a számlában rj feltételes várható értékének szórása, a nevezőben r\ szórása áll, amelyről feltesszük, hogy véges (és pozitív). A 0|(^) mérőszám értéke a [0, 1] intervallumba esik, de nem szimmetrikus.