Hidrológiai Közlöny 1984 (64. évfolyam)
6. szám - Dr. Hankó Zoltán–dr. Vágás István: Vélemények a korrelációs tényező értelmezéséről és használatáról
382 Hidrológiai Közlöny 1984. 6. sz. Dr. Hankó Z.—dr. Vágás I.: Vélemények a korrelációs tényezőről Kiegészítésként Hankó Z. megjegyezte, hogy az ,, arány torzítás" pszichológiai hatását fokozza, hogy a 0 -s-1 intervallumba eső változók közötti kapcsolat „mérlegének tengelye " ^2/2 (ha r — = Y2/2, akkor a o y\a y v —1/2/2), és ez majdnem másfélszerese az intervallum felezőjének. Hankó Z. ismeretei szerint azonban az eddigiekben soha nem tekintettük a a 0 V\a V íi hányadost a kapcsolat szorossága mérőszámának (bár ez a Pythagorasz-i kapcsolat útján tükörképe a korrelációs tényezőnek és így megengedhető. Nem szabad azonban elfelejteni, hogy e felfogásban a korrelációs tényezőből számíthatjuk a szigmák arányát és nem fordítva.) Hogy a korrelációs tényező a kapcsolat szorosságának (és inkluzíve linearitásának) egyértelmű és közelítőleg lineáris mérőszáma, azt az alábbiak tanúsítják Hankó Z. gondolatmenetében: Ismeretes, hogy A fentiek ligyelembevételével belátható, hogy Oyx— fyx valamint Y„i.= Y+h„ x(Xi — X) és XOI—X + h x„( YÍ — Y), továbbá > )XX b x„— IK (8/a) (8/b) (4/a,b) H r> x [(Xi-Z) 2! n ]/D y y yn x x r\ 0i=r yx Sí, továbbá />« \D y i Zoí=r u:c1]i D, m=D f í=l és D, l S=r y x (8/a,b,c) r„x= Dyx/YDypDxx, ahol (5) Yot és Xni — a „függő" változó feltételes várható értéke, Xiós Yí •—a „független" változó, Y és X — a változó empirikus várható értéke (a minta középértéke), r y x —a két változó közötti korrelációs tényező (a minta alapján becsült empirikus érték), — a két változó kovarianciája (a minta alapján becsült empirikus érték), [(Yi-m a változó(k) varianciája (a minta alapján becsült empirikus érték). A fentiek ismeretében a, (3) egyenlet átrendezhető : Y 0i~y Xi—X =r y X - , illetőleg (G/a) (V/a) — oi X =r v x ———, illetőleg r (fl/b) (7/b) Az rj (és a !;) az Y (és az X) változó standard alakja és két lényeges tulajdonsággal bír: — a változók azonos dimenziójúak (pontosabban dimenzió nélküliek), — a változók egyforma súlyúak. Az előbbi közvetlenül belátható, az utóbbinál azt kell figyelembe venni, hogy a súly fordítottan arányos a varianciával és a standard változók varianciája egységnyi. A (7/a, b) egyenletek a derékszögű koordináta rendszerben szimmetrikus elhelyezkedésűek, és átmennek a rendszer origóján. Miután a változók dimenzió nélküliek és egyforma súlyúak, vizsgálhatjuk, hogy miként változik a regressziós egyenesek helyzete, miközben r x y befutja aö-fl intervallumot. Ez alatt az egyenesek a koordináta tengelytől kiindulva (nincs kapcsolat a két változó között), az origó mint forgástengely körül elfordulva a szögfelező felé tartanak, és r y x= 1 esetben a szögfelezőben átfeelésbe kerülnek (függvénykapcsolat a két változó között). Az r y x változásával (közelítőleg) lineárisan változik a két egyenes által közbezárt szög. A szorosság mérőszámaként elfogadva a derékszög és a közbezárt szög különbségének a derékszöghöz való viszonyát, akkor a szoros sáq mértéke: 2 arc ts\r y X\ , , , o=i M= ^ ( 9) A kiinduló hipotézis szerint a korrelációs tényező (közelítőleg) lineáris mérőszáma a kapcsolat szoros ságának. Ezért keressük meg a —l'";«!) különbség szélsőértékét. Az első derivált zérushelyé bői az r y xm0,52 érték adódik, ahol p 0,61, tehát. az eltérés kb. 17%, a biztonság javára. A második derivált tanúsága szerint ez maximum. Ezzel a kiinduló hipotézist (a gyakorlat számára elfogadható közelítéssel és a biztonság javára szolgáló elhanyagolással) igazoltnak tekinthetjük, vagyis a korrelációs tényező közelítőleg lineáris mérőszáma a kapcsolat szorosságának (és ezen belül a kapcsolat linearitásának). Vágás István a közölt levezetést a Hankó Zoltán által helyesnek ítélt alaphipotézisek rendszerében nem kifogásolta, ellenben aggodalmát fejezte ki a ,,kapcsolat"-ró 1, mint fogalomról akkor, ha ez alatt, kimondva -— ki nem mondva, a legnagyobb valószínűség elérésének céljával definiált kapcsolatot értjük. Ha viszont az a célunk két vagy több változó közötti kapcsolatkereséseinknél, hogy abba igen sok (majdnem minden) statisztikailag értékelhető eset beleférjen, vagy éppenséggel: ne férjen bele, akkor a regressziós egyenesektől sem követelhetünk általános kapcsolati jellemző tulajdonságot. Sőt, ilyen esetekben a „kapcsolat" lazasága és szorossága is más értelmezést kell, hogy kapjon, ha egyáltalában marad valami az értelmezhetőségéből. így a korrelációs tényezőt Vágás I. mellőzni, Hankó Z. megtartani javasolja. A két szerző úgy érzi. hogy a köztük folyt szakmai vita legfől)b kérdéseit a Hidrológiai Közlöny olvasóinak megvilágította, rámutatva az egyező és eltérő álláspontokra és azok indokolására. Mindketten úgy vélik, hogy sokat tanultak egymás véleményébői. A vitát nem kívánják e sorokban eldönteni. Az összefoglalást és a következtetéseket a szakmailag igényes, tisztelt Olvasóra hízzák.