Hidrológiai Közlöny 1983 (63. évfolyam)

11. szám - Dr. Reimann József: Megjegyzések a korreláció- és regresszióelmélethez. I. Korreláció-elmélet

478 Hidrológiai Közlöny 1983. 11. sz. Dr. Reimann ./.: Korreláció-elmélet 1. A korrelációs együttható néhány tulajdonsága Két valószínűségi változó 1 | és rj közötti szto­chasztikus kapcsolat mérésére a mérnöki gyakor­latban leginkább elterjedt a korrelációs együttható alkalmazása, amelyet g(£, r;)-val jelölünk és a kö­vetkező módon definiálunk. e(f> v)= M[(£~M(Z)(ri-M(rim ahol az M várható értéket, D a szórást jelöli. Rövidség kedvéért vezessük be az M('£) = mi, M(rj)=m 2 D(£)=ai, D(r,) = a. 2 (3) e(S> v) M[(Z-?n x)(rj-m 2)] o xa 2 M\ jelölést, ekkor «I •mi)(r\ — M 2)] -ÍJ) — m\m 2 (4) Ct\0 2 (7](T 2 Ha egy valószínűségi változó értékeiből levonjuk a változó várható értékét és a különbséget osztjuk a változó szórásával, akkor ón. standard]zálást végzünk. £ —m E*=­0*1 standardizált változóra nyilvánvaló, hogy M(£*) = 0, D(|*) = 1. A standardizált változók bevezetésével a korrelá­ciós együttható igen egyszerű alakot ölt: »h v­O; £ H» . RYJ "t* j (5) Vagyis két valószínűségi változó közötti korrelá­ciós együttható a megfelelő standardizált változók szorzatának a várható értékével egyenlő. A standardizálást a mérnöki gyakorlatban olykor szokás a változó dimenziónélkülivé alakításának ne­vezni, ez a szóhasználat azonban félreérthető, ezért kerülni fogjuk. Közismert, hogy —1 == o(|, 1 továbbá, hogy ha £ és rj függetlenek, akkor g(|, 97) = 0. Ugyanis függetlenség esetén M(|. jj) = M(|) M(íj) = m 1 -m 2 és a (4) formula alapján |és rj korrelálatlanok. En­nek a ténynek a megfordítása azonban közismer­ten nem igaz, a két változó korrelálatlanságáhól a függetlenség általában nem következik. Még az is lehetséges, hogy | és rj között szigorú függvény­kapcsolat van (| értékéből rj értéke kiszámítható), a korrelációs együttható mégis zérus. Mutatunk erre egy példát, amely a [4] dolgozatban található. Legyen f egyenletes eloszlású a [—1, 1] interval­lumban és legyen rj —5| 3—azaz rj polinomja |-nek. Ekkor | sűrűségfüggvénye az alábbi 1. áb­rán látható. M(£) = 0, | -íj = 5| 4—3| 2 í Jf({.7?) = 4- f (5x i-3x*)dx = ^-[x5-x 3]l 1=0 £ J £ m m -1 1 * 1. ábra. A [-7, .7] intervallumban egyenletes eloszlású valószínűségi változó sűrűségfüggvénye Puc. 7. <t>ynKi}UR nAomnocmu eeponmnocmnoeo nepeuen­hozo paenoMepnoeo pacnpeöejienun e í)uanoci30ue —7, 7 Abb. 1. Dichtefunktion einer im. Intervall -1, 1 gleich­mäßig verteilten Zufallsgrössen l l 5 /• 3 r M(r]) = — I x 3dx — —~ I xdx— 2 J x 2 -Li 5 1 a: 4 1' 3 X x 2 l 1 Tehát Tj) = M(£. V)-M(S)M{ V) m)D(v) = 0 A fenti példa megvilágítja, hogy általában miért nem mindig tekinthető a korrelációs együttható jó mérőszámnak két valószínűségi változó kapcsolatának szorosságát illetőleg. Jó mérőszámtól elvárnánk, hogy akkor és csak akkor legyen 0, ha a két változó független, míg függvénykapcsolat esetén a mérőszám értéke I le­gyen (ekkor lenne áttekinthető skálánk a kapcsolat szorosságának mértékéről). Ismeretes, hogy a g(£, rj) korrelációs együttható értéke akkor és csak akkor +1 vagy —1, ha | és rj között lineáris függvénykapcsolat van. A korre­lációs együttható tehát két valószínűségi változó kapcsolatának nem annyira a szorosságát, mint inkább a linearitását méri. Az olvasóban felmerül­het az a gondolat, hogy a fenti példa (amely RE­NYI Alfrédtól származik (talán túlságosan mester­kélt és csak véletlenül fordulhat elő, a két változó közötti függvénykapcsolat esetében a korrelációs együttható zérus. Felvetődik a kérdés, hogy álta­lában a í és rj valószínűségi változók között mi­lyen rj = f(i;) "függvénykapcsolat esetében mutat függőséget a korrelációs együttható és milyen függvénykapcsolat esetében nem méri a kapcsola­tot. Weierstrass — approximációs tétele értelmé­ben, adott [a, 6] — intervallumon folytonos rj = /(£) függvény tetszőleges pontossággal közelíthető polinom segítségével. Egyszerűség kedvéért legyen az [a, 6] intervallum a [—1, +1] intervallum és legyen | egyenletes eloszlású ebben az interval­lumban, továbbá legyen r)=f(£) = a 0+a |+a ä| 2+. . . A ^ és rj változók közötti korreláció kiszámítása céljából vizsgáljuk először a korrelációs együttha­tót a | és rj — valószínűségi változók között.

Next

/
Oldalképek
Tartalom