Reimann József - Tóth Julianna: Valószínűségszámítás és matematikai statisztika (Tankönyvkiadó, Budapest, 1989)
II. rész. Matematikai statisztika - 12. Korreláció- és regresszióelmélet
egyértelműen meghatározza g értékét; ez esetben ha a > 0, akkor r = 1, ha a < 0, akkor r= — 1. Definíció. Amennyiben q = 0, akkor a ^ és rj valószínűségi változókat korrelá- latlanoknak nevezzük. Ha két valószínűségi változó független, akkor korrelálatlan is, hiszen független valószínűségi változók szorzatának várható értéke a várható értékek szorzatával egyenlő, tehát függetlenség esetén a korrelációs együttható számlálója zérus. Abból a tényből viszont, hogy 0 = 0, általában még nem következik a két változó függetlensége. Látni fogjuk, hogy a gyakorlati szempontból fontos kétdimenziós normális eloszlás esetében a korrelálatlanság maga után vonja a két változó függetlenségét. Más eloszlások esetében előfordulhat, hogy 0 = 0, a két változó között mégis szoros kapcsolat (sőt az is lehet, hogy függvénykapcsolat) áll fenn. Ha q értéke közel van 1-hez vagy (-l)-hez, akkor mindenesetre azt mondhatjuk, hogy a vizsgált valószínűségi változók között szoros lineáris sztochasztikus kapcsolat van. Ahhoz, hogy ajésg valószínűségi változók kapcsolatát megbízhatóan jellemezhessük, és a kapcsolat függvényalakjáról is képet kapjunk, a h(x, y) együttes sűrűségfüggvény segítségével további mennyiségeket is ki kell számítanunk. Definíció. A h(x, y) kétdimenziós sűrűségfüggvény ismeretében az tj valószínűségi változó feltételes várható értéke a j = x feltétel mellett: j yh(x,y)dy M(g\j = x) = -----------------= ß2(x). j h(x,y)dy Az M(rj |£ = x) feltételes várható értéket mint x függvényét az g változó c^-re vonatkozó regressziós görbéjének nevezzük. Az M(g\j — x) = /i2(x) regressziós görbe a j és rj valószínűségi változók közötti kapcsolat függvényalakját, a két változó közötti közös tendenciát fejezi ki; mivel azt tükrözi vissza, hogyan függ az g változó várható értéke ij megfigyelt értékétől. Hasonlóan értelmezhető az M{é,\rj=y) = ni(y) feltételes várható érték mint y függvénye. A gyakorlati probléma dönti el, hogy melyiket vizsgáljuk a két függvény közül. A regressziós görbének fontos optimumtulajdonsága van, amelyet a következő tétel fejez ki: Tétel. Ha cp = (p(f) tetszőleges függvénye a tj változónak, akkor tetszőleges j = x értékre: M[r/-n2(x)]2 < M[g-(p(x)]2, 223