Reimann József - Tóth Julianna: Valószínűségszámítás és matematikai statisztika (Tankönyvkiadó, Budapest, 1989)
II. rész. Matematikai statisztika - 12. Korreláció- és regresszióelmélet
hogy az egyik változó értékei könnyebben mérhetők, mint a másiké, vagy pl. egyik változó aktuális értéke korábban megfigyelhető, mint a másik változóé. Tekintsük a folytonos eloszlású Ij és rj valószínűségi változókat, amelyek összetartozó mért értékeit tartalmazó (*1> Ti), (*2. y2)> •••, (*„, Tn) kétdimenziós mintával rendelkezünk. A mintát síkbeli ponthalmazként ábrázolva, a pontok elhelyezkedése sokszor arra utal, hogy megelégedhetünk a két változó közötti közös tendenciának valamely tj = a£ + b egyenessel való kifejezésére. Ilyen pontelhelyezkedést láthattunk a 50.a) ábrán. Amikor az rj változó értékét a £ változó a£ + b lineáris függvényével közelítjük, akkor feladatunk az a és b állandók meghatározása. E közelítés esetében r/ tényleges értéke és a lineáris közelítés közötti eltérést az V - (a£ + b) különbség adja. Definíció. Lineáris közelítés esetén a legkisebb négyzetek módszere szerint a és b értékét úgy kell meghatároznunk, hogy az eltérés négyzetének várható értéke a lehető legkisebb legyen, azaz fennálljon: M[tj — (a^ + b)]2 = minimum. Határozzuk meg mely a, b értékekre áll fenn ez a minimum. A fenti összefüggésben szereplő kifejezés a és b függvénye: f{a, b) = M[r,-(a£ + b)]2. Az f(a, b) kétváltozós függvény szélsőértékét csak ott veheti fel, ahol mindkét változó szerinti parciális deriváltja zérussal egyenlő: dfja, b) 8f(a, b)_ 8a ’ db Ha a £ és rj változók h(x, y) együttes sűrűségfüggvényét ismerjük, akkor az f(a, b) függvény a következő: 00 00 f(a,b)= j J (y-ax-b)2 h(x,y)dxdy. — 00 — 00 226