Hidrológiai Közlöny 1983 (63. évfolyam)
11. szám - Dr. Reimann József: Megjegyzések a korreláció- és regresszióelmélethez. I. Korreláció-elmélet
HIDROLÓGIAI KÖZLÖNY 63. ÉVFOLYAM 11. SZÁM 477—524. oldal Budapest, 1983. november Megjegyzések a korreláció- és regresszióelmélethez I. Korrelációelmélet DR. R E I M A N X JÓZSEF egyetemi tanár % Bevezetés A Hidrológiai Közlöny 1981. évi 11. számában dr. Vágás István: „Az árhullám előrejezés mércekapcsolati módszerei" c. cikkében, valamint dr. Hankó Zoltán a fenti tanulmányhoz írt hozzászólásában vizsgálják a „Korrelációs tényezőnek" néhány tulajdonságát és következtetéseket vonnak le a regresszióelméletre vonatkozólag. Az általuk vizsgált kifejezés voltaképpen az n ^ {xt-x){yi-y) n n I 2 {xi-xf^iyt-y)* i = 1 . i = 1 empirikus korrelációs együttható, amely az elméleti korrelációs együtthatónak statisztikai mintából történő becslése. A matematikai statisztikai irodalomban az utóbbi évtizedekben a korrelációés regresszióelmélet igen terjedelmes vizsgálat tárgya, melynek a mérnöki, többek között a vízépítőmérnöki tevékenységben nagy jelentősége van. A korrelációelmélet valószínűségi változók közötti függőségi viszonyok, sztochasztikus kapcsolatok szorosságának vizsgálatával, az erre vonatkozó mérőszámok keresésével és ezek statisztikai tulajdonságainak elemzésével foglalkozik. A regresszióelmélet a valószínűségi változók közötti összefüggések, közös tendenciák függvényformájával, a kapcsolatnak bizonyos értelemben optimális tulajdonságokkal bíró függvények segítségével való kifejezésével foglalkozik. Napjainkban ezért nem szokás azonosnak venni a korrelációelméiétet a regresszióelmélettel. A megkülönböztetésnek a fogalmi tisztánlátás szempontjából van jelentősége, viszont bármely kérdéskörben a fogalmak tisztázása alapvető fontosságú az elméleti előrehaladás szempontjából. Jelen hozzászólásommal ehhez szeretnék némileg hozzájárulni. Szeretném említeni, hogy bár a kérdéskör felvetését gyakorlati hidrológiai probléma indította el, meggondolásaikban tisztán valószínűségelméleti jellegű kérdésekről van szó, az említett dolgozatban szereplő következtetések matematikai természetünk, így hozzászólásom is matematikai jellegű. Hangsúlyoznom kell, hogy az (1) formula nem a két valószínűségi változó korrelációs együtthatóját, hanem annak statisztikai becslését, az empirikus (tapasztalati) korrelációs együtthatót definiálja, amely maga is valószínűségi változó, amelynek eloszlását elég bonyolult feladat meghatározni. A matematikai statisztikai könyvekben is általában csak kétdimenziós normális eloszlás esetére található meg r sűrűségfüggvénye, amely ez esetben n-2 —i n~ 4 r x n~ 2 1 f«(z,e) = —-—(l-Q*) 2 (I-* 2) 2 / q ^i d x (-1-z-l) (2) 71 J (1 QXZ) A (2) formulában q az elméleti korrelációs együtt- zisztens becslése. Ilyenformán az r empirikus korható, n a mintaelemszám. Az empirikus korrelációs relációs együtthatóból — mint becslésből —, a q együttható várható értékére és szórásnégyzetére a elméleti korrelációs együttható tulajdonságaira lekövetkező aszimptotikus formulák érvényesek: vonható következtetések is valószínűségi jellegűek {1 \ (1 -{- Q 2) 2 ( 1 és sokkal bonyolultabb számításokat igényelnek, M(r)= J; D'-(r) = - !r/T~j mintha o elméleti korrelációt tartjuk szem előtt, mint azt a továbbiakban látni fogjuk. A továbbiak^ ' ban a kérdéskör valószínűségelméleti alapjainak A (2') formulák azt mutatják, hogy az r tapasz- megvilágításával szeretnénk hozzájárulni bizotalati korrelációs együttható p-nak aszimptotiku- nyos félreértések tisztázásához. Röviden rámusan torzítatlan és aszimptotikusan erősen kon- tatunk a korreláció- és regresszióelméletbenC. F. Gauss (1777—1855) óta történt fejlődés néhány je1 Feltesszük, hogy { és T) közül egyik sem állandó! leiltősebb eredményére is.