Hidrológiai Közlöny 1981 (61. évfolyam)
11. szám - Dr. Vágás István: A regresszió-analízis kritikája (Válasz dr. Hankó Zoltán hozzászólására)
Hidrológiai Közlöny 1981. 11. sz. 495 A REGRESSZIÓ-ANALÍZIS KRITIKÁJA (Válasz dr. Hankó Zoltán hozzászólására.) D R. VÁIÍÍS ISTVÁN* Dr. Hankó Zoltán részletes hozzászólása arról győzött meg, hogy a regresszió analízis egyes paraméterei — így elsősorban a korrelációs tényező — valóban nélkülözik az egyértelműséget, más paraméterei viszont — pl. a különböző értelmezésű szórás értékek - csak erős fenntartásokkal és vonatkoztatási lehetőségeiknek az eddigieknél pontosabb megállapításával használhatók. Az általam megfogalmazott kritika azonban nemcsak hidrológiai oldalról érvényes, hanem kibővíthető sokkal általánosabban is. Hogy a korrelációs tényező a koordináta rendszer elforgatására nézve nem invariáns, ezt az eredeti tanulmányban egy módon bizonyítottam. Örvendetes, hogy a hozzászólás más módon, sőt, valószínűleg általánosabban is bizonyította, sőt, itt hivatkozhatom rá, hogy időközben Nováky Béla is felhívta a figyelmemet, hogy George U. Yule—Maurice <>. Kandell: An introduction to the theory of statistics (Gh. Griffin and Co. Ltd., London, 1950) c. könyve, amelynek orosz fordítása is megjelent 1960-ban Moszkvában, egy a most említettektől eltérő harmadik módon is ugyanilyen eredményre jutott. Érdekes, hogy hazánkban (és külföldön) a korrelációs tényező használata éppen 1950 után terjedt el, de a kapcsolatos kritikák nem váltak közismertekké. A hozzászólás a koordinátarendszer nyújtásával-zsugorításával szemben — ami egyenértékű a különböző dimenziójú változók mértékegységváltoztatásának figyelembevételével — igazolta a korrelációs tényező invariáns voltát. Ez az invariancia valós, sőt, valószínű, hogy a korrelációs tényező éppen ennek köszönhette elterjedését, és egyáltalában: alkalmazhatóságát. Ha ugyanis éppen ez az invariáns tulajdonsága is hiányzott volna: semmilyen szempontból nem lehetett volna egyértelmű jellegszám. Természetesen, a nyújtással-zsugorítással szembeni állandóság azt az elvi kérdést veti fel, hogy vajon a regresszióanalízis két (vagy több) változó összefüggésének abszolút szorosságát határozza-e meg, vagy csupán azt, hogy ha a Gauss szerint ,,legmegbízhatóbb"-nak nevezett függvénykapcsolatot használjuk, akkor tévedéseink halmazának a várható értéktől való eltérése (szintén csak várhatólag!) minimális lesz. Az eredeti tanulmányban közölt levezetéseknek (jórészt még Gauss által adott) megfogalmazásából és alapfeltevéseiből az következik, hogy az utóbbi esetről van egyértelműen szó. Akkor viszont a korrelációs tényező, ha egyértelmű is az adott határokon belül: pótolható, mert a tényleg bekövetkezett és a kapcsolati egyenlet alapján számított értékek eltéréseinek halmazára vonatkoztatott szórás (eredeti tanulmány 11. egyenlet) értéke alapvetően jellemzi azt, hogy az egyenletünk mennyiben áll közel ahhoz, hogy determinisztikus összefüggés * Alsótiszavidéki Vízügyi Igazgatóság, Szeged. lehessen. Nem is bizonyos, hogy dimenzió nélküli jellegszám fejezi ki ezt a legjobban. Előrejelzéseinknél pl. alkalmasabb a várható tévedés mértékét ugyanabban a mértékegységben, tehát cm-ben meghatároznunk, amelyben magát az előrejelzést is megadjuk, mint pl. százalékban, amit az eredeti adatoktól már meglehetősen elszakítottnak érezhetünk. Sem az eredeti tanulmány, sem a hozzászólás nem terjeszkedhetett ki annak vizsgálatára, hogy invariáns marad-e a korrelációs tényező akkor, ha az eredeti változók helyett azoknak valamilyen függvényét (pl. logaritmusát, exponenciális függvényét, stb.) használjuk. Nyilvánvaló, hogy a korrelációs tényező invariáns volta ezekkel az általános átalakításokkal szemben csak kivételesen maradhat meg. Ez viszont — az elforgatáshoz hasonlóan - ismét széles lehetőségeit nyithatja meg a korrelációs tényező szubjektív érdekek szerinti manipul álásának. Végső összegezésben tehát kimondhatjuk, hogy a korrelációs tényező vagy nem invariáns egyfajta átalakítással szemben és ezért rossz jellegszám, vagy invariáns ugyan, deákkor mással is helyettesíthető. Nagy kérdés, hogy a kritikát csak a korrelációs tényezőre kell-e kiterjeszteni, vagy magára a regresszió-analízis egészére. A regresszió analízis ugyanis csak egy kétségtelenül praktikus kérdést old meg: azt, hogy ha két vagy több változó közt nincs determinisztikus kapcsolat, akkor melyik az a determinisztikus formájú kapcsolat, amelynek használatával várhatólag a legkisebb eltéréseket kapom az elméletileg számított és a tényleg bekövetkező függvény-értékek között. Az a tény viszont, hogy a különböző változók szempontjából a Gauss-elmélettel meghatározható kapcsolat megfordíthatatlan, ez csak a számítási módszert illetően szükségszerű, a számítási módszer mögött megjelenő hidrológiai, hidraulikai, vagy fizikai tartalom szempontjából viszont logikátlan és elviekben nem igazolható engedmény annak a kényszerhelyzetnek az igazolására, hogy teljesen, vagy nem teljesen sztochasztikus folyamatokat determinisztikus szkéma szerint is szeretnénk leírni. A ,,megfordíthatatlanság"-ból ellentmondások származnak, hiszen ez (fizikai értelemben) önmaga is a legteljesebb ellentmondás. A műszaki élet az ellentmondásokat tűrheti ugyan, de csak addig a mértékig, amíg az ebből származó eltérések a mérések, vagy az előrejelzések pontossági igényeivel még arányban állnak. Éppen ezért valószínű, hogy a regresszió-analízis annál kevésbé jogosult, minél kevésbé szorosak az általa leírni kívánt kapcsolatok. Emellett más módszerek is jogosultak lehetnek. A következőkben már csak egy különleges következménnyel foglalkozom. A tanulmány, a hozzászólás, a hivatkozott irodalmi állásfoglalás megegyezett abban, hogy a korrelációs tényező a koordináta rendszer elforgatásával szemben nem invariáns. Ez a megegyezés elegendő ahhoz, hogy csatlakozhassunk Fényes Dnrc fizikus alapvetően