Hidrológiai Közlöny 1981 (61. évfolyam)

11. szám - Dr. Vágás István: A regresszió-analízis kritikája (Válasz dr. Hankó Zoltán hozzászólására)

Hidrológiai Közlöny 1981. 11. sz. 495 A REGRESSZIÓ-ANALÍZIS KRITIKÁJA (Válasz dr. Hankó Zoltán hozzászólására.) D R. VÁIÍÍS ISTVÁN* Dr. Hankó Zoltán részletes hozzászólása arról győzött meg, hogy a regresszió analízis egyes paraméterei — így elsősorban a korrelációs té­nyező — valóban nélkülözik az egyértelműséget, más paraméterei viszont — pl. a különböző értel­mezésű szórás értékek - csak erős fenntartásokkal és vonatkoztatási lehetőségeiknek az eddigieknél pontosabb megállapításával használhatók. Az álta­lam megfogalmazott kritika azonban nemcsak hidrológiai oldalról érvényes, hanem kibővíthető sokkal általánosabban is. Hogy a korrelációs tényező a koordináta rend­szer elforgatására nézve nem invariáns, ezt az eredeti tanulmányban egy módon bizonyítottam. Örvendetes, hogy a hozzászólás más módon, sőt, valószínűleg általánosabban is bizonyította, sőt, itt hivatkozhatom rá, hogy időközben Nováky Béla is felhívta a figyelmemet, hogy George U. Yule—Maurice <>. Kandell: An introduction to the theory of statistics (Gh. Griffin and Co. Ltd., London, 1950) c. könyve, amelynek orosz fordítása is megjelent 1960-ban Moszkvában, egy a most említettektől eltérő harmadik módon is ugyan­ilyen eredményre jutott. Érdekes, hogy hazánkban (és külföldön) a korrelációs tényező használata éppen 1950 után terjedt el, de a kapcsolatos kritikák nem váltak közismertekké. A hozzászólás a koordinátarendszer nyújtá­sával-zsugorításával szemben — ami egyenértékű a különböző dimenziójú változók mértékegység­változtatásának figyelembevételével — igazolta a korrelációs tényező invariáns voltát. Ez az invari­ancia valós, sőt, valószínű, hogy a korrelációs tényező éppen ennek köszönhette elterjedését, és egyáltalában: alkalmazhatóságát. Ha ugyanis éppen ez az invariáns tulajdonsága is hiányzott volna: semmilyen szempontból nem lehetett volna egyértelmű jellegszám. Természetesen, a nyújtással-zsugorítással szem­beni állandóság azt az elvi kérdést veti fel, hogy vajon a regresszióanalízis két (vagy több) változó összefüggésének abszolút szorosságát határozza-e meg, vagy csupán azt, hogy ha a Gauss szerint ,,legmegbízhatóbb"-nak nevezett függvénykap­csolatot használjuk, akkor tévedéseink halmazá­nak a várható értéktől való eltérése (szintén csak várhatólag!) minimális lesz. Az eredeti tanulmány­ban közölt levezetéseknek (jórészt még Gauss által adott) megfogalmazásából és alapfeltevései­ből az következik, hogy az utóbbi esetről van egyértelműen szó. Akkor viszont a korrelációs tényező, ha egyértelmű is az adott határokon belül: pótolható, mert a tényleg bekövetkezett és a kapcsolati egyenlet alapján számított értékek eltéréseinek halmazára vonatkoztatott szórás (ere­deti tanulmány 11. egyenlet) értéke alapvetően jellemzi azt, hogy az egyenletünk mennyiben áll közel ahhoz, hogy determinisztikus összefüggés * Alsótiszavidéki Vízügyi Igazgatóság, Szeged. lehessen. Nem is bizonyos, hogy dimenzió nélküli jellegszám fejezi ki ezt a legjobban. Előrejelzé­seinknél pl. alkalmasabb a várható tévedés mérté­két ugyanabban a mértékegységben, tehát cm-ben meghatároznunk, amelyben magát az előrejelzést is megadjuk, mint pl. százalékban, amit az eredeti adatoktól már meglehetősen elszakítottnak érez­hetünk. Sem az eredeti tanulmány, sem a hozzászólás nem terjeszkedhetett ki annak vizsgálatára, hogy invariáns marad-e a korrelációs tényező akkor, ha az eredeti változók helyett azoknak valamilyen függvényét (pl. logaritmusát, exponenciális függ­vényét, stb.) használjuk. Nyilvánvaló, hogy a korrelációs tényező invariáns volta ezekkel az általános átalakításokkal szemben csak kivételesen maradhat meg. Ez viszont — az elforgatáshoz hasonlóan - ismét széles lehetőségeit nyithatja meg a korrelációs tényező szubjektív érdekek szerinti manipul álásának. Végső összegezésben tehát kimondhatjuk, hogy a korrelációs tényező vagy nem invariáns egyfajta átalakítással szemben és ezért rossz jellegszám, vagy invariáns ugyan, deákkor mással is helyet­tesíthető. Nagy kérdés, hogy a kritikát csak a korrelációs tényezőre kell-e kiterjeszteni, vagy magára a regresszió-analízis egészére. A regresszió analízis ugyanis csak egy kétségtelenül praktikus kérdést old meg: azt, hogy ha két vagy több változó közt nincs determinisztikus kapcsolat, akkor melyik az a determinisztikus formájú kapcsolat, amelynek használatával várhatólag a legkisebb eltéréseket kapom az elméletileg számított és a tényleg bekö­vetkező függvény-értékek között. Az a tény viszont, hogy a különböző változók szempontjá­ból a Gauss-elmélettel meghatározható kapcsolat megfordíthatatlan, ez csak a számítási módszert illetően szükségszerű, a számítási módszer mögött megjelenő hidrológiai, hidraulikai, vagy fizikai tartalom szempontjából viszont logikátlan és elviekben nem igazolható engedmény annak a kényszerhelyzetnek az igazolására, hogy teljesen, vagy nem teljesen sztochasztikus folyamatokat determinisztikus szkéma szerint is szeretnénk leírni. A ,,megfordíthatatlanság"-ból ellentmon­dások származnak, hiszen ez (fizikai értelemben) önmaga is a legteljesebb ellentmondás. A műszaki élet az ellentmondásokat tűrheti ugyan, de csak addig a mértékig, amíg az ebből származó eltérések a mérések, vagy az előrejelzések pontossági igényei­vel még arányban állnak. Éppen ezért valószínű, hogy a regresszió-analízis annál kevésbé jogosult, minél kevésbé szorosak az általa leírni kívánt kap­csolatok. Emellett más módszerek is jogosultak lehetnek. A következőkben már csak egy különleges következménnyel foglalkozom. A tanulmány, a hozzászólás, a hivatkozott irodalmi állásfoglalás megegyezett abban, hogy a korrelációs tényező a koordináta rendszer elforgatásával szemben nem invariáns. Ez a megegyezés elegendő ahhoz, hogy csatlakozhassunk Fényes Dnrc fizikus alapvetően

Next

/
Oldalképek
Tartalom