Hidrológiai Közlöny 1981 (61. évfolyam)
7. szám - Dr. Reimann József: Hidrológiai változók közötti kapcsolatok vizsgálatáról
Hidrológiai Közlöny 1981. 7. sz. 289 Hidrológiai változók közötti kapcsolatok vizsgálatáról DIl. K E I M A N N J Ó Z S E F* egyetemi tanár, a műszaki tudományok doktora A hidrológiában meghatározott események előrebecslése és előrejelzése, valamint megfelelő döntések meghozatala szempontjából igen gyakran felmerül annak szükségessége, hogy gyors és egyszerű eszközökkel nyerjünk információt különböző valószínűségi változók közötti függőségi viszonyok, sztochasztikus kapcsolatok, közös tendenciák természetére vonatkozólag. Az álló- és folyóvizekre vonatkozó mennyiségi ós minőségi jellemzők véletlen hatástól befolyásolt változók, tehát a szokásos matematikai terminológia szerint valószínűségi változók. Bizonyos változók között semmiféle statisztikai kapcsolat nem mutatkozik, más változók között viszont közös tendencia, úgynevezett sztochasztikus kapcsolat van, amelyet korrelációnak szoktak nevezni. A korreláció mértékét a jól ismert korrelációs együtthatóval szokás számítani. Amennyiben két valószínűségi változó között szorosabb korreláció mutatkozik, akkor a közöttük lévő kapcsolat-függvény az ún. regressziós görbe meghatározása általában a legkisebb négyzetek módszere révén történik. A jelen tanulmányban a korrelációs együtthatót, valamint a regresszió számítás módszereit ismertnek tekintjük. Megjegyzendő, hogy a korrelációs együttható két valószínűségi változó közötti kapcsolatnak nem annyira a szorosságát, mint inkább a kapcsolat lineáris voltát méri, ezért elsősorban akkor jó mérőszáma a sztochasztikus kapcsolatnak, ha a két változó együttes eloszlása kétdimenziós normál eloszlás. A legkisebb négyzetek módszerén alapuló regresszió két valószínűségi változó között elsősorban akkor tekinthető kielégítő módszernek, ha egyik változó értékeit pontosan ismerjük, vagy legalább is lényegesen pontosabban tudjuk mérni, mint a másik változó értékeit, mivel a legkisebb négyzetek módszerének alkalmazásakor csak az egyik változó szerint minimalizálhatunk. Ezek a megjegyzések is érzékeltetik, hogy a valószínűségi változók közötti sztochasztikus kapcsolatok vizsgálata sem lezárt témakör. A kérdéskör nagy elméleti és gyakorlati jelentőségét mutatja, hogy az utóbbi évtizedekben is igen gazdag irodalom született ebben a témában. Két vagy több valószínűségi változó közötti függetlenség vagy függőségi viszony vizsgálatának különösen akkor van nagy jelentősége; ha: 1. az egyik változó értékei könnyebben mérhetők, mint a másik változóé; 2. egyik változó értékei időben korábban megfigyelhetők, mint a másik (vagy többi) változó értékei. Az (1) esetre példaként említhetjük a vízállás és a vízhozam értékei közötti kapcsolatot. Nyilvánvaló, hogy a vízállás lényegesen könnyebben *Budapesti Műszaki Egyetem, Budapest. mérhető, mint a vízhozam. Amennyiben a két mennyiség között függvényszerű kapcsolatot sikerül meghatározni statisztikai módszerrel, akkor a vízállás értékéből a vízhozam általában jól becsülhető. (Még célravezetőbb lenne, ha egy választott időegységre vonatkozó vízállás-változás és a vízhozamváitozás között vizsgálnánk a sztochasztikus kapcsolatot.) Ugyancsak az (1) esetre példa az amikor különböző vízminőségi jellemzők között vizsgáljuk a kapcsolatot. Vannak olyan vízminőségi jellemzők, amelyek könnyen mérhetők, mások csak laboratóriumban, kémiai elemzés útján határozhatók meg. így pl. ha szoros kapcsolatot találunk az elektromos vezetőképesség és a vízben oldott ásványi sók mennyisége között, akkor az elektromos vezetőképesség értékből becsülhetjük az összes oldott sók mennyiségét már laboratóriumi elemzés előtt stb. A (2) esetre vonatkozólag megemlítjük, hogy ha pl. egy adott folyó árvizei esetén az árhullám tetőzési értéke és a levonulási ideje között szoros kapcsolatot találunk, akkor a tetőzési értékből (amely nagyjáb<SI a levonulási idő felénél következik be) előre becsülhetjük a levonulási idő közelítő tartamát. A hidrológiai adatsorok (vízállás, vízhozam stb.) általában idősort alkotnak. Az idősor tagjai valószínűségi változc>k, amelyek általában függőségi viszonyban vannak egymással. Az időbeli távolság növekedésével a változók közötti sztochasztikus kapcsolat általában erősen csökken. Fontos kérdés tehát az, hogy mekkora időbeli távolságra lévő adatok között van még egyáltalán kapcsolat, mert ez meghatározza, hogy milyen időtartamra vonatkozólag lehet megbízhatóan előre jelezni az adatsorból. Ügy is fogalmazhatjuk a kérdést, hogy milyen hosszú időtartamra vonatkozólag van még kapcsolat az idősor elemei 'között, olyan hosszú az idősor emlékezete és olyan hosszú időre lehet az adatsorból előre látni. Az idősor emlékezete egyben eldönti, hogy ha egy adott idősort (pl. vízállás adatsort) Markovlánc segítségével akarunk modellezni, akkor hányszorosan összetett Markov-lánccal lehet megfelelően közelíteni az idősort. (Ugyanilyen fontos az idősor emlékezete más modellek, pl. autoregresszív-sémák alkalmazása szempontjából is.) Meg kell jegyeznünk, hogy valószínűségi változók közötti függőségi viszonyok meghatározása távolról som egyszerű feladat. Foglalkozzunk azzal a kérdéssel, hogy milyen módon mérhető két valószínűségi változó kapcsolatának szorossága. Azt mondjuk, hogy két valószínűségi változó X és Y akkor van legszorosabb kapcsolatban egymással, ha az egyik változó értékéből a másik változó értéke kiszámítható, azaz közöttük kölcsönösen egyértelmű (monoton) függvénykapcsolat van: Y=f{X) vagy X = g(Y). Amikor X és Y között semmiféle kapcsolat nincs, akkor függetleneknek