Vízügyi Közlemények, 1992 (74. évfolyam)
1. füzet - Szilágyi József: Vízállások előrejelzése adaptív sztochasztikus modellel
Vízállások előrejelzése adapt iv sztochasztikus modellel 95 2.2. A multikollinearitás figyelembe vétele Az általános legkisebb négyzetek módszerének egyik alapvető feltétele a magyarázó változók függetlensége. Abban az esetben, ha ezen változók egy folyószakasz vízmérceállomásainak vízállásadatai, ez természetesen nem teljesül. Ennek az a következménye, hogy a szükséges paramétereket csak rendkívül nagy bizonytalansággal tudjuk becsülni, ami abban jelentkezik, hogyha a paraméterek számításához felhasznált idősorokhoz egy adatot hozzáteszünk, vagy elhagyunk, akkor esetleg egészen új paraméter értékek jöhetnek ki eredményül (Mundruczó 1984). Ez azt is jelenti, hogy az egyes magyarázó változók hatása külön-külön csak nagy hibával becsülhető ( Bennett 1979). Ezen az sem segít, ha az idősorokat egyre hosszabbra növeljük, azaz a paramétereket egyre nagyobb terjedelmű mintából becsüljük. Erre nincs is szükség, mivel a paraméterek becslésére egy-egy új mérési adat beérkezésével újabb és újabb értékeket kapunk. Tegyük meg azt, hogy ezeket újra és újra számoljuk, és a kiszámolt paramétereket csak az előrejelzés idején tekintjük érvényesnek, az újabb mérési adatok beérkezésével ezeket automatikusan újraszámoljuk, azaz minden egyes alkalommal módosítjuk őket, vagyis adaptáljuk a modell paramétereit a mind frissebb mérési adatok segítségével. Ez annál is inkább megtehető, mert egy bizonyos időhossz előtt mért adatok már nincsenek hatással az előrejelzés pontosságára. A Duna és a Tisza esetében egy kb. 80 napos időszak az, amin belül a magyarázó állomások mért vízállásértékei a célállomás előrejelzésére még hatással vannak a paraméterek becslése révén (Abonyi-Zsuffa 1978). Ez pontosabban azt jelenti, hogy a (6) egyenletben a T megfigyelések száma optimálisan 80, azaz kb. 3 hónap, ha napi egy adatot veszünk figyelembe. Tehát valamely vízmérceállomás tetszőleges rövid időelőnyű ( s 4 nap) előrejelzéséhez a paraméterek az elmúlt 80 nap napi egyszeri észleléseiből optimálisan számolhatók. Optimálisan azért, mert ha ennél hosszabb vagy rövidebb időszakot veszünk figyelembe a paraméterek (6) egyenlet szerinti számolásához, akkor mind a Duna, mind a Tisza esetében az előrejelzések pontossága romlik bármely állomásra. A 80 napos időközt - napi egyszeri adat esetén - az ún. „trial and error" módszerrel határoztuk meg. Ez a kb. 3 hónap is sugallja, hogy Magyarország éghajlati viszonyai között a hidrológiai folyamatoknak markáns évszakos menetük van. 2.3. Adaptivitás A multikollinearitás kiküszöbölésére tett erőfeszítések a modellparaméterek adaptív becslésére vezetnek. Az elv mégegyszer az, hogy mivel a paraméterek becslését - a magyarázó változók nem független volta miatt - csak nagy hibával végezhetjük, ezért a becsült paramétereket csak az előrejelzés készítésének időpontjában tekintjük érvényesnek, az újabb mérési adatokkal azt mindig módosítjuk. A módosítás könnyen megtehető, mert a paraméterek optimális becsléséhez szükséges mintaterjedelem nagysága 80 adat magyarázó állomásonként.