Hidrológiai Közlöny 1972 (52. évfolyam)
9. szám - Korszerű eszközök, matematikai módszerek a területi vízgazdálkodás gyakorlatában (II. rész) - Nováky Béla: Lineáris extrapoláció a hosszúidejű előrejelzésekben
38'S Hidrológiai Közlöny 1972. 9. sz. Korszerű eszközök, matematikai módszerek vizsgált jelenségen, adott esetben hidrológiai jelenségen kívülálló, bizonyos szabály szerint viselkedő jelenség (esetleg a naptevékenység) lehet. A lineáris extrapolációnak nagy előnye épp abban van, hogy ezt a kívülálló jelenséget nem kell kutatnia. A lineáris extrapoláció legkisebb négyzetekkel való végrehajtására elterjedt módszer a lineáris regresszió analízis, amelynél többváltozós kapcsolatot keresünk egyfelől a hidrológiai esemény egv i-edik időpontjában bekövetkezett értéke, másfelől az i-t megelőző időpontok értékei között. A regressziós kapcsolat együtthatói az idősorból felírható korreláció matrix inverzének elemeiből a szórásokból, valamint a középértékekből írhatók fel. A regresszió szorosságát ugyancsak az inverz mátrixból, annak első eleme alapján kiszámítható többszörös korrelációs tényező fejezi ki, egyúttal ez utóbbi kifejezheti bizonyos mértékig az előrejelzés jóságát, avagy egy segédlet előrejelzésére való alkalmazhatóságát. Az előrejelzési segédlet szerkesztésének lényege tehát az, hogy a rendelkezésünkre álló minta — a vizsgált hidrológiai jelenség idősora — alapján a korreláció mátrix összeállításán keresztül megállapítsuk a többváltozós regresszió együtthatóit, a lineáris extrapoláció végrehajtásához szükséges koefficienseket. A probléma abból adódik, hogy egy végtelen folyamatot annak egy véges mintájából kell leírni, egy olvan véges mintából, amelyen keresztül egyáltalán ismerjük magát a folyamatot. Az extrapoláció koefficienseinek a mintából való számításánál a következő kérdéseket kell tisztázni: 1. A korreláció mátrix elemeiben szereplő autokorrelációs együtthatókat milyen számú értékpárból számítsuk ki, s ugyanezt kell tisztázni a szórásnál és a középértékeknél is. 2. A többváltozós regressziónál hány megelőző értéket vegyünk figyelembe ahhoz, hogv a többszörös korrelációs tényező elegendő nagyságú, s ezáltal az előrejelzés megbízható legyen. 3. Végül, de nem utolsósorban vizsgálni kell azt, hogy a mintából nyert regressziós együtthatók, az extrapoláció koefficiensei mennyire állandók a mintán túl, azaz az összeállítás után mennyi idővel kell az együtthatókat újólag kiszámítani. Nyilvánvaló, hogy az első két kérdés megválaszolásánál az értékeknek határt szab az idősor hoszsza. Amennyiben az autokorrelációs tényezők kiszámításához legalább m számú értékpárt követelünk meg, úgy egy T hosszúságú, s így T tagú idősor esetén legfeljebb n = T+\— m megelőző évet vonhatunk be a rengresszióba. Egy adott m érték mellett a még célszerűen bevonható megelőző értékek száma a következőképp határozható meg. Kiszámítjuk a korrelációs függvényt a lehetséges r ma x értékig, azaz meghatározzuk az autokorrelációs tényezőket a T = 0 és az adott m mellett maximális r értékek közötti minden r-ra. Majd az autokorrelációs tényezőkből felírjuk a teljes korrelációs mátrixot. Ha e mátrixból töröljük az első két sor és az első két oszlop metszésében levő értékek kivételével minden értéket, tehát csupán a felső sarokmátrixot hagyjuk meg, az korrelációs mátrixa lesz a kétváltozós regressziós kapcsolatnak. Hasonlóképpen kaphatók a három, négy és így tovább egész az n változóig a regresszió kapcsolatok korreláció) mátrixai, amelyek mindegyikére meghatározható a többszörös korrelációs tényező. A többszörös korrelációs tényező értéke pedig kapcsolatba hozható a változók számával, s e kapcsolat már alkalmas lesz a célszerűségnek és a követelményeknek megfelelő, maximálisan bevonandó megelőző értékek számának meghatározására, feltéve, ha ez egyáltalán a T idősor esetleges rövidsége miatt megengedhető. Nyilvánvaló tehát, hogy nagyszámú idősorral különböző variációkban elvégzett vizsgálatok statisztikai alapján is kimutatják a legszorosabb regressziós összefüggéseket, s feltehetően, azon túl, egysoros szabályszerűségre is rámutatnak. Ami az előrejelzésre alkalmazható regressziós egyenlet együtthatóinak állandóságát illeti, ezek teljesülése az előrejelzés szempontjából legalább olyan fontos, mint a korrelációs összefüggések szorossága. Még mindig jobb egy, a mintából esetleg kisebb szorossággal megállapított, de a mintán túl is igaz összefüggés, mint egy, az adott mintára ugyan szoros kapcsolat, de amelyik a mintán túl már nem alkalmazható. Az előx-ejelzési együtthatók állandóságánál a középértékek, a szórás és a korrelációs függvény állandóságát kell megkövetelni. Az első kettőre voltak már vizsgálatok, így azok állandóságával kapcsolatban már bizonyos empirikus tapasztalataink vannak. A középértékekre, amelyek a regresszió analízisénél lényegében az idősor mozgó átlagai, tehát a középértékekre elvégzett vizsgálatok sok esetben kimutattak emelkedő vagy süllyedő trendeket, de egy bizonyos ideig a mozgó átlagban mutatkozó változás még nem jelentős oly annyira, hogy akár a középértékek eltéréseinek szignifikáns, vagy véletlen voltát vizsgáló /-próba is igazolja az eltérés véletlen jellegét, s így a két középérték valószínűségi értélemben vett azonosságát. Feltehető, hogy még trend esetén is az előrejelzési koefficiensek kiszámításánál még figyelembe vett időponton túl egy bizonyos határig elengedő jogossággal elfogadhatók a mintából számított középértékek anélkül, hogy magában az előrejelzésben lényegesebb pontatlanság állna be. Mindenesetre elgondolkoztató, hogy miként lehetne az esetleges trendhatást is figyelembe venni az extrapolációs koefficiensek meghatározásánál. Ami a korrelációs függvények állandóságát illeti, a hidrológiai jelenségekre ezt sem elméletileg, sem gyakorlati kiszámításokon keresztül statisztikusán nem vizsgálta senki. Az biztos, hogy minél nagyobb számú értékpárokból lettek kiszámítva a korrelációs függvényt alkotó autokorrelációs tényezők, annál nagyobb valószínűséggel fogadhatók el a jövőre vonatkozóan. Végül, ami az előrejelzési segédlet alkalmazhatóságának igen lényeges feltételeként kimondott regressziós együtthatók állandóságát illeti, ezzel kapcsolatosan is a nagyszámú, egvidősoron belüli különböző mintákból elvégzett regresszió analízisek statisztikai összehasonlítása adhat választ.