Hidrológiai Közlöny 1995 (75. évfolyam)
3. szám - Abonyi István: Dunai árhullámok statisztikai elemzése, különös tekintettel az előrejelzési módszerekre
150 HIDROLÓGIAI KÖZLÖNY 1995. 75. ÉVF. 2. SZ^JVI sort (1902-1982-ig) az a együtthatóvektor elemeinek LKN meghatározásához, majd ugyanezt a számítást végezzük el csonka (196l-l982-ig) mintával. Az eltérések idősora (15. ábra) ill. a szórások értékei igazolják azt a feltevést, hogy az 1961. év előtti adatok szerepeltetése a statisztikai számításokban kifejezetten hátrányos következményekkel járhat a becslésekre. 20 -10 35 40 45 50 55 árhullámok 15 ábra. Becslési hibák idősora Mindezek figyelembe vételével négy többváltozós esetet tanulmányoztunk: a) Tetőző vízállások előrejelzése Mohácsra az engelhartzelli tetőzések, ill. azokkal egyidejű vízállások segítségével, teljes adatsorral (1902-1982-ig) és az összes magyarázó változó (1. ábra) bevonásával. b) Az előrejelzési segédlet összeállítása során csak az 1961-1982-ig terjedő időszak árhullámait vettük figyelembe. c) A magyarázó változók közül töröltük a dunaremetei észlelések adatait (az idősorok hossza: 1902-1982-ig). d) Duneremetei adatok nélkül rövid (1961-1982-ig) adatsorra. Az eredményeket a 2. táblázatban foglaltuk össze. 2. táblázat A többváltozós regressziós becslés statisztikai mutatói Mohács célállomásra a.) b) c.) d.) Többszörös korrelációs tényező 0,84 0,86 0,84 0,86 A hibák szórása (cm) 35 39 33 38 Látható, hogy a többváltozós kapcsolatokra vonatkozó vizsgálatok nem igazolták az adatsor megosztására irányuló előzetes feltételezéseinket. A rövid adatsorokkal végzett számítások becslési hibáinak szórásai (b. és d. eset) mindkét esetben meghaladják a teljes mintával végzett becslések paramétereit. Ennek csak látszólag mond ellent a többszörös korrelációs tényező alakulása, melynek értékét a változószám-adatszám arány is jelentősen befolyásolhatja. Fontos tanulság tehát, hogy a magyarázó változók közötti inhomogenitás (esetünkben az Engelhartzell-Linz kapcsolat) önmagában még nem lehet elegendő indok egy többváltozós kapcsolat statisztikai mintájának megváltoztatására. A dunaremetei adatok óvatos kezelésére viszont már a trendvizsgálat fölhívta a figyelmet, amit a célállomásra vonatkozó keresztkorrelációs számítások is megerősítettek. A többváltozós segédletek közül a legjobb eredményeket szolgáltató c. változat előrejelzéseit és a hozzátartozó bekövetkezett tezőzéseket mutatja aló. ábra. 700 -Eszi olt 16. ábra. Előrejelzett és bekövetkezett tetőzési értékek A magyarázó változók adatsorait, a célállomásra előrejelzett és bekövetkezett értékeket a 3. táblázat tartalmazza, az engelhartzelli tetőzések dátumaival. A lineáris regressziós becslés egyik lényeges tulajdonsága, hogy a hibák idősora ortogonális a magyarázó változókra (Tusnády-Ziermann 1986.), azaz cov(x (, £") = 0 (11) ahol az egyenlet baloldala az i.-ik magyarázó változó és e az eltérések idősorának kovarianciáját jelenti. Ezért sem a maradékok adatsora, sem azok lineáris kombinációja nem tartalmaz további, a tetőzések előrejelzése szempontjából hasznosítható információt. Ez természetesen nem jelenti azt, hogy elérkeztünk a statisztikus tetőzés előrejelzési módszerek lehetőségeinek határaihoz. Lehet próbálkozni pl. a folyamat dinamikáját jobban leíró vízállásváltozások bevonásával, a megfelelően pontos operatív előrejelzések figyelembe vételével, a különösen nagy hibázások egyedi vizsgálatával, stb. A statisztikai számításokba bevont független változók számát azonban nem növelhetjük tetszés szerint. Tekintettel kell lennünk egyrészt a statisztikai minta nagyságára, másrészt arra, hogy a magyarázó változók közötti függőség (átfedő információk) növekedésével együtt jár a regressziós együtthatók becslésének fokozott bizonytalansága.