Hidrológiai Közlöny 1977 (57. évfolyam)

5. szám - Domokos Miklós–Dr. Csermák Béla–Dr. Jean Weber: Többváltozós regressziós modellek alkalmazása a vízigények előrejelzésére

212 Hidrológiai Közlöny 1977. 5. sz. Domokos M. és mtsai: Többváltozós regressziós modellek egyenletek becslésére szolgáló számológépi progra­mok a multikollinearitás mértékének kimutatása érdekében rendszerint különféle parciális és több­változós korrelációs együtthatókat is számítanak. A multikollinearitás nemcsak a vízigény-előrejel­zésben, hanem a többváltozós regressziós modellek legtöbb gyakorlati alkalmazása esetében is, újra meg újra felbukkanó probléma. Azért építjük be éppen az adott független változókat a regresz­sziós egyenletbe, mert úgy tudjuk vagy úgy véljük, hogy az előrejelzendő változóval (pl. a vízigénnyel) kapcsolatban vannak. Nyilvánvaló azonban, hogy ha több független változó is kapcsolatban van az előrejelzendő változóval, akkor az is valószínű, hogy e független változók egymással is korreláltak. A független változók multikollinearitása külö­nösen akkor szokott problémát okozni, amikor — mint a vízigény-előrejelzés esetében is — adat­idősorokon alapuló regressziós egyenletek eredmé­nyeit kell értékelni. Valahányszor az idősor-reg­resszió azt mutatja ki, hogy szignifikáns kapcsolat van az előrejelzett változó és a független változók halmaza között, ennek a legtöbbször az az oka, hogy a szóbanforgó változók nagyrésze együttesen az időnek növő vagy csökkenő függvénye. Ha pl. egy terület fejlődik, akkor a lakosság száma, a jö­vedelem, az iparosodás, a költségek, valamint a különböző szolgáltatások — így a vízszolgáltatás — iránti igények egyszerre nőnek. Akár logikai, akár statisztikai szempontból nézzük, ezen változók közül a függő változó kiválasztása mindenképpen önkényes: minthogy valamennyi változó értéke nő az időben, tehát bármelyikük előrejelezhető lenne néhány vagy az összes többi változó függvényében. Ilyen esetekben, legalábbis elméleti szempontból, nem helyes az előrejelzett érték változását az egyes független változók megváltozásának következmé­nyeként értelmezni, vagyis közöttük semmiféle oksági kapcsolat nem tehető fel. 3.3. A független változók előrejelzésének szükségessége A vízigény, mint függő változó, jövőbeli (nem észlelésből származó) értékeinek előrejelzése a füg­getlen változók (lakosság, jövedelem stb.) jövőbeli, általában ugyancsak nem észlelésből származó érté­kein alapulnak. (Analóg terület bevonása esetén természetesen a független változók között már lehetnek észlelt értékek is.) Bizonyos esetekben könnyebb előrejelezni a füg­getlen változók értékeit, s ezeket a függő változó előrejelzésére felhasználni, mint az utóbbit közvet­lenül előrejelezni. Sok esetben azonban a független változók előrejelzése legalább olyan nehéz és bizony­talan, mint a vízigényt közvetlenül (pl. a 2.1 sza­kaszban tárgyalt idősor-extrapolációval) előreje­lezni. Ez a helyzet különösen akkor valószínű, ami­kor a független változók nagymértékben kollineá­risak. Tegyük fel például, hogy a vízigényt a lakos­szám, a jövedelem, az iparosodottság mutatója és a költség lineáris függvényeként adjuk meg. Na­gyonis könnyen előfordulhat, hogy a felsorolt négy független változó értékének 15 évre való előrejel­zése vagy becslése sokkal nehezebben és kevésbé megbízhatóan valósítható meg, mint a vízigény közvetlen (pl. idősor-extrapolációval) való előre­jelzése, minthogy mind a vízigény, mind az emlí­tett négy változó értékének időbeli növekedése zömmel ugyanazoktól a meghatározó tényezőktől függ. Mindenesetre tény, hogy ha magukat a füg­getlen változókat is becsülni, illetve előrejelezni kell, akkor a vízigényelőrejelzést ezzel egy további hibaforrás terheli. Mint ismeretes, a (3b) szerinti modell mellett olyan regressziós egyenletek is léteznek, amelyek az Y t+ m értékek előrejelzéséhez nem az Xj, l+ m' hanem az Xj, t+ m_ í' x x ,t+m— 2' stb. korábbi füg­getlen változó-értéket használják fel. Ezek némileg enyhítik a független változók előrejelzésével kap­csolatos nehézséget. E modellek azonban, sajnos, gyakorlatilag mégis nehezen alkalmazhatók, mivel az 1-nél több időegységgel megelőző adatokat al­kalmazó modellek általában csak akkor használ­hatók, ha későbbi értékeket is figyelembe vesznek. Valójában a legtöbb, megelőző adatokra épülő megbízható modell egyidejű adatokat is tartalmaz. Bizonyos esetekben előfordulhat ugyan, hogy a vízigény előrejelzéséhez elég, ha a független válto­zók egy időegységgel korábbi (észlelt) értékeit is­merjük és nincs szükség azok egyidejű (vagyis jövő­beli) értékeire, azonban ez is csak ritkán lehetséges. Az egynél több időegységgel való előrejelzés pedig szinte sohasem oldható meg a független változók jövőbeli értékeinek becslése nélkül. 4. Összefoglalás A vízigény előrejelzésére szolgáló többváltozós regressziós modellekhez a népességre, a jövede­lemre, a gazdasági növekedésre, a költségekre stb. vonatkozó adatok idősorai használhatók fel. A többváltozós regressziós modelleken alapuló vízigény-előrejelzésekkel kapcsolatban még akkor is különböző nehezségek merülhetnek fel, ha a reg­ressziós egyenlet jól illeszkedik a rendelkezésre álló adatokhoz. E nehézségek okai a következők: a) Az adat—idősorok rendszerint nem elégítik ki a lineáris regressziós modell hibájának vélet­lenszerű voltára vonatkozó feltevéseket. b) A modell független változóira vonatkozó ész­lelési idősorok elemei rendszerint egymás kö­zött is korreláltak. c) A függő változó (a vízigény) előrejelzése ér­dekében rendszerint a függő változók jövő­beli értékeit is előre kell jelezni. Vannak olyan statisztikai módszerek, amelyek­nek segítségével meghatározható a három buktató jellege, mértéke és az előrejelzésre gyakorolt ha­tása. E statisztikai elemzések elvégzésére azért van szükség, mivel a vízigény-előrejelzés eredményei sokkal jobban használhatók az őket terhelő bizony­talanságok ismeretében, illetve figyelembevéte­lével. IRODALOM [1] Abrahamse, A. P. .7. and Koerts, .7. (19G9): A Com­parison of the Dui'bin —Watson Test and the Power of the BLUS Test. Journal of the American Statis­tical Association, 64, 938—948.

Next

/
Thumbnails
Contents