Hidrológiai Közlöny 1977 (57. évfolyam)
5. szám - Domokos Miklós–Dr. Csermák Béla–Dr. Jean Weber: Többváltozós regressziós modellek alkalmazása a vízigények előrejelzésére
208 Hidrológiai Közlöny 1977. 5. sz. / Többváltozós regressziós modellek alkalmazása a vízigények előrejelzésére DOMOKOS MIKLÓS 1 — Dr. CSERMÁK BÉLA' — Dr. JEAN WEBER* a műszaki tudományok kandidátusa 1. A tanulmány célja Korábbi tanulmányainkban [3, 4, 5] áttekintettük a vízgazdálkodás-fejlesztés tervezése egyik nélkülözhetetlen alapjának, a vízigény-előrejelzésnek a módszereit. A különböző (rövid, közepes és hosszú) időelőnyű vízigény-előrejelzés sajátosságainak áttekintése után ismertettük a tervezésben alapvető jelentőségű hosszúidejű vízigény-előrejelzés legfontosabb módszereit, amelyek a következők : a) A vízigény-időfüggvény múltban megfigyelt szakaszának statisztikai extrapolálása — csak a vizsgált terület vízigény-időfüggvónyének és egyéb sajátosságainak a figyelembevételével, — a vizsgált terület, továbbá más, fejlettebb terűletek vízigóny-időfüggvényének és egyéb sajátosságainak a figyelembevételével. b) Jellemző népgazdasági paraméterek, így — a népesség száma, — a nemzeti jövedelem, — az energiaszükséglet és — egyéb paraméterek (pl. foglalkoztatottság, termelékenység, termelési érték, recirkuláció stb.) alapján történő vízigény-előrejelzés. Jelen tanulmányunk célja a (b) típusú hosszúidejű vízigény-előrejelzésre használható egyik legegyszerűbb módszer, a többváltozás lineáris regreszszió-analízis alkalmazhatóságának vizsgálata, illetve a vele kapcsolatos nehézségek, bizonytalanságok tárgyalása. 2. A többváltozós regresziós modellek elve A regressziós modellek alkalmazása az utóbbi időben, elsősorban a számítógépek általános hozzáférhetősége következtében, vált általánossá. Vízigény-előrejelzésre többnyire lineáris vagy log-lineáris modelleket alkalmaznak. A vízigényt a lineáris modellek különböző társadalmi, gazdasági és technológiai tényezők lineáris kombinációjaként, a log-lineáris modellek pedig e tényezők meghatározott hatványainak szorzataként fejezik ki. A vízigény-előrejelzésre használható log-lineáris regressziós modellek egyik legújabb példája a [6] vizsgálat, amely a világ mintegy 30 — a gazdasági fejlettség különböző fokozatait képviselő — ország adatai alapján a vízigény és a gazdasági növekedés • 1 Vízgazdálkodási Tudományos Kutató Intézet, Budapest. * Arizonai Egyetem, Tucson, Arizona, U.S.A. egyes mutatói közötti következő kapcsolatot állapította meg: Y= 2,66 • X° , 3° 5 • X°' 25 0 • X° 3' 06 9, (1) ahol Y az adott országban egy főre jutó vízkivétel (m 3/fő - év), X x az egy főre jutó bruttó nemzeti termelés (dollár/fő-év, 1971. évi piaci áron), X 2 a népesség száma (1000 fő), X 3 az öntözött terület és a művelt terület aránya (%). A többváltozós lineáris regressziós modell szerint az Y előrejelzett érték, illetve annak logaritmusa általában bizonyos számú Xj (j= 1,2,..., k) független változó, illetve azok logaritmusai lineáris kombinációjának és az sztochasztikus hibának (más elnevezéssel: zavaró tagnak) az összege: r = + + • • • +b kX k+e, (2a) vagy mátrix-jelöléssel: 7=Xb+e. (2b) Ha a modell bj paramétereinek becslése n észlelésből történik, ezt egy második index, i jelöli: Y i = bQ-\-biX 1i + b2X< íi+ . . . +bkX ki+Ei, (3a) ahol i= 1, 2,...., n. Ha a modellhez észlelési idősort használunk fel, akkor i-t rendszerint a t indexszel helyettesítjük. A bj regressziós együtthatók bj optimális értékeit a legkisebb négyzetek kritériuma alapján határozzuk meg, úgy, hogy az előrejelző egyenlet Yi = bo + biXii+b2X2i+...+b~kX k i (3b) lesz. A legkisebb négyzetes becslés a » 2 e?=e'e = (y-Xb)'(y-Xb) (4) » = 1 összeget minimálja, ahol a=Yi— Y{. A fenti egyenletből: b = (X'XHX'Y (5) (A ' jel a transzponált, a jel pedig az inverz mátrixot jelöli.) A becsült regressziós együtthatókra és a hozzájuk tartozó előrejelző függvényre vonatkozó statisztikai következtetések érdekében a zavaró tagra feltevéseket kell tennünk. A szokásos feltevések: E(e) = 0 (6) pq E(e'e) = o% (7) ahol E a várható érték és I az egységmátrix jele. E feltevések alapján bizonyítható, hogy -E(b) = b, (8)