Hidrológiai Közlöny 1978 (58. évfolyam)
6. szám - Dr. Bogárdi István–dr. Rétháti László–dr. Szidarovszki Ferenc: A statisztikai csoportosítás módszerének felhasználása a talajvízjárás jellemzésére
245 Hidrológiai Közlöny 1978. 5. sz. A statisztikai csoportosítás módszerének felhasználása a talaj vízjárás jellemzésére Dr. BOGÁRDl ISTVÁN* —Dr. RÉTHÁTI LÁSZLÓ** —Dr. SZIDAROVSZKY FERENC*** Bevezetés A tanulmány célja a statisztikai csoportosítás módszerének bemutatása és alkalmazása a) hasonló talajvízjárású helyek felkutatására, b) pontosabb előrejelzésre és c) megbízhatóbb statisztikai jellemzők becsléséhez. A változó talajvízszinthez fűződő döntési problémák közül néhány példát említünk. Az öntözés üzemét ós szükségességét befolyásolhatja a talajvízszint magassága. A magas talajvízszint veszélyezteti a felszín alatti tereket, növeli a szivattyútelepek üzemköltségét és nehezíti a felszín alatti építési munkát. A talajvízszint figyelembevétele felmerül alapozások tervezésénél és munkagödrök víztelenítésénél is; agresszív talajvíz esetén különösen lényeges a lehetséges ingadozás előzetes meghatározása. Ebből a néhány példából is látható, hogy a talaj vízjárás ismeretéhez és az előrejelzéshez jelentős gazdasági érdekek fűződnek, a helytelen és pontatlan méretezés károkat és többletköltségeket okoz. Hazánkban a talajvízjárás törvényszerűségeit számos korábbi kutatás elemezte [8, 9, 12]. Mivel a vízutánpótlódás elsősorban a csapadékból származik, a véletlen elemeket tartalmazó csapadék input miatt a talajvízjárás is jellemezhető statisztikai módszerekkel [11, 13], figyelembe véve természetesen a trendet és a periodicitást. A talajvízjárás előrejelzésére számos kísérlet történt, részben statisztikai [13], részben hidrológiai módszerekkel [6]. Ebben a tanulmányban a statisztikai előrejelzéssel foglalkozunk, amely a korábbi időszakok információja alapján ad becslést a következő időszakban várható értékre. A talaj vízjárás valószínűségi jellemzéséhez és a statisztikai előrejelzéshez egyaránt adatok szükségesek. Ezek lehetnek közvetlen észlelések vagy a talajvízjárás hidraulikai számításokkal megállapított szimulált adatai. Ez utóbbi — származtatott — adatokat hosszú időszakra és nagyobb területre ma még igen bonyolult számítani, különösen a talaj vízjárást befolyásoló talajfizikai jellemzők (pl. a szivárgási tényező és ennek területi általánosítása) bizonytalanságai miatt [7]. A talaj vízjárást számos helyen figyelik észlelő kutakkal, de igen gyakran felmerül a nehézség, hogy a kérdéses helyen egyáltalán nincs vagy csak rövid időszakra vonatkozó észlelés van, vagy mesterséges hatások (pl. vízkivétel) miatt zavart idősor áll rendelkezésre [10]. tgy önkéntelenül felmerül a lehetőség, hogy a számos más helyen észlelt talaj vízjárásból vonjunk le következtetéseket a kérdéses helyre vonatkozóan. *Bányászati Kutató Intézet **Földmórő és Talajvizsgáló Vállalat ***Kertészeti Egyetem Nyilvánvaló, hogy csupán a hasonlóan viselkedő régiók információját lehet egymással összevetni. Ha adott helyen kevés adatból kell döntést hoznunk, ebből jelentős gazdasági kár származik, melynek várható értéke számítható; az információ mennyiségét növelve ez a gazdasági kár csökkenthető és a csökkenés mértéke is becsülhető [16]. Az adott helyen rendelkezésre álló információ növelésének egyik lehetősége a tanulmányunkban bemutatott statisztikai csoportosítási módszer, az ún. cluster analízis. A következőkben ismertetjük az eljárást, majd gyakorlati példák segítségével bemutatjuk alkalmazását a talajvízjárás szempontjából statisztikailag hasonló kutak megállapítására és a pontosabb előrejelzésre. Utalunk végül arra, hogy az információ többletet hogyan lehet hasznosítani az alapozás és a felszín alatti terek (pincék, föld alatti garázsok stb.) tervezésekor. 1. A statisztikai csoportosítás módszere A statisztikai csoportosítás (cluster analízis) ismert matematikai módszer [4]. A talaj vízjárásra való alkalmazását azonban csupán a közelmúltban mutatta be Yakowitz a Vízgazdálkodási Intézet és az Arizonai Egyetem közös kutatási programja keretében [18]. A módszer segítségével tulajdonképpen három féle feladatot lehet megoldani: — csoportosíthatók a statisztikailag hasonlóan viselkedő talaj víz járási helyek; — az összevont statisztikai adatokból pontosabb valószínűségek becsülhetők; — megbízhatóbb előrejelzés készíthető. A következőkben ismertetjük a módszer lényegét, de néhány matematikai részletet is közlünk a függelékben. Jelölje I az idősorok számát és tegyük fel, hogy valamennyi idősor azonosan T hosszúságú. Jelölje az Xi vektor az i-edik idősort: Xi—{Xii, X 2i, .. .x T i) T, ahol az x vektor-elemek jelenthetik a havi vagy évi átlagokat, a sokévi KÖV-től való eltérést stb. Feltételezzük, hogy a vizsgált terület (ahonnan az adatsorok származnak) földrajzilag olyan régiókra bontható, hogy az egy régión belüli idősorok statisztikailag homogénnak tekinthetők. Más szavakkal, ha Xi és Xj azonos régióhoz tartozó idősor, TT akkor az (x 2, x } ) 2T hosszúságú vektor egy homogén idősornak tekinthető. Ez azt jelenti, hogy az egyes régiók idősorainak azonos eloszlás típus és paraméterek feleltethetők meg. Az egyáltalán nem várható, hogy pontosan azonos paraméterekkel rendelkező idősorokat sikerül kiválasztanunk, így a régiókra való bontás olyan szempont szerint történik, hogy az egymáshoz statisztikailag ,,legkö-