Hidrológiai Közlöny 1978 (58. évfolyam)
6. szám - Dr. Bogárdi István–dr. Rétháti László–dr. Szidarovszki Ferenc: A statisztikai csoportosítás módszerének felhasználása a talajvízjárás jellemzésére
Dr. Bogárdi I.—Dr. Rétháti L.—Dr. Szidarovszky F.: A statisztikai csop. Hidrológiai Közlöny 1978. 6. sz. 247 A következőkben csak a hosszú idősorú kutakra végzett vizsgálatok eredményét ismertetjük. Az idősorok száma 7=24 volt (az.l. típusba 17, a 3. típusba 7 kút került a korábbi vizsgálatok szerint). A számítógép a kutakat először két, majd három, négy stb., végül 20 clusterba sorolta. (Megemlítjük, hogy a csoportosítás módszere nem ad lehetőséget arra, hogy a clusterek célszerű számát előzetesen kiválasszuk.) Az első három csoportosítás eredménye a következő volt: M 1=3, M 2= 21, M x= 3, M 2= 8, M 3 =13, M x= 2, M 2= 8, M 3 = 6, M 4 = S. A csoportosítási műveletet tovább folytatva, egyre jobban elkülönülnek egymástól a statisztikailag hasonló idősorok. Jól megfigyelhető ez a folyamat az 1. ábrán: négy cluster esetén az elkülönülés tisztább, reálisabb, mint három esetén, így pl. határozottabban kialakul egy É-i és egy ÉK-i kútcsoport. Ez a „területi átrendeződós" hasonlóképpen megy végbe, mint annál az eljárásnál, amelyet az ország tájegységekre való bontásakor követtünk [10]. Az első lépés itt először egy közelítő beosztás elkészítése volt. A négy tájegység határvonalai nem érintkeztek egymással, a közéjük eső kutak idősorának összehasonlító elemzése döntötte el, hogy hidrológiai paramétereiket tekintve a két szomszédos tájegység melyikébe sorolhatók. Az 1. ábrán érzékeltetett clusterokba-sorolással és a clusterok hidrológiai jellemzőinek meghatározásával a további számításokhoz (2.3. fejezet) szükséges adatokat már tulajdonképpen megadtuk. Érdekes lesz mégis megvizsgálnunk, mennyire szoros az egyes kutak közötti statisztikai hasonlóság. Erre a célra vezessük be az affinitási index fogalmát. Számszerű értékét (A) úgy kapjuk meg, hogy megszámoljuk, hány másik kúttal volt a vizsgált kút azonos clusterban a 2, 3, . . ., 19 clusterra való bontás során, majd ezeket a számokat összeadjuk. Az erre vonatkozó számítások eredményét az 1. táblázat tünteti fel. A 25. sz. kutat vizsgálva pl. azt látjuk, hogy nyolcszor volt a 64. sz. kúttal azonos clusterban, egyszer a 255. sz. kúttal és így tovább; a vízszintes sorban (vagy a függőleges oszlopban) látható számokat összeadva A = 64-et kapunk az affinitási index számszerű értékére. Az egyes kutakra kiadódó A-értékek az 1b ábrán láthatók. A számok területi eloszlása önmagában véve is érdekes, még szemléletesebb képet kapunk azonban, ha az affinitási index összetevőit, vagyis két-két egymásnak megfelelő Ai^-értékeit vizsgáljuk. Az 1. táblázatban megkeresve a 11 és ennél nagyobb ^4 ^-értékeket, grafikusan is érzékeltetni tudjuk a kutak között fennálló hidrológiaistatisztikai kapcsolatokat. Az ezt bemutató 2. ábrán jól látható, miként különülnek el a 2—4 kutat összefogó csoportok, valamint azt, hogy milyen (rendszerint igen gyenge) kapcsolat fűzi össze a szomszédos csoportokat. Megvizsgáltuk azt is, alkalmas-e a cluster módszer az idősorok homogenitásának kimutatására. Erre a célra a hosszú idősorú és minden kúttípust magában foglaló számítási rendszert használtuk fel. Mivel a rendellenesen emelkedő vagy süllyedő idősorú kutak viselkedése egymáshoz viszonyítva igen eltérő, a zavartalan vízjárású 2. ábra. A közelebbi kapcsolatban álló kútpárokat, ill. -csoportokat jellemző affinitási indexek Puc. 2. Hndeiccbi a00uiiumema, xapaicmepHbie ÖASI nap u epynn CKeaMun, uax0dnii{uxai e 6AÜ3KOÜ cen3U Abb. 2. Die in näherer Beziehung stehenden Brunnenreihen bzw. Brunnen gruppén charakterisierenden Affinitäts-Indexe kutak viselkedése pedig hasonló, joggal várhattuk, hogy a cluster módszer erre érzékeny, ós a megfelelő szelekciót elvégzi. Ezzel szemben azt a meglepő eredményt kaptuk, hogy az 1. típusú kutakra A = 93, a 2. típusúakra A = 108, a 3. típusúakra pedig A = 98, a cluster módszer tehát nem alkalmas a homogenitás vizsgálatára. 2.2. A talajvízjárás előrejelzése A statisztikai jellegű előrejelzés (például a következő évben várható talajvízszint változásra) akkor lehetséges, ha az egymást követő adatok statisztikailag nem függetlenek. Korábbi hazai vizsgálatok [13] és a külföldi eredmények [18] azt mutatják, hogy az éves talaj víz járási adatok között szériális korreláció áll fenn. A rövidebb időszakra vonatkozó adatok, pl. az évszakos vagy havi talajvízjárás természetesen még kevésbé független egymástól. Nyilvánvaló, hogy az előrejelzés megbízhatóbb, ha a szériális korrelációt több adatból számítjuk. Ugyanakkor, ha egy clusterba túl sok kút adatát igyekszünk bevonni, a statisztikai jellemzők viszonylag nagyobb inhomogenitása miatt az előrejelzés hibája növekszik. Ezzel szemben az egyetlen kútra rendelkezésre álló adatsor ugyan egyöntetű, de gyakran túl rövid, így az előrejelzés hibája várhatóan ismét nagyobb lesz. Fentiek alapján arra következtethetünk, hogy az előrejelzés hibája az egy-egy clusterhoz tartozó kutak számával minimumgörbe szerint változik. Nézzük meg, hogy a gyakorlati adatok mennyiben igazolják ezeket a következtetéseket. Az előző fejezetben láttuk, hogy a statisztikai csoportosítást — többek között — 25 alföldi VITUKI észlelő kútra készítettük el. Mindegyik kútra 34 év észlelési adata áll rendelkezésre; ez a