Hidrológiai Közlöny 1978 (58. évfolyam)
6. szám - Dr. Bogárdi István–dr. Rétháti László–dr. Szidarovszki Ferenc: A statisztikai csoportosítás módszerének felhasználása a talajvízjárás jellemzésére
Dr. Bogárdi I.— Dr. Rétháti L.— Dr. Szidarovszky F.: A statisztikai csop. Hidrológiai Közlöny 1978. 6. sz. 249 2. táblázol Előrejelzési együtthatók és az előrejelzés hibája a 951. sz. kútra Taő/i. 2. KoscßcßuifueHmbi npozno3a u ornuöKa npoeno3a dnn aceaJKUHbi K) 951 Tabelle 2. Vorhersage Koeffizienten und der Fehler der Vorhersage für den Brunnen Nr. 951 Clusterok száma Kutak száma Együtthatók S Hiba [cm] Clusterok száma Kutak száma ao «1 a2 S Hiba [cm] 25 1 —1,5201 —0,4383 0,2057 39,4984 19 3 —0,6993 —0,2836 0,1075 35,4676 16 3 1,1724 —0,0885 0,1087 35,3436 10 4 —1,5350 —0,3301 0,0798 38,2934 8 6 —1,2925 —0,3303 0,0429 37,3726 6 6 1,5637 —0,1293 0,0326 28,2902 5 7 —1,1046 —0,2088 —0,0393 40,5720 4 8 1,1266 —0,0652 —0,0553 34,0086 3 13 0,2880 —0,1774 —0,0134 35,5117 2 21 0,2061 —0,1660 0,0378 40,2262 3 <> 5 6 T 8 9 10 11 12 13 % 15 K 17 18 19 20 11 21 23 Ä 25 Clustered száma 3. ábra. Az előrejelzés hibájának változása a clusterok számával a 951. sz. kút esetén Puc. 3. H3MEHEHUE OUÍUGKU NP0ZH03A e 3aeucuMocmu om lucAa KAwemepoe ÖAH ciceayicuHbi 951 Abb. 3. Änderung der Vorhersagefehler mit der ClusterZahl im Falle des Brunnens Nr. 951 mét növekszik. Érdekes, hogy csoportosítás nélkül, illetve két nagy csoport esetén közel egyenlő az előrejelzés hibája. A legkisebb átlagos hibát n = 6 cluster esetén kaptuk, amikor m= 6 hasonlóan viselkedő kút észleléseit kezeltük együttesen, az előzőekben leírt módon. A szélsőérték-keresés gondolatát az vetette fel, hogy a hiányos idősorú (háborús) évek KÖV-einek számítása akkor a legpontosabb, ha a hiánytalan évek meghatározott számú hónapjait vonjuk be a korrelációs kapcsolatok felállításába [14]. 2.3 A bővített adatsor hasznosítása tervezés esetén A bevezetőben felsorolt néhány példa mutatja, hogy a talajvízjárás véletlen jellegű eseményei számos tervezési feladatban jelentős szerepet játszanak. Bármelyik esetről is van szó, az észlelésekből különböző valószínűséggel várható talajvízjárási jellemzőket kell megállapítani (pl. az éves talajvízszint változást vagy adott szint feletti magasságot). Alapozások vagy más mélyépítmények kialakítását természetesen az is befolyásolja, hogy milyen valószínűséggel várható káros magas talajvízjárás, különösen agresszív víz esetén. A talajvízszint emelkedés által okozott károk és az ezek leküzdéséhez szükséges többletköltségek, valamint a talajvízjárás statisztikai jellemzése alapján ki lehet választani a gazdasági szempontból legcélszerűbb műszaki megoldást [1]. Az optimális érték azonban bizonytalan, ha a talajvízjárás statisztikai jellemzését rövid adatsor alapján hajtottuk végre. Amennyiben az adott helyen rendelkezésre álló viszonylag rövid adatsort a statisztikai csoportosításnak ebben a tanulmányban bemutatott módszerével kibővítjük, az optimum megbízhatóbb lesz, ami sokmillió forintos megtakarítást eredményezhet. Ennek számszerű megállapításával egy következő tanulmányban foglalkozunk. Függelék Könnyen belátható, hogy a dy mennyiségek valóban eleget tesznek a távolság, vagy más szóval a metrika szokásos tulajdonságainak (pl. 15, 100—101. oldal): (t>) (P) a) dij sO és dij =0, akkor és csak akkor, amikor xi = xj, vagyis a két idősor megegyezik, (v) (p) b) dij —dji, azaz a távolság kölcsönös, vagyis az egyiknek másiktól való távolsága megegyezik a másodiknak az elsőtől való távolságával; c) tetszőleges i, j, k adatsorok esetén dij =s di/c + díj , ami annak az egyszerű geometriai ténynek az általánosítása, miszerint két pont között a legrövidebb út az egyenes szakasz, azaz a távolságuk. E legutóbbi tulajdonságot a matematikai irodalomban háromszög egyenlőtlenség néven is szokták emlegetni. Az a) ós b) tulajdonság fennállása nyilvánvaló, a c) tulajdonság a Minkowski egyenlőtlenségből ([2], 583. oldal) közvetlenül leolvasható. Megjegyezzük, hogy idősorok (vektorok) távolságának mérésére a mennyiségnél lényegesen általánosabb formák is bevezethetők, ezzel itt azonban részletesen nem foglalkozunk. Jelölje I az idősorok számát, valamint M a meghatározandó clusterok számát. A feladat matematikailag a következőképpen fogalmazható meg. Határozzuk meg az {1. 2. . . ., I—1,1) egészeknek egy olyan G L T 0 2 GM particíóját, amely eleget tesz az M U Gí={l,2, ...,1-1,1} »=1 GI*& «=1, 2 M) Gi n Gj=& feltételeknek (ahol 0 az üres halmazt jelöli) és amelyre a M W = <=1 jíOikíOi M j <F1 ) mennyiség minimumot vesz fel, ahol n(G{) a Gí halmaz elemeinek a száma ós h valamilyen, a [0, intervallumon szigorúan monoton növekvő függvény. Az optimális G l t G G M cluster — felbontás természetesen függ a djp metrikában szereplő p konstans és a célfüggvényben szereplő h függvény megválasztásától. Az (FI) célfüggvény minimalizálása elvileg nem okoz nehézséget, hiszen az 1, 2, . . ., I—1, I számok, M nem üres részhalmazba való csoportosításának száma véges, ós kimutatható, hogy értéke az /