Hidrológiai Közlöny 2006 (86. évfolyam)
4. szám - Szűcs Péter–Tóth Andrea–Virág Margit: A leggyakoribb érték (MFV) módszerének alkalmazása a hidrogeológiai modellezésben
32 HIDROLÓGIAI KÖZLÖNY 2006. 86. ÉVF. 4. SZ. (kef e 2 = (ke) 2 + (X t -T) 2 ND 3Y J(X i-T) 2(fV i(X i)) 2 (16) (17) Zmx,)) 2 Emellett az is bizonyított, hogy az MFV eljárás nem csak rezisztens, hanem robusztus is. A robusztusságot általában kvalitatív értelemben használják: egy statisztikai eljárás hatékonysága nem túl érzékeny az eloszlástípus megváltozására. A T becslésének véges aszimptotikus szórásnégyzete van, azaz a nagy számok törvénye mindig teljesül a leggyakoribb érték számításaira. A legkisebb négyzetek módszere nem teljesíti ezt a törvényt, ha például a hiba eloszlása Cauchy típusú (Steiner (ed) 1991, 1997). Steiner (ed) (1991, 1997) bebizonyította, hogy a médián elvén alapuló L,-m0dszer az összes lehetséges földtudományi hibaeloszlást figyelembe véve 50,1 % hatásfokú, ami sokkal több, mint a klasszikus statisztikai módszerek (az L 2 normán alapuló) hatásfoka, amely nem több mint 7.8 %. Az MFV-módszerek statisztikai hatásfoka jelentősen nagyobb, mint az L r vagy L 2eljárásoké. A P k normák hatásfoka több mint 90 %. Ezek után érdemes részletesebben beszélni az MFV eljárás magas statisztikai hatásfokáról. Elméletileg egy statisztikai eljárás hatásfokának a legpontosabb definíciója a következő (Dutter 1987): Statisztikai hatásfok = 100 (kinyert információ /összes információ) % (18) Az nem kérdéses, hogy ez a definíció adja vissza a valódi tartalmát a statisztikai hatásfoknak, de szükségünk van egy a gyakorlatban használható definícióra ennek a fontos mennyiségnek a numerikus számítására (Hajagos és Steiner 1995). A következő formula kielégíti ezt a kívánalmat: e = 100 (minimális aszimptotikus szórásnégyzet/aszimptotikus szórásnégyzet) % (19) A nevező számítható az aktuális alkalmazott statisztikai eljárásra. A számláló az ún. Cramer-Rao határ, amely szinte minden matematikai statisztikai kézikönyvben megtalálható. A Cramer- Rao határ () az f a szupermodell adott paraméterére a következő szerint számítható (Steiner (Ed) 1997): (20) a(a-1) Steiner (Ed) (1997) szintén levezette az aszimptotikus szórásnégyzet értékét a legkisebb négyzetek és az MFV eljárásra. Ismerve ezeket az összefüggéseket, a hatásfok a legkisebb négyzetek és az MFV eljárásra szintén levezethető, ha az aktuális hibaeloszlás az f a szupermodell családból származik. Mint azt korábban említettük, az f a szupermodell a valós földtudományi adatok és hibaeloszlások igen széles tartományát képes reprezentálni az "a" szupermodell paraméter változtatásával (Gausstól Cauchy típusig). (a + 2)(a - 3) e(MFV) = a(a -1) (a+ 2) a{a-\)A 2 MF V (21) (22) A 2. ábra ezeket a hatásfokokat mutatja a t = l/(a-l) függvényében. Ez az egyszerű paraméter transzformáció előnyös, mert míg "a" értéke 2-től co -ig változik, addig a "t" értéke 0 és 1 között marad. A transzformált t értéket felhordva az abszcisszára, a 2. ábra világosan megmutatja, mit is jelent a robusztusság valójában. A legkisebb négyzetek módszere 100 % hatásfokkal működik Gauss hibaeloszlás esetén. Ez nem csoda, hiszen a legkisebb négyzetes becslés Gauss hibaeloszlás esetére lett kidolgozva. Ezt követően azonban a hatásfok élesen csökken nulláig, ha különböző súlyosabb szárnyakkal bíró eloszlásunk van. Ez az oka, miért oly veszélyes a legkisebb négyzetek elvének alkalmazása bármely eloszlásra. Ezzel a viselkedéssel szemben, az MFV módszer igen nagy hatásfokot (> 90 %) ad, függetlenül az eloszlás típusától. Az MFV módszer a legjobb becslés a geostatisztikai eloszlásra (a = 5), ahol a hatásfok értéke 100 %. A bemutatott hatásfok értékek alapján az MFV módszer robusztus jellege vitathatatlan. Alkalmazás szintetikus és terepi problémákban Az MFV módszer alkalmazása igen széleskörű lehet a hidrogeológiában, illetve a hidrodinamikai és transzport modellezés területein. Különböző minimalizálandó kifejezések, célfüggvények, helyparaméterek és hibaparaméterek, sőt még regresszióanalízis is definiálható az MFV módszer használatával a hidrogeológia különböző problémáiban. A 3. ábra példát mutat be egyszerű lineáris illesztésre. Egy hidrogeológiai vizsgálat keretében két különböző kútban történt vízszintmérés, ahol erős korreláció van a vízszintek között a beszürőzött rétegek közötti hidraulikus kapcsolat miatt. Ez a jelenség nagyon gyakran előfordul az üledékes rendszerek esetében, ahol az egyes vízadó rétegek között átszivárgás lép fel. A vízszintek között fennálló erős kapcsolatot az általánosított és robusztifikált korrelációs tényező szintén megadta (Steiner (Ed) 1997). A hagyományos lineáris korrelációs tényező csak gyenge kapcsolatot mutatott a kieső adatok miatt. A 3. ábra jól szemlélteti, hogy milyen erősen befolyásolja néhány kieső adat (ami jelen esetben emberi tévedés eredménye volt) a legkisebb négyzetek elvén alapuló lineáris kapcsolatot. Ezzel szemben az MFV módszer elhanyagolja a kieső adatokat és a valós lineáris fizikai korrelációt szolgáltatja. 100 • 90 80 70 60 £ 40 30 20 10 0.2 0.8 0.4 0.6 t = 1 /(a-1) 2. ábra. A hatásfok görbéje a legkisebb négyzetek és az MFV módszerre az f a(X) szupermodell család esetén