Hidrológiai Közlöny 2006 (86. évfolyam)
4. szám - Szűcs Péter–Tóth Andrea–Virág Margit: A leggyakoribb érték (MFV) módszerének alkalmazása a hidrogeológiai modellezésben
SZŰCS P. - TÓTH A. - VIRÁG M.: A leggyakoribb értékmódszerének alkalmazása 31 A leggyakoribb érték módszere (MFV) Az optimalizálási módszeren kívül, a cél- vagy hibafüggvénynek szintén nagy szerepe van a hidrogeológiai inverzió vagy a hidrodinamikai és transzport modellezés során a modellparaméterek számításában. Az alkalmazott statisztikai norma meghatározza az optimalizálás hatékonyságát egy adott hibaeloszláshoz. Számos korábbi földtudományi alkalmazáson és példán keresztül bizonyítást nyert (Steiner 1972, Steiner 1988, Ferenczy et al 1990, Steiner és Hajagos 1994, Szűcs és Civan 1996), hogy a leggyakoribb érték elvének (MFV) alkalmazása számos előnyt nyújthat a hidrogeológiában, szemben a legkisebb négyzetes vagy egyéb hagyományos statisztikai módszerekkel. Ha a fentebb említett módon a mért és számított adatvektorok rendelkezésre állnak, akkor a különbségvektor elemeit a következőképpen definiálhatjuk: X i = d" esasure d -d. a > (10) Ezek után például egy általános hidrodinamikai modellezési probléma optimalizációja a következőképpen definiálható. A mért és számított vízszintek különbségének normája minimum kell, hogy legyen. A legtöbb esetben a legkisebb négyzetek elvét alkalmazzák. A klasszikus statisztika a normál eloszlás elvén alapul, amely matematikailag könnyen definiálható az Xj különbségvektorral: az a modell paraméter vektor a legjobb, amely teljesíti az alábbi feltételt: : minimum (11) Habár ez a minimumfeltétel igen elterjedt, számos hátránya van a hatékonyság és rezisztencia vonatkozásában. Steiner (1965) vezette be a maximum reciprokok elvét a Miskolci Egyetemen. Az elv esetén az a modellparaméter vektor tekinthető legjobbnak, amely az alábbi feltételt teljesíti: ND i V í = maximum (12) i^Xf+S 2 ahol az S skála paraméter jellemzi a mérési hibát. Ha összevetjük a fentebb definiált elveket, akkor nyilvánvaló, hogy a (11) egyenlet a kieső adatokra igen érzékeny. Ha egy, vagy több Xj nagy mérési hibával terhelt, ez a körülmény bizonyos esetekben teljesen a valóságtól eltérő, félrevezető eredményhez vezethet. Ezzel szemben a (12) kifejezés értéke csak elhanyagolható mértékben változik nagyon nagy Xj különbég előfordulásakor. Ezt a tulajdonságot rezisztenciának nevezzük. Tehát a legkisebb négyzetek elve nem tekinthető rezisztensnek, míg a (12) egyenlettel egy rezisztens statisztikai eljárást kapunk. A maximális reciprok összeg módszerét alkalmazva a Steiner Ferenc által vezetett geostatisztikai kutatócsoport kifejlesztette a leggyakoribb érték (MFV) eljárást (Steiner 1988 és 1990, Hajagos és Steiner 1991, Steiner (ed) 1991 és 1997). Egy statisztikai módszert akkor nevezhetünk "MFV" eljárásnak, ha az Xj eltéréseknek leggyakrabban kicsi (vagy közel nulla) értékei vannak. A (12) egyenlet feltétele biztosítja, hogy az Xj különbségek döntő többsége a lehető legkisebb legyen (nem számít, hogy közben néhány Xj érték nagyon nagy). Következésképpen olyan statisztikai eljárások, amelyek a (12) egyenletből származnak, MFV módszemek nevezhetők. Bebizonyítható, hogy a következő feltétel eredménye szintén az MFV eljárásba sorolható: ND ~[(Xf +S 2) = minimum. (13) Egyetlen ismeretlen esetén, például ha a helyparamétert (T) kívánjuk meghatározni, mind a (12), mind a (13) egyenlet valóban a "leggyakoribb értéket" adja olyan vonatkozásban, hogy a d™ asure á mért értékek a T környezetében fordulnak elő leggyakrabban. (Ebben az esetben £ ^ measured Fy E témakörben megjelent legutóbbi könyv szerzői (Steiner (ed) 1997) az MFV eljárást "modern statisztikai módszereknek" hívják. Az biztos, hogy a "modern" jelző nem adja vissza hűen a közel négy évtized azon időtartamát, amelyen keresztül a kutatások és a módszer kifejlesztése folyt az MFV algoritmus megszületésétől kezdve (Steiner 1965). Sajnos csak kevés szakember tudja valójában mit jelent az MFV módszer. A klasszikus statisztika vezető szerepe még napjainkban is talán magyarázható annak a régi dogmának az elfogadásával, hogy "a hibák eloszlása mindig normális" (Steiner and Hajagos 1995). Szűcs (1994) bemutatta, hogy milyen félrevezető lehet a szakemberek részére, ha olyan statisztikai próbákat használnak, mint például a a ^ 2-próba. A Monte Carlo szimulációk bebizonyították, hogy a / 2-teszt nem ajánlható a gyakorlatban előforduló földtudományi eloszlások normalitás vizsgálatára. Még ha a minták eléggé különböznek is a Gauss eloszlástól, a^ 2-teszt elfogadja, mint normális eloszlásút a leggyakrabban alkalmazott magas szignifikancia szinteken. Ennek eredményként, amikor / 2-tesztet alkalmazunk, a Gauss anyaeloszlás látszólag domináns jelenléte hozzájárulhat a hagyományos (nem robusztus és rezisztens) statisztikai algoritmusok túléléséhez. Feltételezve a mérések normális eloszlását, a klasszikus becslések a „maximum likelihood" elvén alapulnak. Az MFV algoritmus egy teljesen más elvi megközelítést követ. Az MFV módszer az I- divergencia minimalizálásának elérésére törekszik (Steiner (ed) 1997). Az I- divergenciát relatív entrópiának vagy információveszteségnek is nevezhetjük. A klasszikus L p normák helyett, az ún. P k normákat definiálhatjuk a leggyakoribb érték módszerén alapulva ((6) egyenlet): PK = £ n i+ (d: measured jcal \2 -dry (ke dr sure d f (14) Egyetlen ismeretlen esetén, azaz, ha a helyparamétert (T) kell meghatározni, a következő dupla iterációs formula használható a T és az £ számítására: ND T = ±!_ (15) ahol a súlyok Wj(Xj) és a dihézió a következőképp számítható: