Hidrológiai Közlöny 2006 (86. évfolyam)

4. szám - Szűcs Péter–Tóth Andrea–Virág Margit: A leggyakoribb érték (MFV) módszerének alkalmazása a hidrogeológiai modellezésben

SZŰCS P. - TÓTH A. - VIRÁG M.: A leggyakoribb értékmódszerének alkalmazása 31 A leggyakoribb érték módszere (MFV) Az optimalizálási módszeren kívül, a cél- vagy hiba­függvénynek szintén nagy szerepe van a hidrogeológiai inverzió vagy a hidrodinamikai és transzport modellezés során a modellparaméterek számításában. Az alkalma­zott statisztikai norma meghatározza az optimalizálás ha­tékonyságát egy adott hibaeloszláshoz. Számos korábbi földtudományi alkalmazáson és példán keresztül bizo­nyítást nyert (Steiner 1972, Steiner 1988, Ferenczy et al 1990, Steiner és Hajagos 1994, Szűcs és Civan 1996), hogy a leggyakoribb érték elvének (MFV) alkalmazása számos előnyt nyújthat a hidrogeológiában, szemben a legkisebb négyzetes vagy egyéb hagyományos statiszti­kai módszerekkel. Ha a fentebb említett módon a mért és számított adatvektorok rendelkezésre állnak, akkor a kü­lönbségvektor elemeit a következőképpen definiálhatjuk: X i = d" esasure d -d. a > (10) Ezek után például egy általános hidrodinamikai mo­dellezési probléma optimalizációja a következőképpen definiálható. A mért és számított vízszintek különbségé­nek normája minimum kell, hogy legyen. A legtöbb eset­ben a legkisebb négyzetek elvét alkalmazzák. A klasszi­kus statisztika a normál eloszlás elvén alapul, amely ma­tematikailag könnyen definiálható az Xj különbségvek­torral: az a modell paraméter vektor a legjobb, amely tel­jesíti az alábbi feltételt: : minimum (11) Habár ez a minimumfeltétel igen elterjedt, számos hátrá­nya van a hatékonyság és rezisztencia vonatkozásában. Stei­ner (1965) vezette be a maximum reciprokok elvét a Mis­kolci Egyetemen. Az elv esetén az a modellparaméter vek­tor tekinthető legjobbnak, amely az alábbi feltételt teljesíti: ND i V í = maximum (12) i^Xf+S 2 ahol az S skála paraméter jellemzi a mérési hibát. Ha összevetjük a fentebb definiált elveket, akkor nyilvánva­ló, hogy a (11) egyenlet a kieső adatokra igen érzékeny. Ha egy, vagy több Xj nagy mérési hibával terhelt, ez a körülmény bizonyos esetekben teljesen a valóságtól elté­rő, félrevezető eredményhez vezethet. Ezzel szemben a (12) kifejezés értéke csak elhanyagolható mértékben vál­tozik nagyon nagy Xj különbég előfordulásakor. Ezt a tu­lajdonságot rezisztenciának nevezzük. Tehát a legkisebb négyzetek elve nem tekinthető rezisztensnek, míg a (12) egyenlettel egy rezisztens statisztikai eljárást kapunk. A maximális reciprok összeg módszerét alkalmazva a Steiner Ferenc által vezetett geostatisztikai kutatócsoport kifejlesztette a leggyakoribb érték (MFV) eljárást (Stei­ner 1988 és 1990, Hajagos és Steiner 1991, Steiner (ed) 1991 és 1997). Egy statisztikai módszert akkor nevezhe­tünk "MFV" eljárásnak, ha az Xj eltéréseknek leggyak­rabban kicsi (vagy közel nulla) értékei vannak. A (12) e­gyenlet feltétele biztosítja, hogy az Xj különbségek döntő többsége a lehető legkisebb legyen (nem számít, hogy közben néhány Xj érték nagyon nagy). Következéskép­pen olyan statisztikai eljárások, amelyek a (12) egyenlet­ből származnak, MFV módszemek nevezhetők. Bebizo­nyítható, hogy a következő feltétel eredménye szintén az MFV eljárásba sorolható: ND ~[(Xf +S 2) = minimum. (13) Egyetlen ismeretlen esetén, például ha a helyparamé­tert (T) kívánjuk meghatározni, mind a (12), mind a (13) egyenlet valóban a "leggyakoribb értéket" adja olyan vo­natkozásban, hogy a d™ asure á mért értékek a T környeze­tében fordulnak elő leggyakrabban. (Ebben az esetben £ ^ measured Fy E témakörben megjelent legutóbbi könyv szerzői (Steiner (ed) 1997) az MFV eljárást "modern statisztikai módszereknek" hívják. Az biztos, hogy a "modern" jelző nem adja vissza hűen a közel négy évtized azon időtarta­mát, amelyen keresztül a kutatások és a módszer kifej­lesztése folyt az MFV algoritmus megszületésétől kezd­ve (Steiner 1965). Sajnos csak kevés szakember tudja valójában mit jelent az MFV módszer. A klasszikus sta­tisztika vezető szerepe még napjainkban is talán magya­rázható annak a régi dogmának az elfogadásával, hogy "a hibák eloszlása mindig normális" (Steiner and Haja­gos 1995). Szűcs (1994) bemutatta, hogy milyen félreve­zető lehet a szakemberek részére, ha olyan statisztikai próbákat használnak, mint például a a ^ 2-próba. A Monte Carlo szimulációk bebizonyították, hogy a / 2-teszt nem ajánlható a gyakorlatban előforduló földtudományi el­oszlások normalitás vizsgálatára. Még ha a minták elég­gé különböznek is a Gauss eloszlástól, a^ 2-teszt elfogad­ja, mint normális eloszlásút a leggyakrabban alkalmazott magas szignifikancia szinteken. Ennek eredményként, a­mikor / 2-tesztet alkalmazunk, a Gauss anyaeloszlás lát­szólag domináns jelenléte hozzájárulhat a hagyományos (nem robusztus és rezisztens) statisztikai algoritmusok túléléséhez. Feltételezve a mérések normális eloszlását, a klasszikus becslések a „maximum likelihood" elvén ala­pulnak. Az MFV algoritmus egy teljesen más elvi meg­közelítést követ. Az MFV módszer az I- divergencia mi­nimalizálásának elérésére törekszik (Steiner (ed) 1997). Az I- divergenciát relatív entrópiának vagy információ­veszteségnek is nevezhetjük. A klasszikus L p normák helyett, az ún. P k normákat definiálhatjuk a leggyakoribb érték módszerén alapulva ((6) egyenlet): PK = £ n i+ (d: measured jcal \2 -dry (ke dr sure d f (14) Egyetlen ismeretlen esetén, azaz, ha a helyparamétert (T) kell meghatározni, a következő dupla iterációs for­mula használható a T és az £ számítására: ND T = ±!_ (15) ahol a súlyok Wj(Xj) és a dihézió a következőképp szá­mítható:

Next

/
Thumbnails
Contents