Hidrológiai Közlöny 2006 (86. évfolyam)
4. szám - Szűcs Péter–Tóth Andrea–Virág Margit: A leggyakoribb érték (MFV) módszerének alkalmazása a hidrogeológiai modellezésben
29 A leggyakoribb érték (MFV) módszerének alkalmazása a hidrogeológiai modellezésben Szűcs Péter 1, Tóth Andrea' és Virág Margit 2 'Hidrogeológiai-Mérnökgeológiai Tanszék, Miskolci Egyetem, 3515. Miskolc-Egyetemváros, 2VIZITERV Environ Kft., 4400. Nyíregyháza, Jósa A. u. 5. Kivonat: A cikk bemutatja a robusztus és rezisztens tulajdonságokkal rendelkező leggyakoribb érték (MFV) módszerének alkalmazását a hidrogeológiai modellezésben. Az MFV módszer az információveszteség, vagyis az I-divergencia minimalizálásának elméletére épül. A leggyakoribb érték módszere és a globális minimumhely keresés együttes alkalmazása igen eredményes eszköz a hidrodinamikai és transzport modellezés területén. A bemutatott esettanulmányok felhívják a figyelmet a leggyakoribb érték módszerének alkalmazhatóságára és előnyeire a hagyományos statisztikai algoritmusokkal szemben. Kulcsszavak: leggyakoribb érték módszere, hidrogeológia, modellezés. Bevezetés A leggyakoribb érték (angolul „Most Frequent Value", MFV eljárás) módszerét (Steiner (ed) 1991, 1997) a Miskolci Egyetem Geofizikai Tanszékén dolgozták ki. Dr. Steiner Ferenc professzor úr által vezetett kutatócsoport dolgozta ki az elméleti hátterét ennek az igen robusztus és hatékony geostatisztikai eljárásnak mintegy 30 éve. Ma már a eljárást széles körben sikerrel alkalmazzák különböző földtudományi problémák megoldására. A leggyakoribb érték módszer elve az információ veszteség (I-divergencia) minimalizálásából ered. Az MFV módszemek jelentős előnyei vannak a „maximum likelihood" elvből kiinduló klasszikus statisztikai módszerekkel szemben. Az MFV algoritmus és a globális optimailizáció együttes alkalmazása egy hatékony új eszköz lehet a hidrogeológia, illetve a vízföldtani modellezés inverz feladatainak megoldásában (Szűcs et al. 2006). A javasolt új eljárás alkalmazhatóságát és előnyeit szintetikus és valós adatrendszerek felhasználásával mutatjuk be. A különböző típusú vízföldtani modellezés egyik fő célja egy olyan jól működő modell felállítása, ami a hidrogeológiai megfigyeléseket kellő mértékben visszaadja. Matematikai megközelítésből optimalizációt végzünk, hogy megtaláljuk a megoldást (Lee 1999). Ez alapján a hidrogeológiai modell paramétereinek az optimális értékét határozzuk meg az inverz módszerrel. Az inverz folyamat során egy speciális hibafiiggvényt, vagy más néven egy célfüggvényt minimalizálunk, ami a különbséget vagy eltérést jellemzi a mért és a modellparaméterekkel számított adatok között. Földtudományi alkalmazásokban a célfüggvénynek általában számos minimuma és maximuma van a többdimenziós paramétertérben. A klasszikus, ún. lokális minimumhely kereső algoritmusok sokszor elakadnak valamelyik lokális minimumban, ahelyett hogy megtalálnák a globális minimumot. (Sen and Stoffa 1995). A globális optimalizációs módszerek alkalmazása éppen ezért lehetne széleskörű a különböző hidrogeológiai problémák megoldásában. Legtöbb esetben a globális optimalizációs módszerek Monte Carlo becslésen alapulnak. A genetikus algoritmus mellett (GA), a Simulated Annealing (SA) globális optimalizáció az egyik legelterjedtebben alkalmazott minimalizálási eljárás a földtudományi és a mérnöki gyakorlatban. Az SA algoritmus könnyen programozható, és ma már még az ismeretlen paraméterek nagy száma esetén is kellően gyors. A modell paramétereknek bizonyos értékeket adva a számított vagy teoretikusan mért adatokat származtatunk. Ez képezi a direkt problémát. A direkt feladat megoldása szolgáltatja a matematikai kapcsolatot a modell paraméterek és a számított vagy szimulált adatok között. A pontos direkt feladat megoldás alapvető fontosságú egy hatékony inverz algoritmushoz. Numerikus módszerek alkalmazása nagy szerepet kap a kívánt pontosságú direkt feladat számításban. A direkt és inverz feladatok mellett, az alkalmazott statisztikai vagy geostatisztikai elv szintén kulcstényező a sikeres modellezésben, mivel az optimalizálandó célfüggvény különböző statisztikai normákon alapul. Sajnos a régi dogma még mindig erősen tarja magát még a gyakorló szakemberek között is, miszerint a mérési hibák közelítőleg normál (Gauss) eloszlásúak (Huber 1981). Ennek köszönhető, hogy a maximum likelihood becslésen alapuló legkisebb négyzetek elvének alkalmazása a földtudományokban is igen széleskörűen alkalmazott. Ezeknek a klasszikus algoritmusoknak a hatékonysága azonban kérdéses, amikor a hiba nem Gauss eloszlású. Az inverz feladat a hidrogeológiai modellezésben A vízbázis-védelmi programokban vagy egyéb területeken alkalmazott hidrogeológiai inverz feladat során egy szintetikus adathalmazt állítunk elő az előzetesen felvett modellparaméterek segítségével. Az így számított adatokat hasonlítjuk össze a mért adatokkal. Amennyiben az illeszkedés mértékét elfogadhatónak találjuk, az aktuális modellparamétereket megoldásként fogadjuk el. Ellenkező esetben, a modell paramétereket módosítjuk, hogy egy új számított adathalmazt állítsunk elő. Ezt követően az illesztést újra végrehajtjuk. Az egész procedúra így folytatódik, míg a mért és számított adatok közötti illeszkedés kielégítő nem lesz. Ilyen szempontból tehát az inverz feladat optimalizálástjelent. A célfüggvény értéke az alkalmazott inverz módszer megbízhatóságáról és pontosságáról szolgáltat információt. A legegyszerűbb inverz számításoknál lineáris kapcsolat áll fenn a mért adatok és modellparaméterek között. Sajnos ezek az egyszerű inverz problémák nagyon ritkák a hidrogeológiában, illetve a hidrodinamikai és transzport modellezés során. Az esetek döntő többségében a hidrogeológiai modellezésben diszkrét adatokat használunk. A legegyszerűbb mód az adatainkat egy oszlopvektorba helyezni (Sen and Stoffa 1995): " measured ~~ l~l >^2 »^3» ->^ND Y (i) ahol ND az adatok száma, T a mátrix transzponált műveletet jelenti. Hasonlóan a modell paramétereit is egy oszlopvektorba tehetjük: m = [m l,m 2,m }, ,m„ M] r (2) ahol NM a modellparaméterek számát jelenti. A számított adatokat egy g operátor függvény segítségével a direkt feladat megoldásaként kapjuk: d ca l=g(m) (3) Amennyiben a kapcsolat a modellparaméterek és a számított adatok között nem lineáris, a Taylor soron alapuló linearizált módszerek vezethetők be a megoldás egyszerűsítésére. A Taylor-sor másod- és magasabb rendű tagjait elhanyagolva a következő egyenletet kapjuk.