Hidrológiai Közlöny 1994 (74. évfolyam)
3. szám - Goda László–Zsuffa István: Vízrajzi adatok homogenitásának vizsgálata a kétmintás Szmirnov–Kolmogorov próba élesített változatával
174 bonyolult numerikus kapcsolat számítására szolgáló, úgynevezett eró'függvény meghatározása ugyanis a Kolmogorov próba esetén igen nehéz, sőt a gyakorlatban legtöbbször megoldhatatlan föladat (Vincze, 1966). A népességstatisztikában, egyszerű fizikai méréseknél alkalmazott igen szigorú 95 %-os szignifikancia szint a hidrológiai adatsorok esetén azonban aligha tartható: ugyanis valamely hidrológiai folyamat elemeire vonatkozó észlelési adatsor olyan egyetlen statisztikai minta, amely nem helyettesíthető. A laboratóriumi, vagy társadalmi statisztikai vizsgálatoknál, például mikroorganizmusok társulásainak numerikus elemzésénél, vagy közvélemény-kutatásnál, az inhomogén minták helyett új statisztikai mintavétel, a mikroszkópos vizsgálatok, illetve az adatfölvétel akár többszörös ismétlése könnyen biztosítható. Ez legföljebb újabb munkát, illetve többletköltséget jelent. A hidrológiai folyamat egyetlen észlelt realizációja, inhomogenitásával együtt a múltban lezajlott természeti vagy vízgazdálkodási hatások következményeit is mutatja. Az adatsor statisztikai elemzése alapján esetleg arra kell következtetnünk, hogy ezek az adatok nem a jövőt is jellemző statisztikai sokaságból valók, más adatsor viszont nem áll rendelkezésünkre. Ezekből, a múltbeli folyamatokra vonatkozó igen fontos információkat hordozó adatokból a valószínűségi változóknak a mára, és a közvetlen jövőre is érvényes előfordulási valószínűségei egyszerű matematikai módszerekkel azonban nem becsülhetők. Az előzőekben említett gyakorlati problémát súlyosbítja az időjárás, és általa a vízjárás idősorait terhelő, bibliai idők óta ismert, többé-kevésbé szabályos futamok, periódusok (11-15 éves napfoltperiódus stb.) Ezek a fizikai háttérrel rendelkező, de a véletlen tovább bővülő fogalomköréhez tartozó periódusok miatt a rövidebb adatsorok inhomogénnek bizonyulnak. Ezek a periódusok viszont a vizsgálatok tényezői kell, hogy maradjanak. E meggondolásoknak megfelelően Bernier professzor hidrológiai statisztikai vizsgálatokra vonatkozó általános javaslatának (Bernier, Veron 1963) alkalmazását ajánljuk. Ennek megfelelően — vízrajzi, vízállás vagy vízhozam adatsort homogénnak minősítjük, ha a fentiekben megfogalmazott módon meghatározott paraméter érték 1 -L(z)> 0,7 — Az adatsor ihomogén, amennyiben 1 -L(z)s0,3 — Az adatsor homogenitása kétesnek minősül, ha a paraméter érték az úgynevezett szürke tartományba esik, azaz 0,3<1 — L(z)<0,7 Bizonyos esetekben a statisztikai vizsgálatoknál csak a kifejezetten inhomogénnek minősített adatsorok első felét, a régebbi adatokat vetik el. Tehát a kétes homogenitásúnak minősített adatsort már fölhasználják. Mivel ez a gyakorlat általános, és teljesen el sem ítélhető. HIDROLÓGIAI KÖZLÖNY 1994. 74. ÉVF. 2. SZÁM ragaszkodnunk kell az előzőekben részletezett 70 %-os szignifikancia szint általános alkalmazásához. Az úgynevezett szürke tartománynak az elfogadása esetén a szigorúbbnak tartott 95 %-os szignifikancia szintű vizsgálat nemcsak ellentétesen engedékeny, hanem elfogadhatatlan eredményre vezet, hiszen ebben az esetben az elfogadásra ajánlott tartomány már 5 % szint fölött kezdődik. A szignifikancia szint rögzítésére vonatkozó ajánlások megállapodás jellegű volta mellett az idősorok homogenitásának a vizsgálatánál sokkal súlyosabb szubjektivitás terheli a vízrajzi idősor két mintára való kettéválasztását. Akár az egyszerű felezés módszerét alkalmazzuk, akár valamely meghatározott eseménynek föltételezett változásnak az időpontjánál osztjuk ketté az adatsort, e döntés teljesen önkényes, és így az eredmények emiatt az önkényesség miatt alapvetően megkérdőjelezhetőek. Jónéhány vizsgálat mutatja az azonos idősor két szétvágási pontjával végzett két vizsgálat teljesen ellentétes, és így végeredményben értékelhetetlen eredményét. A homogenitás vizsgálat eredményét teljesen ellentétesen befolyásolható szubjektivitás kézi számítással történő kiküszöbölésére aligha lehet útmutatást adni. 3. A Szmirnov-Kolmogorov próba kiterjesztése számítástechnikai eszközökkel A számítógép korlátlan számítási kapacitásának fölhasználásával ez a szubjektivitás azonban igen egyszerűen kikapcsolható: a számítógéppel ugyanis valamenynyi szétvágási ponttal rögzített statisztikai részmintapárral a kétmintás Kolmogorov próba elvégezhető. A gép a ciklikus vizsgálat végrehajtása után az ítélethez a legkisebb számított 1 -L(z) értéket szolgáltatja, ezen minimális értéket adó elvágási ponttal. A vizsgálat tehát a legélesebb, hiszen minimális értékre támaszkodhat, és egyben ezen elválasztási időpont szolgáltatásával a szubjektív gondolatmenet megfordítható. Ez a gépi vizsgálat ugyanis a találgatáson alapuló előítéletekre támaszkodó kézi számítás esetleges eredménye helyett a legszigorúbb ítéletet biztosító egyetlen értékre vezet, amelyhez tartozó elválasztási időpontot is szolgáltatja. Ezt követően a vizsgálatot végző mérnök az ezen időponthoz kötött, vízjárást befolyásoló jelenséget föl kell, hogy kutassa, majd az így meghatározott okok, objektív információk ismeretében az adatsor egyöntetűségéről már sokkal több fizikai és statisztikai információ birtokában dönthet. A módszer tehát egyrészt kiküszöböli a szétvágási időpont megválasztásának szubjektivitását, másrészt biztosítja a mechanikus, gépies döntésnek indokolt ítélettel való kiváltásának a lehetőségét. A számítógépi eszközökkel kiterjesztett Komogorov próba magas szinten élesített volta mellett tehát az adatsor objektív fizikai vizsgálatát is lehetővé teszi. A következőkben a Duna bajai vízállás adatsorának ezzel az élesített módszerrel való elemzését mutatjuk be. Ezek a komplex vizsgálatok nemcsak példa értékűek, hanem a kérdéses Duna-szakasz vízjárásának a részletesebb megismerésére is vezetnek. Az 1901-1990 közötti bajai vízállásészlelések évi