Hidrológiai Közlöny 2007 (87. évfolyam)

4. szám - Gálai Antal: A Szmirnov-Kolmogorov próba – ahogy az alkalmazók monták: élesítése

57 A Szmirnov-Kolmogorov próba - ahogy az alkalmazók mondták: élesítése Gálái Antal http:llvip.baja.hulGalailAntalliialai@baia.hu Kivonat: A korábban kézi kalkulátorral vagy grafikusan végzett vizsgálatok gépesítését a 70-es évek derekán többnyire valószínű­ség- és statisztikai könyvek alapján saját barkácsolást! programokkal kezdte a Szerző és az általa vezetett közösség. Az ADUVÍZIG egykori R10-es alapú, s a PC-s kor hajnalán szélnek eresztett bajai számítóközpontjában készült programo­kat az egész országban alkalmazták, s eleinte az adatok utaztak, de egyre gyakrabban és egyre nagyobb távolságra útra keltek maguk a programok is szerte e világban a fejlett és fejlődő régiókba, amerre csak magyar vízmémökök hosszabb­rövidebb ideig dolgoztak, tanítottak: Mongólia, Algéria, Nigéria területére. De idegenek is használtak, pl. Koreában, s Ausztráliában bajai programokat. A későbbiekben elhajítva minden eddigi programot, semmi már ismert vagy kipróbált algoritmust fel nem használva, a Szerző a gyorsítás érdekében újrafogalmaztam a feladatot. Kulcsszavak: vízügyi számítógépesítés történelem, valószínúségszámítás. A Kolmogorov-Szmirnov próba a mért adatok, a statisz­tikai minta homogenitását illetve a homogénnek bizonyult i­dőszak valószínűségi eloszlásra való illeszkedését hivatott eldönteni. Most a homogenitást vizsgáljuk. A homogenitás ez esetben hétköznapi szavakkal azt je­lenti, hogy a véletlen - vagyis pontosan nem ismeret tör­vényszerűségektől függő, mérhető jellemzővel leírható-je­lenség a teljes mintavételezés alatt azonos szabályszerűsé­gek szerint játszódott le, s e jellemző - a mintát alkotó ­mért értékei azonos eloszlást követnek a teljes mintavétele­zés során. Az inhomogenitás egyik jó példájában a különben jól vi­selkedő jelenséget egy beavatkozás - pl a vízgyűjtő fejlesz­tése során a művelési ág megváltoztatása - egy adott idő­pontban erőteljesen befolyásol, s ettől kezdve más törvény­szerűségek szerint játszódik le a jelenség. Ekkor és emiatt a beavatkozás előtti és a beavatkozás utáni minta eltérő elosz­lást követ. Sok esetben ez a mért adatokon nyomon követ­hető s elegendő hosszúságú minta esetén ez már a grafikus feldolgozások korában is jól észlelhető volt. Amennyiben a beavatkozásról nincs tudomásunk, és a különben elegendően hosszú minta idősora rendelkezésre áll, akkor a kézi számolásos és grafikus értékelésű eljárások helyett néhány évtizede adatfeldolgozási alkalmazásokkal végezzük e vizsgálatot. Igaz ugyan, hogy statisztikai prog­ramcsomagok már az első komputerek elterjedésével egy i­dőben felbukkantak, s a piac bővülésével az egyre jobban térhódító IT komponensek olcsóvá tették az alkalmazásokat is, nem térhetünk ki e metódusok magjának ismerete elől. Háromszög-szerkesztésre sincs szüksége legtöbbünknek az iskolapadot elhagyva, mégis a biztos gondolkodás és tájéko­zódás megköveteli e módszerek lényegének ismeretét. így van ezzel a statisztikai metódusokat alkalmazó mérnök is, a biztos kezű alkalmazáshoz kell ismernie a lényeges metódu­sok algoritmikus motorjának főbb működését. Az ADUVÍZIG bajai számítóközpontjában a 70-es évek közepe óta dr. Zsuffa István javaslatára a vízügyi gyakor­latban hazánkban elterjedt kétmintás próbát használtuk az a­datsorban rejlő változások felderítésére, vagyis az idősor ­inhomogenitásának mértékétől függő - két részidőszakra történő szétválasztására, vagy egyben hagyására. Ekkor az adatsort két rész-adatsorra bontogatva elvégeztük a két gya­korisági függvény legnagyobb eltérésének számítását, s az ebből a differenciából és a részminták elemszámaiból kép­zett valószínűségi változóhoz tartozó függvény-értéket te­kintettük a homogenitás mértékének, míg ennek komple­mentere az adatsor inhomogenitásának fokát határozta meg. Az idővel elfogadott konszenzus alapján a gyakorlatban ki­alakított konfidencia értékeket, a próba használatát ismerteti e folyóirat 74. (1994) évfolyam 3. számában az ötletadó Zsuffa István, és az elkészült programokat futtató, s az e­redmény-értékelések előkészítését régóta végző Goda Lász­ló közös írásában. Amint az sok matematikai statisztikai és műszaki szak­könyv az elmúlt fél évszázadban ismerteti - a Kolmogorov egyenlőtlenségből következik, hogy - eloszlások és gyako­riságok eltérésének maximuma arányos a minta elemszáma reciprokának gyökével. A becslést két részmintára felírva s a két részminta eltérő elemszáma miatt pedig az eltérésének maximuma arányos a részminták elemszám-reciprok-össze­gének gyökével. A maximális különbséggel való felső becs­lésnek persze történeti okai is vannak, hiszen kézi és/vagy grafikus feldolgozáskor a két lépcsős-függvényt felrajzolva rögtön szembe tűnik a legnagyobb eltérés, s nem kell az összes eltérés négyzetét számolgatni. Az adatfeldolgozás automatizálásával nem lenne szükség a különbségeket ma­ximumukkal felülről becsülni, hisz a maximum meghatáro­zásához az összes különbséget úgyis végigszámoljuk, s ez már a két függvény eltérésének informatívabb mértékét a két függvény közti területtel is jellemezhetné, de ennek ki­használása a teljes felépítményt érintené, s ezért a pár kom­puterizált évtizedért eddig nem kavarták meg a több évtize­des előző jól bevált gyakorlatot. A korábban kézi kalkulátorral vagy grafikusan végzett vizsgálatok gépesítését a 70-es évek derekán többnyire va­lószínűség- és statisztikai könyvek alapján saját barkácsolá­sú programokkal kezdtük. A sorfejtési és konvergencia-, s egyéb numerikus hibák kiküszöbölésére felderítettem az MTA SzTAKI CDC3300-asán OSLO és MONTREAL né­ven elérhető első "public domain" programkönytárakat, s a­zok rafináltabb elemit felhasználva egészítettem ki a bajai ADUVIZIG-nél ekkoriban vezetésem alatt s programozási részvételemmel Fortran és esetenként Assembly nyelveken elkészült matematikai statisztikai eljárás-csomagot. Az ADUVÍZIG egykori R10-es alapú, s a PC-s kor haj­nalán szélnek eresztett bajai számítóközpontjában készült programokat addigra már az egész országban alkalmazták, s eleinte az adatok utaztak, de egyre gyakrabban és egyre na­gyobb távolságra útra keltek maguk a programok is szerte e világban a fejlett és - szemérmesen szólva - fejlődő régiók­ba, amerre csak magyar vízmémökök hosszabb-rövidebb i­deig dolgoztak, tanítottak: Mongólia, Algéria, Nigéria terü­letére. De idegenek is használtak, pl. Koreában, s Ausztráli­ában bajai programokat. A tanulságul felhozott s mindenki praxisában jelentkező (homogenitás-vizsgálat, mint) részfeladat az elsők közt ké­szült el, a mérnököknek készült Prékopa zsebkönyvben fel­lelt eloszlásfüggvénye szépen konvergált, és semmi különös trükkre, matematikai, vagy numerikus, esetleg programozói rafinériára nem volt szükség. Közben az ADUVÍZIG csa­pata képzettekkel s józan fejűekkel, s látnokokkal egyaránt gyarapodott, de szélsebesen növekedett a digitális állapot-

Next

/
Thumbnails
Contents