Hidrológiai Közlöny 2012 (92. évfolyam)
3. szám - Szigyártó Zoltán: Folytonos eloszlások új illeszkedés-vizsgálata – A Fisher–Szigyártó próba továbbfejlesztése
27 Folytonos eloszlások új illeszkedés-vizsgálata A Fisher-Szigyártó próba továbbfejlesztése Szigyártó Zoltán 1118. Budapest, Somlói út 30/B Előzmények és a tanulmány célja Azzal, hogy a 2005. évi vizsgálataink során bebizonyítottuk, hogy — legalábbis a Tisza völgyében — az évi legnagyobb jégmentes vízállások eloszlása az időben változik (Szigyártó—Bénik-Szlávik Bálint 2005), új helyzet állt elő. így a valószínűségek meghatározása érdekében végzett számításoknak célszerű alkalmazkodniuk a feltárt tényekhez. Tehát ahhoz, hogy (Szigyártó-Bénik 2003) - az eloszlás középértéke időnként ugrásszerűen megváltozik, míg - a középértékek körüli szórás a minta származási helyétől (a vízmérce-állomás szelvényétől) függő, időben állandó érték (tehát független a középérték nagyságától), továbbá - egy-egy állandó középértékkel jellemezhető időszakon belül az eloszlás továbbra is normális eloszlással jellemezhető. Szerencsére az eloszlás paramétereinek ilyen vagy hasonló jellegű szakaszos változása igen sok más gyakorlati esetben is előfordul, s a valószínűségelmélet az ilyen sajátosságokkal rendelkező valószínűségi változók eloszlásának a kezelésére vezette be a keverékeloszlásokat (Rényi 1954, 239. o.). E szerint az évi legnagyobb jégmentes vízállások eloszlása, mint azt bebizonyítottuk (Szigyártó-Bénik 2003), számítható az E k(x) = ^i( x' mi' ( J) (1 ) í=I összefüggéssel, amelyben F k(x) a keverékeloszlás eloszlásfüggvényét, F,{x,mi,s) az m, középértékű és s szórású i-ik rész-időszak eloszlásfüggvényét, p,az F,{x,mj,s) eloszlásfüggvény súlyát jelöli, amely utóbbi esetünkben számítható a hányadosból, ahol (az adott esetben) Ti z'-edik a rész-időszak hossza, vagyis éveinek a száma (az í-edik minta elemszáma), 7az egész minta hossza, vagyis éveinek a száma (a minta elemszáma). Ennek az eljárásnak tehát alapvető sajátossága, hogy a számítások alapját képező minta szakaszosan nem azonos eloszlásból származik, s így nem egyöntetű. Következésképpen ilyen esetben a minta egyes elemei sem lehetnek egymástól függetlenek; hiszen a középérték megváltozását követően a valószínűségi változó (a változás irányától függően) egy alacsonyabb vagy magasabb középérték körül ingadozik. Ha viszont a mintára sem az egyöntetűség, sem pedig annak elemeire a teljes függetlenség nem teljesül, úgy nincs mód a vízimémökök körében Kolmogorov próbaként ismert (iCsoma-Szigyártó 1975, 58. o.) illeszkedés-vizsgálat elvégzésére. Tehát nincs lehetőség annak a gyakorlat szempontjából is fontos kérdésnek az eldöntésére, hogy az empirikus eloszlásfiiggvény milyen módon illeszkedik az (1) és (2) öszszefiiggéssel meghatározható eloszlásfüggvényre. Keverékeloszlások esetében az illeszkedés mértékének a kiszámításához tehát új eljárásra van szükség. Ez pedig (egy lehetséges megoldásként) kiindulhat az azonos középértékkel rendelkező rész-időszakok illeszkedésére elvégzett vizsgálatok eredményiből is. Ha viszont ezt a célt tűzzük ki, újabb gondot okoz az, hogy a középértékek változását felderítő sorozatos statisztikai hipotézis vizsgálat (Szigyártó-Várnainé 1981) eredményeként olyan rész-szakaszokat is kaphatunk, amelyek elemszáma igen gyakran a nagy minták alsó határának tekinthető «=30 alatt marad. így pedig (a kis elemszám miatt) a teljes minta egyes rész-szakaszaira az illeszkedés-vizsgálatot a már említett Kolmagorov próbával csak igen ritkán lehet elvégezni. Abban az esetben tehát, ha a keverékeloszlás illeszkedés-vizsgálatát a keveréket alkotó minták illeszkedés-vizsgálatára kívánjuk alapozni, e célra egy olyan illeszkedés-vizsgálatra van szükség, amely a minta elemszámától függetlenül, bármekkora minta esetén szabatosan elvégezhető. Ugyanekkor ismeretes, hogy a Fisher által az exponenciális eloszlásokból származó minták illeszkedésének a vizsgálatára kifejlesztett eljárás (Gnyegyenko-Baljajev-Szolovjev 1965, 268. o.) éppen ilyen célból készült. Bár kétségtelen az, hogy a Fisher által levezetett eloszlásfüggvény illeszkedés-vizsgálatra történő felhasználása úgy, ahogyan azt a szerző javasolta, helyes eredményt nem adhat. Az eljárásnak ez a hibája azonban viszonylag könnyen kiküszöbölhető. Ugyanakkor pedig, ha ehhez kapcsolódva a módszert megfelelően továbbfejlesztjük, az bármely folytonos eloszlás szabatos illeszkedés-vizsgálatára alkalmassá tehető (Szigyártó 1980). Ma már azonban látjuk, hogy ezzel a továbbfejlesztett változattal szemben is több kifogás merülhet fel. Ugyanis baj van vele három okból is: Egyrészt azért, mert egy fontos képletébe sajtóhiba került. Másrészt azért, mert a kifejlesztett módszer nem számolt azzal, hogy az eljárás alapjául szolgáló eloszlás nem csak korlátos, hanem aszimmetrikus is. Végül azért, mert (mint utólag megállapítható) a tanulmány szövege inkább matematikusok, mint vízimérnökök számára íródott. Ez pedig az addig elért eredmények szélesebb körű gyakorlati alkalmazását megnehezítette annak ellenére, hogy ennek lehetővé tételére egy kísérlet azért történt (Kontur-Kóris-Winter 1993). Mindezeket végig gondolva bizonyára belátható, hogy a korábban közölt eljárás (Szigyártó 1980) továbbfejlesztésére ma már igencsak szükség van. Emellett azonban nyilván szükség van arra is, hogy ennek a továbbfejlesztett új eljárásnak az ismertetése — a gyakorlati szakemberek igényét szem előtt tartva -— egységes keretben készüljön. Ezért látszott tehát célravezetőnek az, hogy (az előzőekben felsorolt elméleti vonatkozású hiányosságok kiküszöbölését követően) az eredményeket ismertető anyag minden részlete egy tanulmányban legyen összefoglalva; még akkor is, ha ennek egyes részei a korábbi vizsgálatok eredményét közlő tanulmányban is megtalálhatók (Szigyártó 1980). Fisher eljárása az exponenciális eloszlások illeszkedésvizsgálatára Fisher eredménye szerint (Gnyegyenko-Baljajev-Szolovjev 1965, 268. o.) bármely