Vízügyi Közlemények, 2002 (84. évfolyam)
4. füzet - Klemeš, Vit: A simuló eloszlásfüggvények és az L-momentumok fetisizálása a hidrológiában
A simuló elosziásfiiggvények és az l-momentumok fetisizálása a hidrológiában 637 A probléma súlyosságára talán Wallis és Matalas (1974) mutattak rá a legélesebben: azt találták ugyanis, hogy a normál eloszlásból vett, n - 10-től 90-ig változó terjedelmű mintákból történt „legkisebb négyzetösszegú" illesztések az esetek 40-47%ában, n értékétől függetlenül, nem azonosították anya-eloszlásként a normális eloszlást, amikor pedig ugyanezt a kísérletet Gumbel-zloszlású anyasokaságból végezték, a téves eredmények száma 60-80%-ra növekedett! Az utóbbi, önmagáért beszélő eredményt tanulmányom utolsó fejezetében veszem górcső alá. Ha tehát valóban azt hisszük, hogy X„ észlelési sorozatunk valamely meghatározott eloszlásból származó véletlen mintaként állt elő, és ha beismerjük, hogy nem ismerjük sem ezt az eloszlást, sem pedig a P\, P% ..., P n rendezett véletlen értékeknek azt a halmazát, amelyet —a generálásra képes végtelen N számú ilyen halmazok közül - a Természet az észlelési adatsor előállítására „felhasznált", mit is tudunk becsülettel mondani az F(X) eloszlásfüggvény valószínű alakjáról? A válasz: Vajmi keveset! A „valószínűségi felrakás" számára ugyanis nem létezik a felrakási pozícióknak semmiféle preferált halmaza: a mi rendezett X„ halmazunkat ugyanis jogosan társíthatjuk az U(0,1 ) egyenletes eloszlásból vett véletlen számok bármely P n rendezett halmazához úgy, hogy ezek mindegyike a minta-EDF „egyenlő valószínűségű realizációja" legyen. A legtöbb, amit tehetünk, az, hogy jó sok ilyen „egyenlő valószínűségű" realizációt állítunk elő, hogy jobban érzékeljük a velük járó bizonytalanságokat. így például a 4a ábrában bemutatott három minta mindegyikére 4/b ábrában N = 10 ilyen realizációt raktunk fel. Ha ugyanezt az eljárást az 1. ábra való életből vett mintájára alkalmazzuk, akkor erre vonatkozóan korántsem az lb ábra szerinti EDF-re alapozott „eloszlási feltevésekkel" kellene élnünk — ahogyan azt a mindennapi gyakorlat sugallná - hanem sokkal inkább az 5. ábra szerinti „bizonytalansági zóná"-ból kellene kiindulnunk, amely utóbbit a feltételezett ismeretlen F(X) anyaeloszlású adatok 500 egyenlő valószínűségű realizációjának a valószínűségi felrakásaiból szerkesztettük. Szükségtelen rámutatnunk, hogy egy ilyen „bizonytalansági zóna" az F{X) eloszlás alakjára, különösen annak felső szakaszára vonatkozó „eloszlási feltevésekhez" édeskevés használható információt szolgáltat. Az általa kifejezett bizonytalanság nincs köze semmiféle hidrológiai jelenséghez, hanem csupán az adatokkal végzett, meghatározott statisztikai müvelet — nevezetesen az adatrendezés - következménye: ez a bizonytalanság az azonos mintateijedelmü bármiféle adatok esetében ugyanaz lesz. Más szóval: csupán a felrakási helyek empirikusan konstruált konfidencia-sávját jeleníti meg, amely, tetszőleges kondidencia-szintre előállítható az (1) képlettel. Lloyd (1995) például a PP\.so = PP(X\ :so) = 1/51 =0,0196 felrakási hely 95%-os szintű konfidencia-intervallumának két határpontjára, számítással, a 0,0005 és a 0,071 értéket kapta. Ez az információhiány azonban, meglepő módon, még jobb gyakorlati útmutatással is szolgálhat az eloszlásfüggvény felső szakaszának az extrapolációjához, mint valamely „szigorúan" illesztett és tesztelt „elméleti eloszlási modell". Ennek több oka is van: Először is, a tanulmányom elején tárgyalt hidrológiai okok következtében a standard EDF-пак még az általános alakja is — torzított felső farkától függetlenül is — félrevezető, ha belőle az F(X) eloszlásfüggvény alakjára akarnánk következtetni. Másodszor, bármely többé-kevésbé nagy teijedelmü mintából előállított EDF-hez igen sok -