Hidrológiai Közlöny 1980 (60. évfolyam)
5. szám - Dr. Szigyártó Zoltán: Folytonos eloszlásból származó kis elemszámú minták illeszkedés-vizsgálata
194 Hidrológiai Közlöny 1980. 5. sz. Dr. Szigyártó Z.: Folytonos eloszlásból származó Ffx) 1,0 0,5 1. ábra. Az e n o értekhez tartozó empirikus eloszlásfüggvény értelmezése (l>uz. /. TüAKoeaiiue 3Mnupu<tecK0Ü 0ynKifUU pacnpeOenehuh, omiiocmiieücn k eeAmuae e n a Fig. 1. Definition of the empirical distribution function pertaining to the e„ 0 value szempontjából azonban ezen eljárások alkalmazhatóságának jelentős akadályát jelentette az, hogy a határeloszlások csak nagy —- gyakorlatilag legalább mintegy 30 elemű — minta esetén adnak megfelelő közelítést. A hidrológia szempontjából tehát igen jelentősek azok az egyéb vizsgálatok is, amelyek, bár kötött eloszlásfüggvénytípusra, de a minta terjedelmétől függetlenül adnak lehetőséget az il leszkedés-vizsgálat elvégzésére. Az ezeket megalapozó elméleti eredmények közül, egyszerűségére tekintettel kiemelkedik aztán Fisher azon tétele, amely szerint, ha az exponenciális eloszlásból vett minta reprezentatív, s elemei egymástól függetlenek, úgy a belőle képzett * n S-i = 1 paraméter eloszlását — az eloszlás paraméterétől függetlenül — a h P(e„>e)= Zj ( 2) összefüggés adja meg [3., 268. o.]*, ahol f; az n elemű minta i-edik, I* annak a legnagyobb eleme, s h az 1 /e egész része. A továbbiakban ez lesz majd az a tétel, amely célszerű felhasználása lehetőséget ad a tetszőleges folytonos eloszlásból vett kisminták illeszkedésvizsgálatának a szabatos elvégzésére is. * Az eredeti, orosz nyelvű és a magyar kiadásban egyaránt meglevő képlethiba kijavításáért Csáki Endrének mondunk köszönetet. Az e próba Illeszlcedés-vizsgálat exponenciális eloszlás esetén Fisher az előzőekben már említett (2) összefüggést az eloszlás exponenciális jellegének az ellenőrzésére vezette le. Gyakorlati felhasználásával kapcsolatban pedig azt javasolta, hogy segítségével az e=e n behelyettesítés útján meghatározva a mintából számított s„ értéknél is nagyobb hasonló érték valószínűségét, az így kapott értéket tekintsük az illeszkedés mérőszámának. Könnyen belátható azonban, hogy l/n<e„<l, (3) s az \\n értékhez tartozó, valamint az 1 értékhez rendelhető empirikus eloszlásfüggvény az exponenciális eloszlásra egyaránt igen rosszul illeszkedik. Más oldalról Kolmogorov munkásságának az eredményeként szemléletünk azt sugalja, hogy az empirikus eloszlásfüggvény az eloszlásfüggvényhez annál jobban simul, minél kisebb a kettőjük közötti abszolút értelemben vett legnagyobb eltérés. így figyelembe véve azt, liogv egy n elemű minta esetén az előbbiek szerinti maximális eltérés lehetséges legkisebb értéke 1/2n (1. ábra), indokoltnak látszik az illeszkedés jóságát azzal mérni, hogy a mintából számítható e„ érték milyen közel van az említett optimális esethez kiszámítható Cn 0= — :— 4 " 2n—1 . nk 1=1 értékhez. E feltétellel szemben felhozható aztán esetleg az, hogy számtalan olvan, az 1. ábrán bemutatott illeszkedés típustól bizonyos mértékig eltérő illeszkedési eset is elképzelhető, melyhez ugyancsak az e n o érték tartozik. Ezek azonban az említett optimális esettől mind csupán abban térnek el, hogy bizonyos értelemben megnő az empirikus eloszlásfüggvénynek az elméleti eloszlásfüggvény körüli ingadozása. Mindezek átgondolása indokolja tehát végül is azt, hogy alapul véve az e n előzőek szerint értelmezett optimális, e n o értékét, 0 hipotézisül a H 0:|e„ 0 e n g | = 0 (5) feltételt fogadjuk el. Ennek megfelelően számítottuk ki aztán az 1. táblázatban összefoglalt értékeket, melyek — figyelembe véve az eloszlás korlátosságát s asszimetriáját — a különböző n értékekhez megadják az 1%-os és 5%-os quantilisek alsó és felső értékét. Illeszkedés-vizsgálat tetszőleges folytonos eloszlás esetén Arra már Kolmogorov felhívta a figyelmet [3., 247. o.], hogy ha a f valószínűségi változónak folytonos, F(x) = P(f< x) eloszlásfüggvénye van,