Hidrológiai Közlöny 1968 (48. évfolyam)
10. szám - Domokos Miklós–dr. Szász Domokos: Eloszlás függvények alkalmazása a vízkészletgazdálkodásban
438 Hidrológiai Közlöny 1968. 10. sz. Domokos M.—Szász D.: Eloszlásfüggvények Ha pl. az augusztus 1-i vízhozamokat tekintjük, az egymásutáni évek adatairól feltehető a gyenge függés. De ha például az átlagos augusztusi napi, közópvízhozamot kívánjuk vizsgálni, akkor a 60 év augusztusi napjain mért 2046 adat sem tekinthető még csak gyengén függőnek sem, mert az egymásutáni napok vízhozamai között igen erős a pozitív korreláció. Azt mondhatjuk — bár a fogalomalkotás homályos —, hogy ez a 2046 adat remélhetően nagyságrendben lényegesen több független adatnak felel meg, mint a minden egyes évből vett egy-egy adat. Az 1. ábra grafikon-sorozata jól szemlélteti az elmondottakat. Látjuk például, hogy a havi közepek eloszlásfüggvényének értelmezési tartománya alul-fölül szűkebb, mint a napi vízhozamoké. Ez a csonkítás — noha általa valószínűségelméleti szempontból szabatosabb, mert függetlennek tekinthető adatokból szerkesztett függvényhez jutunk — érzékenyen érinti a vízkószletgazdálkodási szempontból legfontosabb kisvízi tartományt is. Azt is látjuk, hogy a napi vízhozamok eloszlásfüggvénye mennyivel simább, természetesebb görbe, mint a havi közepeké. Csak fokozódnék ez a különbség, ha az eloszlásfüggvényeket nem osztályközök alapulvételével, hanem szigorúan az eredeti meghatározás alapján — esetünkben 2046, ill. 66 adatból — szerkesztenék : ekkor ugyanis az a) ábra lépcsői nagymértékben tovább aprózódnának, ab) ábráié viszont alig. Ha pedig a napi vízhozamok véges sorozata helyett a vízhozamok (folytonos) időfüggvény-szakaszait (azaz végtelen sok adatot) dolgoznánk fel, akkor az a) görbe is majdnem mindenütt folytonos lenne. A két sűrűségfüggvény (lc ós ld ábra) összehasonlítása az előzőkhöz hasonló gondolatokat ébreszt: a napi vízhozamokból szerkesztett hisztogram itt is sokkal természetesebb jellegű, mint a havi közepeké. Tudjuk azonban, hogy ez esetben az osztályközök zsugorítása nem járna az előbbihez hasonló eredménnyel: a függvények ahelyett, hogy egyre kiegyenlítettebbekké válnának, a határon — azaz 0-mértékű osztályközök esetében — oo ordinátájú diszkrét pontok sorozatává válnának. Ha viszont az adatokat diszkrét értékek helyett itt is (folytonos) függvényekkel adnánk meg, 0-ra zsugorodó osztályközök esetében a sűrűségfüggvény is majdnem mindenütt folytonos függvénybe (nevezetesen a megfelelő eloszlásfüggvény differenciálgörbéjébe) menne át. Összefoglalásképpen megállapíthatjuk, hogy ha a fentiekben megadott mh darab napi középvízhozamból tapasztalati eloszlásfüggvényt, ill. simuló eloszlásfüggvényt készítünk, akkor a vízkészletgazdálkodásban szokásos, mlc darab adatot felhasználó a) eljárással kapott függvények — a vízkészletgazdálkodási felhasználás szempontjából célszerűbbek és — az elméleti eloszlásfüggvénynek legalább egyenértékű, de általában jobb közelítését adják, mint az m adatot felhasználó b) eljárással kapott függvények. Ugyanakkor az a) eljárás általában munkaigényesebb a b) eljárásnál; a különbség azonban a gyakorlatban alkalmazott célszerű egyszerűsítések (osztályközönként való feldolgozás stb.) miatt nem jelentős, a függvényelőállítás programozása esetén pedig elenyésző. Az elmondottak miatt a vízkészletgazdálkodásban a tapasztalati eloszlásfüggvények, ill. tartóssági görbék, (valamint a simuló eloszlásfüggvények) előállítására továbbra is az mk darab adatot felhasználó a) eljárás ajánlható. 3.42 Az adatok egyöntetűsége A Glivenko-tétel alkalmazhatóságának másik feltétele, hogy az adatok azonos eloszlásúak, más szóval egyöntetűek (homogének) legyenek. Ebben a pontban azzal a kérdéssel foglalkozunk, hogy hogyan lehet ennek a feltételnek a teljesülését statisztikai próba segítségével megvizsgálni. Az ilyen vizsgálatok alapja a Kohnogorov— Szmirnov próba [5]. A próba a következő típusú feladatnál alkalmazható: legyenek fj, | 2, . .., | nfüggetlen, azonos F(.r) eloszlásfüggvény ű valószínűségi változók, rj v rj 2, . . ., r]m független, azonos G(x) eloszlásfüggvénvű valószínűségi változók. A | 2, ..., értékek alapján készített tapasztalati eloszlásfüggvényt jelölje F»(a;), az rj v r/ 2, . . ., rj m értékek alapján készített tapasztalati eloszlásfüggvényt jelölje G„,(x). Ekkor, ha a két eloszlásfüggvény 771 folytonos és megegyezik, azaz F(.r) = G(a;) és — véges pozitív határértékhez tart, akkor P \ 1/ rnax | F»(x) - G„(*) 11 L ] n-\-m — =c<»<~ 1 J |K (y), ha ?/> 0 ( 0, ha y^ 0 ahol K(y) a 3.3 szakaszban definiált függvény. A tétel segítségével tehát eldönthető, hogy két adatsorozat azonos eloszlású sokaságból származik vagy nem, azaz helyesebben a próba egy szükséges feltételt ad bizonyos valószínűséggel. A próbát az adatsorok egyöntetűségének vizsgálatára úgy szokták alkalmazni [6], hogy a pl. 66 éves adatsort két egyenlő részre osztják, az első 33 adatból elkészítik az F 3 3(a;), a második 33 adatból elkészítik a G 3 3(x) tapasztalati eloszlásfüggvényt, s ha a próba pozitív eredményt ad, úgy az adatokat homogéneknek tekintik. Ezzel kapcsolatban két megjegyzésünk van: a) A próba csak szükséges feltétele a homogenitásnak, de semmiképpen sem elegendő. Például egy olyan adatsor, amelynek az első 33 évben növekvő, a második 33 évben ugyanilyen mértékben csökkenő tendenciája van, az eljárással homogénnek adódik, holott ez nem okvetlenül igaz. b) A próbát a legtöbbször olyan esetekre alkalmazzák, amikor n = m. Ez esetben, ha kis mintáról van szó, célszerűbb a Gnyegyenko—Koroljuktétel alkalmazása, amely a Kolmogorov—Szmirnov-tétel feltótelei mellett azt állítja, hogy vV 2n n\ -7L t (k—\, 2, - • , n) v n / t=—co A jobb oldalon szereplő függvényről is készült táblázat. Megjegyezzük, hogy a gyakorlatban a próba esetleg úgy is alkalmazható, hogy az adatokat három vagy több részre osztjuk, ós ezeket hasonlítjuk össze. Ez újabb szükséges feltételt jelent, de csak sok adat esetén van értelme. 3.43 A nem-véletlen ingadozások kiküszöbölése Ha az adatsorunk valamilyen tendenciát vagy periodicitást mutat, akkor a tapasztalati eloszlásfüggvény csak eléggé durva becslést ad, míg ha a vizsgálatot