Reimann József - V. Nagy Imre: Hidrológiai statisztika (Tankönyvkiadó, Budapest, 1984)
5. A matematikai statisztika és annak hidrológiai alkalmazásai
5.5. Az empirikus eloszlásfüggvény. Glivenko tétele Valamely folytonos eloszlású X valószínűségi változó eloszlásának statisztikai vizsgálatához kiindulásul az (I), X1,X2, ■ ■■,Xn statisztikai minta szolgál. A hidrológiai gyakorlatban a kérdéses X valószínűségi változó F{x) eloszlásfüggvényét legtöbbször nem ismerjük. Jelentős kérdés tehát, hogy az F(x) eloszlásfüggvényt milyen statisztikai eljárással tudjuk megközelíteni? Az alább ismertetendő egyszerű módszerrel — amint látni fogjuk — elég nagy mintaelemszám esetén az F(x) eloszlásfüggvény igen jól közelíthető. Rendezzük az (1) minta elemeit nagyság szerint növekvő sorrendben: (II) X*< X%< «=...•< X*. Definiáljuk most az F„(x) lépcsős függvényt a következő módon: o, ha Aí; F„(x) = ■ k n ha Xt^xif X*k+1 (5.3) .1, ha x>X*n. Az F„(x) függvényt az illető mintához tartozó empirikus eloszlásfüggvénynek nevezzük. Könnyű belátni, hogy F„(x) az eloszlásfüggvény tulajdonságaival rendelkezik, azaz értéke 0 és 1 közé esik, monoton nem csökkenő és balról folytonos (5.2. ábra). ,F„(x)-nek minden egyes Xf (/ = 1,2, ...,n) helyen \/n nagyságú ugrása van. F„(x) értéke valamely X helyen tehát annyiszor 1 //?, ahány mintaelem értéke kisebb A'-nél. Más szóval Fn(x) értéke az helyen a {A<x} esemény relatív gyakoriságával egyenlő. Ugyanezen esemény valószínűsége: P(X<x) = F(x). Az F„(x) empirikus eloszlásfüggvény tehát úgy viszonyúk az F(x) elméleti eloszlásfüggvényhez, mint adott esemény relatív gyakorisága viszonyúk ugyanezen esemény valószínűségéhez. Amikor n elég nagy, akkor a relatív gyakoriság nagy valószínűséggel kevéssé tér el az ismereteién valószínűségtől. F{x)„ ~r 5.2. ábra 185