Reimann József - V. Nagy Imre: Hidrológiai statisztika (Tankönyvkiadó, Budapest, 1984)
5. A matematikai statisztika és annak hidrológiai alkalmazásai
könyvekből), és a mért X,, X2. .... X„ adatok alapján (esetünkben n^lOO) meg tudjuk határozni az A esemény kjn relatív gyakoriságát. A nagy számok törvénye értelmében, ha n elég nagy, akkor a_ kjn relatív gyakoriság nem nagyon tér el az ismeretlen p valószínűségtől. Esetünkben (miként a hidrológiai adatsoroknál általában) n nem nevezhető elég nagynak, ezért a kjn relatív gyakoriság segítségével az ismeretlen p valószínűséget nem tudjuk pontosan meghatározni, azaz meg kell elégednünk a p valószínűség bizonyos közelítésével, ún. becslésével. Az ismeretlen p valószínűség a [0, 1) intervallum egy bizonyos pontja. A p értékét nem tudjuk pontosan meghatározni, ezért kívánatos legalább egy viszonylag rövid intervallumot megadni, amely a p valószínűséget tartalmazza. Erre meg is van a lehetőségünk, mivel az A esemény bekövetkezéseinek k száma (n kísérlet során) binomiális eloszlású valószínűségi változó E(k) = np várható értékkel és D(k)=\npq szórással. Következőleg a k/n relatív gyakoriság várható értéke: E(k/n)=p, és D(k/n) = = Ypq/n. Mármost a Moivre—Laplace-féle határeloszlás-tétel alapján a normális eloszlás ismert tulajdonsága miatt: Ez az összefüggés azt jelenti, hogy a 'k n (5.1) intervallum, amely véletlen helyzetű (a k/n középpont véletlentől függő értéke miatt), csaknem biztosan tartalmazza az ismeretlen p valószínűséget. Az (5.1) összefüggés hiányossága, hogy hosszát nem ismerjük és szerepel benne az ismeretlen p n — k (és q=\—p) érték. A p^k/n és r/%------ becslést alkalmazva arra az eredm ényre jutunk, hogy a k 2 i/ k(n — k) k 2 W k(n — k) n n I n ’ n n \ n véletlen helyzetű és véletlen hosszúságú intervallum kb. 95%-os valószínűséggel lefedi az ismeretlen p valószínűséget abban az értelemben, hogy ha sokszor ismételjük azt az eljárást, hogy n számú megfigyelés alapján megszerkesztjük az (5.2) intervallumot, akkor az kb. az esetek 95%-ában tartalmazza, kb. az esetek 5%-ában nem tartalmazza az ismeretlen p valószínűséget. Ez az intervallumbecslési eljárás az ún. konfidenciaintervallumok módszere. Az eljárás nemcsak az ismeretlen valószínűség becslésére, hanem valószínűségeloszlások számszerű jellemzőinek — pl. a várható értékének, szórásának, kvantiliseinek stb. — becslésére, tehát általában az ismeretlen paraméterek közelítő statisztikai meghatározására is alkalmazható. (5.2) 12* 179