Csoma János - Szigyártó Zoltán: A matematikai statisztika alkalmazása a hidrológiában (VITUKI, Budapest, 1975)
2. A minták elemzése
2. Ha az illeszkedésvizsgálat folyamán az alapsokaság sejtett jellegű eloszlásfüggvényének a paramétereit a minta alapján becsült paraméterekkel helyettesítjük, s az illeszkedésvizsgálatot az így meghatározott eloszlás- függvénnyel végezzük el, az előző tétel az esetek zömében csak annyiban módosul, hogy a y2 eloszlás szabadságfoka becsült paraméterenként eggyel- eggyel csökken. f — r — b — 1 (2.32) ahol b a minta alapján becsült paraméterek száma. A vizsgált gyakorlati végrehajtásával kapcsolatban viszont a következőkre kell felhívni a figyelmet: A számítási eljárást tulajdonképpen korlátos valószínűségi változókra dolgozták ki (mivel csak ebben az esetben lehet r véges). így egyértelmű eredményt — legalábbis elvileg — csupán ilyen valószínűségi változók esetén kaphatunk. A gyakorlatban azonban bonyolítja a helyzetet az, hogy a kis valószínűségű, tehát szélsőséges értékek a y2 összegbe túlságos súllyal jönnek számításba és annak értékét túlzottan megnövelik. Ezért Fisher szerint e számításokat csak akkor alkalmazhatjuk, ha a legkisebb valószínűség esetén is igaz az npi ^ 5, 0 ^ Pi ^ 1 (2.33) feltétel. így, egyes esetekben, ha a vizsgálatot el akarjuk végezni, még a korlátos valószínűségi változóknál is szükségessé válhat az, hogy egyes értékek bekövetkezését mint eseményt összevonjuk oly módon, hogy az összevont események valószínűsége most már kielégítse a (2.33) kikötést. Ezzel kapcsolatban azonban nem szabad szem elől téveszteni, hogy a vázolt átalakítás után tulajdonképpen nem az eredeti eloszlást, hanem egy abból leszármaztatott másik (jó esetben ahhoz hasonló) eloszlást veszünk vizsgálat alá; s így az eredmény közelítő jellegűvé válik. Lényegében hasonló a helyzet akkor is, ha a szóban forgó vizsgálatot nem korlátos valószínűségi változóra végezzük el, azzal a kiegészítéssel, hogy a kis valószínűségű, szélsőséges értékek egy kategóriába sorolása itt már soha sem kerülhető el, s így a számítások eredménye mindig közelítő jellegű lesz. Az elmondottak alapján a számítások gyakorlati végrehajtása a következő lépésekben zajlik le. A valószínűségi változó sejtett eloszlását figyelembe véve a minta alapján meg kell határozni annak paramétereit, s a paraméterek segítségével — legalább arra a tartományra, amelybe az észlelések esnek — ki kell számítani a különböző i értékek előfordulásának a p; valószínűségét, továbbá annak (az ugyancsak p;-vel jelölt) valószínűségét, hogy a valószínűségi változó az említett tartomány alatti, illetve feletti értéket vesz fel. A minta elemszámát figyelembe véve ezekre a kiszámított valószínűségekre meg kell határozni az np; értékeket, s a (2.33) feltételt szem előtt tartva az egyes i értékeket, illetve a szélső értékeket egyesítő kategóriákat szükség szerint olyan újabb kategóriákba kell összevonni, hogy az elemszám és a valószínűség szorzata ezek mindegyikénél nagyobb legyen, mint 56