Hidrológiai Közlöny, 2015 (95. évfolyam)
2015 / 1. szám - Szigyártó Zoltán: Sorozatos statisztikai hipotézisvizsgálat excel-táblázattal
36 ményének bemutatásakor arra a figyelmet mindenképen fel kell hívjuk, hogy e próba elvégzése során a minta e- lemszáma a szükségesnél kisebb volt. Ami aztán a sorozatos statisztikai hipotézisvizsgálat másik feltételét illeti — azt, hogy a minta (esetleg különböző paraméterű) normális eloszlásokból származzék — ez természetesen csak azt követően ellenőrizhető, hogy a Student és (szükség esetén) az F próba alkalmazásával a statisztikai hipotézisvizsgálatot már elvégeztük. Vagyis tudjuk azt, hogy melyek az egymástól eltérő paraméterekkel rendelkező mintaszakaszok. Emellett azonban figyelembe kell venni azt is, hogy a tapasztalatok szerint a mintaszakaszok elemszáma igen gyakran kisebb, mint 30, s ezekben az esetekben az illeszkedést szabatosan csak a kis minták esetében is alkalmazható Fisher-Szi- gyártó próbával ellenőrizhető (Szigyártó 2012). Mindebből pedig az következik, hogy a sorozatos statisztikai hipotézisvizsgálattal kapott mintaszakaszok esetében annak a feltételezése, hogy ezek elemei normális eloszlásból származnak csak a vizsgálat elvégzését követően ellenőrizhető. Az eljárás algoritmusa Az eljárás feladata és általános előírásai Az előzőeket figyelembe véve a sorozatos statisztikai hipotézis vizsgálat feladata és a feladat végrehajtásához szükséges algoritmus általános előírásai a következőkben foglalható össze: 1. A sorozatos statisztikai hipotézisvizsgálat feladata a különböző középértékü vagy különböző szórású (általánosan fogalmazva: „különböző paraméterű”) normális eloszlásokból származó keverékeloszlások n elemű mintáján belül az azonos középértékű vagy azonos szórású, általában különböző ns elemszámmal rendelkező mintaszakaszok meghatározása. 2. Az eljárás a vizsgált paraméter mintán belüli eltéréseit az n elemű minta azonos (np=2, 3, ... maximum ni2) számú mintaelemet tartalmazó, s közvetlenül egymáshoz csatlakozó két mintából álló mintapárjainak a sorozatát vizsgálva határozza meg. 3. Az eljárás az empirikus középértékek eltérésének a vizsgálatát a Student próbával, az empirikus szórások eltérésének a vizsgálatát az F próbával végzi, és szignifikáns eltérésnek a P<5 %-os valószínűséggel jellemzett különbségeket tekinti. 4. Az «p elemű mintapárok vizsgálata nem eredményezhet n<np elemszámú mintaszakaszt. 5. A sorozatos statisztikai hipotézisvizsgálat szabatos elvégezhetőségének feltétele, hogy az n elemű minta minden egyes eleme a többitől teljesen független legyen, hogy a minta elemei normális eloszlásból származzanak. Ezért: 5.1. a mintaelemek teljes függetlenségét a vizsgálat megkezdése előtt, a teljes n elemű mintára támaszkodva, a Wald- Wolfowitz próbával, 5.2. a minta elemeinek a normális eloszlását pedig a vizsgálat végén, a mintaszakaszok elemeire támaszkodó Fisher-Szigyártó próbával ellenőrizni kell. 5.3. Mindkét próbáknak az eredményét a vizsgálat eredményeinek az összefoglalásakor közölni kell. Abban az esetben pedig, ha valamelyik próba eredménye szerint a szóban forgó statisztikai hipotézis teljesülése kétséges, a vizsgálat nem vagy nem teljes megalapozottságára a figyelmet fel kell hívni. A minta mintaszakaszokra bontásának algoritmusa Az n elemű minta általában különböző ns elemszámmal rendelkező mintaszakaszokra bontásának egymást követő lépései a következők: 1. Az eljárás a mintapárok paramétereinek a vizsgálatát a kételemű (np~2 elemmel rendelkező) mintapárok sorozatával kezdi a következők betartásával: 2. Az eljárás az azonos nv elemszámú mintaelemet tartalmazó mintapárok sorozatát a következők szerint veszi fel: 2.1. Az eljárás a két egymás melletti, azonosan np elemszámú, összesen 2np egymás melletti elemmel rendelkező mintapárt elsőként a minta, vagy — ha a mintán belül már vannak mintaszakaszok elő irányozva, úgy — az előirányzott mintaszakasz bal első mintaelemének a felhasználásával állítja elő. 2.2. Ezt követően a többi, ugyanezen np elemszámmal rendelkező mintapárt a minta észlelési sorrendjében balról jobbra egy-egy mintaelemmel tovább haladva jelöli ki, s így halad előre mindaddig, amíg a mintapár jobboldali mintájának jobboldali eleme azonos nem lesz a minta vagy az előirányzott utolsó, legalább 2«p elemszámú mintaszakasz utolsó elemével. 3. Az eljárás az azonos npelemszámú mintaelemet tartalmazó mintapárok sorozatának vizsgálatát a következők szerint végzi el: 3.1. Az eljárás a mintapár két tagjánál a kiválasztott paraméter eltérésének vizsgálatát a minta, vagy — ha már a mintán belül már vannak mintaszakaszok elő irányozva úgy — a vizsgált mintaszakasz bal első mintapárjánál kezdi, s a mintapárokkal balról jobbra egy-egy mintaelemmel tovább haladva folytatja mindaddig, amíg a mintapár jobboldali mintájának jobboldali eleme azonos nem lesz a minta vagy az előirányzott mintaszakasz utolsó elemével. 3.2. Az eljárás az np elemű mintapárok vizsgálata során a minta azonos paraméterekkel rendelkező szakaszokra bontását azon mintapárok két mintája között irányozza elő, amelyek vizsgált paraméterének az értéke egymástól szignifikánsan eltér; annak a feltételnek a betartása mellett, hogy az np elemű mintapárok vizsgálata nem eredményezhet ns<np elemszámú mintaszakasz előirányzását. 4. Abban az esetben, ha az adott np elemszámú mintapárokkal végzett vizsgálat a mintán vagy valamelyik már előirányzott mintaszakaszon belül talál olyan elvágási helyet, vagy helyeket, amelynek figyelembe vétele kisebb, mint np elemszámú újabb mintaszakaszokat eredményezne, úgy az eljárás ezeket az újabb elvágási helyeket megjelöli, majd a következők szerint jár el: 4.1. A mintát, illetve a vizsgált mintaszakaszt a megjelölt elvágási helyek közül elvágja annak a minta- párnak a két mintája között, amelynél a két paraméter vizsgálata a mintán, illetve a mintaszakaszon belül a legkisebb P<5 %-os valószínűséget eredményezte. 4.2. Ezt követően e vágási hely előtt, illetve után elhagyja azokat a szignifikáns eltérések alapján előzőleg már megjelölt elvágási helyeket, melyek figyelembe HIDROLÓGIAI KÖZLÖNY 2015. 95. ÉVF I.SZ..