Hidrológiai Közlöny, 2015 (95. évfolyam)
2015 / 1. szám - Szigyártó Zoltán: Sorozatos statisztikai hipotézisvizsgálat excel-táblázattal
38 HIDROLÓGIAI KÖZLÖNY 2015. 95. ÉVF. l.SZ számos helyen azért módosítva, hogy a bemutatott példából a sorozatos statisztikai hipotézisvizsgálat jellemző sajátosságai minél jobban kitűnjenek — a Student próba felhasználásával vizsgáljuk meg annak kiderítésére, hogy az így kapott (és az 7. táblázat második oszlopában feltüntetett) adatsor középértéke hol és milyen mértékben változik. Magával e táblázattal kapcsolatban mindenek előtt azt kell megemlíteni, hogy annak következtében, hogy az e- redetileg észlelet adatok közül többet megváltoztattunk, a minta egyes elemeihez évek már bizonyosan nem rendelhetők. Ezért tartalmazza tehát a táblázat első oszlopa az észlelés éve helyett a mintaelemek sorszámát. Továbbá hivatkozva az eljárás általános előírásainak az 5.1. pontjára, itt kell szólni arról is, hogy a 31 elemű mintára elvégzett Wald-Wolfowitz próba 7JWW=96,9 %-os eredménnyel zárult. Vagyis a minta elemei egymástól teljesen függetlenek tekinthetők, s így nincs akadálya annak, hogy a bemutatott algoritmus szerint a vizsgálatot elvégezzük. Egyébként az említett 7. táblázat szerint az előirányzott sorozatos statisztikai hipotézisvizsgálat eredményes lezárásához két vizsgálatra és két ellenőrzésre volt szükség, amelyekkel kapcsolatban a figyelmet a következőkre célszerű felhívni: 1. vizsgálat AZ ADATSOR 1.Ytog*l»t 2. »tagtet 2..ll.n6a«» *orNV 2-2 év 3-3 év 4-4 év P. Feltétel 4-4 év 5-6 év P. Feltétel szitm cm % % % % % % % 1 904 # Vége!2 873 # Nincs3 885 47,5 6 év!4 769 13,7 0,»l Vésel 0,0 P<6%0,0 P<6% 5 702 28.7 7,5 Nincs6 716 83,1 71.8 8 év!7 777 8.5 29,98 810 77.0 3«,09 720 29.4 32.810 773 51,9 19.811 560 8,3 r 0/4| Vége! 0.7 P<6%0.7 P<5% 12 460 34.4 20.6 Nincs13 544 35,5 68,t 8 év!14 658 7,61 1,41 Vége! OJ P<5 %0,8 P<5% 15 732 28,2 10.8 Nincs16 685 100,0 27.1 8 év!17 705 52.0 83.818 800 93.3 54,219 610 99,6 47,920 897 21.5[ 2,1 J Vége! 0,7 P<5%0,7 P<5 % 21 974 31.6 20,3 Nincs22 1041 92.2 90,0 8 év!23 800 19.7[ 4,S| Vége) 4,6 P<5 % f Vége! 0,3 P<5% 24 569 16.5 i Nincs # Nincs 25 492 74.9 # 8 évi f 10 év! 26 750 • Vége! 38,8 P25% # 27 827 21.3 • Nincs 42,8 28 1013 97.7 • 8 év! 76,2 29 547 12,6 f 30 654 62.8 * • I_!2 598 f • # 1. táblázat. Mintapélda az évi legnagyobb jégmentes vízállás középértékének a változását kimutató sorozatos statisztikai hipotézisvizsgálat elvégzésére. 1. Az 7. táblázat harmadik oszlopa az algoritmus 1-3.1. pontja szerint a kételemű adatpárokkal végzett vizsgálatok eredményeit foglalja össze. Ezeket alapján pedig megállapítható, hogy a mintánál a 25. és 26. elem közötti elválasztó vonal előtt és után egyetlen olyan kételemű egymás melletti adatpár van, amelynél a Student próba P<5 %-os szinten (P=4,2 %-os értékkel) szignifikáns eltérést mutat. 2. Ezért ezen a helyen az algoritmus 3.2. pontja szerint a minta elvágását előirányozva a vizsgálatok az algoritmus 4. pontja szerint folytatódnak. Azaz meg kell vizsgálni azt, hogy a minta 1-25. és a 26-31. eleme közötti két mintaszakaszon belül teljesül-e az ns>np kikötés. Ami a jelen esetben teljesül is, hiszen np=2, s az első mintaszakasz esetében ns=25, míg a másodiknál ns=6. 3. így aztán a vizsgálat a továbbiakban az algoritmus 5. és 5.2. pontja szerint folytatódhat; megállapítva azt, hogy az adott körülmények között 2(«p+l)=6. Vagyis mindkét most előirányzott mintaszakasz esetében a vizsgálatokat az algoritmus 2-4. pontja szerint a háromelemű mintapárokkal kell folytatni. Ezekkel a háromelemű mintapárokkal folytatott vizsgálatoknak az eredményeit aztán az 7. táblázat negyedik oszlopa foglalja össze. E szerint tehát a mintának a 25. e- leméig tartó, eddig előirányzott első szakaszán belül (a 3. és 4., a 10. és 11., a 13. és 14., a 19 és 20, továbbá a 22. és 23. eleme közötti elválasztóvonalat közrefogva) öt o- lyan háromelemű, egymás melletti adatpárja is van, a- melynél a Student próba P<5 %-os szinten fP=0,8 %-os, P=0,4 %-os, P= 1,4 %-os P=2,1 %-os és P=4,6 %-os értékkel) szignifikáns eltérést mutat. Másrészt megállapítható az is, hogy a mintának a 26. elemével kezdődő, eddig előirányzott második mintaszakaszán belül a minta további felbontására most lehetőség nincsen. 4. Ezért az előzőekben felsorolt helyeken az algoritmus 3.2. pontja szerint a minta elvágását előirányozva meg kell vizsgálni azt, hogy a mintának az előzőekben felsorolt hat elvágásával létrehozott öt mintaszakaszán belül teljesül-e az n^nr kikötés. Ami a jelen esetben teljesül is, hiszen np=2, s az első, a harmadik és az ötödik mintaszakasz esetében ns=3, míg a másodiknál n=l, a negyediknél pedig ns=6. 5. így a vizsgálat az algoritmus 5. pontja szerint folytatódhatna, ha legalább egy mintaszakasz esetében teljesülne az «s>2(np+l)=8 feltétel. A jelen esetben azonban (a jelen ismertetés előző pontja szerint) mindegyik előirányzott mintaszakasz esetében ns<2(«p+l). így figyelembe véve az algoritmus 5.2. pontját a vizsgálatokat négyelemű mintapárokkal a további vágás helyek keresése érdekében folytatni már sehol sem lehet. 6. Éppen ezért a további feladat az algoritmus 6. pontja szerint annak ellenőrzése lesz, hogy az előirányzott összesen hét mintaszakasz mindegyikének a középértéke szignifikánsan eltér-e a szomszédos mintaszakasz (illetve szomszédos mintaszakaszok) középértékétől. 1. ellenőrzés 1. Az eddigi eredmények szerint (mint azt az 7. táblázat is jól mutatja) a vizsgált 31 elemű mintán belül hat vágással hét mintaszakaszt lehetett előirányozni. U- gyanekkor azonban az algoritmus 6.2. pontjának megfelelő vizsgálat eredménye szerint a minta 25. és 26. eleme közötti utolsó, hatodik vágáshellyel létrehozott három- és hatelemű minta két középértéke a Student próba P= 38,8 %-os eredménye szerint szignifikáns (P<5 %-os) eltérést nem mutat. 2. Ezért e két előirányzott mintaszakaszt egyesíteni kell, majd ezen az új szakaszon a vizsgálatot az algo-