Hidrológiai Közlöny, 2018 (98. évfolyam)
2018 / 3. szám - SZAKCIKKEK - Bagyinszki György: Monitoring adatsorok értékelése - lehetőségek és módszerek az adatgyűjtéstől az előrejelzésig
56 Hidrológiai Közlöny 2018. 98. évf. 3. sz. Maga a monitoring folyamat a mintavétel, mérés és adatközlés ciklusának ismétlődését jelenti mindaddig, amíg el nem érkezik a kiértékelés feladata. ÉRTÉKELÉS A kiértékelés során az addig gyűjtött adatokat, eredményeket kell feldolgozni és értelmezni, gyakran a nem szakmabeli vagy a körülményeket kevésbé ismerő döntéshozók számára. Az ilyesfajta értékelésben nagy jelentőségük van a feldolgozott adatokat és az értékelés eredményeit bemutató ábráknak, diagramoknak, táblázatoknak, amelyek segítenek a feltárt tulajdonságok bemutatásában és a levonható következtetések megvilágításában, megértetésében. Az adatfeldolgozás Tu key (1977) nyomán két fázisra bontható, az első ún. feltáró fázisra és az ezt követő igazoló vagy bizonyítási fázisra. Az első célja az alapvető jellegzetességek feltárása, míg a másodikban a feltárt jellegzetességek igazolása, számszerűsítése, értelmezése, összevethető formában történő megjelenítése történik. A két fázis nem válik el élesen egymástól és gyakran iteratív módon zajlik az értékelési folyamat, amely rendszerint a feldolgozandó adatok táblázatba rendezésével és áttekintésével kezdődik. Manapság erre a célra szinte kizárólag valamilyen táblázatkezelő szoftvert használunk. Ezek a szoftverek lehetővé teszik az adatok rendezését, ábrázolását, bizonyos szintű feldolgozását, számítások elvégzését, ezért nagyon jól használhatók a felismerési fázisban. Elsődleges feldolgozás Táblázatba rendezett adatsoraink vizsgálatát rendszerint az adatok jellemzésével kezdjük. Alapvető jellemzők az adatok száma, a legkisebb és legnagyobb értékek, a különböző csoportjellemzők, mint az átlag, szórás, médián, stb. értéke, és nem utolsó sorban az adatok elhelyezkedése a határértékhez képest. Az így kapott számszerű jellemzők fontosak, de még gyakorlott értékelők számára sem mindig értelmezhetők könnyen. Jóval szemléletesebben mutatja be adatainkat az 1. ábrán látható dobozdiagram (Hipel és McLeod 1994). Bőr koncentrációk frityi] eloszlása az M9 monitoring kútban o 8 O ' O o CD O O CD O O TT O O CM 1. ábra. Adatok ábrázolása dobozdiagramban Figure 1. Data visualisation in box-whisker diagram A dobozdiagramon látható téglalap vízszintes oldalai az alsó és felső kvartilis, a középen látható vastag vonal a médián értékét mutatja. A szaggatott vonallal jelölt tartomány addig a legkisebb és legnagyobb értékig terjed, melynek távolsága az alsó és felső kvartilistől nem nagyobb, mint a belső kvartilisek különbségének 1,5-szerese. Más szavakkal: azokat a szélső értékeket mutatja meg, melyek a doboz aljától és tetejétől nincsenek messzebb, mint a doboz magasságának másfélszerese. A tartományon kívül eső (kiugró) értékeket külön pontok jelölik. Kiugró érték nélküli esetben a tartomány végpontjai a legkisebb és legnagyobb értéknél találhatók. Ha a diagramba az 1. ábrán látható módon (piros vonal) berajzoljuk az adott komponenshez tartozó határértéket is, akkor rögtön lehetővé válik az adatok elsődleges értékelése. Egy ábrán belül több adatsort is ábrázolhatunk, ezáltal a 2. ábrán látható módon egyszerre szemléltethetjük a monitoring rendszer elemeinek adatait. 2. ábra. Több objektum eredményeinek együttes megjelenítése Figure 2. Showing data of multiple objects A dobozdiagramként történő ábrázolás alkalmas a környezeti adatokban minden esetben feltételezhető szezona- litás gyors felismerésére is. Az adatokat a vélt szezonali- tásnak megfelelően negyedéves, havonkénti, stb. csoportokra bontva és ábrázolva, értékelhetővé válnak az éven belüli szezonális különbségek (3. ábra). Fajlagos elektromos vezetőképesség [nS/cm] az M2 kút vizében o o rr o o CM 8 O 3. ábra. Negyedévenkénti adatok összehasonlítása a szezona- litás felismerésére Figure 3. Comparing quarterly data to detect seasonality A felismert szezonalitás igazolásának egyik lehetséges módszere a Kruskall-Wallis próba (Hipel és McLoad 1994), melynek nullhipotézise az, hogy az összehasonlított mintacsoportok eloszlásfüggvénye azonos, ami azt is jelenti, hogy várható értékük megegyező. Az alternatív hipotézis szerint az összehasonlított mintacsoportok közül legalább az egyik eloszlásfüggvénye különbözik a többitől. A Kruskall-Wallis teszt előnye, hogy nem-paraméteres