Hidrológiai Közlöny, 2022 (102. évfolyam)
2022 / 1. szám
Hidrológiai Közlöny 2022. 102. évf. 1. szám 2. ábra. Sentinel-2 Multispectral Instrument szenzor valósszínes felvétele a Balaton 2019 szeptember 5-ei állapotáról (Forrás: ESA, Copernicus program) Figure 2. Colour image of Lake Balaton acquired by the Multispectral Instrument on Sentinel-2 on the 5th of September 2019 (Source: ESA, Copernicus program) A GPR Bayes módszerre vezethető vissza, amelynek több előnye is van. A módszernek analitikus megoldása van, a teljes a posteriori eloszlás elérhető és a variancia egy automatikus hozzáférhető eredménye a modellnek. így igény esetén nem csak a becsült a-klorofill értékek, hanem az ahhoz tartozó konfidenciaszintek is elérhetőek (Rasmussen és Williams 2006). A GPR mátrixok invertálásávai működik, nagy méretű adatsoroknál a tanítása lassú. Az NN-ben a tanulás alapja, hogy az input Rrs adat egy több neuronokból álló hálón vagy hálókon megy keresztül egy összegzési folyamat során. Majd a becsült output aklorofill egy költségfüggvényen keresztül kerül összehasonlításra a valós értékkel. A folyamat addig iterál, míg a felhasználó által előre meghatározott hibaérték alá kerül. Az NN-eknek előnye, hogy nagy adatmennyiséget is hatékonyan tudnak kezelni, viszont jellemző rájuk a túltaníthatóság, illetve a neurális hálózatok „fekete doboz” (black boksz) modellként viselkednek, ezért alkalmazhatóságuk a távérzékelésben kétségeket von maga után. Mind a három fentebb ismertetett módszernek számos változata létezik. Jelen munkában is több típust vizsgáltunk, azonban a számított regresszió statisztikái alapján a következő modellek elemzésével foglalkozunk: SVM-nél egy Gauss kernel függvényt használó modell, amely sikeresen tudja az adat nem lineáris természetét megtanulni; GPR-ban két variáns eredményezte a legerősebb regressziót: a négyzetes exponenciális, illetve az exponenciális kernel függvénnyel tanított modellek; NN-ek esetében négy variánst használtunk: a keskeny, a közepes, a széles és a mély gépi tanulásos hálókat vizsgáltuk. A különbség ezen NN-ek között a neuronok és rétegek számából adódik. A felhasznált MI módszerek tanítása és használata kétféleképpen történt. Az első esetben nem korlátoztuk az input Rrs adatforrások számát, és az S3 OLCI műszeren található összes (11) spektrális csatornát tartalmazta, míg a második esetben a tanításhoz felhasznált spektrális csatornák XAI algoritmussal lettek kiválasztva (Blix és társai 2018). A második módszer esetében a tanulásnál a 443, 665, 673 és 683 nm-es hullámsávú Oa03, Oa08, Oa09, illetve OaO 10-csatornákat használtuk. Vizsgálati módszer A tanító adatsort három részre osztottuk: az adatok többségét (70%-át) tanításra, míg az adatsor 20%-át tesztelésre és 10%-át validációra használtuk. A teszt és validációs adatokra regressziót illesztettünk, azonban jelen dolgozatunkban csak az átlagos abszolút hiba, a regressziós korrelációs koefficiens, valamint a tanuláshoz és a predikcióhoz szükséges időt mutatjuk be. Az algoritmusok közül kiválasztottuk a legjobb statisztikával rendelkezőket és azokon teszteltük a 2019. szeptember 5-ei műholdas felvételeket. Az egész folyamatot MATLAB-ban végeztük (www.mathworks.com). A legjobb teljesítményt (legalacsonyabb átlag abszolút hiba és legmagasabb regressziós korrelációs koefficiens) mutató modellek kerültek kiválasztásra az adatelemzési teljesítményük összevetéséhez, melyhez a 2019-es balatoni algavirágzás felvételeit használtuk fel, hiszen a kiemelkedően magas a-klorofill tartalom nagy hibákat is eredményezhet. EREDMÉNYEK, KÖVETKEZTETÉSEK ÉS JAVASLATOK Eredmények Algoritmusok kiértékelése Az 1. táblázat összefoglalja az MI módszerekkel, a validációs adatsorra számított statisztikai értékeket, me-