A Magyar Hidrológiai Társaság XXXIX. Országos Vándorgyűlése (Nyíregyháza, 2022. július 6-8.)
5. szekció - Hidrológia, hidrogeológia, hidraulika, numerikus modellezés - 7. Fekete Árpád - Keve Gábor (NKE): A villámárvíz kockázatának becslése sztochasztikus modellel
A kategorizálási eljárás matematikailag felírva a következő: f 1 ,ha 0 < xt < Q1 Xt = {i, ha Qt-1 < xt < Qi, i = 2,3, ..., N — 1 I N,ha xt > Qn-1, ahol az Xt változó a hozam intervallumot jelzi és 0 < Q1 < Q2 < ■■■ < QN-1 < QN a vízhozam értékek a kategóriák határain. Az Xt idősor az X = {1,2,..., N} véges halmazból vesz fel értékeket. A csapadék adatokat is hasonló módszerrel kategorizálhatjuk. A kategorizálás során természetes kérdésként adódik, hogy miként válasszuk meg a kategóriák számát (N) és a kategóriák határait. Erre a legjobb módszer a K-közép algoritmus (Hartigan 1975), mely a nem hierarchikus klaszterelemzési módszerek közül a legnépszerűbb. Ez az algoritmus az adatsor minden egyes elemét ahhoz a klaszterhez (kategóriához) sorolja, amelyiknek a középpontja a legközelebb esik az adott elemhez. A K-közép algoritmus tehát a legjobb particionálást keresi adott K számú klaszterhez az n E[P(n,K)] =Yix(0— B[L(i)]]2 i=1 kritérium alapján, ahol n az összes adat száma, melyet K darab klaszterbe csoportosítunk. Az x(i) jelöli az i. adat értékét, L(i) jelöli azt a klasztert, amelyhez az i. adat tartozik, míg B[L(i)] az L(i) klaszter értékeinek számtani közepe. így a felírt kritérium az n darab adat K számú klaszterbe sorolásának teljes négyzetes hibáját adja meg. A kritérium alapján az a partíció a legjobb, amely minimalizálja a teljes négyzetes hibát. A kategóriákat szubjektív módon is megalkothatjuk, de vigyázni kell, hogy minden kategóriába elegendő számú adat essen, különben hibás és félrevezető számítások adódhatnak. A KÉTVÁLTOZÓS MARKOV-LÁNC Mindenekelőtt röviden összefoglaljuk a Markov-láncokkal kapcsolatos alapvető fogalmakat. A Markov-folyamat olyan sztochasztikus folyamat, melyet az a tulajdonság jellemez, hogy a folyamat jövőbeli viselkedése alakulásának valószínűsége, ha a pillanatnyi állapot teljesen ismert, nem változik azáltal, hogy többet tudunk meg a múltbeli viselkedéséről (Karlin-Taylor 1985). Matematikai formában felírva Markov-folyamatot adunk meg, ha P{a <Xt< b\Xti = xvXt2 X2, ■■■,Xtn = xn] = P{a <Xt< b\Xtn = xn} (1) minden t1 < t2 < ...<tn<t esetén. Markov-láncnak nevezzük a véges vagy megszámlálható (más szóval diszkrét) állapotterű Markov-folyamatokat. Az (1) alapján felírható tehát a diszkrét-idejű Markov-lánc definíciója: P{Xt = i\X± = ivX2 = Í2............Xt-± = i—} = P{Xt = i\X-íf-1}. (2) Azt mondjuk, hogy a folyamat a t időpontban az i állapotban van, ha Xt = i. A (2) egyenlet jobb oldalát egylépéses átmenet-valószínűségnek nevezzük és Ptj-vel jelöljük. Megjegyezzük, hogy itt homogén Markov-láncot tételezünk fel, azaz az egylépéses átmenet-valószínűségek függetlenek az időtől. A P számok mátrix formájában is elrendezhetők (Feller 1951). A P= (P ) mátrixot a folyamat átmenet-valószínűség mátrixának nevezzük. A P minden egyes P eleme annak a valószínűségét jelenti, hogy az állapotok értéke az i-ből j-be megy át egy lépésben. Egy lépés egy időegy