Hidrológiai Közlöny 1977 (57. évfolyam)
10. szám - Szöllősi–Nagy András: Sztochasztikus irányítási modell vízfolyások oxigénháztartásának folyamatos szabályozásához
Szőllősi-Nagy A.: Sztochasztikus irányítási modell Hidrológiai Közlöny 1977. 10. sz. 441 0 = -K r K a — K r exp (- Kr) [exp ( — Kr) — exp (-K a)] • exp(-K a) (24) alakban írható. Annak következtében, hogy az u(t) irányítási változó szakaszonként állandó, vagyis u(í + e)=u(Q, v«€[í,í+l), (25) a G mátrix a diszkrét modellben is ugyanaz marad; megkülönböztetés kedvéért azonban azt most P-val jelöljük — megjegyezve, hogy ha a (25) feltétel nem teljesül a G mátrix diszkrét modellbeli megfelelőjének megkereséséhez a fentiekhez hasonló eljárást kell kövessünk. Most már felírhatjuk a folytonos folyamat diszkrét modelljét, ami tehát az alábbi alakot ölti: x(í+lj=0x(f) + ru(f) + w(í), (26) ahol w(t) a T diszkrét időhalmazon értelmezett sztochasztikus sorozat a (13) statisztikák diszkrét megfelelőjével megadva. Ami az n(<) irányítást illeti, arról még a következőt mondhatjuk: nyilvánvaló, hogy az iV+1 elemet (véges számú diszkrét időpontot) tartalmazó T halmazon értelmezett folyamatot irányító döntési sorozat csak N döntést tartalmazhat, hiszen a döntéseket diszkrét időpontokban hozzuk meg — pontosabban szólva: „közvetlenül azok után" — lim u(í + e) -s->-0 + u(í), (27) tehát az x(N) végállapotot csak az u(N — 1) irányítással tudjuk befolyásolni, így u(i^)-nek már nincs értelme — nem is definiáljuk. A teljes döntési sorozatot — melyet döntési törvénynek is szoktak nevezni —, tehát az Utf=[u(í 0), u(í 0+l), ..., u(JV — 2), 11 (A^ — l)] y hipervektor reprezentálja, amelyre fennáll, hogy U. Az A T — 00 esetet jelentő szabad végidejű irányítási problémákat illetően Kushner [44] könyvére utalunk, megjegyezve, hogy azok matematikailag lényegesen nehezebben kezelhetők. Összefoglalva: a (26) vízminőség-szabályzozási modell időben diszkrét, állapotváltozójában folytonos, az irányítás végideje pedig rögzített. (e) Az állapotok mérése. A szabályozás célja az állapotváltozók kedvező irányába történő befolyásolása, amiből következik, hogy a politikák mindig az állapotváltozók mérésén alapulnak. A (26) szerinti vízminőség-szabályozási modellnél azonban nem mérhető on-line mindkét állapotváltozó — a BOI meghatározása több napos laboratóriumi analízist igényel, és így az irányítások megválasztása a közvetlen oxigénhiány-méréseken alapszik. A diszkrét mérési modell tehát az alábbi alakot ölti: z(*) = Hx(f) + i>(*), (28) ahol H=[0, 1], {?;(<): t£T} pedig egy gaussifehér zaj típusú skaláris mérési bizonytalanság zérus várhatóértékkel 6{v(t)}=0 (29a) és cov{v(t)}=£{v(t), ^(T)}^^ (296) kovarianciával (skaláris folyamatról lévén szó, itt: szórásnégyzettel) jellemezve, d t T a diszkrét esetnek megfelelően a Kronecker-szimbólumot jelenti. A továbbiakban feltesszük, hogy a w(<) modell- és a v(t) mérési bizonytalanság egymástól függetlenek, vagyis cov{v(t), W(Í)}=^{Í;(<)W T(T)}—0. (29c) Az a feltétel, mely szerint a bizonytalanságok zérus középértékűek, nem megy az általánosság rovására, hiszen ha (5{w(í)} = r 1 <5{»W>=r, jelölik az ismeretlen állandó középértékeket, melyekre vonatkozóan igaz, hogy r 1(í+l) = r 1, r 2(<+l)=r 2, akkor az x(í) állapotvektort ezekkel kibővítve egy új x'(í + l)=[x T(í) j r^í), M«)] 1" állapotvektor bevezetésével a következő módosított állapot- ós mérési egyenletek írhatók fel: x'(í+l) = tf>'x'(<) + -ru(<) + w'(e) z(t) = Wx'(t), +v(t), ahol: 0 0 0 0 0 0 0 1 0 r 0 0 0 0 0 0.01 H'=[H T ; 0 o] T, W'(Í)=[W T(<): 0 of, melyekből kitűnik a (26) és (28) egyenletekkel való formai megegyezés, mely egyúttal lehetővé teszi azonos módon történő matematikai kezelésüket is. Az egyszerűség kedvéért azonban, a továbbiakban változatlanul élünk a (13/a) és (29/a) feltételekkel. A t időpontban rendelkezésre álló mérési sorozatot a £t=[z(t 0), z(t 0+l), ..., z(t)Y (30) vektorral reprezentáljuk. A £í t mérési vektor a (t — í 0+l) dimenziós Z, mérési térhez tartozik, !2.tíZt, és a következő magától értetődő „lánc"tulajdonsággal rendelkezik: z(t)i (3i) Mint láttuk az u(<) irányítás a megelőző íZt-i mérési eredményeken alapszik, tehát U(<)=^_ 1], (32) ahol az egyes irányítási politikákat szimbolizáló funkcionál, amelyek közül választandó ki az egy bizonyos szempontból optimálisan viselkedő — nevezetesen: a minimális költséget adó 2 ). Előrebocsátjuk, hogy az optimalizálás során éppen az okozza a nehézséget, hogy a mérési tér dimenziója nem állandó, dim Zt^ const, hiszen az idő haladtával egyre több mérés áll rendelkezésünkre, és így Z t dimenziója növekszik. A mérési bizonytalanság statisztikájáról ugyanazt mondhatjuk mint a modell bizonytalanságáról: