Hidrológiai Közlöny 1977 (57. évfolyam)
11. szám - Szöllősi-Nagy András: Szochasztikus irányítási modell vízfolyások oxigénfogyasztásának folyamatos szabályozásához. II. rész
472 Hidrológiai Közlöny 1977. 12. sz. Szöllősi-N agy A.: Sztochasztikus irányítási modell szuboptimalitésára utal. A rekurzív eljárás kezdő értéke tetszőleges lehet, azonban minél jobb a priori kezdeti becslés áll rendelkezésünkre az algoritmus annál hamarább konvergál. A [80] dolgozatban példát mutattunk be az algoritmus használatára, és kiemeltük az eljárás konvergenciájának gyorsaságát, nevezetesen: kb. 50 időegység után a becsült kovarianciaértékek „beálltak" valódi értékükre. Ez a konvergenciához szükséges idő pedig elenyészően kicsi ahhoz az időtartamhoz képest, amely a hidrológiai jelenségek kovariancia struktúrájában történő szignifikáns változás (évszakos ingadozás) megállapításához szükséges. Ebből következik, hogy mihelyst a kovariancia értékek „beálltak" valódi értékükre, attól kezdve állandóak, ill. olyan mértékben változnak, amilyen mértékben a környezeti bizonytalanságok módosulnak — tehát automatikusan adaptálódnak a változó környezeti (hidrológiai, meteorológiai, biológiai) hatásokhoz. Természetesen mindaddig amíg a kovarianciák nem vettek fel stabil értéket a folyamatot csak megfigyeljük és nem irányítjuk. A 2. táblázatban a Kalman-szűrő algoritmusában Rj(í) és -ffj(í) a már stabil kovarianciákat jelentik, azok további adaptív becslését változatlanul a táblázat alján levő algoritmusokkal számítjuk. Megjegyezzük még, hogy hasonló elvű szekvenciális adaptív algoritmus konstruálható a bizonytalanságok várható értékének becslésére (1. [68]) — ezzel a modell paramétereinek becslése és a folyamat mérése során jelentkező szabályos hibákat lehet kiküszöbölni. A szabályos hibákat az (e) pont (1. I. részben) alatt tárgyalt módoÍ-X sított állapottér modellel azonban lényegesen egyszerűbben is lehet kezelni. A fentiek szerint tehát, a sztochasztikus állapotváltozások optimális becslését ill. előrejelzését egy szekvenciális rekurzív algoritmussal valósíthatjuk meg. 3. Az optimális irányítási stratégia megválasztása dinamikus programozással Mint láttuk az optimális vízminőségszabályozási politika a (35) költségfüggvény minimalizálásával kapható meg — az adott korlátozó feltételek egyidejű figyelembe vétele mellett. A következőkben megmutatjuk, hogyan vezethető vissza a sztochasztikus optimalizálási probléma determinisztikus dinamikus programozási feladatra, ahol az állapotokat azok — az előző pontban tárgyalt — optimális becslése reprezentálja. A t időpontig a megelőző mérések u2<_i = [z(ío). z(t 0+1), . . ., z(t — \)Y vektora áll rendelkezésre, a feladat pedig a még hátralevő döntések optimalizálása. A t időpontnál a (35) költségfüggvény tulajdonképpen két részre bontható fel: N-l 2 tll x(T)-d IP +11 u(T) ll^]} + <5{|| x(N)-á + 2 [II s(T)-d 11^ + 11 u(T) IIJ^]}, T = «„ I = í amiből is látható, hogy csak a második tag értéke dő csak a második tag minimalizálása. Feltéve, függ a meghozandó u(í) döntéstől, mely optimális hogy a minimum létezik, akkor az optimalizálási értékének megállapításához nyilvánvalóan elegen- lemma (1. Függelék, F.l.) alkalmazásával kapjuk, hogy N-I <5|||x(^)-d||J B+ X tll 11^ + 11 u(r) = z = t =<(0 4 1 x(IV )D "QO + 2 ni m+n «<*> ny !*,_,}}• (47) ahol <5{-|iZí_i} feltételes várható értéket jelent függvényeként fejezhetők ki és megengedheadottj2«_i mint feltétel mellett, míg a jobboldal első tők (v.o. (32)). . , , ,.(>„,, — Ti// ,. , , A fenti gondolatmenetet ismetelve a í+1, /,{.} művelete a eloszlására vonatkozo vár- í +2> x időpontokra> é s továbbra is feltéve hatóérték-képzést jelöli; a minimumot pedig mind- az u( í) ; u( í +i), u(jy_ 1) irányítások egziszazon u(t) irányításokra nézve tekintjük melyek tenciáját és unicitását a következő kifejezést kapjuk: min u(<) u(iV-l) N-L _ <ü{|| x(2V) —d \\l+ 2 [II x(r)-d ||^ + || u(r) II^^K-x'')}' (48) ahol az egyenlet jobb oldala a (47) jobb oldalán a külső kapcsos zárójelben álló kifejezés megfelelője az összes hátralevő döntésre nézve, azaz t-1 ut€U N-l <sj|| x(iV)-d + 2 [II x(T)-d H^ + ll U(T) 11^] (49) ahol U( a hátralevő döntések halmazát jelöli, fennáll, hogy u< = u.y, hacsak < —í 0. A <V(<2. t~\, t) U/ = {U(T) : Í=s T^N— L}, amelyre definiciószerűen részletesen kiírva tehát a következőt jelenti: «KSL t-i u(/) ;|ll x(í) —d + ll«(0lli + + min u(í+l) 4 D-d Ii; + 11 u(í+1) N i + u (7 + n 2 )^-. -I^J. • •}. (50)