Vízügyi Közlemények, 2023 (105. évfolyam)

2023 / 3. szám

Vízügyi Közlemények, CV. évfolyam, 2023. évi 3. füzet 95 Napjainkban a mélytanuló rendszerek markáns részében használunk ilyen architektúrát (pl. gépi látással, beszédfelismeréssel és beszédkeltéssel, vagy ál­talános idősor elemzéssel kapcsolatos alkalmazásokban). A rekurrens neurális hálózatok (Recurrent Neural Network, RNN) irányított, kört is tartalmazó számítási gráfokat használnak a be- és kimenet közötti kap­csolat meghatározásához, így alkalmasak szekvenciális adatok, idősorok model­lezésére. Az RNN alapjait John Hopfield munkája jelenti (Hopfield 1982). Az RNN-ek sokáig csak rövid szekvenciákat tudtak hatékonyan modellezni. Ennek a problémának a megoldására nyújtott megoldást a Long Short-Term Memory (LSTM) (Hochreiter et al. 1997). A fenti három különböző típusú neurális háló­zatot a célnak megfelelően akár egy számítási gráfban is lehetséges kombinálni. A mélytanulási eljárások elterjedését részben a korlátozott Boltzmann-gépek­­ből (Restricted Boltzmann Machine, RBM) felépített Deep Beilef (DBN) archi­tektúrák vezették be (Hinton et al. 2006). Jelentős áttörést A lex Krizhevsky, Ilya Sutskever és Geoffrey Hinton munkája hozott (Krizhevsky et al. 2012), amikor szignifikánsan jobb eredményt értek el a GPU-kon megvalósított konvulációs neurális hálózatok segítségével a korábbi módszerekhez képest. Ettől kezdve ki­emelt figyelmet kapott a neurális hálózatok szakterülete. Ahhoz, hogy a mai komplex mélytanuló rendszerek adott alkalmazási területeken a legnagyobb pon­tosságot el tudják érni, még további elméleti eredményekre is szükség volt: • törtvonalas aktivációs függvény (Glorot et al. 2011), • reziduális hálózatok (Szegedy et al. 2017), • dropout eljárás (Srivastava et al. 2014). 2.3. A mélytanulás jelene A mélytanulás mára számtalan szakterületen került alkalmazásra, és jelentős eredményeket hozott a közgazdaságtantól, a gépjárműiparon, a közigazgatáson keresztül a vízgazdálkodás tudományterületét érintően egyaránt. A legáltaláno­sabb értelemben három szakterület eredményei került át a köztudatba. 2.4. A gépi látás A gép látás témaköréhez kapcsolódóan a képfelismerés (a tanulási fázisban megadjuk, hogy mi látható a képen (Hinton et al. 2006), az objektum felismerés (Liu et al. 2016), a szemantikus szegmentáció (Chen et al. 2018), mélységbecslés (Liu et al. 2015), tartalomrekonstrukció, továbbá a kép- és videogenerálás (Van den Oord et al. 2016). A képfelismerési eljárások jelentős támogatást nyújtanak az egészségügy területén (Esteva et al. 2017). 2.5. Beszéd és hangfeldolgozás A technológia két meghatározó ága a beszédkeltés (Van den Oord et al. 2016)

Next

/
Thumbnails
Contents