Levéltári Szemle, 72. (2022)

Levéltári Szemle, 72. (2022) 2. szám - MÉRLEG - Szerényi Ildikó: Az 1828. évi országos összeírás feldolgozása mesterséges intelligencia támogatásával és önkéntesek segítségével

73 2022/2. ▪ 73 – 86. Szerényi Ildikó Az 1828. évi országos összeírás feldolgozása mesterséges intelligencia támogatásával és önkéntesek segítségével 2021 folyamán a Magyar Nemzeti Levéltár a European Digital Treasures (Európa Digitális Kincsei) nemzetközi projekt keretén belül nagyszabású, innovatív önkéntes programot valósított meg. A programra jelentkezők eddig egyedülálló módon vállalhattak részt a levéltár szakmai munkájában, az 1828-as országos összeírás kézírásfelismerés alapján kereshetővé tett adatbázisának előkészítésében, értékes és pótolhatatlan támogatást nyújtva egy állami kulturális intézménynek. Az önkéntesek feladata az 1828-as országos összeírásból készülő, névre kereshető adatbázis közzétételének előkészítésében való részvétel volt. Mivel az önkéntes program által megvalósított társadalmi innováció szorosan kötődik az újító informatikai fejlesz­tésekhez (mesterséges intelligencia alapú kézírás-felismerő szoftver használata), ezért a projektleírásban először a projekt innovatív jellegének technológiai, ezt követően pedig társadalmi aspektusait ismertetem. A projekt háttere A családtörténet-kutatások az elmúlt időszakban – elsősorban a feldolgozást segítő tech­nológiai lehetőségek fejlődésének köszönhetően – új lendületet vettek, a felhasználók többsége szerte a világon genealógiai tartalmakért keresi fel a levéltárakat. Az intézmé­nyek a megnövekedett társadalmi igényt csak újszerű megoldásokkal tudják hatékonyan kiszolgálni, részben az automatikus feldolgozási lehetőségek jobb kihasználásával, rész­ben új munkavégzési formák alkalmazásával. A Magyar Nemzeti Levéltár az elmúlt tíz évben igen nagy tapasztalatot szerzett a di­gitalizált levéltári iratok optikai karakterfelismeréssel (OCR = optical character recog­nition) kereshetővé tett publikálásában. Az újabb és újabb informatikai újítások meg­jelenésével ma már a gépi kézírás-felismerés (HTR = hand-written text recognition) jelenti a legújabb kihívást – és lehetőséget – a levéltári szakma számára itthon és külföl­dön egyaránt. A levéltári iratok jelentős része hazánkban kézírással keletkezett, mivel Magyarországon az állami hivatalokban az írógéphasználat csak a 20. század elején vált elterjedtté. Jogosan merül fel tehát az igény a kutatói társadalom részéről a gépi kézírás­felismerés és az ebből fakadó előny, a kutatást sokszorosan megkönnyítő kereshetőségi funkció iránt. A gépi kézírás-felismerés gyakorlati levéltári alkalmazásához a European Digital Treasures nevű nemzetközi projekt biztosította a keretet. 2021 nyarán a Valenciai Műszaki Egyetem egy átírási algoritmust dolgozott ki a Trans­kribus kézírás-felismerő szoftver segítségével, a projektben részt vevő levéltárak egy-egy MÉRLEG

Next

/
Thumbnails
Contents