Levéltári Szemle, 72. (2022)
Levéltári Szemle, 72. (2022) 2. szám - MÉRLEG - Szerényi Ildikó: Az 1828. évi országos összeírás feldolgozása mesterséges intelligencia támogatásával és önkéntesek segítségével
74 Levéltári Szemle 72. évf . homogén irategyüttesére alapozva. A nemzetközi projektben közreműködő levéltárak a Magyar Nemzeti Levéltár mellett Málta, Norvégia, Spanyolország és Portugália nemzeti levéltárai voltak. A résztvevők feladata az volt, hogy egy előzetesen feldolgozott iratanyag gépi tanulással felismertetett verzióját további tanítással tökéletesítsék. A mesterséges intelligencia közgyűjteményi környezetben történő használata hazánkban már nem számít teljes egészében újdonságnak, hiszen azt a Magyar Nemzeti Levéltár a Szovjet táborok magyar foglyai elnevezésű adatbázis indexelésénél is igénybe vette már. A Transkribus kézírás-felismerő program tesztelését Magyarországon közgyűjteményi területen először a Petőfi Irodalmi Múzeum Digitális Bölcsészeti Központja1 kezdte meg. A felhasznált iratanyag Az előkészítés során a projektben részt vevő minden nemzeti levéltár maga döntött arról, hogy mely családtörténeti vonatkozású iratanyag digitális másolatát dolgozzák fel egységes szempontok alapján. Az egységes szerkezetű, egységes időkörrel és a lehetőségekhez képest egységes kézírással keletkezett levéltári irategyüttesek feldolgozásra való kiválasztása segítette a gépi kézírás-felismerés hatékonyságát, ám természetesen fontos szempont volt még a kiválasztott iratanyagok iránti kutatói figyelem is. E szempontrendszer alapján a levéltáros kollégák és az egyes országok önkéntesei Máltán kivándorlási nyilvántartásokat, Norvégiában lakcímnyilvántartásokat, Portugáliában kegyelmi kérvényeket, Spanyolországban pedig útlevél-nyilvántartásokat dolgoztak fel. A Magyar Nemzeti Levéltárnak egy 2020-as kormányhatározat2 értelmében kiemelt szakmai feladata lett a családtörténeti források feltárása és digitalizálása, az eredeti iratok digitális másolataihoz való elektronikus hozzáférés elősegítése, a családtörténeti kutatásokat elősegítő tartalom- és szolgáltatásfejlesztések megvalósítása, mindezek élményszerű bemutatása, valamint a családtörténeti kutatások módszertani támogatásának díjmentes szolgáltatásként történő ellátása. Az intézményhez érkező kutatói kérések igen nagy részét családfakutatási tárgyú megkeresések teszik ki, ezért a feldolgozandó iratanyag kiválasztásánál annak családtörténet-kutatási hasznosíthatósága kiemelkedően fontos szempont volt. Így esett a választás a család- és helytörténészek által igen gyakran kutatott, de eddig digitális másolatban még közzé nem tett 1828-as országos összeírásra.3 A 190 ezer képfájlból álló teljes irategyüttesben mintegy száz különböző kancelláriai kézírás ismerhető fel, ezért a kézírás-felismerő szoftver eredményeinek pontosításához nélkülözhetetlen volt az önkéntesek által hozzáadott humánerőforrás, az algoritmus által automatizáltan felismert és átírt nevek jóváhagyása vagy javítása. Az 1828-as összeírásból internetes adatbázis készül, amelynek szakmai előzményei közé tartozik a 2010-es évek elején közzétett 1715-ös és 1720-as összeírás. Utóbbiak a Magyar Nemzeti Levéltár által kezelt Adatbázisok Online felületen érhetők el és 1 Az említett szervezeti egységet azóta az Országos Széchényi Könyvtárba integrálták. 2 Magyar Közlöny, 2020/288. szám, p. 10718. 3 HU-MNL-OL-N 26 Szerényi Ildikó