Levéltári Közlemények, 93. (2022)
Levéltártan - Bánki Zsolt István: A névterek mint a hiteles tudás forrásai. A Nemzeti Levéltár névtér projektjének bemutatása
Levéltártan A levéltári gyakorlat számára azonban ez az eljárás nem megfelelő, hiszen elképzelhetetlen lenne, hogy egy középkori forrásban szereplő korabeli helységnév helyett a mai közigazgatási állapotnak megfelelő elnevezés kerüljön be egy segédletbe. Azt az utat kell tehát járni, hogy a névtérbe kerülő összes földrajzi név - akár kitüntetett névalak, akár névváltozat - szükség szerint kiválasztható legyen. E felismerés - a maga újszerűségével - megnyitotta a kaput abba az irányba, hogy redundánsan egymás mellé helyezzünk több földrajzinév-állományt úgy, hogy azokat nem gyúrjuk össze egyetlen homogén masszává, hanem integritásukat és az eredeti kontextusokat minél teljesebben megőrizve nyújtanak választási lehetőséget a felhasználóknak. A rendszer egyúttal nyitott marad további adatforrások befogadására is. E megoldás nyilvánvalóan jelentős redundanciát eredményezett az egyes adatforrások között, de azokon belül megőriztük az egyediség elvét. A forrásállományok hitelességének garantálása végett született meg az a döntés, hogy a jövőben, a feltáró munka közben csak az MNL eredeti névtérállományát fogjuk bővíteni, módosítani, adatgazdagítani, a külső, kompakt adatforrásokat validált egységükben őrizzük, azzal az opcióval, hogy időről időre érdemes egy update-tel frissíteni az állományt. Nem mondhattunk le azonban arról a célról, hogy - bár az egyes források parallel léteznek - a névtérben mégis megteremtsük az entitások azonosságának kifejezését. E célt szolgálja az úgynevezett MesterID létrehozása, amely az összes névtérkomponensben logikai egységesítést hoz létre. E technikai csomópont mentén együtt láthatóak mindazok a névformák és kapcsolatok, amelyek fogalmilag összetartoznak. „A földrajzi névtér létrehozása során a különböző adatforrásokban szereplő rekordok egyértelmű (elsődleges) azonosítóikon keresztül kerülnek összekapcsolásra az egyes adatforrások között. Ezen azonosításhoz egy újonnan létrehozott, úgynevezett MesterID-t használunk, mely egyértelmű entitásként azonosítja az egyes rekordokat, (csak olyan földrajzi neveket tekint egyezőnek, melyek ugyanazon földrajzi helyet írják le és azonos típusúak).”12 A meglévő állomány adattisztítása, adatgazdagítása új, helyes koordinátákkal A meglévő állomány javításánál jelentős nehézséget jelentett, hogy a 2011 -es input állománynak tekinthető Geotaurusz nem rendelkezik azonosító elemmel, illetve az aktuális, 2022-es verzió közvetlenül nem tartalmaz geokoordinátákat. Rendelkezésünkre állt azonban a Földmérési és Távérzékelési Intézet adatbázisa, amely 78.798 földrajzi hely pontos geokoordinátáját tartalmazta. Ezen adatbázis 12 A Magyar Nemzeti Levéltár földrajzi névtér adatbázis rekordjainak összekapcsolása és levéltári segédletekkel való összerendelése - [Stratis Vezetői és Informatikai Tanácsadó Kft.:] Feladatleírás. Kézirat, 2022. 182