Levéltári Közlemények, 93. (2022)

Levéltártan - Bánki Zsolt István: A névterek mint a hiteles tudás forrásai. A Nemzeti Levéltár névtér projektjének bemutatása

A névterek mint a hiteles tudás forrásai rekordazonosítói viszont be voltak építve az aktuális Geotauruszba. így két lépcsőn keresztül mégis lehetséges volt a koordináták javítása, amennyiben sikerült magát a földrajzi helyet egyértelműen azonosítani az MNL rendszerében és a Geotauruszban. Ezt az műveletet az névalak azonossága és a meglévő koordináták meghatározott számú karakteregyezése alapján végeztük el és a következő ered­ményt értük el: - 70.854 Subject- 75.276 Term - 25.022 koordináta összesen- 15.832 javított koordináta (63,58%)- 9.190 javítatlan koordináta- 45.832 koordináta nélküli subject A számokat szemlélve - mielőtt gyors ítéletet mondanánk az eredményességet illetően - két szempontot vegyünk figyelembe. Az első az, hogy az azonosság meg­állapításánál nem tartottuk elegendőnek a névalak azonosságát, így a koordináta nélküli esetek kiestek a javítandók köréből. Ezt nem tekinthetjük veszteségnek, mivel a Geotaurusz koordinátákkal kiegészített aktuális verziója szerepelt a betöl­tendő új adatállományok között, és a MesterID képzés eredményétől várjuk a régi és az új állomány azonosságainak megállapítását. A másik szempont a 63,58% javítási arány, amely igen jónak mondható, hiszen abból a tapasztalatból indultunk ki, hogy a MNL állomány jelentős mértékben tar­talmaz jó koordinátákat is. Megítélésünk szerint a projektszakasz megfelelő ered­ményt hozott. Adatmapping és migráció - új adatforrások A kiinduló, meglévő állomány adattisztítása után a következő lépésben az új adat­forrásokkal folytattuk a munkát. Első lépésként pontos térképet kellett készíteni a rendelkezésünkre álló három állomány - két adatbázisból származó export, és egy szövegfájl - struktúrájáról és ezeket meg kellett feleltetni a Oracle-ben létező Getty modellnek. Tapasztalatunk szerint a Getty adatmodell döntően alkalmas volt az input állo­mányok fogadására, amit módosítani kellett, azt megengedte a rendszer rugalmas szerkezete. A tanulmány megírásának pillanatában a tervezett állományok közül betöltöt­tük a Geonames allCountry, a Geotaurusz és a Középkori Magyarország digitális atlasza (Engel) adatait, míg A magyar szent korona országainak helységnévtára még nem áll rendelkezésünkre. Ez a forrás minden bizonnyal a rendszer bővíthe­tőségének tesztjeként szolgál majd. 183

Next

/
Oldalképek
Tartalom