Levéltári Szemle, 61. (2011)
Levéltári Szemle, 61 (2011) 3. szám - HÍREK - KENYERES ISTVÁN: Beszámoló a 8. európai digitális archiválási konferenciáról
Hírek ha egy adatbázis nem ilyen, átadás előtt be kell tölteni egy relációs rendszerbe. Ez vonatkozik a fájlrendszerben, könyvtárstruktúrában tárolt minden dokumentumra is, ezeket is átadás előtt be kell tölteni tartalmukkal együtt egy relációs adatbázis-kezelőbe. A dán SIP-et tehát a fentebb felsorolt könyvtárstruktúraként kell elképzelni, amelyek az alábbi fő könyvtárakból és tartalmakból áll össze: 1) A Table könyvtár tartalmazza az adatbázis teljes megőrzendő adatállományát xml-ben, illetve az xml-t definiáló sémákat. Ebben lényegében a SIARD-ot követik, ugyanakkor annyiban eltérnek, hogy vannak számukra fontos információk, amelyeket ki kell nyerni, illetve le kell írni, és amelyek szükségesek a saját megjelenítő eszközük használatához (tehát meg lehessen nézni az átvett adatállományt). 2) Az átadandó dokumentumok/iratok külön könyvtárba kerülnek (Documentsj, itt a fájlokat max. 12 számjegyből álló ID-vel kell ellátni. A dánoknak fontos, hogy az átadandó dokumentumok formátumát (pl. mindegyik TIFF-e?), ami náluk rendeletben van előírva, automatikusan ellenőrizni tudják, ezért ragaszkodnak ezen dokumentumok külön könyvtárba helyezéséhez. Levéltári formátumként ismerik el a TIFF-et és a JPEG-2000-et irodai alkalmazásban készített dokumentumok, rajzok, térképek stb. átadásánál, a hangfájlokat MP3-ban, a videókat MPEG-2 vagy MPEG-4-ben kell átadni. (Ugyanakkor gond a GIS rendszerekben keletkezett dokumentumok átadása, annak ellenére, hogy a dán szervek a GIS-ben keletkezett anyagaikat gyakran csatolják a dokumentum-menedzsment rendszereikben lévő iratokhoz, és így elvben automatikusan megőrzendők lesznek.). 3) A ContextDocumentation könyvtárba kifejezetten levéltári célokra készült állományok találhatok becsatolva, vagy ha papíralapúak voltak, szkennelve: az adott IT-rendszer, adatbáziskezelő technikai leírása, struktúrája (pl. táblák kapcsolatai), az átadási dokumentációk, az ingest és a teszt folyamatok során készített dokumentációk. 4) Az Indices könyvtárban az alábbiak szerepelnek: archivelndex-. ez egy xml fájl, amiben a kutatói használathoz nélkúlözheteden alapinformációkat írják le: pl. az iratanyag létrehozója, a rendszer megnevezése, leírása (pl. vannak-e benne dokumentumok stb.); a doclndex egy lista a csomagban található dokumentumokról (a dokumentumok ID-ja, hol található a SIP-ben, az eredeti fájlmegnevezés, kiterjesztés); filelndex a SIP-ben található valamennyi fájl listája, mindegyik mellett chek sum (ellenőrző összeg) is szerepel, ez segíti nyomon követni a levéltári folyamatok (pl. konverziók, migrációk) eredményeit.; tablelndex, hasonló a SIARD-ban leírtakhoz, az adatbázis tábláit, mezőit írja le. 5) A Schema könyvtár tartalmazza a SIP-ben használt xml-ek definícióit (pl. az 5 említett indexét) Az előadó kifejtette, hogy az e-levéltári munka egyre nagyobb feladatok elé állítja őket is, ugyanakkor a költségvetési megszorítások miatt egyre kevesebb képzett szakemberük van. A fő irány éppen ezért az automatizáció, tehát a folyamatok minél nagyobb mértékű szabványosítása és automatizálása, hogy a levéltáraknak minél kevesebb labormunkára legyen szükségük, másrészt az átadó szervekkel való kooperáció lehet a másik támasz. Urs Meyer (Svájci Szövetségi Levéltár) „Save your databases!" címmel szintén nagysikerű előadást tartott a svájci SI ARD (Software Independent Archiving of Databases) szabványról és az ahhoz készült implementációról, a SIARD Suite szoftverről. A SIARD relációs adatbázisokat képes archiválni. Kiindulópontjuk az volt, hogy a használt adatbázis rendszerek 90%-a relációs, a többi, mint pl. a hierarchikus, hálózatos (Object oriented databases (OODB), NoSQLDatabases (CouchDB, HBase,) stb. rendszerek kevésbé terjedt el. A relációs adatbázis fő jellemzője, hogy az adatokat táblákban írják le, amelyek hivatkoznak egymásra. A megoldás során használt SQL (Structured Query Language) (az alkalmazott verzió: SQL 1999) alkalmas mind az adatok kinyerésére, mind pedig a kinyert levéltári adat „visszatöltésére" azaz megjelenítésére. A céljuk egy platform független adatbázis-archiválási rendszer létrehozása volt, innen ered a 90