Takáts Béla (szerk.): Helyismereti könyvtárosok XI. országos tanácskozása : Helyismereti - digitalizálás - Európai Unió : Szolnok, 2004. július 14-16. (2005)
2. NAP. - Szepesi Judit: A hódmezővásárhelyi könyvtár digitalizálási gyakorlata.
2. nap Szepesi Judit: A hódmezővásárhelyi könyvtár digitalizálási gyakorlata Az XML olyan SGML nyelven alapuló metaadat leíró, platformfüggetlen nyelv, mely többféle dokumentumtípus rögzítésére alkalmas. A HTML nyelvhez hasonlóan magában a szövegben elhelyezett szintén karakteres elemek strukturálják. Ideális eszköz az alkalmazások közötti adatátvitelre. Az így elraktározott adatokat persze át kell alakítani, ha más alkalmazás kéri, néha többször is. Tehát az XML az alkalmazások közötti adatátvitelre alkalmas, mert: • platformfüggetlen, minden rendszer tudja alkalmazni, időtálló, • nyílt szabvány, • az egyszeri adatfelvitel sokféle formában átalakítható. A digitalizáláshoz kialakítottunk egy szabályzatot, melyben részletesen kitérünk a legfontosabb kérdésekre (szerzői jog, fájlformátumok stb.) és meghatároztuk a munka menetét is. Eldöntöttük a digitalizálandó dokumentumok sorrendjét. Elsősorban az oktatási, kutatási területen sokat használt dokumentumok kerültek előtérbe, majd állományvédelmi szempontok szerint vizsgálódtunk. 4.1 A munka menete A szöveges dokumentumokat beszkenneltük (300 dpi). Először mi is a Recognitát használtuk, majd az ABBEY Fine Readerre esett a választásunk. Tapasztalataink szerint sokkal tisztább, szebb munkát végez, ha megfelelő módon állítjuk be a programot. Célunk az volt, hogy a digitális szöveges dokumentum oly módon legyen rögzítve, hogy egyrészt megtartsa az eredeti fizikai objektum jellemzőit, másrészt a legkülönfélébb szempontok alapján váljon visszakereshetővé. Ennek az adatrögzítési és szegmentálási/kódolási módszernek a lehetőségét egy dokumentumkezelő rendszer, a JaDoX biztosítja. A szöveg felismertetése és a szükséges korrekciók megtétele után a kijavított oldalakat ebben a rendszerben nyitottuk meg, és itt folytattuk az XML-es feldolgozást. így a munkánk egyszerűbbé, áttekinthetőbbé vált. 4.2 JaDoX A JaDoX nyílt szabványokon alapuló, platfromfüggetlen dokumentumkezelő rendszer, a szegedi székhelyű Ikron Kft munkája. A beszkennelt, vagy digitális 54