A Fővárosi Szabó Ervin Könyvtár évkönyve 2002-2003-2004
TANULMÁNYOK - Reisz László: A digitalizálás és a Magyar Társadalomtudományok Digitális Archívuma
információkeresési szokásai átalakulásával is jár: az on-line elérhető ingyenes tartalmak mondhatni színvonaluktól függetlenül - kiszorítják a hagyományos hordozón megjelenő (akár jogvédett) tartalmakat, pusztán azáltal, hogy könnyen, gyorsan elérhetőek. E felhasználói pragmatizmus akarva-akaratlanul új felhasználói szokások, igények elterjedését is segíti. A közvetlen információ-elérés társadalmilag jogos igénye a tradicionális könyvtári munkát, tágabb értelemben a hagyományos könyvtárat is átalakítja. Ha elfogadtuk, hogy a digitalizálásra feltétlenül szükség van, akkor azt kell áttekintenünk, milyen digitalizálási alternatívák állnak rendelkezésünkre. Fontos megjegyeznünk, hogy a továbbiakban a duplikáló-szolgáltató digitalizálásról beszélnünk. A dolog technológiáját nem szükséges részletezni: a végcél, a nyomtatott dokumentum elektronikus megfelelőjének előállítása. Elvileg - ez a végeredmény szempontjából irreleváns - ez történhet az eredeti forrás anyagának begépelésével is, s ha ez az esetek többségében nem ezt a megoldást választják, annak pusztán hatékonysági okai vannak. A feldolgozandó anyag elektronikus formába öntésének leggyakoribb módja az annak beszkennelését követő OCR, azaz optikai karakterfelismerő program használata. Ezt minden esetben az olvasási hibákat javító korrektúrázási folyamatnak kell követnie. A már felismert, de még nem ellenőrzött állomány áttöltése során fontos, a dokumentum későbbi formátumát eldöntő döntést kell hoznunk, azaz el kell döntenünk, hogy milyen formátumot választunk az új elektronikus dokumentumnak. Félreértések elkerülése végett itt nem a mentés formátumáról beszélünk. Ez gyakorlati tapasztalataink szerint általában ,,.doc” vagy „.rtf’ lesz. Itt a feldolgozott dokumentum tényleges megjelenéséről beszélünk, függetlenül attól, hogy azt képernyőn vagy akár kinyomtatva kívánjuk felhasználni. A digitalizált dokumentumok formátumuk szempontjából két nagy csoportra oszthatók: 1. Formátumsemleges dokumentumok Ezek többnyire xml platformú, „nyitott” dokumentumok. Internetes gyökereikből következően alapvető jellemzőjük az, hogy a tényleges dokumentum formátumát, struktúráját csak a legminimálisabb mértékben őrzik meg. A bekezdéseken kívül s szöveg igazítására, kiemelésére-döntésére van lehetőségünk. Oldalszám, élőfej, élőláb nincs, az anyag tördelése a használt eszköz jellegétől, vagy beállításától (ablakméret) függően változik. Az ilyen szöveg messzemenően „hordozható”, jórészt platform-független, jóllehet e függetlenség és hordozhatóság árát az eredeti dokumentum lebutításával fizetjük meg. Rövid cikkek, kisebb publikációk feldolgozására ideális, ám más esetekben használata rendkívül problematikus. Inkább „feldolgozóbarát” mint „felhasználóbarát” digitalizálási forma, bár nem hallgathatjuk el, hogy e-olvasón, PDA-n olvasva előnyös a formázás hiánya, mivel így a szöveg az alkalmazott eszköz paramétereinek megfelelően újratördeli magát. Praktikusan tehát a sorhossz, s így az oldalszám eszközfüggő, s alkalomról alkalomra változik. 217