A Fővárosi Szabó Ervin Könyvtár évkönyve 2002-2003-2004

TANULMÁNYOK - Reisz László: A digitalizálás és a Magyar Társadalomtudományok Digitális Archívuma

információkeresési szokásai átalakulásával is jár: az on-line elérhető ingyenes tartalmak mondhatni színvonaluktól függetlenül - kiszorítják a hagyományos hordozón megjelenő (akár jogvédett) tartalmakat, pusztán azáltal, hogy könnyen, gyorsan elérhetőek. E fel­használói pragmatizmus akarva-akaratlanul új felhasználói szokások, igények elter­jedését is segíti. A közvetlen információ-elérés társadalmilag jogos igénye a tradicionális könyvtári munkát, tágabb értelemben a hagyományos könyvtárat is átalakítja. Ha elfogadtuk, hogy a digitalizálásra feltétlenül szükség van, akkor azt kell áttekin­tenünk, milyen digitalizálási alternatívák állnak rendelkezésünkre. Fontos megjegyeznünk, hogy a továbbiakban a duplikáló-szolgáltató digitalizálásról beszélnünk. A dolog technológiáját nem szükséges részletezni: a végcél, a nyomtatott dokumentum elektronikus megfelelőjének előállítása. Elvileg - ez a végeredmény szem­pontjából irreleváns - ez történhet az eredeti forrás anyagának begépelésével is, s ha ez az esetek többségében nem ezt a megoldást választják, annak pusztán hatékonysági okai vannak. A feldolgozandó anyag elektronikus formába öntésének leggyakoribb módja az annak beszkennelését követő OCR, azaz optikai karakterfelismerő program használata. Ezt minden esetben az olvasási hibákat javító korrektúrázási folyamatnak kell követnie. A már felismert, de még nem ellenőrzött állomány áttöltése során fontos, a dokumentum későbbi formátumát eldöntő döntést kell hoznunk, azaz el kell döntenünk, hogy milyen formátumot választunk az új elektronikus dokumentumnak. Félreértések elkerülése végett itt nem a mentés formátumáról beszélünk. Ez gyakor­lati tapasztalataink szerint általában ,,.doc” vagy „.rtf’ lesz. Itt a feldolgozott dokumen­tum tényleges megjelenéséről beszélünk, függetlenül attól, hogy azt képernyőn vagy akár kinyomtatva kívánjuk felhasználni. A digitalizált dokumentumok formátumuk szempontjából két nagy csoportra oszthatók: 1. Formátumsemleges dokumentumok Ezek többnyire xml platformú, „nyitott” dokumentumok. Internetes gyökereikből kö­vetkezően alapvető jellemzőjük az, hogy a tényleges dokumentum formátumát, struktú­ráját csak a legminimálisabb mértékben őrzik meg. A bekezdéseken kívül s szöveg igazítására, kiemelésére-döntésére van lehetőségünk. Oldalszám, élőfej, élőláb nincs, az anyag tördelése a használt eszköz jellegétől, vagy beállításától (ablakméret) függően vál­tozik. Az ilyen szöveg messzemenően „hordozható”, jórészt platform-független, jóllehet e függetlenség és hordozhatóság árát az eredeti dokumentum lebutításával fizetjük meg. Rövid cikkek, kisebb publikációk feldolgozására ideális, ám más esetekben használata rendkívül problematikus. Inkább „feldolgozóbarát” mint „felhasználóbarát” digitalizálá­si forma, bár nem hallgathatjuk el, hogy e-olvasón, PDA-n olvasva előnyös a formázás hiánya, mivel így a szöveg az alkalmazott eszköz paramétereinek megfelelően újratör­deli magát. Praktikusan tehát a sorhossz, s így az oldalszám eszközfüggő, s alkalomról alkalomra változik. 217

Next

/
Oldalképek
Tartalom