Cseh Gergő Bendegúz – Körmendy Lajos – Rácz György: Digitalizálás a levéltárakban. Levéltári Szemle, 52. (2002) 3. 3–18.

elektronikus másolat —, másrészt valószínűleg a jövőben is túlságosan drága marad, mert szűk a felhasználói kör (könyvtárak, levéltárak), ezért csak alacsony szériaszámban gyártják. A digitalizálás történhet kép formájában (erről beszéltünk a fentiekben), valamint „intelligens" módon, és a kettő között lényeges különbség van. Az „intelligens" digitalizálás két fázisban történik: először a fényképezőgép vagy a szkenner digitálissá alakítja az analóg képet, majd egy speciális karakter-felismerő szoftver (OCR, azaz Optical Character Recognition) a pontokból összeálló betűket, egyéb írásjeleket, számokat felismeri, és azokat a megfelelő számítógépes kódokhoz rendeli. így létrejön egy szövegfájl, amiben szavakat kereshetünk, amit szövegszerkesztővel átalakíthatunk, adatbázissá konvertálhatunk. A kép formájában történő digitalizálásnál az említett második fázis elmarad, és a képet, illetve azon belül a karaktereket a számítógép pontok halmazaként kezeli, azaz bár megjeleníti őket, nem „tudja", hogy milyen betűkről van szó, ezért a szövegben nem tudunk géppel keresni, és azt szövegszerkesztővel sem tudjuk módosítani. Kétségtelen előnye viszont a kép-dokumentumnak az „intelligens" szöveggel szemben, hogy az eredeti irat fakszimile képét adja, így az iraton láthatók a pecsétek, aláírások, lapszéli jegyzetek stb., amelyek karakterfelismerő programok számára teljesen értelmezhetetlenek lennének. A digitális képeket is tehetjük — korlátozott módon — „intelligenssé", ha összekötjük azokat egy adatbázissal vagy adatbázisként működő fájllal. (Ennek kifejtését 1. alább.) A technika jelenlegi állása szerint csak jó minőségű nyomtatott iratok alkalmasak OCR-rel történő feldolgozásra. Az évtizedekig használatban volt, hagyományos írógéppel írt szövegeknél — nem beszélve a sérült, foltos, kézzel javított gépelésekről — olyan sok a rosszul felismert karakter (a tévesztés), hogy egyszerűbb újragépelni a szöveget mint javítani. Azt mondani sem kell, hogy a kézzel írt levéltári iratok belátható időn belül nem lesznek feldolgozhatók OCR-rel, csak képként. A digitális információ hallatlan előnye az analóggal szemben a szinte korlátlan kommunikálhatóság, ami levéltári anyagnál egyet jelent a széleskörű hozzáférhetőséggel. Van azonban néhány nem lebecsülendő hátránya és fogyatékossága is, amit csak a levéltári követelmények és alapelvek szigorú betartásával, ül. alkalmazásával kezelhetünk. 3. Levéltári alapelvek és követelmények 3. 1. Biztonság Ez a levéltári anyaggal szemben támasztott követelmények közül a legfontosabb, mert ha az iratok elpusztulnak, akkor minden további követelmény vagy alapelv értelmét veszíti. Értelemszerűen tehát a digitalizálás útján létrejött másolatnak is meg kell felelnie a levéltári másolattól elvárt két alapvető biztonsági követelménynek: 1. a hordozónak (CD, mágneslemez stb.) tartósnak kell lenni, 2. a rajta lévő információnak hosszú időn keresztül olvashatónak kell lenni. Jelenleg — és a belátható jövőben — csak korlátozottan teljesíthetők ezek a követelmények mert 5

Next

/
Thumbnails
Contents