ARHIVSKI VJESNIK 43. (ZAGREB, 2000.)

Strana - 102

M. Dörr - H. Weber, Digitalna obrada podataka u funkciji zaštite arhivskih fondova?, Arh. vjesn., god. 43 (2000), str. 91-107 vrpce, izradu CD-R-a, pakiranje i transport, za naknadnu individualnu obradu slika radi poboljšanja kvalitete (image enhancement) s pomoću posebnih softvera. Ne smiju se zaboraviti ni troškovi migracije. U nekim je slučajevima od redovi­te migracije isplativija ponovna digitalna obrada mikrofilmova. 3.8. Digitalna obrada i prepoznavanje teksta Optical Character Recognition (OCR) je strojni postupak prijenosa slikovnih alfanumeričkih znakova u kodirane (šifre alfanumeričkih znakova i njihovog kon­teksta) na temelju prepoznavanja uzorka. Primjenjuju se dvije različite tehnike: au­tomatsko prepoznavanje teksta (Omnifont tehnika) i trenirajuće prepoznavanje tek­sta (podržavaju ga rječnici, lingvističke metode i tzv. umjetna inteligencija). Progra­mi za prepoznavanje tekstova sve više integriraju rječnike i supstitucijske liste. Da se izbjegnu supstitucije s pogrešnim znakovima, neki sustavi rade s "fuzzy logic" i vjerojatnostima. "Mixed Mode" pohranjuje neprepoznate znakove kao sliku (Ima­ge) koja kao nekodirana informacija ostaje u kontekstu točno prepoznatih znakova. Segmentacija stranice je važna za interpretaciju tekstova. Tekst se dijeli na stupce, blokove te grafičke elemente. Posebno je važan pravilan položaj (Deskew), segmentacija znakova, prepoznavanje pisma i mogućnost obrade tekstova na više jezika. Granica ekonomičnosti strojne obrade tekstova iznosi 99,95% točnosti pre­poznavanja teksta. Manualna je obrada ekonomičnija, ako strojna obrada ima više od 4-5 grešaka na 1000 znakova. Pouzdanost prepoznavanja ovisi o predlošku, pismu, rukopisu, veličini znako­va, kontrastu podloge i teksta, nečistoći, nepotpunosti ili neravnomjernosti tiskanih slovnih znakova, količini slikovnih podataka. Stoje veća količina slikovnih podata­ka, to je veći postotak prepoznavanja. I veći stupanj razlučivosti u digitalnoj obradi pojačava sposobnost prepoznavanja (polutonska digitalizacija). Slični kvalitativni kriteriji vrijede i za mikrofilm (visoki stupanj razlučivosti, kontrast, gustoća pozadine i minimalna pozadinska sjenka). Nečistoća i ogrebotine izbjegavaju se digitalnom obradom negativa. Strojno prepoznavanje tekstova na mikrofilmovima još je danas prevelika nepoznanica, da bi se mogli donositi pouzda­ni zaključci. 4. Mikrofilm i digitalni mediji pohrane - kompatibilni mediji? 4.1. Provjere kompatibilnosti i reprodukcijske kvalitete Radna skupina napravila je niz provjera kompatibilnosti digitalnih i analognih oblika konverzije. Koristili su testnu tablicu u formatu DIN A2 s normiranim ozna­kama stupnja razlučivosti (oštrine) reprodukcije u sivim nijansama i u boji. Na nju su stavljeni uzorci tekstova u različitom tisku i različitim rukopisima te crno-bijele i 102

Next

/
Thumbnails
Contents