Levéltári Szemle, 39. (1989)

Levéltári Szemle, 39. (1989) 4. szám - KILÁTÓ - Szaszkó István: A "The American Archivist" 1987-es évfolyama / 70–75. o.

és a selejtezés kérdéseire is, ha tudniillik az adattárolás és a visszakeresés gyorssá, hatékonnyá és olcsóvá válik, megszűnne az ok a selejtezésre. A másik számítástechnikai újdonság, amit az Egyesült Államok Nemzeti Levéltárában már vizsgálnak-alkalmaznak: az optikai karakterfelismerés (1. Allén, Marié: Optikai karakterfelismerés; új lehetőségek a levéltári adatfel­dolgozás gépesítésében, vol. 50., no. 1., 1987 tél, p. 88—99). Az optikai karak­terfelismerés, vagy másképpen fogalmazva, írott adatoknak számítógéppel ol­vasható formára történő automatikus átalakítása eleinte a levéltárak számára csak lehetőség, nem pedig gyakorlatilag is alkalmazható eljárás maradt. Az optikai karakterfelismerés (angol rövidítéssel OCR) területén az 1984 óta le­zajlott fejlődés azonban már a sok régi, halványan gépelt, vagy kifakult tin­tájú s kézírásos irattal rendelkező levéltárak számára is új lehetőségeket nyi­tott. A mai olcsó asztali OCR berendezések már mikroszámítógépekhez is csatlakoztathatóak. A cikk az OCR berendezésekkel a washingtoni Nemzeti Levéltárban folytatott kísérletek tapasztalatairól szól. A Nemzeti Levéltár illetékes részlege 1983-ban kezdte meg az OCR berendezések használatát; a háromféle vizsgált karakterfelismerési módszer leírását ábrák is illusztrálják. A vizsgált OCR gép másodpercenként 85—150 karaktert olvas, ez óránként 300 oldalnak felel meg, s 300 000 karakterenként 1 a hibásan olvasott karakter. Az 1984—1985-ben megkezdett második kísérlethez beszereztek egy asz­tali OCR gépet (akkor 10 000, 1987-ben már csak 5000 dollárt kértek érte — NB. az utóbbi árért adtak — amíg ki nem tiltották az USA-piacról — egy Yugo kisautót!), amelyet egy IBM PC/AT személyi számítógéphez kapcsoltak, mely Word Perfect 4.0 szövegszerkesztővel dolgozott. A feldolgozásra többféle gépe­léssel készített segédletköteteket választottak ki, s mind a feldolgozási sebesség, mind a felismerési százalék azt bizonyították, hogy az OCR levéltári alkalma^­zása hatékony és olcsó. A szövegszerkesztővel való kapcsolat nagy előny, ugyanis így külön adatbevitel nélkül is formázott szöveg volt nyerhető. 1984 végén egy angol cég bejelentette, hogy 99,9%-os pontossággal sike­rült kézírás optikai karakterfelismerését megoldania. 1985 őszén a washing­toni levéltár felkereste a londoni gyártót s megkezdte a kézírás-felismerő vizsgálatát. A kézírás gépi felismerését 2—2 ábra is illusztrálja. A cikket az OCR feldogozásra kiválasztott irategyüttesek és jellemzőik felsorolása zárja. A sok komoly és magvas cikket tartalmazó rovatok mellé a szerkesztők egy rövid és érdekes egyedi iratokat bemutató rovatot is kialakítottak. A 2. számban olvashatjuk hasonmásban és átírásban a 12 éves Fidel Castrónak Roosewelt elnökhöz 1940 novemberében, elborzasztó angolsággal írott levelét. Szaszkó István 75

Next

/
Thumbnails
Contents