Levéltári Szemle, 39. (1989)
Levéltári Szemle, 39. (1989) 4. szám - KILÁTÓ - Szaszkó István: A "The American Archivist" 1987-es évfolyama / 70–75. o.
és a selejtezés kérdéseire is, ha tudniillik az adattárolás és a visszakeresés gyorssá, hatékonnyá és olcsóvá válik, megszűnne az ok a selejtezésre. A másik számítástechnikai újdonság, amit az Egyesült Államok Nemzeti Levéltárában már vizsgálnak-alkalmaznak: az optikai karakterfelismerés (1. Allén, Marié: Optikai karakterfelismerés; új lehetőségek a levéltári adatfeldolgozás gépesítésében, vol. 50., no. 1., 1987 tél, p. 88—99). Az optikai karakterfelismerés, vagy másképpen fogalmazva, írott adatoknak számítógéppel olvasható formára történő automatikus átalakítása eleinte a levéltárak számára csak lehetőség, nem pedig gyakorlatilag is alkalmazható eljárás maradt. Az optikai karakterfelismerés (angol rövidítéssel OCR) területén az 1984 óta lezajlott fejlődés azonban már a sok régi, halványan gépelt, vagy kifakult tintájú s kézírásos irattal rendelkező levéltárak számára is új lehetőségeket nyitott. A mai olcsó asztali OCR berendezések már mikroszámítógépekhez is csatlakoztathatóak. A cikk az OCR berendezésekkel a washingtoni Nemzeti Levéltárban folytatott kísérletek tapasztalatairól szól. A Nemzeti Levéltár illetékes részlege 1983-ban kezdte meg az OCR berendezések használatát; a háromféle vizsgált karakterfelismerési módszer leírását ábrák is illusztrálják. A vizsgált OCR gép másodpercenként 85—150 karaktert olvas, ez óránként 300 oldalnak felel meg, s 300 000 karakterenként 1 a hibásan olvasott karakter. Az 1984—1985-ben megkezdett második kísérlethez beszereztek egy asztali OCR gépet (akkor 10 000, 1987-ben már csak 5000 dollárt kértek érte — NB. az utóbbi árért adtak — amíg ki nem tiltották az USA-piacról — egy Yugo kisautót!), amelyet egy IBM PC/AT személyi számítógéphez kapcsoltak, mely Word Perfect 4.0 szövegszerkesztővel dolgozott. A feldolgozásra többféle gépeléssel készített segédletköteteket választottak ki, s mind a feldolgozási sebesség, mind a felismerési százalék azt bizonyították, hogy az OCR levéltári alkalma^zása hatékony és olcsó. A szövegszerkesztővel való kapcsolat nagy előny, ugyanis így külön adatbevitel nélkül is formázott szöveg volt nyerhető. 1984 végén egy angol cég bejelentette, hogy 99,9%-os pontossággal sikerült kézírás optikai karakterfelismerését megoldania. 1985 őszén a washingtoni levéltár felkereste a londoni gyártót s megkezdte a kézírás-felismerő vizsgálatát. A kézírás gépi felismerését 2—2 ábra is illusztrálja. A cikket az OCR feldogozásra kiválasztott irategyüttesek és jellemzőik felsorolása zárja. A sok komoly és magvas cikket tartalmazó rovatok mellé a szerkesztők egy rövid és érdekes egyedi iratokat bemutató rovatot is kialakítottak. A 2. számban olvashatjuk hasonmásban és átírásban a 12 éves Fidel Castrónak Roosewelt elnökhöz 1940 novemberében, elborzasztó angolsággal írott levelét. Szaszkó István 75