NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Dömők Zsuzsanna - Pachmann Zsuzsanna: A népszámlálási adatok múltbeli és jelenkori feldolgozása
teszi lehetővé. 2.2 Az OCR technológia néhány alapfogalma Az OCR az Optical Character Recognition kifejezés rövidítése. Ez a technológia a látható, olvasható információkat képfeldolgozó eszközök felhasználásával vagy teljesen automatikusan, vagy kis mértékű emberi beavatkozással alakítja át szabványos karakterkódokká. Az OCR elnevezés nem fedi le teljesen a karakterfelismerő rendszereket, az egyszerűség kedvéért azonban ezt az elnevezést használjuk. Az OCR rendszer a nyomtatott karakterek felismerésére alkalmas megoldásokat foglalja magában. Ezen belül is megkülönböztethetünk - írógéppel, nyomtatóval, vagy nyomdai úton előállított szövegek felismerésére alkalmas rendszereket, - szabványosított karakterkészletek felismerésére specializálódott komplex megoldásokat. Az ICR technológia a kézzel írt karakterek (betűk, számok) felismerésére alkalmas, az OCR technológia megoldásain kívül. Az OMR rendszereket a csak jelzéseket tartalmazó formanyomtatványok feldolgozására fejlesztették ki. Az OCR rendszer öt lényeges alrendszerből tevődik össze: - beolvasó alrendszer (szkennelés), - felismerő alrendszer, - javító-ellenőrző alrendszer, - irányító, felügyelő alrendszer, - adatszolgáltató alrendszer. A beolvasó alrendszer feladata az összeíróíveken (papíron) szereplő információk számítógépes képi információkká való átalakítása. Ez azt jelenti, hogy az összeíróívek megadott egységek szerinti kötegeit laponként, megfelelő sebességű eszközök (szkennerek) segítségével digitalizálják, a digitális képeket pedig eltárolják és automatikusan elküldik a következő munkafázis elvégzésére. 96