NÉPSZÁMLÁLÁS AZ EZREDFORDULÓN 3. / Tanulmányok (2000)
Dömők Zsuzsanna - Pachmann Zsuzsanna: A népszámlálási adatok múltbeli és jelenkori feldolgozása
Az optikai beolvasáshoz a bizonylatoknak speciális és szigorú formai és minőségi előírásoknak kell megfelelniük. A bizonylatokkal szemben támasztott formai és minőségi követelmények: - papírminőség, - a jelölőmezők pontos pozicionálása, - minden olyan szöveg, amely az adattartalom szempontjából lényegtelen, legyen vakszínnel (piros, sárga, zöld) nyomtatva, - az adatmezők színkiejtés utáni azonosítása érdekében legyen valamilyen vakszíntől eltérő azonosítási lehetőség (kérdés sorszáma, alsorszáma ne legyen vakszín), - a jelölésre szolgáló (markeres) mezők nagysága, egymástól való távolsága, amelyek kétségtelenül növelik a bizonylat terjedelmét, - a bizonylat sértetlensége, - a kitöltés minősége (karakterek formája, toll színe, vastagsága, a beírásra szolgáló mezők keretén belül legyen a beírt szám stb). A felismerő alrendszer feladata a felismerő algoritmusok felhasználásával a képi információk számítógépes karakterré való átalakítása. A karakterfelismerő rendszerek különféle jelekre specializálódnak. Alkalmazásuk attól függ, hogy kézzel írt számok, vagy jelölések felismerése-e a feladat. A felismerő alrendszer a keretprogramokból és az általa meghívott felismerő programokból áll. Az egyes mezőkhöz - a bennük felismerendő jelek tulajdonságának függvényében más-más felismerő program tartozik. Ezeknek a programoknak a feladata az adott mezőben lévő szöveg felismerése. A javító-ellenőrző alrendszerben történik - a felismerő program által észlelt és megjelölt, illetve - a program által hibásan felismert szemantikus és szintaktikus hibák javítása. Az első esetben a program által speciális karakterrel megjelölt mezők a mező képével együtt automatikusan megjelennek a javítást-ellenőrzést végző munkaállomásokon, a javítás pedig a képen látható karakter hagyományos adatrögzítésével végezhető el, amely különös szakértelmet nem igényel. A második esetben csak logikai vagy más (kódintervallum) összefüggések alapján szűrhető ki a hiba. A hibát azonban ebben az esetben csak megfelelő szakértelemmel rendelkező