Károly István: Előzetes egy demográfiai-statisztikai számítógépes adatfeldolgozó rendszerhez. Levéltári Szemle, 32. (1982) 1. 21–30.

Még nem teljesen tisztázott, hogy a feldolgozási folyamat utolsó lépéseként ismertetett „egyéb számítások" kategóriájába mi kerüljön be. Valószínűleg minden olyan számítást meghagyunk, melyet használni fogunk, esetleg ezeket bővítjük is, de az alapvető statisz­tikai-demográfiai számításokat mindenképpen fogjuk itt programozni (pl. születések, házasságkötések, halálozások száma, népszaporulat, ill. fogyás kimutatása, csecsemő­halandóság stb.). Mindenképpen olyan megoldást fogunk készíteni, hogy mellékelünk egy programlistát a rendszertervhez, mely egy programazonosító kód alapján tételszerüen felsorolja a rendelkezésre álló programokat, ezek az azonosító alapján l-l kártyával hívhatók meg. így elkerülhető, hogy más felhasználó esetén olyan számításokat is el­végezzen a gép, melyekre neki nincs szüksége, de mi használtuk (pl. koordinátarendszer­ben felvitt községtérkép alapján Medina településszerkezetének és terjeszkedésének vizsgálata, vagy a rokon családok elhelyezkedése a falun belül stb.). A feldolgozó rendszer legproblematikusabb része a számítógépes névazonosítás. Felelőtlenség lenne részünkről már most, egy előzetes ismertetőben várható eredménye­ket előre jelezni. Az azonban már bizonyos, hogy egy több nemzetiséget magában foglaló település valamennyi felkutatható családnevét nem lehet egységesen kezelni a névazono­sítás során. Figyelembe kell venni az adat származási idejét, bizonyos hierarchikus sorren­det kell felállítani az adat származási helyétől, azaz a forrás típusától függően. Bizonyos jellegzetességek mutatkoznak az egyes családnevek különböző alakban történt leírása­kor, de ezek még az adatfelvételek során tűntek fel, hogy ezekről megbizonyosodjunk, egy számítógépes kísérletet kell tenni. Valószínűleg jelentősége van a leíró nemzetiségi hovatartozásának és nyelvtudásának is. Tipikus elírások mutatkoznak a szerb és a német erede.tű családnevek esetében. Például a ma is élő Janyaics család nevét a következő alakokban találtuk meg a különböző forrásokban: Janaminn, Jananinn, Jannyanin, Janyai, Jenyei, Janyanin, Jannonin, Janyin, Janonim, Janyanics, Janyani, Janyan, Janyca, Jonay, Janya, Janyay, Nyanyai, Nyanyaics, Nyanyaity, Janyaics. Ez pontosan 20 féle változat! Mivel közel 2500 családnévvel rendelkezünk, elégségesnek tűnik bizonyos törvény­szerűségek felismeréséhez és ezek alapján a névazonosítás nagy mértékű gépesítéséhez, de a feldolgozó rendszer lehetőséget ad arra is, hogy a név vizsgálata nélkül végezzük el a névazonosítást. Ennek főleg akkor van jelentősége, ha nem „szabályszerű" a név elírása. Végezetül a feldolgozó rendszer két jellegzetességét szeretnénk megemlíteni. Egyrészt a rendszerterv és az adatkártyák beosztása úgy készült, hogy egyidejűleg akár egy na­gyobb földrajzi egység valamennyi települése — mintegy 8000 település — dolgozható fel vele, másrészt pedig bármilyen pontján tovább bővíthető akár a rendszerterv és a programok módosításával, vagy bővítésével, csekély programozói munka ráfordításával. Jelenleg a rendszerterv befejező munkálatai folynak, a programozás nagyobbik része még hátra van. A programozói feladatok elvégzése után egy kreált adatállománnyal fogjuk a programcsomagot kipróbálni, a munka befejezése mintegy másfél-két év múlva várható. 30

Next

/
Oldalképek
Tartalom