Előzetes egy demográfiai-statisztikai számítógépes adatfeldolgozó rendszerhez. Levéltári Szemle, 32. (1982) 1. 21–30. | Könyvtár

Károly István: Előzetes egy demográfiai-statisztikai számítógépes adatfeldolgozó rendszerhez. Levéltári Szemle, 32. (1982) 1. 21–30.

Még nem teljesen tisztázott, hogy a feldolgozási folyamat utolsó lépéseként ismertetett „egyéb számítások" kategóriájába mi kerüljön be. Valószínűleg minden olyan számítást meghagyunk, melyet használni fogunk, esetleg ezeket bővítjük is, de az alapvető statisztikai-demográfiai számításokat mindenképpen fogjuk itt programozni (pl. születések, házasságkötések, halálozások száma, népszaporulat, ill. fogyás kimutatása, csecsemőhalandóság stb.). Mindenképpen olyan megoldást fogunk készíteni, hogy mellékelünk egy programlistát a rendszertervhez, mely egy programazonosító kód alapján tételszerüen felsorolja a rendelkezésre álló programokat, ezek az azonosító alapján l-l kártyával hívhatók meg. így elkerülhető, hogy más felhasználó esetén olyan számításokat is elvégezzen a gép, melyekre neki nincs szüksége, de mi használtuk (pl. koordinátarendszerben felvitt községtérkép alapján Medina településszerkezetének és terjeszkedésének vizsgálata, vagy a rokon családok elhelyezkedése a falun belül stb.). A feldolgozó rendszer legproblematikusabb része a számítógépes névazonosítás. Felelőtlenség lenne részünkről már most, egy előzetes ismertetőben várható eredményeket előre jelezni. Az azonban már bizonyos, hogy egy több nemzetiséget magában foglaló település valamennyi felkutatható családnevét nem lehet egységesen kezelni a névazonosítás során. Figyelembe kell venni az adat származási idejét, bizonyos hierarchikus sorrendet kell felállítani az adat származási helyétől, azaz a forrás típusától függően. Bizonyos jellegzetességek mutatkoznak az egyes családnevek különböző alakban történt leírásakor, de ezek még az adatfelvételek során tűntek fel, hogy ezekről megbizonyosodjunk, egy számítógépes kísérletet kell tenni. Valószínűleg jelentősége van a leíró nemzetiségi hovatartozásának és nyelvtudásának is. Tipikus elírások mutatkoznak a szerb és a német erede.tű családnevek esetében. Például a ma is élő Janyaics család nevét a következő alakokban találtuk meg a különböző forrásokban: Janaminn, Jananinn, Jannyanin, Janyai, Jenyei, Janyanin, Jannonin, Janyin, Janonim, Janyanics, Janyani, Janyan, Janyca, Jonay, Janya, Janyay, Nyanyai, Nyanyaics, Nyanyaity, Janyaics. Ez pontosan 20 féle változat! Mivel közel 2500 családnévvel rendelkezünk, elégségesnek tűnik bizonyos törvényszerűségek felismeréséhez és ezek alapján a névazonosítás nagy mértékű gépesítéséhez, de a feldolgozó rendszer lehetőséget ad arra is, hogy a név vizsgálata nélkül végezzük el a névazonosítást. Ennek főleg akkor van jelentősége, ha nem „szabályszerű" a név elírása. Végezetül a feldolgozó rendszer két jellegzetességét szeretnénk megemlíteni. Egyrészt a rendszerterv és az adatkártyák beosztása úgy készült, hogy egyidejűleg akár egy nagyobb földrajzi egység valamennyi települése — mintegy 8000 település — dolgozható fel vele, másrészt pedig bármilyen pontján tovább bővíthető akár a rendszerterv és a programok módosításával, vagy bővítésével, csekély programozói munka ráfordításával. Jelenleg a rendszerterv befejező munkálatai folynak, a programozás nagyobbik része még hátra van. A programozói feladatok elvégzése után egy kreált adatállománnyal fogjuk a programcsomagot kipróbálni, a munka befejezése mintegy másfél-két év múlva várható. 30

Oldalképek

Tartalom