1970. ÉVI NÉPSZÁMLÁLÁS 31. Az adatfelvétel és feldolgozás összefoglaló ismertetése (1977)
I. AZ ADATFELVÉTEL ÉS FELDOLGOZÁS ÖSSZEFOGLALÓ ISMERTETÉSE - 8. Az 1970. évi népszámlálás gépi feldolgozása
A lakás és épület adatok ellenőrzése és javitása Az épület-lakás adatoknál a kérdezett információk sokkal egyszerűbbek voltak, mint a személyi adatoknál. A kódolás is megbízhatóbb volt, ezáltal a hibák száma is kevesebb lett. Az eredeti tervezettnél erre való tekintettel kevésbé bonyolult megoldást sikerült találni, amely mégis a kivánt megbízhatósággal végezte a javítást, és igy a teljességi ellenőrzéssel együtt 2 programba lehetett sűríteni a teljes épület-lakás anyag javitását. Első lépésben az épület-lakás adatoknál is a teljességi ellenőrzésre került sor. A teljességi ellenőrzés a személyi adatoknál végzett ellenőrzéssel azonos volt. A második lépésben a lehetetlen kódszámok, majd a helységekre vonatkozó adatok javitása következett. Ezek az adatok kevésbé függnek a többitől, igy célszerű volt a nagy javítástól külön választani. Szintén itt ellenőrizte és javította a számitógép az épület lakásai közti kapcsolatokat és bizonyos korrekciókat is végrehajtott. Igy például, ha nem volt konyha, vagy főzőfülke, de volt nyári konyha, akkor a nyári konyhát konyhára javította, stb. Az ellenőrzés összefüggései olyanok, hogy valamely ismérv aktuális értékeiből következik, hogy a másik ismérv milyen aktuális értékeket vehet fel. Az összefüggések egyirányúak, azaz viszszafelé nem érvényesek. A hibasorszám mindig egy ismérv egy másik ismérvvel való minden lehetséges összefüggéséhez tartozik. Ha egy ilyen összefüggés nem teljesül, akkor ebből még nem tudjuk megmondani, hogy melyik ismérv a hibás értékű, ugyanis a két fogalom egyforma valószínűséggel lehet hibás. Célszerűnek látszott, hogy az összefüggés vizsgálata után határozza meg a hibás fogalmat. Nyilván, ha bizonyos ismérvcsoport olyan hibásnak minősül, hogy nem lehet és nem érdemes javítani, akkor az egész ismérvcsoportot kicserélje a gép a számlálókörzet legjellemzőbb hibátlan mintapéldányából. Ezt a módszert az irodalomban "cold-deck" eljárásnak nevezik. Ilyen ismérvek már előre "előállíthatók" akár a korábbi népszámlálás átlagából is és ha a kérdezett kapcsolatok nem adnak irányt a javításra, ezt az értéket kapja a hibás rekord. Amennyiben az egész rekordra jellemző a hiba, akkor az egészet cserélni kell egy hibátlan mintapéldánnyal ("hot-deck" eljárás). Felkészültünk arra, hogy ilyen esetleges cseréket végrehajtson a gép, de a gyakorlatban a javítási müvelet során ez nem fordult elő. A lakás-épület állomány adatait - egy másik munkafázis - a személyi-állományból készitett háztartás adatokkal egészítette ki. A kiegészített adatok lehetőségeket adtak, hogy néhány összefüggést (amelyre korábban nem volt információ) javítani lehessen. Ezeket a javításokat a háztartások száma, lakók száma, épület lakásainak száma stb. kapcsolataiból kiindulva lehet elvégezni. A feldolgozás szempontjait figyelembe véve még különböző kiegészítő, valamint összevont kódszámok kerültek a lakás-épület rekordokhoz. Ezt követően szétválasztásra került a lakás, illetve épület állományra, amelyből a táblák készítése volt elvégezhető. A 25 %-os reprezentatív felvétel hibajavítása Az eddig ismertetett automatikus ellenőrzés és hibajavítás a 100 %-os alapadatok feldolgozására vonatkozott. A 25 %-os reprezentatív felvétel kódszámainak javitása ettől némileg eltért. A 25 %-os minta teljességi szempontból ellenőrzött recordjaiból ugyanis az alapfeldolgozásnak megfelelő ismérveket a gép kimásolta. A kimásolt adatokkal az alapfelvétel 75 %-os állománya kiegészült és igy jött létre a teljeskörü 100 %-os állomány. A 25 %-os minta kimásolt recordjaiban eszközölt 74