1996. ÉVI MIKROCENZUS A népesség és a lakások jellemzői (1996)
MÓDSZERTANI ISMERTETÉS - A MIKROCENZUS ADATAINAK MINTAVÉTELI HIBÁJA
szabályokhoz vezettek a rétegkódok, illetve az elsődleges mintavételi egységek kódjának kialakítására vonatkozóan. a) Rétegkód: első két pozíció = megyekód; második két pozició = a kerület kódja Budapest esetén; = a nagyságkategória kódja egyébként. b) Elsődleges mintavételi egység kódja = településazonosító + a számlálókörzet azonosítója, önreprezentáló települések esetén; = településazonosító + 4 db '0', kisebb (nem önreprezentáló) települések esetén. A második szabálynál a „ + " jel egymás után írást (konkatenációt) jelöl. Az általános gyakorlatnak megfelelően a hibaszámítást a mikrocenzusnak csupán néhány, gondosan kiválasztott mutatójára vonatkozóan végeztük el. A kiválasztásnak az volt a célja, hogy viszonylag kis számú, ugyanakkor egymástól eltérő nagyságrendű és jellegű mutató mintavételi hibáján keresztül közelítően átfogó képet nyújtsunk a felvétel adatainak megbízhatóságáról. Megjegyezzük, hogy a nem mintavételi hibák vizsgálatával nem foglalkoztunk. A hazai gyakorlattal összhangban mintavételi hibán az adat becsült — esetünkben jackknife módszerrel becsült — szórásnégyzetéből vont pozitív négyzetgyök 1,96-szorosát értjük, amelynek segítségével megadható a becslés környezetében a tényleges értéket 95 %-os valószínűséggel lefedő konfidenciaintervallum. Az alábbiakban bemutatott számítási eredmények az egyes mutatók becsült értéke és a megfelelő mintavételi hiba mellett tartalmazzák az adat relatív hibáját is, vagyis a mintavételi hiba és a becslés hányadosát. Megjegyezzük, hogy a mikrocenzus bizonyos adatai — többek között bizonyos korcsoportos létszámadatok — a korrekciós eljárás következtében nem tartalmaznak mintavételi hibát, hiszen ezek kerekítésből adódó eltérésektől eltekintve megegyeznek a megfelelő továbbszámított népszámlálási adatokkal. A VPLX program nem érzékeli ezt a körülményt — ti. azt, hogy gyakorlatilag a mintától független értékről vagy értékekről van szó —, és olyan szórásnégyzetet rendel a szóban forgó mutatóhoz, amely közelítőleg megegyezik a megfelelő, korrigálatlan mutató szórásnégyzetével. 345