1996. ÉVI MIKROCENZUS A népesség és a lakások jellemzői (1996)
MÓDSZERTANI ISMERTETÉS - A MIKROCENZUS ADATAINAK MINTAVÉTELI HIBÁJA
A MIKROCENZUS ADATAINAK MINTAVÉTELI HIBÁJA A mikrocenzus adatai korrigált becslések, kiszámításuk csak részben követi a mintavételi terv előírásait, a mutatók végleges értékét az 1990. évi népszámlálás továbbszámított adatain alapuló korrekciós eljárás határozza meg. Ennek következtében az adatok szórásnégyzetét nem lehet analitikus eszközökkel, zárt formula segítségével becsülni — mint azt a mikrocenzus mintavételi terve szerint, korrigálatlan becslések esetében lehetne —, ezért közelítő eljárás alkalmazására volt szükség. Az ilyen esetekben használatos eljárások — véletlen részcsoportok módszere, kiegyensúlyozott félminták módszere, bootstrap stb. — közül a mikrocenzus szempontjából az ún. jackknife módszernek a rétegzett minták esetére kidolgozott változata látszott a legcélravezetőbbnek. Többlépcsős, de nem rétegzett minták esetén a jackknife módszer a következőképpen működik. Tegyük fel, hogy a mintában k számú elsődleges mintavételi egység van, és hogy Y az alapsokaság valamilyen Y paraméterének a mintából származó becslése; lényegtelen, hogy 7értékösszeg, átlag vagy éppen arány. Jelöljük Y(l)-lel azt az ún. pszeudobecslést, amelyet úgy kapunk, hogy az /-edik elsődleges mintavételi egységet kihagyjuk a mintából, és az Fismérvet a megmaradó k-1 számú elsődleges egység segítségével becsüljük. A pszeudobecslés előállításánál úgy járunk el, mintha az /-edik elsődleges mintavételi egység meghiúsulás miatt maradt volna ki, tehát a megmaradó (végső) egységek mintasúlyát megfelelően korrigáljuk. Y szórásnégyzetének becslése a jackknife módszer szerint: ^--TnrrX^-Y? K\K-L) i =i Rétegzett minták esetén a jackknife módszer alkalmazásánál a rétegzetlen esethez mérten az a különbség, hogy az /-edik elsődleges egység kihagyása után csak azoknál a megmaradó, elsődleges mintavételi egységeknél módosítjuk a mintasúlyokat, melyek ahhoz a réteghez tartoznak, amely az éppen kihagyott elsődleges egységet tartalmazza. A hibaszámítást — az adott esetben a jackknife módszer alkalmazását — a VPLX nevű program segítségével hajtottuk végre a^ . A számítás előkészítésének legfontosabb eleme a minta rétegeinek és azokon belül az elsődleges mintavételi egységeknek az azonosítása volt az adatállományok rekordjain. Emlékeztetünk arra, hogy a mintavételi terv szerint a fővárosban a kerületek alkották a minta egy-egy rétegét, míg az ország többi részén a megyék és a települések nagyságkategóriái határozták meg a rétegeket, továbbá, hogy a 15 000 lakosú és az annál népesebb települések önreprezentálók voltak, míg a kisebb települések elsődleges mintavételi egységek voltak a megfelelő rétegekben. Ezek a körülmények az alábbi egyszerű a) A program elérhető az Interneten, http://www.census.gov címen. 344