1973. ÉVI MIKROCENZUS Adatai (1974)
VI. A MINTAVÉTELI ADATOK MEGBÍZHATÓSÁGI HATÁRAI
Ennek 1, 96-szorosa adja + értelemben a megbízhatósági határokat, 95 %-os valószínűség mellett. Az 1. számú táblázat ilyen valószínűségi szinten mutatja ki a mintavételi hiba abszolút és százalékos értékét, valamint a megbízhatósági határokat. Ez a táblázat első közelítésben a mikrocenzus adatainak elbírálására felhasználható. Az 1. számú táblázat személyi adatokra, a 2. számú lakás-, háztartás- és család-adatokra vonatkozik. Utóbbi 2. sz. táblázat csak a nagyobb (50 000-nél nagyobb nagyságrendű kivetített, 1 000-nél nagyobb mintabeli) adatokat tartalmazza, e határoknál kisebb adatoknál lakásokra, háztartásokra és családokra is az 1. sz. táblázat használható. 2. A SZÁMLÁLÓKÖRZETI KIVÁLASZTÁS MEGBÍZHATÓSÁGÁRA VONATKOZÓ ADATOK A mikrocenzusnál ténylegesen alkalmazott mintavétel - az előzőekben elmondottak szerint - háromlépcsős, csoportos, rétegzett mintavétel volt. Az egyedi, egyszerű véletlen mintához képest a csoportos kiválasztás növeli a hibahatárokat, a rétegzés viszont csökkenti. A mintavételi tervet nyomon követő hibaszámitás képleteit az akkor alkalmazott kétlépcsős mintára az 1968. évi mikrocenzus kiadványa közölte. A háromlépcsős mintára vonatkozó képlet három tagból állana, melyek közül az első tag a községek kiválasztásának, a második tag a számlálókörzeteknek, a harmadik a lakások kiválasztásának szórását, ill. az abból eredő mintavételi hibát fejezi ki. Minthogy minden megyére, (megyei városra, Budapestre) a minta külön müvelettel készült, az országos adatok megbízhatósági határainak becslésénél e területi egységek rétegeknek tekintendők. Az általános célú minta és mikrocenzus-minta képzése kapcsán a gépi feldolgozás minden megyére kiszámította a számlálókörzeti átlagok szórását a megyei átlag körül, még pedig arra a jellegzetes 20 ismérvre, amely az 1970. évi népszámlálás kiadványaiban számlálókörzetenkénti adatokkal szerepel. A számítás nem a megye összes számlálókörzeteire támaszkodott, hanem az általános célú mintába foglalt számlálókörzetekre. Minthogy ez a minta községek kiválasztásával és rétegzett eljárással készült, ezért a mintabeli számlálókörzeti átlagokból számított szórásban a községkiválasztás és a rétegzés hatása is kifejezésre jut. Ez utóbbinak, a megfelelő rétegzésnek tudható be, hogy a számlálókörzeti mintavétel relatív hatékonysága, amit az egyedi véletlen kiválasztás hibájához mért viszonyszám jelez (V /V ), a vizsgált ismérP ^ veknél aránylag kisebb különbségeket mutat. (Lásd a 3. sz. táblázatot) Rétegzés nélkül a foglalkozási ismérveknél lényegesen kedvezőtlenebb hatékonysági arányszámok mutatkoznának. Az ezt ellensúlyozó rétegzés ugyanis elsősorban éppen a területi egységek foglalkozási jellege szerint történt, tehát a foglalkozási adatok pontosságát javítja a számlálókörzetek egyszerű véletlen (rétegzetlen) kiválasztásával szemben. A számítás az 1970. évi népszámlálás adataira vonatkozik, az időközi uj építkezések és lakótelepek adatait tehát nem tartalmazza. Nem terjed ki az intézeti háztartásokra sem. A 3. sz. táblázat országos szinten és egyes jellegzetes területegységekre mutatja be a feldolgozás és számítás eredményeit, a következő mutatókra kiterjedően; a/ A vizsgált ismérvek relatív gyakoriságának (p százalékos arányának) standard hibája; cr p = 117^ i " \l m ahol f a kiválasztási arány; az általános célú mintánál 0, 1, Sp a számlálókörzeti átlagok szórása a megyei átlag körül, m a mintába vett számlálókörzetek száma. 326