1963. ÉVI MIKROCENZUS Személyi és családi adatai (1964)

VI. A mintavételi eljárás módszere

A mintavételi módszerrel nyert adatokból nem lehet az országos sokaság megfelelő adatait teljes bizonyossággal kiszámítani. Meg kell elégednünk olyan típusú következtetésekkel, hogy az alapsokaság megfelelő értéke bizonyos valószínűséggel megadott (a mintavételi adatokból kiszámít­ható) határok (ún. hibahatárok vagy megbízhatósági határok) közé esik. Mintavételi adataink annál pontosabbak, mennél kisebbek ezek a megbízhatósági határok. A mikrocenzus adatai gyakorlatilag csak akkor használhatók, ha ismerjük pontosságukat. A következőkben becsléseket adunk a mikro­cenzus adatainak hibahatáraira. A megbízhatósági határokat a 95%-os valószínűségi szintnek meg­felelő becslésekhez számítottuk ki. Ez azt jelenti, hogy ha igen sok és mindig ugyanannyi elemből álló mintát készítenénk, akkor 20 eset közül átlagosan 19-ben a minta adata az adott hibahatárok között helyezkedne el. Természetesen előfordulhat olyan eset is (átlagosan legfeljebb 20 közül 1), amikor a mintavételi adat pontatlannak bizonyul és ilyenkor nem esik bele az előre megadott meg­bízhatósági intervallumba. Ez azonban nem a mikrocenzus hibája, hanem az alkalmazott mate­matikai-statisztikai módszer természetéből adódik. Mivel a mikrocenzus mintájánál (részben) kétlépcsős, rétegezett mintavételi eljárást alkal­maztunk, ahol első lépcsőben községeket nagyságukkal arányos valószínűséggel, második lépcsőben pedig ezeken belül lakásokat szisztematikus úton választottunk ki, a mikrocenzus adatainak meg­bízhatósági határait előre pontosan nem tudtuk meghatározni. Egy adott ismérvvel rendelkezők arányának megbízhatósági határait a mintavételi eljárás minden fázisának pontos figyelembe­vételével meghatározni csak hosszadalmas számolási eljárással lehetséges. Ezért a mikrocenzus adatainak pontosságát közelítőleg számítottuk ki oly módon, hogy a mintavételnél egyszerű, véletlen egyfokozatú, egyénenkénti kiválasztást tételeztünk fel. Egy a mikrocenzus n elemszámú mintájában pn = (l—q)n előfordulási gyakorisággal rendel­kező érték abszolút d hibája 95%-os valószínűségi szinten d= + 1,96-K0,98 pqn lesz. E formulából következik, hogy a 75 000-es nagyságrendű kivetített mintavételi adatok hibája közelítőleg 3500, relatív hibája ±5%. Ha tehát a mikrocenzus kivetített eredményei között egy ismérvvel rendelkező száma 75 000, akkor az ország össznépességéből az ismérvvel rendelkezők száma, 95%-os megbízhatósággal, valamely 71 500 és 78 500 közötti érték. Természetesen a 75 000­nél nagyobb mintavételi adatok relatív hibája kisebb, 75 000-nél kisebb adatok relatív hibája nagyobb 5%-nál. A különböző nagyságú kivetített mintavételi adatok relatív és abszolút hibáját, valamint hibahatárait a VII. Táblázat tartalmazza. A táblázat adatainak gyakorlati felhasználásánál, illetve a hibahatárok mérlegelésénél fel­tétlenül figyelembe kell azonban venni a mintavételi eljárás hatását az adatok pontosságára. Ez az eljárás az adatok nagyságától és az ismérvek minőségétől függően javítja a véletlen hibák VII. Táb­lázatban közölt értékeit. Az 1960. évi népszámlálás előzetes feldolgozásához használt 1%-os minta, valamint teljeskörű adatok alapján meghatároztuk a mikrocenzus néhány adata hibahatárainak a VII. Táblázat adatainál pontosabb, de mégis felső becsléseit. (A községeken belül a lakások közötti szórásokat csak az 1%-os minta összes lakásadatai közti szórásokkal tudtuk felülről becsülni.) Kivetített mintavételi adat relatív hibája Ismérv értéke a VII. Táblázat pontosabb számítások alapján A mezőgazdasági népesség száma 3 001 750 0,7 0,5 Az iparban alk. állók száma .. . 1 322 350 1,1 1,0 15—39 éves népesség 3 639 500 0,6 0,4 Kereső nők száma 2 117 550 0,8 0,7 Bizonyos mintavételi adatok elméleti relatív hibája a közelítőleg számított hibáknak csak 65 —70%-át teszi ki, más mintavételi adatok esetén ez az arány már 90% körül mozog. Ily módon a mikrocenzus eredményeiből a VII. Táblázat figyelembevételével óvatos következtetések von­hatók le. 211

Next

/
Thumbnails
Contents