1960. ÉVI NÉPSZÁMLÁLÁS 2. Személyi és családi adatok képviseleti minta alapján (1960)
IV. A fogalmak magyarázata
ahol t értékét a standard normális eloszlású valószínűségi változó 0 (t) eloszlás függvényéből 3 határozhatjuk meg, abból a feltételből, hogy megállapításainkat adott [:2 a> (í) — 1] (6) valószínűségi szinten tesszük. Bár a népszámlálási eredmények között bizonyos értékek számtani közepe és egyszerű összege (átlagos életkor, gyermekszám stb.) is előfordul, az adatok zöme előfordulási gyakoriságból, ill. ezekből számított megoszlási viszonyszámokból áll. Az ilyen jellegű mintavételi adatok pedig alternatív valószínűségi változók, melyek értéke pl. vagy 1, vagy 0, aszerint, hogy pl. a mintába került egyén rendelkezik egy adott ismérvvel, vagy nem. Első közelítésben feltehetjük, hogy a képviseleti minta visszatevés nélküli kiválasztása véletlenszerűen történik. Ezen alternatív valószínűségi változók szórása cr = Ypq, ahol p a vizsgált esemény relatív gyakorisága a mintában és q — I — p. így x átlag cr- standard hibájára, figyelembevéve, hogy adott esetben x = p. a következő kifejezést kapjuk: <r(T Vn n ¥ M n n N j (7) n ahol 7i, ill. N a képviseleti minta, ill. az alapsokaság elemszáma (— — / a mintaún. ..kiválasztási aranya AT Ily módon (2) és (7) alapján x = p felhasználásával kapjuk, hogy Vi pq n yr=7 i r np fi-t, amiből (1) segítségével q í 2 pD (8) N -f pD 2 adódik. Az előző népszámlálások eredményei szerint az általunk közölni kívánt, legfontosabb országos adatok zömének minimális relatív gyakorisága közelítőleg p = 0,015, az alapsokaság elemszáma (az ország lélekszáma) pedig az 1960. évi népszámlálás előzetes adatai alapján N = 9 976 530 ^ 10 7. Mivel a képviseleti minta eredményeiből (a gyakorlatban igen jól használható) 95%-os valószínűségi szint mellett kívánjuk a megfelelő országos adatokat becsülni, ezért (5) és (6) formulákból t = 1,96. Ily módon (8)-ból q = 0,985 felhasználásával a képviseleti minta keresett elemszámára n = 99 854 adódik. A képviseleti mintával szemben támasztott követelményeket tehát egy közelítőleg 100 000-es elemszámú minta elégíti ki legjobban és ezért a minta kiválasztását 1%-os kiválasztási arány mellett végeztük. Ily módon az 1960. évi népszámlálás előzetes eredményeinek megfelelően az 1%-os képviseleti minta n = 99 765 személy adatait tartalmazza. A képviseleti minta kiválasztási arányát úgy határoztuk meg, hogy. a legfontosabb közlendő országos adatok minimumainak relatív gyakorisága p = 0,015-nél kisebb ne legyen. így elérjük, hogy a képviseleti minta közlési tábláiban zömmel előforduló adatok relatív hibája 5%-nál alacsonyabb lesz 95%-os valószínűségi szinten. 3 Itt o (t) —u 1 e 2 du, (5) mely integrál az ún. „normálgörbe" és az u tengely által határolt tartomány —oo és t határok közötti területét jelenti. 148